Сегодня в сервисе "Яндекс.Новости" появилось существенное нововведение. Как сообщается в пресс-релизе компании "Яндекс", все новости в службе теперь представляются "объемно" - на странице новостного сюжета можно увидеть не только основные факты, но также иллюстрации и справочную информацию.
При выборе фактов служба использует сведения из различных источников, причем приоритет получают информативные, оперативные и эксклюзивные новости. Сюжет сопровождается фотографиями и картами, если в новости упомянуты географические объекты. Кликнув на имена главных действующих лиц сюжета, можно сразу перейти на их пресс-портреты.
В основе нововведения лежит технология, получившая название "многодокументная аннотация", которая автоматически выделяет из всех сообщений сюжета наиболее значимые объекты - имена людей, названия организаций, географические объекты, даты и числа. Все эти объекты, как и ключевые слова сюжета и новостные запросы, определяют выбор текстов для аннотации.
Ежедневно служба "Яндекс.Новости" обрабатывает 100000 сообщений. Обработка и систематизация новостей происходят автоматически и основаны на определении текстуальной близости и кластеризации информационных потоков. Впервые технология извлечения данных в "Яндекс.Новостях" была применена для автоматического выделения главных действующих лиц новостных сюжетов, а затем - для выделения и отождествления адресов и цитат.