Интернет и связь

Интернет и связь / Сервисы /

Преодолим ли языковой барьер Википедии?

17 мая 2012 года, 13:41 | Текст: Дмитрий Целиков | Послушать эту новость

Вам когда-нибудь приходило в голову, что Википедия содержит огромное количество нужной информации на незнакомых вам языках, к тому же изложенной с позиций иной культуры?

Дабы преодолеть языковой барьер, Брент Хехт из Северо-Западного университета (США) и его коллеги создали «Омнипедию» — ПО, позволяющее просматривать статьи на одну и ту же тему из 25 языковых разделов Википедии.

Так носители дравидийского языка малаялам праздновали десятитысячную статью в своём разделе Википедии. (Фото <noindex><a target=_blank href=/>Abhishek Jacob</a></noindex>.)
Так носители дравидийского языка малаялам праздновали десятитысячную статью в своём разделе Википедии. (Фото Abhishek Jacob.)

Это не просто ещё один автоматический переводчик. Программа анализирует ссылки на боковой панели, указывающие на иноязычные статьи той же тематики. Система проходит по этим ссылкам и пытается понять, какие темы универсальны в данной области, а какие — специфичны для каждого языка, после чего отображает их все.

Этот метод анализа не назовёшь надёжным: например, на многих языках «Теория заговора» связана со статьёй об НЛО, а в испанском разделе такая ссылка отсутствует, хотя сама статья об НЛО есть. Поэтому приходится применять дополнительные алгоритмы, которые охотятся за такими недостающими звеньями.

«Омнипедия» отображает каждую тему, найденную в конкретной статье, в виде круговой диаграммы, разделённой на цветные сегменты: каждый из них представляет язык, на котором обсуждается тема. Щелчок по кругу открывает соответствующий фрагмент из статьи, и он автоматически переводится с помощью Bing Translator.

Разработчики попросили 27 добровольцев с различным знанием языков протестировать программу. Говорят, многие были поражены тем, какого количества информации лишена английская Википедия и насколько полны другие языковые разделы — например, японская статья о регги.

«Омнипедия» была представлена в Остине (штат Техас, США) на Конференции по вопросам человеческого фактора в компьютерных системах.

Подготовлено по материалам NewScientist.

Каждый день слушайте итоговый подкаст Свободного Радио «Компьюлента»!
blog comments powered by Disqus

Последние новости по теме "Сервисы":