Компания Google призвала пользователей перепроверить автоматический перевод Википедии (Wikipedia) на малораспространенные языки, сообщается в официальном блоге компании.
Переводом Википедии Google занимается с 2008 года. Тогда за три месяца на хинди было переведено 600 тысяч слов из более 100 англоязычных статей, что составило примерно 20% всего раздела Википедии на хинди (hi.wikipedia.org).
Для перевода выбирались англоязычные материалы, к которым чаще всего обращались жители Индии. С помощью сервиса Google Trends были выбраны статьи с стабильно высокой посещаемостью. Затем осуществлялся машинный перевод с помощью инструмента Translator Toolkit. Результат редактировался вручную добровольцами-переводчиками.
Стоит отметить, что объем раздела как правило определяется числом статей, однако при машинном переводе его значительную часть занимают заглушки (stubs), которые при помощи волонтеров Google надеется превратить в полноценные вики-статьи.
Количество полноценных статей в разных языковых версиях Википедии (Английский язык = 1)
Судя по графику, неудивительно, что более 16 млн слов планируется перевести именно на арабский, гуджарати, хинди, каннада, суахили, тамильский и телугу.
Результаты деятельности Google и волонтёров были предоставлены 10 июля на партнёрской конференции Wikimania 2010 в Гданьске (Польша).
(Голосов: 1, Рейтинг: 3.3) |
YA_HELEN пишет:
Просто какой тогда смысл ориентироваться на статистику обращаемости жителей Индии к англоязычным статьям, если они и так ее уже так или иначе перевели/прочитали.