Э

Мир энциклопедий

encyclopedia.ru

Фонд Викимедиа анонсировал проект Wikidata

Фонд Викимедиа анонсировал проект Wikidata
  • 12 апреля 2012
  • новость года
  • просмотров 9417
  • комментариев 14
Фонд Викимедиа (Wikimedia Foundation), управляющий Википедией (Wikipedia) и рядом других вики-проектов, объявил о запуске своего первого крупного проекта с 2006 года — Wikidata, единой базы для хранения структурированных данных, которые будут использоваться во всех статьях свободной энциклопедии вне зависимости от языковой версии (статистические, хронологические данные, имена известных личностей и т. д.). Проект представил председатель правления Wikimedia Deutschland Павел Рихтер (Pavel Richter) на международной конференции Викимедии, проходившей 30 марта в Берлине.

Например, в Wikidata могут храниться данные по численности населения определённого города. Все статьи Википедии, в которых упоминаются эти данные, будут содержать специальный ключ с названием города и атрибутом, ассоциированным с численностью населения. Чтобы подкорректировать статистику, будет достаточно изменить только одну запись в Wikidata, что отразится на всех соответствующих статьях Википедии. Это же относится к связанным с городом географическим, политическим и прочим сведениям (имя мэра, телефонный код, города-спутники, известные граждане и т. п.).

Структурирование данных в Wikidata позволит автоматически отвечать на запросы типа «десять крупнейших городов мира, где мэром является женщина». На данный момент ответы на такие вопросы можно находить в так называемых списках Википедии, которые составляются вручную. Wikidata поможет формировать их автоматически, считает TechCrunch.

Функционально Wikidata можно сравнить с Викискладом (Wikimedia Commons), только последний выступает в роли общего хранилища мультимедиа файлов, а Wikidata будет содержать единые представления фактов для всех языковых версий Википедии. При этом проект будет включать гибкие средства локализации. Так, даже если статья ранее не была переведена на тот или иной язык, для любой языковой версии можно будет вывести все соответствующие факты из Wikidata.

Данные будут доступны как для правки человеком, так и программой, то есть Wikidata может быть задействована и в разнообразных сторонних приложениях, таких как системы аннотирования научных статей.

Поначалу Wikidata будет охватывать 40 различных версий Википедии из более чем 280. При этом разработка разделена на 3 фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между разными языковыми разделами Википедии. На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.

Стартовую работу по созданию Wikidata ведет германское отделение Фонда Википедиа Wikimedia Deutschland — команда из восьми разработчиков под руководством доктора Денни Врандечича (Denny Vrandečić), выходца из Технологического института Карлсруэ (Karlsruhe Institute of Technology (KIT)), соучредителя проекта Semantic MediaWiki. В дальнейшем планируется передача полномочий по управлению и обслуживанию международной штаб-квартире Викимедии.

Данные как Wikidata, так и Википедии будут предоставляться на условиях лицензии Creative Commons.

На разработку начального прототипа проекта выделено € 1,3 млн, половина из которых пожертвована Институтом решения проблем искусственного интеллекта (Institute for Artifical Intelligence, AI²), созданного Полом Алленом (Paul G. Allen), соучредителем корпорации Майкрософт. Остальную часть финансирования предоставили компания Google и фонд Гордона и Бетти Мур (Gordon and Betty Moore Foundation).

По мнению вице-президента института AI² Марка Гривза (Mark Greaves), проект Wikidata является следующим шагом эволюции Википедии, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Семантические технологии, на которых будет основан проект, позволят упростить выявление нужных сведений.

Эндрю Ли (Andrew Lih), автор книги The Wikipedia Revolution, отметил в комментарии CNet, что проект Wikidata является логическим развитием проекта энциклопедии. С другой стороны, Wikidata — это все-таки техническое решение, которое требует понимания организации энциклопедии и определённых навыков, что может отпугнуть некоторых технически неподкованных редакторов.

С точки зрения английского географа Марка Грэхэма (Mark Graham), которая изложена на сайте The Atlantic, Wikidata подразумевает существенное и чрезвычайно важное изменение принципов функционирования Википедии. Ранее не было задачи сделать так, чтобы статья из одной языковой версии Вики не противоречила другой (например, публикации о памятнике «Бронзовый солдат» в русском и эстонском разделах). При этом каждое сообщество может формировать и воспроизводить разные взгляды на одну и ту же проблему, создавая свою «правду», свое мировоззрение. Безусловно, существуют общепринятые факты, с которыми никто не спорит (Токио — столица Японии и т. д.), но так бывает далеко не всегда... Например, включать ли в состав населения Израиля жителей с оккупированных и спорных территорий, и как уживется этот единый вики-факт в ивритском и арабском языковых разделах?

Обзор этих и других точек зрения на новацию Фонда Викимедиа содержится в статье с сайта The Wikipedian, название которой можно дословно перевести как «Агония и экстаз Wikidata» (The Agony and Ecstasy of Wikidata).

Стоит напомнить, что попытки превратить огромную библиотеку знаний Википедии в структурированный источник данных — семантическую вики — уже предпринимались. Например, проект DBpedia пытался создать такую систему, однако она была односторонней: клиенты-машины не могли вносить в нее свои правки.
  • Теги
  • AI²
  • Google
  • Gordon and Betty Moore Foundation
  • semantic wiki
  • wiki
  • Wikidata
  • Wikimedia Deutschland
  • Wikimedia Foundation
  • Wikipedia
  • Википедия
  • Фонд Викимедиа
  • вики
  • семантическая вики

(Голосов: 4, Рейтинг: 3.66)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Н-да, лет 20 назад нечто подобное было из области научной фантастики, а сейчас воспринимается как должное...

    Все спорные моменты, думаю, как-то решаемы. Если существуют какие-то альтернативные варианты одних и тех же данных, можно же и обе версии в базу включать — с пометкой о происхождении. Так или иначе, это все-таки очень полезное нововведение, энциклопедия будет гораздо быстрее обновляться.
    • 0/0
  • Ссылка на комментарий
    Структурирование данных в Wikidata позволит автоматически отвечать на запросы типа «десять крупнейших городов мира, где мэром является женщина». На данный момент ответы на такие вопросы можно находить в так называемых списках Википедии, которые составляются вручную.

    Вот это действительно интересная функция, которая понравится огромному количеству поклонников Википедии. Но вот с другой стороны, насколько же должен быть сложным алгоритм построения такого рода запросов, а точнее насколько корректен будет ответ. Ведь решение подобной задачи сродни проблеме ПНП в математике, которую не могут решить уже более 30-ти лет. Интересно будет посмотреть.
    • 0/0
  • Ссылка на комментарий
    Очень радует тот факт, что последнее время стало больше внимания уделяться обучению и повышению грамотности молодёжи. Замечательно, что новая энциклопедия Wikidata будет обладать большим количеством достоверной информации и облегчённым поиском!
    • 0/0
  • Ссылка на комментарий
    Радует, что электронные энциклопедии заботятся об обновлении информации. В прошлом пришлось много намучиться с добычей данных, в которых цифры хоть как-то были похожи на современность. Хорошо что прогресс не стоит на месте.
    • 0/0
  • Ссылка на комментарий
    Фонд Викимедиа (Wikimedia Foundation), управляющий Википедией (Wikipedia) и рядом других вики-проектов, объявил о запуске своего первого крупного проекта с 2006 года — Wikidata, единой базы для хранения структурированных данных, которые будут использоваться во всех статьях свободной энциклопедии вне зависимости от языковой версии (статистические, хронологические данные, имена известных личностей и т. д.)...

    А как тут обстоят дела с правами на владение информацией о сугубо персональных данных? Вопрос
    В то же время, насколько полны будут сведения, чтобы хотя бы выглядеть объективно? Вопрос
    И наконец, какой вообще смысл включать в такую базу "всех подряд", кто хотя бы раз "засветился" в Вики? Вопрос
    • 0/0
  • Ссылка на комментарий
    Я считаю, что это очень полезное и удобное для многих пользователей нововведение. Намного больше людей смогут найти в энциклопедии нужные для себя сведения. Хотя проект Wikidata — это техническое решение, но я думаю, что не многих редакторов он отпугнет, ведь всякий человек имеет способность обучаться, и  навыки появятся в процессе работы.
    • 0/0
  • Ссылка на комментарий
    Ранее не было задачи сделать так, чтобы статья из одной языковой версии Вики не противоречила другой (например, публикации о памятнике «Бронзовый солдат» в русском и эстонском разделах).

    Означает ли это, что в Википедии больше не будет субъективных мнений, а будут изложены только факты? Или просто будет возможность сравнить эту тему в различных разделах?
    • 0/0
  • Ссылка на комментарий
    Maxim Yaremenko пишет:
    Означает ли это, что в Википедии больше не будет субъективных мнений, а будут изложены только факты? Или просто будет возможность сравнить эту тему в различных разделах?

    В статье сказано, что речь идет о создании хранилища единых представлений фактов для всех языковых версий Википедии. Другое дело, что оперировать одними и теми же фактами в разных языковых версиях Вики могут по-разному, например, обращая внимание на одни и «забывая» о других.
    • 0/0
  • Ссылка на комментарий
    Чем больше энциклопедий (разных и желательно хороших), тем проще будет любознательным людям почерпнуть нужную информацию. Отсюда новость о появлении нового энциклопедического источника не может не радовать.
    • 0/0
  • Ссылка на комментарий
    Что-то не больно меня обрадовала эта новость. Объективных фактов не так и много, и поэтому любое явление нужно обязательно рассматривать с разных точек зрения. Например, что такое суд? Это рассмотрение точек зрения обеих сторон, и только потом — принятие решения. Не может быть справедливого суда без рассмотрения точки зрения одного из участников. Поэтому в статье энциклопедии «железный солдат» объективная истина одна — то, что это происходило в Таллине. Но ведь речь в ней не только об этом...
    • 0/0
  • Ссылка на комментарий
    А мне эта идея нравится. Тогда действительно легко можно будет исправить численность страны или города сразу во всех статьях Википедии на всех языках ну или имя действующего президента. Ведь частенько сталкиваешься с устаревшими данными, которые никто не собирается корректировать. Все энциклопедии рано или поздно устаревают, не зря же регулярно выпускаются добавления и новые выпуски. Понятно, что внести туда стоит только то, что действительно определяется однозначно. Спорные моменты лучше опустить и оставить их на совести авторов статей.
    • 0/0
  • Ссылка на комментарий
    Lily Rich пишет:
    Очень радует тот факт, что последнее время стало больше внимания уделяться обучению и повышению грамотности молодёжи. Замечательно, что новая энциклопедия Wikidata будет обладать большим количеством достоверной информации и облегчённым поиском!

    Не очень понял, при чем тут Wikidata и повышение грамотности молодежи? Викидата вообще в данном случае выступает как более удобный поисковик по фактам, а не как всеобщий всеобуч. То есть просто данный сервис позволит быстро и оперативно искать информацию тем, кто уже знает исходные данные, для правильного запроса.
    • 0/0
  • Ссылка на комментарий
    Замечательное нововведение!

    Я как постоянный пользователь Википедии могу сказать, что огромная информация, которую предоставляет сайт, нуждается в более детальной структуризации и способах абстрагирования от того, что читать мы не хотим. Новый инструмент как раз поможет в этом, облегчит поиск статистических данных, сделает информацию наглядней и общедоступней, особенно для студентов. Спасибо вам!
    • 0/0
  • Ссылка на комментарий
    Предстоит колоссальный объем работ, по ходу выполнения которых постоянно будут возникать нюансы. Надеюсь, разработчики справятся, и, когда все этапы работ будут закончены, пользователям энциклопедии будет намного легче отыскать в Wikidata нужные сведения.
    • 0/0