Э

Мир энциклопедий

encyclopedia.ru

Владимир Медейко («Рувики»): «Скорость — это ключевая проблема крупного вики-сайта»

Интервью

  • 20 февраля 2024
  • просмотров 2704
  • комментариев 8
Мир энциклопедий. Руководитель «Рувики — новой интернет-энциклопедии» на русском и на других языках народов России Владимир Медейко рассказал «Газете.Ru» о проделанной работе и о базовых проблемах современных копий проекта «Википедия» (Wikipedia).

Генеральный директор АНО «Интернет-энциклопедия Рувики» Владимир Медейко

Владимир Медейко, гендиректор АНО «Интернет-энциклопедия Рувики»

Главная страница проекта «Рувики — новая интернет-энциклопедия» (25 февраля 2024 года)

«Рувики — новая интернет-энциклопедия» (25 февраля 2024 года)
— На прошлой неделе Владимир Мединский предложил обществу «Знание» скопировать все статьи из «Википедии». Можете ли вы прокомментировать это высказывание? Этично ли это?

— Наверное, мне будет некорректно комментировать слова Владимира Мединского, но давайте я расскажу о том, как устроена «Википедия» и как работают её «форки» — то есть копии. Прежде всего, коснёмся вопроса этики. Это не просто этично! Именно ради свободы копировать Ричард Столлман (Richard Stallman) изобрёл концепцию свободных лицензий! Их ключевым принципом является право любого лица не просто воспользоваться свободным произведением (будь то программа, текст или энциклопедия), но и внести в него изменения на своё усмотрение. «Википедия» основана на свободной лицензии, и в мире существует огромное количество её копий и форков: в «Википедии» есть страница, где собирают о них информацию, и там в списке уже более 700 проектов [1]1. Самый известный из них — испанская «Энциклопедия Либре» (Enciclopedia Libre Universal en Español) [2]2.

— То есть это в целом не сложно — поднять еще одну «Википедию»?

— А вот здесь многие мои коллеги сталкиваются с определённым заблуждением. Да, любой человек может легко скопировать контент и поднять движок медиа-вики. Но за последние восемь лет «Википедия» ушла далеко вперёд. Каждая статья состоит из нескольких составляющих — текст, изображения и формализованные данные, которые неразрывно сплетены со статьёй.

Изображения хранятся в так называемом «Вики-складе» (Wikimedia Commons) или «Коммонз» (складе свободных изображений, которых там больше 100 млн) [3]3, а структурированные данные в «Вики-данных» (Wikidata) [4]4.

По объёму эти разделы на порядок больше, чем любой языковой текстовый раздел [5]5. Большинство «легко созданных копий» по факту подставляют материалы с «Вики-склада» и «Вики-данных» и представляют из себя «обёртку». Скорость работы таких «франкенштейнов» оставляет желать лучшего.

Вообще скорость — это ключевая проблема крупного вики-сайта. Когда приходится бороться за скорость обработки большого количества запросов, простые решения перестают работать, и сложность инфраструктуры возрастает на порядки.

В «Рувики» мы не только подняли копию русскоязычного раздела [6]6, не только создали полностью российскую инфраструктуру серверов, но и целиком перевели в российское пространство «Вики-склад» и «Вики-данные». Это абсолютная автономность и способность держать высокую нагрузку, потребовавшие очень больших усилий и ресурсов. Это технический момент.

Но есть ещё момент редакционный: почти 2 млн статей, больше 100 млн изображений — вы представляете себе, какую огромную работу надо провести, чтобы актуализировать и поддерживать эти данные? В «Рувики» над этим ежедневно работает большой штат профессиональных редакторов, к нам стали активно подключаться волонтёры, и мы будем вести серьёзную работу, чтобы создать собственное волонтёрское сообщество.

Ведь просто так «закачать» существующие энциклопедии онлайн не получится, они ограничены авторскими правами.

Так что на собственном опыте могу сказать, что история с «за час подниму «Википедию» канула в лету.

— Многие ваши бывшие коллеги упрекали ваш проект в том, что обновлять его будет некому и прочили ему быструю гибель. Что вы на это ответите?

— Я бы сказал: давайте ещё раз поговорим об этом в конце года. Наша редакция очень активно актуализирует статьи, и, бывает, опережает «Википедию»! Кроме того, к сожалению (и мне искренне жаль, что так происходит), сообщество вокруг «Википедии» уменьшается во всём мире. Во многом это связано со сложностями «входа» для новичков, где-то влияет весьма токсичная атмосфера в сообществе. Поэтому фактически и сама «Википедия» сталкивается с вызовом, как своё сообщество растить.

Сейчас мы проводим конкурсы по написанию статей на различные темы, чтобы постараться привлечь людей со знаниями. Планируем сотрудничество с компаниями, которые профессионально занимаются волонтёрством. Ну и главное, надеемся предложить технологические решения, которые позволят внедрить на платформе элементы геймификации, чтобы привлекать и удерживать новых авторов.

— И всё-таки почему «Рувики» не станет одной из 700 копий «Википедии» в мире, о которой никто не знает?

— Прежде всего потому, что мы не просто скопировали проект ради того, чтобы он существовал. Мы воспользовались правом, предоставляемым свободной лицензией, чтобы развить проект и сделать его релевантным для цифрового будущего. Уже весной мы представим «Рувики 2.0» с целой серией изменений — от интерфейса и аудиоформата до проектов по обновлению и актуализации информации в существующих статьях. И постараемся всех особенно порадовать дальнейшими изменениями, которые сейчас в проработке. Наша цель — сделать новый удобный полезный продукт, который продолжит служить миссии распространения свободных знаний. Каждый из нас от этого только выиграет.

Литература («Мир энциклопедий»)

  1. Wikipedia:Mirrors and forks/All. — Текст: электронный// Wikipedia, the free encyclopedia. — URL: https://en.wikipedia.org/wiki/Wikipedia:Mirrors_and_forks/All (дата обращения: 25.02.2024).
  2. Enciclopedia Libre Universal en Español. — Текст: электронный// Wikipedia, the free encyclopedia. — URL: https://en.m.wikipedia.org/wiki/Enciclopedia_Libre_Universal_en_Español (дата обращения: 25.02.2024).
  3. Викисклад. — Текст: электронный// Википедия — свободная энциклопедия. — URL: https://ru.wikipedia.org/wiki/Викисклад (дата обращения: 25.02.2024).
  4. Викиданные. — Текст: электронный// Википедия — свободная энциклопедия. — URL: https://ru.wikipedia.org/wiki/Викиданные (дата обращения: 25.02.2024).
  5. Википедия:Список Википедий. — Текст: электронный// Википедия — свободная энциклопедия. — URL: https://ru.wikipedia.org/wiki/Википедия:Список_Википедий (дата обращения: 25.02.2024).
  6. Русская Википедия. — Текст: электронный// Википедия — свободная энциклопедия. — URL: https://ru.wikipedia.org/wiki/Русская_Википедия (дата обращения: 25.02.2024).

  • Теги
  • forks
  • high load
  • MediaWiki
  • Wikidata
  • Wikimedia Commons
  • Wikipedia
  • АНО Рувики
  • Викиданные
  • Википедия
  • Викисклад
  • РФ
  • Россия
  • альтернатива Википедии
  • википедия
  • высокая нагрузка
  • интернет энциклопедия
  • онлайн энциклопедия
  • свободные лицензии
  • форки
  • Библиографическое описание ссылки Гришин А. Не просто скопировать тексты: что представляет собой русский аналог «Википедии»/ [Интервьюер Андрей Гришин; Респондент Владимир Владимирович Медейко]. — Текст: электронный// Газета.Ru. — 2024. — 20 февраля. — URL: https://www.gazeta.ru/tech/2024/02/20/18303817.shtml (дата обращения: 25.02.2024).

(Голосов: 1, Рейтинг: 3.3)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Разговоры о перспективах новой сетевой энциклопедии, конечно, хороши, однако на деле пока не всё столь благополучно. Многие статьи «Рувики» после того, как их скопировали из Википедии, попросту никто не трогал. За последний год у современных писателей вышли новые книги, у музыкантов — новые альбомы, но в «Рувики» информации об этом зачастую нет. Так что перспективы перспективами, но заметно, что людей, готовых сегодня следить за актуальностью статей, пока не хватает.
    • 1/0
  • Ссылка на комментарий
    Наконец мы стали мыслить креативно и создавать свои проекты (хоть и на основе копирования, но с этого начинали многие...). Ведь одним копированием материала из «Википедии» на «Рувики» дело не обойдётся — нужно её переработать, о чём и говорится в статье (насчёт «обновления информации в существующих статьях»). Причём надо будет не просто обновлять старое, но и добавлять совершенно новое... Понятно, что за час, даже за год, мы не создадим полноценный аналог оригинальной «Википедии». Но если не начать дело сейчас, то в будущем оно станет ещё и ещё сложнее... Я здесь уже где-то оставлял комментарий о том, что российской творческой интеллигенции (и прочим инстанциям) крайне необходимо развиваться и создавать всё своё — у нас получится. Уверен, мы сделаем не хуже, чем на Западе, а то и вперёд вырвемся! В противном случае останемся отсталой страной/колонией в нашу неспокойную эпоху...
    • 1/0
  • Ссылка на комментарий
    Артик написал:
    Ведь одним копированием материала из «Википедии» на «Рувики» дело не обойдётся — нужно её переработать, о чём и говорится в статье (насчёт «обновления информации в существующих статьях»). Причём надо будет не просто обновлять старое, но и добавлять совершенно новое... Понятно, что за час, даже за год, мы не создадим полноценный аналог оригинальной «Википедии».
    Ну как выше отметила уважаемая Лилия Тумина, скопированными статьями никто не занимается, что и неудивительно, как уверен и в том, что и впредь этим просто будет некому заниматься. Все же на Википедию работают авторы всего мира, а в случае с «Рувики» достаточно ограниченный контингент.
    Артик написал:
    Уверен, мы сделаем не хуже, чем на Западе, а то и вперёд вырвемся! В противном случае останемся отсталой страной/колонией в нашу неспокойную эпоху...
    А зачем делать то же самое? Вот смысл? Вы на велосипеде ездите? Если да, то прекрасно и сразу следующий вопрос: вас как-то задевает, что он был придуман в Германии? С улыбкой
    При чем тут колониальная, отсталая? Придумывать надо свое! Развивать это, а не тырить идею и орать, что мы обгоним Запад. С улыбкой
    • 0/0
  • Ссылка на комментарий
    Такое впечатление, что упор делается на количественные показатели — объем, скорость. А тут нужно бы сделать упор на качество издаваемого — иначе в чем смысл «второй Вики»? Вопрос
    • 0/0
  • Ссылка на комментарий
    Роман Троцкий написал:
    Такое впечатление, что упор делается на количественные показатели — объем, скорость. А тут нужно бы сделать упор на качество издаваемого — иначе в чем смысл «второй Вики»? Вопрос
    Мне как раз-таки смысл понятен — заменить «вражеский» ресурс отечественной сетевой энциклопедией, в которой все статьи идеально бы соответствовали сегодняшнему российскому законодательству. Создатели «Рувики» наверняка прекрасно понимают, что за год-другой создать такой проект «с нуля» попросту невозможно, вот и делают упор именно на то, о чём Вы написали, а если говорить грубо — создают видимость.
    • 1/0
  • Ссылка на комментарий
    Роман Троцкий написал:
    А тут нужно бы сделать упор на качество издаваемого — иначе в чем смысл «второй Вики»?
    Такой задачи, судя по всему, не стоит вообще.
    Лилия Тумина написала:
    Мне как раз-таки смысл понятен — заменить «вражеский» ресурс отечественной сетевой энциклопедией, в которой все статьи идеально бы соответствовали сегодняшнему российскому законодательству.
    И цель уже совсем близка. В Википедии есть статья о VPN, как они работают, какие принципы работы, как используются и так далее. А это уже противоречит недавно вступившему в силу закону о запрету популяризации VPN. Так что блокировка Википедии уже совсем рядом.
    • 0/0
  • Ссылка на комментарий
    за последние восемь лет «Википедия» ушла далеко вперёд. Каждая статья состоит из нескольких составляющих — текст, изображения и формализованные данные, которые неразрывно сплетены со статьёй
    Да, начало бурное было у «Рувики», а о главном-то по сути — о поддержке и развитии, основанном на этой поддержке, в смысле обеспечения механизма «апгрейда», обновления и правок статей — и позабыли. В Википедии этот механизм сформировался практически естественным образом, так как не было необходимости «в кратчайшие сроки» внедрить свой сетевой ресурс, да ещё и не уступающий западному... Да вот, как и написала Лилия, получается «видимость», хотя я бы употребил термин «поверхностность».
    • 0/0
  • Ссылка на комментарий
    arthy написал:
    В Википедии этот механизм сформировался практически естественным образом, так как не было необходимости «в кратчайшие сроки» внедрить свой сетевой ресурс, да ещё и не уступающий западному...
    Если на китайский макет авто налепить наклейку «Москвич», то он не станет от этого автомобилем, тем более отечественным. Так и тут.
    • 0/0