Э

Мир энциклопедий

encyclopedia.ru

Иммунная система Википедии

Иммунная система Википедии
  • 9 мая 2012
  • просмотров 5968
  • комментариев 11

Мир энциклопедий. Русский перевод статьи «Боты и киборги: Иммунная система Википедии» (Bots and Cyborgs: Wikipedia's Immune System) из издания Computer, опубликованный в журнале «Открытые системы».

Боты и киборги — это не просто инструменты, помогающие поддерживать высокое качество статей в Википедии: взаимодействуя с людьми, они фундаментально меняют саму культуру онлайн-энциклопедии.

В пер­вые годы после рож­де­ния Ви­ки­пе­дии (Wikipedia), когда ко­ли­че­ство ее ак­тив­ных ав­то­ров ис­чис­ля­лось де­сят­ка­ми или сот­ня­ми, доб­ро­воль­ные ре­дак­то­ры вполне справ­ля­лись с управ­ле­ни­ем кон­тен­том эн­цик­ло­пе­дии и про­ис­хо­дя­щи­ми в ней про­цес­са­ми. Сей­час ре­дак­то­ры-ста­ро­жи­лы с но­сталь­ги­ей вспо­ми­на­ют те без­мя­теж­ные дни, когда эн­цик­ло­пе­дия раз­ви­ва­лась мед­лен­но, и один че­ло­век мог за счи­тан­ные ми­ну­ты про­ве­рить все из­ме­не­ния, по­сту­пив­шие за день. Идил­лия за­кон­чи­лась в 2004 году, когда на­чал­ся экс­по­нен­ци­аль­ный рост числа новых ав­то­ров и ста­тей, а сама эн­цик­ло­пе­дия при­влек­ла вни­ма­ние по­пу­ляр­ных СМИ. В 2007 году, на ко­то­рый при­шел­ся пик роста, в Ви­ки­пе­дию вно­си­лось уже боль­ше 180 пра­вок в минуту.

С одной сто­ро­ны, эн­цик­ло­пе­дия ис­пы­ты­ва­ла бур­ный при­ток жиз­нен­ной силы — доб­ро­воль­ных поль­зо­ва­те­лей, а с дру­гой, ре­дак­то­ры уже не справ­ля­лись с про­вер­кой всех из­ме­не­ний. Все свое время они тра­ти­ли, следя за тем, чтобы не было на­ру­ше­ний ав­тор­ских прав, кле­вет­ни­че­ских ста­тей и ван­да­лиз­ма, и на кон­троль всех по­сту­па­ю­щих пра­вок вре­ме­ни уже не оставалось.

Для ре­ше­ния этой про­бле­мы участ­ни­ка­ми поль­зо­ва­тель­ско­го со­об­ще­ства «Ви­ки­пе­дии» были со­зда­ны два про­грамм­ных ин­стру­мен­та: ро­бо­ты, или боты , и ки­бор­ги. Боты ав­то­ма­ти­че­ски вы­пол­ня­ют стан­дарт­ные за­да­ния, на­при­мер, SpellCheckerBot ис­прав­ля­ет ошиб­ки пра­во­пи­са­ния. Ки­бор­ги же пред­став­ля­ют собой «умные» поль­зо­ва­тель­ские ин­тер­фей­сы, по­мо­га­ю­щие ре­дак­то­рам быст­рее при­ни­мать ре­ше­ния, — на­при­мер, ки­борг Huggle за­ни­ма­ет­ся мас­со­вым уда­ле­ни­ем пра­вок, вно­си­мых вандалами.

Вме­сте боты и ки­бор­ги со­став­ля­ют первую линию за­щи­ты в «им­мун­ной си­сте­ме» Ви­ки­пе­дии.

Борь­ба с вандализмом

По­жа­луй, лучше всего спо­соб­но­сти ботов и ки­бор­гов про­яв­ля­ют­ся в борь­бе с ван­да­лиз­мом в Ви­ки­пе­дии — с ро­стом аудитории эн­цик­ло­пе­дии в 2004–2007 годах, по­ми­мо цен­ных до­пол­не­ний, в нее устре­мил­ся поток неумест­но­го кон­тен­та и ван­даль­ских пра­вок, с ко­то­рым труд­но спра­вить­ся без автоматизации.

Ран­ние инструменты

Пер­вы­ми ин­стру­мен­та­ми, прин­ци­пи­аль­но из­ме­нив­ши­ми борь­бу с ван­да­лиз­мом в Ви­ки­пе­дии, стали AntiVandalBot и VandalProof. Пер­вый с по­мо­щью неслож­но­го на­бо­ра пра­вил и эв­ри­стик сле­дит за из­ме­не­ни­я­ми, вно­си­мы­ми в ста­тьи, вы­яв­ля­ет самые оче­вид­ные про­яв­ле­ния ван­да­лиз­ма и ав­то­ма­ти­че­ски от­ме­ня­ет их. Бла­го­да­ря этому боту участ­ни­ки со­об­ще­ства Ви­ки­пе­дии впер­вые смог­ли за­щи­щать эн­цик­ло­пе­дию от по­вре­жде­ния без за­трат вре­ме­ни и сил ре­дак­то­ров. Од­на­ко AntiVandalBot мог предот­вра­щать лишь самые во­пи­ю­щие слу­чаи вандализма.

VandalProof — пер­вый ки­борг — пред­став­лял собой на­пи­сан­ный на Visual Basic гра­фи­че­ский ин­тер­фейс, с по­мо­щью ко­то­ро­го упол­но­мо­чен­ные ре­дак­то­ры могли прак­ти­че­ски в ре­аль­ном вре­ме­ни сле­дить за прав­ка­ми ста­тей и одним щелч­ком от­ме­нять неже­ла­тель­ные из­ме­не­ния. VandalProof до­пол­нял AntiVandalBot и его на­след­ни­ков: явные об­раз­цы ван­да­лиз­ма он остав­лял ботам, а на осталь­ное ука­зы­вал ре­дак­то­рам, ко­то­рые вруч­ную от­ме­ня­ли правки.

Так­со­но­мия ботов Ви­ки­пе­дии

Ро­бо­ты в Ви­ки­пе­дии имеют ши­ро­кий круг обя­зан­но­стей, в числе ко­то­рых встав­ка све­де­ний из от­кры­тых ис­точ­ни­ков, мо­ни­то­ринг и мо­де­ри­ро­ва­ние кон­тен­та, рас­ши­ре­ние воз­мож­но­стей движ­ка MediaWiki и за­щи­та эн­цик­ло­пе­дии от вре­до­нос­ной деятельности.

Пер­вые боты встав­ля­ли в ста­тьи Ви­ки­пе­дии све­де­ния из об­ще­до­ступ­ных баз дан­ных — на­при­мер, Rambot, ко­то­ро­го счи­та­ют пер­вым «офи­ци­аль­ным» ро­бо­том эн­цик­ло­пе­дии, до­бав­лял све­де­ния из пе­ре­пи­сей на­се­ле­ния в ста­тьи о стра­нах и го­ро­дах. Rambot и его «род­ствен­ни­ки» дей­ству­ют по прин­ци­пу «си­ло­во­го под­креп­ле­ния», вы­пол­няя по­вто­ря­ю­щи­е­ся дей­ствия сотни тысяч раз в минуту.

Ряд дру­гих ботов от­ве­ча­ют за мо­ни­то­ринг и кор­рек­ти­ров­ку кон­тен­та Ви­ки­пе­дии. Так, SpellCheckerBot про­ве­ря­ет све­жие прав­ки на ошиб­ки пра­во­пи­са­ния, поль­зу­ясь меж­ду­на­род­ным сло­ва­рем, чтобы предот­вра­тить слу­чай­ные ис­прав­ле­ния верно на­пи­сан­ных ино­стран­ных слов, а Helpful Pixie Bot ис­прав­ля­ет но­ме­ра ISBN и дру­гие струк­тур­ные осо­бен­но­сти ста­тей, например, рас­став­ля­ет за­глав­ные буквы в на­зва­ни­ях раз­де­лов. Самый боль­шой класс ку­ра­то­ров кон­тен­та — межъ­язы­ко­вые боты, ко­то­рые с по­мо­щью гра­фо­вых мо­де­лей свя­зей между раз­ны­ми язы­ка­ми Ви­ки­пе­дии вы­яв­ля­ют недо­ста­ю­щие ссыл­ки между ста­тья­ми по одной и той же теме. Когда пи­са­лась эта ста­тья, в ан­гло­языч­ном раз­де­ле Ви­ки­пе­дии дей­ство­ва­ло более 60 межъ­язы­ко­вых ботов.

Неко­то­рые боты рас­ши­ря­ют функ­ци­о­наль­ность Ви­ки­пе­дии, ре­а­ли­зуя функ­ции, ко­то­рых нет в движ­ке MediaWiki, на­при­мер AIV Helperbot упро­ща­ет ра­бо­ту ад­ми­ни­стра­то­ров с со­об­ще­ни­я­ми о пред­по­ло­жи­тель­ных ван­да­лах, а SineBot сле­дит, чтобы каж­дый раз­ме­щен­ный ком­мен­та­рий был под­пи­сан и имел дату.

На­ко­нец, ряд ботов за­щи­ща­ют эн­цик­ло­пе­дию от вре­до­нос­ной де­я­тель­но­сти: на­при­мер ClueBot_NG с по­мо­щью самых со­вре­мен­ных ме­то­дов ма­шин­но­го обу­че­ния про­ве­ря­ет все прав­ки ста­тей для предот­вра­ще­ния ван­да­лиз­ма, а XLinkBit от­ме­ня­ет прав­ки, со­дер­жа­щие ссыл­ки на до­ме­ны из чер­ных спис­ков, тем самым про­ти­во­стоя спамерам.

Со­вре­мен­ные инструменты

Несколь­ко лет тому назад, после смены мно­гих по­ко­ле­ний, боты и ки­бор­ги стали более мощ­ны­ми, точ­ны­ми и дру­же­ствен­ны­ми к поль­зо­ва­те­лю. И те­перь, как видно из рис. 1, эти ин­стру­мен­ты иг­ра­ют все боль­шую роль в под­дер­жа­нии ка­че­ства ста­тей Ви­ки­пе­дии.

Вме­сто AntiVandalBot с его про­сты­ми пра­ви­ла­ми и неслож­ной эв­ри­сти­кой се­год­ня ис­поль­зу­ет­ся ClueBot_NG — вы­со­ко­точ­ный ме­ха­низм на ос­но­ве ней­ро­се­ти и тех­но­ло­гии ма­шин­но­го обу­че­ния: ре­дак­то­ры ука­зы­ва­ют ки­бор­гу на со­вер­ша­е­мые им ошиб­ки, а раз­ра­бот­чи­ки пе­ри­о­ди­че­ски пе­ре­обу­ча­ют его клас­си­фи­ка­тор. Вме­сто VandalProof те­перь при­ме­ня­ет­ся Huggle с более со­вре­мен­ным поль­зо­ва­тель­ским ин­тер­фей­сом, вы­со­кой на­стра­и­ва­е­мо­стью и ин­тел­лек­ту­аль­ной си­сте­мой сор­ти­ров­ки пра­вок по сте­пе­ни ве­ро­ят­но­сти ван­да­лиз­ма. Huggle поз­во­ля­ет об­ра­ба­ты­вать об­раз­цы ван­да­лиз­ма, ко­то­рые не «от­лав­ли­ва­ет» ClueBot_NG.

Соотношение отмены вандальских правок ботами, киборгами и редакторами-людьми в Википедии

Рис. 1. Соотношение отмены вандальских правок ботами, киборгами и редакторами-людьми в Википедии. Роль ботов и киборгов в защите статей от повреждения растет с начала 2006 года

Рас­пре­де­лен­ное опознавание

Се­год­ня, бла­го­да­ря ClueBot_NG и ки­бор­гу Huggle, ра­бо­та­ю­ще­му в связ­ке с лю­дь­ми, боль­шин­ство актов ван­да­лиз­ма вы­яв­ля­ет­ся и от­ме­ня­ет­ся еще до того, как их за­ме­тит ре­дак­тор или чи­та­тель. Од­на­ко ско­рость и эф­фек­тив­ность, с ко­то­ры­ми эти ин­стру­мен­ты справ­ля­ют­ся с ин­ди­ви­ду­аль­ны­ми раз­ру­ши­тель­ны­ми прав­ка­ми, это лишь один из ас­пек­тов стра­те­гии борь­бы с ван­да­лиз­мом в Ви­ки­пе­дии. Стю­арт Гей­гер и Дэвид Райбс в ста­тье “The Work of Sustaining Order in Wikipedia: The Banning of a Vandal” от­ме­ча­ют, что боты и ки­бор­ги об­ра­зу­ют «рас­пре­де­лен­ную си­сте­му опо­зна­ва­ния», при­дав­шую новый облик про­цес­су вы­яв­ле­ния и уда­ле­ния дей­ствий ван­да­лов. Боты и ки­бор­ги, ра­бо­тая неза­ви­си­мо друг от друга, «об­ра­ба­ты­ва­ют каж­дую вре­до­нос­ную прав­ку через со­ци­аль­ную ин­фра­струк­ту­ру, в ре­зуль­та­те чего ад­ми­ни­стра­то­ры и ре­дак­то­ры опо­зна­ют ван­да­лов». Дру­ги­ми сло­ва­ми, боты и ки­бор­ги Ви­ки­пе­дии ав­то­ма­ти­че­ски ре­ги­стри­ру­ют все дей­ствия ре­дак­то­ров-но­вич­ков, что поз­во­ля­ет быст­ро и эф­фек­тив­но иден­ти­фи­ци­ро­вать ван­да­лов, бло­ки­ро­вать их де­я­тель­ность и тем самым со­зда­вать «им­му­ни­тет» к даль­ней­шим по­пыт­кам повреждения.

Со­ци­а­ли­за­ция ботов

Боты вы­пол­ня­ют прав­ки в сотни раз быст­рее, чем люди, но они также могут на­но­сить мас­со­вый ущерб неумест­ны­ми дей­стви­я­ми из-за оши­бок в коде либо из-за того, что ав­то­ры бота не учли по­же­ла­ний дру­гих участ­ни­ков со­об­ще­ства. Чтобы предот­вра­тить воз­ник­но­ве­ние таких про­блем, участ­ни­ки груп­пы Bot Approvals Group про­ве­ря­ют все пред­ло­же­ния о со­зда­нии новых ботов и рас­смат­ри­ва­ют жа­ло­бы на дей­ствия су­ще­ству­ю­щих. По мне­нию Гей­ге­ра, ре­дак­то­ры Ви­ки­пе­дии рас­смат­ри­ва­ют боты не толь­ко как ин­стру­мен­ты или сред­ства си­ло­во­го под­креп­ле­ния, но также в ка­че­стве участ­ни­ков со­ци­у­ма эн­цик­ло­пе­дии. От­ча­сти это свя­за­но с тем, что боты вза­и­мо­дей­ству­ют с Ви­ки­пе­ди­ей так же, как и ре­дак­то­ры-лю­ди: они ре­дак­ти­ру­ют ста­тьи и стра­ни­цы через поль­зо­ва­тель­ские ак­ка­ун­ты, а также от­прав­ля­ют и по­лу­ча­ют со­об­ще­ния, ко­то­рые для кон­тро­ля дол­жен про­чи­ты­вать че­ло­век, от­ве­ча­ю­щий за бот. Ре­дак­тор Tawker, опе­ра­тор AntiVandalBot, в 2006 году даже в шутку но­ми­ни­ро­вал свой бот на вы­бо­ры в Ар­бит­раж­ный ко­ми­тет — сво­е­го рода вер­хов­ный суд Ви­ки­пе­дии.

В ка­че­стве при­ме­ра в под­держ­ку сво­е­го мне­ния Гей­гер при­во­дит мас­со­вое воз­му­ще­ние участ­ни­ков со­об­ще­ства Ви­ки­пе­дии де­я­тель­но­стью бота HagermanBot, ко­то­рый сле­дил за ис­пол­не­ни­ем об­ще­при­ня­то­го в эн­цик­ло­пе­дии пра­ви­ла о под­пи­сы­ва­нии ком­мен­та­ри­ев, чтобы в дис­кус­си­ях не было ано­ним­ных участ­ни­ков. Бот ино­гда по ошиб­ке под­пи­сы­вал прав­ки, не яв­ляв­ши­е­ся ком­мен­та­ри­я­ми, од­на­ко недо­воль­ство вы­зы­ва­ла имен­но нор­маль­ная ра­бо­та про­грам­мы. «Мне не нра­вит­ся, что этот бот ре­дак­ти­ру­ет со­об­ще­ния на стра­ни­цах бесед без ве­до­ма и со­гла­сия их участ­ни­ков», — объ­яс­нил Sensemaker, один из ре­дак­то­ров Ви­ки­пе­дии. Пре­тен­зии к HagermanBot воз­ник­ли несмот­ря на то, что ре­дак­то­ры-лю­ди вы­пол­ня­ли те же функ­ции еще за­дол­го до его по­яв­ле­ния. В дис­кус­сии о том, сле­ду­ет ли поз­во­лить HagermanBot про­дол­жать ра­бо­ту, ав­то­ри­тет­ный ре­дак­тор и ад­ми­ни­стра­тор Рич Фарм­б­ро предо­сте­рег поль­зо­ва­те­лей от «бо­то­фо­бии», об­ра­тив вни­ма­ние, что боты ведут себя лучше, чем люди. Таким об­ра­зом, боты до ка­кой-то сте­пе­ни стали участ­ни­ка­ми со­ци­у­ма он­лайн-эн­цик­ло­пе­дии, по­это­му при­ш­лось ис­кать спо­со­бы их мир­но­го со­су­ще­ство­ва­ния с редакторами-людьми.

Про­бле­ма HagermanBot была ре­ше­на при по­мо­щи ме­ха­низ­ма от­ка­за от ис­поль­зо­ва­ния (opt-out) — ре­дак­тор может при­ка­зать боту не под­пи­сы­вать его прав­ки путем из­ме­не­ния со­от­вет­ству­ю­щей на­строй­ки в про­фи­ле. Со вре­ме­нем ме­ха­низм opt-out стал во­пло­ще­ни­ем вто­ро­го за­ко­на ро­бо­то­тех­ни­ки Ай­зе­ка Ази­мо­ва — робот дол­жен под­чи­нять­ся всем при­ка­зам, ко­то­рые ему от­да­ет человек.

Мо­ти­ва­ци­он­ные ас­пек­ты киборгов

Huggle, один из самых по­пу­ляр­ных ан­ти­ван­даль­ных ин­стру­мен­тов ре­дак­ти­ро­ва­ния в Ви­ки­пе­дии, на­пи­сан на C#.NET, и любой поль­зо­ва­тель может ска­чать и уста­но­вить его. С по­мо­щью Huggle ре­дак­то­ры могут от­ме­нять из­ме­не­ния, но, учи­ты­вая ши­ро­ту воз­мож­но­стей ин­стру­мен­та, раз­ре­ше­ние на от­ме­ну предо­став­ля­ет­ся толь­ко ад­ми­ни­стра­то­рам и при­ви­ле­ги­ро­ван­ным пользователям.

Фильтрация в пользовательском интерфейсе программы Huggle

Рис. 2. С помощью пользовательского интерфейса Huggle можно просмотреть серию последних правок путем их фильтрации в соответствии с пользовательскими настройками

Huggle упро­ща­ет про­смотр серии по­след­них пра­вок, поз­во­ляя филь­тро­вать их в со­от­вет­ствии с поль­зо­ва­тель­ски­ми на­строй­ка­ми. На рис. 2 слева по­ка­зан спи­сок недав­них пра­вок, от­сор­ти­ро­ван­ных по сте­пе­ни ве­ро­ят­но­сти ван­да­лиз­ма. При вы­бо­ре одной из пра­вок она ис­че­за­ет из спис­ка у осталь­ных поль­зо­ва­те­лей Huggle, чтобы сни­зить риск кон­флик­та. В пра­вой части экра­на вы­де­ле­ны из­ме­не­ния вы­бран­ной прав­ки: зе­ле­ным обо­зна­чен до­бав­лен­ный кон­тент, жел­тым — уда­лен­ный. Число у пра­во­го края над прав­кой (+6128) — это ко­ли­че­ство до­бав­лен­ных слов (или уда­лен­ных, когда оно от­ри­ца­тель­ное). Ввер­ху спра­ва отоб­ра­жа­ет­ся ско­рость ра­бо­ты поль­зо­ва­те­ля (в дан­ном слу­чае в ми­ну­ту он про­смат­ри­ва­ет 92 прав­ки и де­ла­ет че­ты­ре от­ме­ны). При от­сут­ствии ин­фор­ма­ции о ка­че­стве ре­дак­тор­ской ра­бо­ты поль­зо­ва­те­лей этот «счет» по­ощ­ря­ет к тому, чтобы уве­ли­чи­вать ча­сто­ту отмен. Этой же цели слу­жит про­сто­та от­ме­ны: когда поль­зо­ва­тель на­жи­ма­ет на боль­шую крас­ную кноп­ку с вос­кли­ца­тель­ным зна­ком ввер­ху слева, Huggle от­ме­ня­ет отоб­ра­жа­е­мую прав­ку и пе­ре­да­ет пред­по­ло­жи­тель­но­му ван­да­лу уве­дом­ле­ние о недо­стой­ном поведении.

Неко­то­рые участ­ни­ки со­об­ще­ства Ви­ки­пе­дии по­ла­га­ют, что эти мо­ти­ва­ци­он­ные меры за­хо­дят слиш­ком да­ле­ко, пре­вра­щая эн­цик­ло­пе­дию, ско­рее, в игру, чем в се­рьез­ный про­ект. В самой Ви­ки­пе­дии даже есть ста­тья, утвер­жда­ю­щая, что он­лайн-эн­цик­ло­пе­дия пре­вра­ти­лась в мно­го­поль­зо­ва­тель­скую ро­ле­вую игру с «мон­стра­ми» (ван­да­ла­ми), ко­то­рых нужно по­беж­дать, во­ору­жив­шись «опы­том» (ко­ли­че­ством пра­вок или отмен), ко­то­рый необ­хо­ди­мо за­ра­ба­ты­вать, и «по­ве­ли­те­ля­ми» (ад­ми­ни­стра­то­ра­ми), ко­то­рым сле­ду­ет подчиняться.

Свой путь

Боты и ки­бор­ги стали неотъ­ем­ле­мой ча­стью не толь­ко ан­гло­языч­но­го раз­де­ла Ви­ки­пе­дии, но и прак­ти­че­ски всех про­ек­тов, по­стро­ен­ных на движ­ке MediaWiki, и рус­ско­языч­ный раз­дел не стал ис­клю­че­ни­ем — он также в зна­чи­тель­ной сте­пен­ни об­слу­жи­ва­ет­ся бо­та­ми и ки­бор­га­ми. При­бли­зи­тель­ное со­от­но­ше­ние ко­ли­че­ства пра­вок, сде­лан­ных поль­зо­ва­те­ля­ми вруч­ную, поль­зо­ва­те­ля­ми, осна­щен­ны­ми ин­стру­мен­та­ми мас­со­во­го ре­дак­ти­ро­ва­ния, и управ­ля­е­мы­ми ре­дак­то­ра­ми про­грамм­ны­ми па­кет­ны­ми про­цес­са­ми при­мер­но оди­на­ко­вое во всех круп­ных язы­ко­вых раз­де­лах Ви­ки­пе­дии. Дви­жок MediaWiki снаб­жен есте­ствен­ным при­клад­ным про­грамм­ным ин­тер­фей­сом, поз­во­ля­ю­щим до­ста­точ­но эф­фек­тив­но ав­то­ма­ти­зи­ро­вать мно­гие мас­со­вые опе­ра­ции, по­это­му со­зда­ние ботов и ин­стру­мен­та­рия ки­бор­гов — за­да­ча про­стая и хо­ро­шо фор­ма­ли­зу­е­мая. Боль­шин­ство прак­ти­ку­ю­щих раз­ра­бот­чи­ков ботов ис­поль­зу­ют про­грамм­ный ин­тер­фейс pywikipedia для Python, а самый по­пу­ляр­ный ин­стру­мент ки­бор­га — это AutoWikiBrowser, тогда как Huggle ис­поль­зу­ет­ся реже.

Вме­сте с тем надо от­ме­тить, что не все­гда одни и те же за­да­чи раз­ные язы­ко­вые раз­де­лы ре­ша­ют од­ни­ми и теми же сред­ства­ми, и в этом смыс­ле невер­но го­во­рить о фун­да­мен­таль­ной роли ботов в обес­пе­че­нии ста­биль­но­сти про­ек­та Ви­ки­пе­дии. На­при­мер, в рус­ском и немец­ком раз­де­лах не за­пу­ще­но ни од­но­го ан­ти­ван­даль­но­го бота, од­на­ко про­бле­ма на­ме­рен­ной порчи со­дер­жи­мо­го ре­ша­ет­ся не менее эффективно.

На­стра­и­ва­е­мые ад­ми­ни­стра­то­ра­ми эв­ри­сти­че­ские филь­тры, ре­а­ли­зо­ван­ные движ­ком MediaWiki, поз­во­ля­ют не про­пус­кать зна­чи­тель­ную часть вре­до­нос­ных пра­вок еще на этапе за­пи­си из­ме­не­ния, а ав­то­ма­ти­че­ская по­мет­ка со­мни­тель­ных мо­ди­фи­ка­ций поз­во­ля­ет опыт­ным ре­дак­то­рам и ад­ми­ни­стра­то­рам прак­ти­че­ски мгно­вен­но об­на­ру­жи­вать и от­ка­ты­вать по­дав­ля­ю­щую часть ван­да­лиз­ма. Ко­неч­но, ан­ти­ван­даль­ный робот уви­дит и от­ло­вит из­ме­не­ния еще рань­ше, но за ним все равно нужен че­ло­ве­че­ский при­смотр: на­при­мер, он не раз­об­ла­ча­ет самый опас­ный и под­лый ван­да­лизм — на­ме­рен­ное ис­ка­же­ние информации.

Еще один при­ве­ден­ный в ста­тье при­мер функ­ции для бота — ис­прав­ле­ние часто встре­ча­ю­щих­ся ор­фо­гра­фи­че­ских оши­бок. У рус­ско­го раз­де­ла и здесь име­ет­ся свое ре­ше­ние — ав­то­кор­рек­ция ор­фо­гра­фии ре­а­ли­зо­ва­на во­об­ще без при­вле­че­ния ботов и ки­бор­гов, а вы­пол­ня­ет­ся при по­мо­щи кноп­ки в окне ре­дак­ти­ро­ва­ния, вы­зы­ва­ю­щей сце­на­рий на JavaScript, ко­то­рый ис­прав­ля­ет наи­бо­лее ти­пич­ные ор­фо­гра­фи­че­ские ошиб­ки на ос­но­ве базы зна­ний, по­пол­ня­е­мой всеми участ­ни­ка­ми. Кроме того, дан­ный сце­на­рий за­ни­ма­ет­ся ти­по­граф­ским оформ­ле­ни­ем со­дер­жи­мо­го: рас­став­ля­ет тире, ми­ну­сы, де­фи­сы, ка­выч­ки «елоч­ки» и ка­выч­ки «лапки», апо­стро­фы, нераз­рыв­ные про­бе­лы и т. д. По­это­му с тех­ни­че­ской точки зре­ния да­ле­ко не все­гда бот можно счи­тать един­ствен­но воз­мож­ным решением.

Ан­дрей Ни­ко­ла­ен­ко (anikolaenko@​acm.​org), участ­ник рус­ско- и ан­гло­языч­ных раз­де­лов Ви­ки­пе­дии (Москва).

***

Боты и ки­бор­ги стали важ­ней­шим эле­мен­том эко­си­сте­мы Ви­ки­пе­дии. Без них в усло­ви­ях экс­по­нен­ци­аль­но­го роста числа новых поль­зо­ва­те­лей эн­цик­ло­пе­дию кон­тро­ли­ро­вать невоз­мож­но, од­на­ко боты и ки­бор­ги — это не про­сто ин­стру­мен­ты для кон­тро­ля ка­че­ства кон­тен­та. Вза­и­мо­дей­ствуя с лю­дь­ми, они фун­да­мен­таль­но ме­ня­ют саму куль­ту­ру Ви­ки­пе­дии. Так, недав­нее ис­сле­до­ва­ние по­ка­за­ло, что от­ме­ны пра­вок стали мощ­ным де­мо­ти­ви­ру­ю­щим фак­то­ром для ав­то­ров Ви­ки­пе­дии, осо­бен­но для но­вич­ков. Ин­стру­мен­ты на­по­до­бие Huggle ав­то­ма­ти­че­ски рас­по­зна­ют по­тен­ци­аль­но тре­бу­ю­щие от­ме­ны прав­ки, ра­бо­та­ют быст­ро и воз­на­граж­да­ют ре­дак­то­ров на­чис­ле­ни­ем «очков» за каж­дую от­ме­ну, обес­пе­чи­вая быст­рое и без­жа­лост­ное уда­ле­ние или кор­рек­цию кон­тен­та, уве­дом­ляя ав­то­ров об от­ме­нах лишь через ав­то­ма­ти­че­ски сге­не­ри­ро­ван­ное объ­яс­не­ние. По­это­му ис­сле­до­ва­те­ли из Уни­вер­си­те­та Мин­не­со­ты (University of Minnesota) ра­бо­та­ют с Фондом Викимедиа (Wikimedia Foundation) над со­зда­ни­ем более «ком­му­ни­ка­бель­ных» вер­сий ки­бор­гов, ко­то­рые дадут воз­мож­ность поль­зо­ва­те­лям-лю­дям стать более эф­фек­тив­ны­ми участ­ни­ка­ми со­об­ще­ства Ви­ки­пе­дии. Пред­став­ля­ет­ся весь­ма ин­те­рес­ным, какие на про­тя­же­нии сле­ду­ю­ще­го де­ся­ти­ле­тия по­явят­ся нормы вза­и­мо­дей­ствия между мил­ли­о­на­ми поль­зо­ва­те­лей-лю­дей и ты­ся­ча­ми ав­то­ма­ти­че­ских ин­стру­мен­тов в со­об­ще­стве, где и тем и дру­гим от­во­дят­ся весь­ма важ­ные роли.

Аарон Хал­фей­кер (Aaron Halfaker(halfaker@​cs.​umn.​edu) — ас­пи­рант, Джон Ридл (John Riedl(riedl@​cs.​umn.​edu) — пре­по­да­ва­тель фа­куль­те­та ком­пью­тер­ных наук и ин­же­не­рии Уни­вер­си­те­та Миннесоты.

Aaron Halfaker, John Riedl, Bots and Cyborgs: Wikipedia’s Immune System, IEEE Computer, March 2012, IEEE Computer Society. All rights reserved. Reprinted with permission.


  • Теги
  • anti-vandalism
  • bots
  • University of Minnesota
  • vandalism
  • Wikimedia Foundation
  • Wikipedia
  • Википедия
  • Уни­вер­си­те­т Мин­не­со­ты
  • борьба с вандализмом
  • боты
  • вандализм
  • киборги
  • программы
  • роботы
  • сyborgs

(Голосов: 2, Рейтинг: 3.02)

Комментарии

Предупреждение Для добавления комментариев требуется авторизация
  • Ссылка на комментарий
    Меня восхищает, как работающие в Википедии люди справляются с трудностями для того, чтобы у нас был бесплатный доступ к этой огромной энциклопедии и содержащейся в ней информации. Весь мир изменился, когда энциклопедические знания стали доступны практически мгновенно, и большинство справочников стало возможно найти в интернете. И то, что Википедии можно доверять, то, что там ведется такая работа по контролю за качеством, достойно огромного уважения. Остается только пожелать удачи этим героическим людям с их программами и энтузиазмом...
    • 0/0
  • Ссылка на комментарий
    Быть редактором — это действительно трудная работа, особенно в таком проекте как Википедия. Интересная система ботов и киборгов, что выполняют защиту от вандализма и исправляют грамматические ошибки, но я так и не встретил никакого упоминания о проверке на подлинность информации в данной энциклопедии. А учитывая ее посещаемость, это печально.
    • 0/0
  • Ссылка на комментарий
    ...Неко­то­рые участ­ни­ки со­об­ще­ства Ви­ки­пе­дии по­ла­га­ют, что эти мо­ти­ва­ци­он­ные меры за­хо­дят слиш­ком да­ле­ко, пре­вра­щая эн­цик­ло­пе­дию, ско­рее, в игру, чем в се­рьез­ный про­ект...

    Увы, похоже, это — действительно ТАК.
    А в случаях организации неких специальных акций — только ради того, чтобы оказаться в лидерах по их (правкам) количеству, это вообще может дорасти до беспредела! Со злостью
    Нет, безусловно, Вики (как и любой другой развивающийся и уважающий себя ресурс) нуждается в систематическом редактировании. И это очень хорошо, что идет работа по автоматизации выявления/исправления хотя бы самых элементарных "косяков". Ну а далее работу должны доводить до ума квалифицированные, специально обученные профессионалы. Идея
    • 0/0
  • Ссылка на комментарий
    С интересом прочитал статью. Ранее, при пользовании Википедии, не представлял насколько огромен труд по обслуживанию "живой" энциклопедии. Возникла ассоциация с айсбергом. Впервые прочитал новый термин "ботофобия".
    • 0/0
  • Ссылка на комментарий
    Этого и следовало ожидать, ещё с момента зарождения Википедии. С таким потоком информации человек не в состоянии справиться физически. Как помощь — компьютерные программы. Регулярно пользуюсь этой энциклопедией и желаю ей дальнейшего развития.
    • 0/0
  • Ссылка на комментарий
    Статья впечатлила и заставила другими глазами посмотреть на Википедию. Сколько труда стоит за тем, чтобы нам, обычным пользователям, было удобно. Все изложенное в статье напоминает фантастический рассказ, недаром упоминается имя Айзека Азимова.
    • 0/0
  • Ссылка на комментарий
    Была, есть и будет. Я о Википедии.
    В проектах с начала 2006 года (правда, несколько лет был неактивным участником).

    Все акции, в том числе критикуемые YA_HELEN, направлены на развитие конкретного раздела. Это журналисты придают такой "разворот", у них этот жанр называется "жареха". На самом деле такие акции ни в ком случае не направлены на принижение или превышение какого-то отдельного раздела. Да, дух соперничества есть. Но он здоровый. Не за счет другого, а за счет себя. Сам знаешь, помогай другим. Такой принцип.

    В самих проектах Википедия (в конечном счете) царит благоразумие. И меня учили и быть в нейтральной точке зрения, и быть корректным в общении. Эти 2 из 5 основных принципов Википедии.

    Насчет вандалов скажу, что ТВОРЯЩИХ ДОБРО БОЛЬШЕ, ЧЕМ ТВОРЯЩИХ ЗЛО. ПОЭТОМУ МЫ НЕ БОРЕМСЯ ПРОТИВ ЗЛА, МЫ ТВОРИМ ДОБРО. И ЭТО ДОБРО САМО УНИЧТОЖАЕТ ЗЛО.

    ЛЮДИ!!! ТВОРИТЕ ДОБРО, И ВАМ СТАНЕТ ЛЕГЧЕ ЖИТЬ. УВЕРЯЮ ВАС.

    ЗДОРОВЬЯ и УСПЕХОВ.
    • 0/0
  • Ссылка на комментарий
    Жаль, конечно, что люди не ценят труд других. Зачем делать эти вандальные попытки изменения контента Википедии? С одной стороны, введение ботов облегчит процедуру проверки содержимого, но с другой, все-таки это не люди, и они не смогут справиться с более изощренными вариантами вандализма.
    • 0/0
  • Ссылка на комментарий
    Интереснейшая статья. Понятно, что люди-редакторы уже давно (и не только в Википедии) не справляются с гигантскими массивами информации. Но почитать о конкретных технологиях конкретного ресурса все же очень интересно. Разве что смущает термин "киборг". Кибернетический организм в массовом сознаниии не ассоциируется с программным продуктом, скорее уж с голливудскими книгами или книгами фантастов. А вот о роли ботов как "части социума" читать смешно. Тут уж, извините, явное желание создать "сенсацию" на вечно популярную тему Искусственного Разума и противостояния людей и машин. Описанные в статье "боты и киборги" — всего лишь неодушевленные программы, выполняющие только те функции, которые заложены в них программистами-разработчиками. Какая, простите, социальная роль может быть у молотка (кофеварки или стиральной машинки с программных управлением)? Написание и использование ботов (а также скриптов, демонов и т. п.) — рутинная работа не только программистов, вебдизайнеров, системных админов, но и еще целой кучи спецов разной направленности. Понятно, что фраза "системный администратор ищет способы мирного сосуществования между людьми и киборгом (ботом)" звучит красивше, чем фраза "сисадмин настраивает антивирус и правила для файервола, а то пользователь на страницы с порнухой не попадает". И из-за вот такого журналистского пристрастия к "красивостям" и жонглирования понятиями у рядовых пользователей сплошь и рядом создается полностью неверное представление о многих информационных технологиях. Понятно, что сухим языком справочника тоже злоупотреблять не стоит, но и "ботофобия", и "мирное сосуществование" — это чересчур. Все, описанное в статье — это, извините, будни отладчика (сетевого или системного администратора) любого распространенного ПО или сетевого ресурса. Так что статье — неоспоримый плюс, а вот красивостям и преувеличениям в ней — однозначное "ФУ!"

    N. B. очень жаль, что нельзя написать скрипт (бот) на умывание, бритье и мытье полов. С улыбкой
    Увы, ни одна энциклопедия тут не поможет. Печально
    • 0/0
  • Ссылка на комментарий
    Справиться с огромными массивами информации, ежедневно поступающими в Википедию, людям уже давно не под силу. Так что именно на примере Википедии мы можем наблюдать прекрасно отлаженную работу новых технологий, которые занимают все большую и большую часть нашей жизни.
    • 0/0
  • Ссылка на комментарий
    Статья дает очень подробную информацию о ключевых моментах работы народной энциклопедии, спасибо автору. У меня вопрос, возможно кто-то из знатоков знает. Когда идет "война правок", как действует робот? Все правки отменяет, возвращает к исходному документу? Передает человеку: мол, разберитесь между собой? Под "войной правок" я имею в виду ситуацию, когда несколько авторов друг за другом ПОСТОЯННО (долгое время) вносят противоположные поправки в статью, т. е. статью все время надо проверять в новой редакции. Речь идет не об очернительстве или беспочвенных обвинениях, а о ситуации, когда дается оценка какому-либо человеку, действию, событию.
    • 0/0