Уикипедианската общност и Internet Archive си партнират за поправянето на над милион неактивни препратки в Уикипедия

Автор: Tim1357. Лиценз: CC-BY-SA 3.0. Източник: Общомедия
Автор: Tim1357. Лиценз: CC-BY-SA 3.0. Източник: Общомедия

Повече от един милион доскоро „мъртви“ външни препратки в англоезичната версия на Уикипедия са били „съживени“ с техни  архивирани версии от сайта Wayback Machine. Това се случва благодарение на партньорство между организацията Internet Archive, редактори от англоезичната уики общност и Фондация Уикимедия.

Решението

Софтуерно приложение на доброволците Максимилиан Дьор и Щефан Балбах проверява дали всички препратки, сочещи извън енциклопедията, продължават да работят – понякога години след поставянето им. Ако по някаква причина някоя препратка към уебстраница вече не е активна (например, ако връща код на грешка 404 “Page Not Found”), програмата проверява за копие на уебстраницата, съхранено в архива Wayback Machine (буквално: „машина за откриване на пътя назад“), и ако в интернет архива има такова копие, софтуерът редактира статията в Уикипедия така, че връзката вече да сочи към архивното копие.

Проблемът

Необходимостта от това е очевидна: онлайн базираната енциклопедия Уикипедия съдържа милиони препратки към други онлайн базирани ресурси, които служат както за източници, доказващи фактологичната коректност на данните в статиите, така и за допълнителни материали за прочит и справки от страна на заинтересованите читатели. За да поддържа високото си качество и достоверност, Уикипедия силно зависи от обкръжаващата я интернет среда, въпреки че правилото за външните препратки в Уикипедия гласи, че те не са самоцел и енциклопедията не трябва да се превръща в списък от външни връзки, а те трябва да бъдат използвани пестеливо и само към най-уместно подбраните онлайн ресурси.

Обаче дори най-уместно подбраните препратки в един момент може да престанат да бъдат достъпни. Причините за това са разнообразни: от временен сървърен срив или неплатен навреме домейн или хостинг, през цялостно преструктуриране на съдържанието и адресацията на уебсайта, до умишлено премахнато или подправено уеб съдържание в ущърб на потребителите. Понякога щетите за енциклопедията могат да се окажат мащабни: от преструктурирането на някой по-голям уебсайт, например на водеща обществена медия, наведнъж могат да пострадат стотици статии в Уикипедия, които са съдържали препратки, сочещи към този уебсайт.

Неактивността на препратките се усеща особено остро, когато вече недостъпните външни ресурси са служили за доказателства на твърдения в Уикипедия, тъй като правят невъзможно удостоверяването на истинността на написаното. Доброволците в Уикипедия с по-голям опит обикновено знаят как да процедират с интернет архивите и да заместват тези препратки с идентичните им архивни копия, но дори и за тях автоматизираното решение на проблема е добре дошло, тъй като спестява стотици часове труд, който може да бъде вложен в създаването на ново качествено съдържание.

Предизвикателствата

Сега с този проект в англоезичната Уикипедия, повече от един милион хипервръзки вече сочат към идентични копия на липсващото уеб съдържание.  Следващите предизвикателства пред екипа са софтуерът да „съживи“ мъртвите препратки и в другите почти 300 езикови версии на Уикипедия, както и да се открие начин поставените препратки да се самообновяват, когато оригиналните ресурси станат постоянно недостъпни. Всичко това се прави в полза на читателите на Уикипедия, за много от които енциклопедията е не само първият, но понякога и единственият източник за справки по много въпроси. Но проектът е и доказателство за ползите от споделянето на ресурси и знания и от съвместната работа в един отворен свят.


Автор: Вася Атанасова
Редактор: Лъчезар Илиев

По текст на Марк Греъм от блога на Фондация Уикимедия
По проекта работят: Кенджи Нагахаши, Винай Гоел, Джон Лекашман, Марк Греъм, Максимилиан Дьор, Щефан Балбах, Фондация Уикимедия, членове на уикипедианската общност и Брюстър Кале.

Leave a Reply

Този сайт използва Akismet за намаляване на спама. Научете как се обработват данните ви за коментари.