Semalt: Как работи Wiki на различни езици?

Оливър Кинг, мениджърът за успех на клиентите на Semalt , казва, че Wikipedia има богат набор от данни, статии и съдържание на различни езици и редакторите се насърчават да създават липсващите статии в тази гигантска енциклопедия. Сигурно е да се каже, че Wikipedia съществува на повече от триста езика, но повечето от тях са непълни и сравнително малко. Хора от всички краища на света посещават Уикипедия ежедневно и четат нейните над 300 езикови издания. Някои от тях търсят конкретни статии и съдържание, написани от стотици до хиляди писатели доброволци, които са отговорни за изграждането и поддържането на тази известна и безплатна енциклопедия. Посетителите на Уикипедия търсят предимно статиите на английски език, а останалите езици представляват 30 милиона записа на Wiki.

Демократизирайте достъпа до знанието

За да помогнат на писателите и редакторите на различни езикови общности да оценят липсващите статии, компютърните експерти от Фондация Уикимедия и Станфорд успешно са създали някои инструменти. Една от тях помага да се идентифицират важните статии, които все още не са достъпни на определен език. След това редакторите използват тези препоръки, за да изработят нови статии. Ако редакторите и писателите са многоезични, тогава намирането на статии на втори език и превеждането им на местния език за читателите на Wikipedia е много лесно.

Така че тази система първо ще идентифицира редактора на Мадагаскар, който иска да пише на френски език, и ще поиска редактора да попълни липсващите части на статия и да я публикува в Малагасийската уикипедия. По този начин редакторите могат да създават статии за различни хора по света, което от своя страна може да повлияе на цялостното потребителско изживяване.

Изследователите на фондация Wikimedia Leila Zia и Ellery Wulczyn си сътрудничиха със студента на университета в Станфорд Робърт Уест, за да представят доклад на Международната конференция за световна уеб мрежа в Монреал. Според тях Уикипедия разполага с голямо количество данни и между нейните статии има силна връзка.

Учените започнаха да създават списъци с статии на различни езици и препращат списъците, за да установят кои статии липсват на кои езици. Тогава те оцениха значението на всички изчезнали статии въз основа на географското и културното значение. Те се стремят да публикуват липсващите статии възможно най-скоро и да ги получат по-добри.

Запушване на пропуските

Изследователите са тествали помещението с редица експерименти. Те стартираха проекта с повече от 4 милиона статии, написани на английски език и откриха, че над 1,5 милиона статии липсват в раздела за френската Уикипедия. След това експертите подбраха 300 000 важни статии на английски език и ги преведоха на френски език. Статиите бяха разделени в три основни групи от повече от 100 000 статии и бяха предадени на най-добрите и опитни редактори. В основата на експеримента бяха включени две основни групи от шест хиляди редактори и писатели, които направиха много редакции на френски и английски език в рамките на дванадесет месеца преди приключването на експеримента. През юни 2015 г. всички редактори получиха имейл, посочващ уникалните липсващи статии, и бяха помолени да преведат пълния списък с статии от английския на френския език. Един месец по-късно експертите достигнаха до създаването на липсващите артикули и откриха, че могат да увеличат процента на създаване на органични изделия. Въз основа на всички тези резултати Фондацията Wikipedia разработи някои експериментални инструменти, при които редакторите и писателите могат да намерят пропуските на техните местни езици и да се насочат към конкретни записи.

mass gmail