Wikipédia v ohrození: Ničí ju tento nešvár, veľa Slovákov to podporuje a nič netušia

Autor: Peter Steigauf Čítanie na 3 min.

Slobodná encyklópedia čelí obrovskému riziku

Mnoho modelov umelej inteligencie (AI) obľúbených aj u Slovákov používa na tréning voľne dostupnú, takzvanú slobodnú encyklopédiu Wikipédia. Tým pádom sa však ocitá v ohrození jej spoľahlivá dostupnosť pre ľudí, uvádza heise.de.

Od začiatku roka 2024 zaznamenala Wikimedia Foundation prudký nárast prístupov k obrázkom a videám na platforme Wikimedia Commons. Tento projekt obsahuje 144 miliónov súborov, ktoré zhromaždili dobrovoľníci. Používajú sa napríklad na ilustrovanie článkov na Wikipédii.

Tieto obrázky majú voľnú licenciu, čo znamená, že na ne neexistuje autorské právo. Práve preto sú mimoriadne obľúbené na tréning modelov AI. To sa však stalo vážnym problémom.

Problémy s hromadným sťahovaním

Zásadne zvýšený prenos údajov je spôsobený hlavne automatizovanými požiadavkami, medzi ktoré patria boty, API prístupy a rôzne príkazy na hromadné sťahovanie. Nadácia Wikimedia Foundation kritizuje, že tieto požiadavky neprinášajú nových čitateľov na Wikipédiu. Súborové servery však napriek tomu extrémne zaťažujú.

V oznámení zo stredy nadácia uviedla: „Naša infraštruktúra je navrhnutá tak, aby zvládala náhle špičky v premávke spôsobené ľudskými používateľmi počas dôležitých udalostí. Objem generovaný botmi má však bezprecedentný rozsah a predstavuje rastúcu hrozbu a náklady.“

Vyťažujú im servery

Veľkú časť zdrojov Wikimedia zhltnú požiadavky AI, ktoré neprichádzajú od reálnych ľudí. Nielenže je tak Wikipédia v ohrození kvôli nadmernému zaťaženiu serverov, ale zároveň menej IT kapacít zostáva pre skutočných používateľov, napríklad pri sledovaní volebných výsledkov v Spojených štátoch alebo v prípade úmrtia globálne známej osobnosti.

Wikipédia v ohrození
Zdroj: Pexels

Celosvetová sieť serverov Wikimedia prevádzkuje globálnu sieť serverov, ktorá zabezpečuje rýchly prístup k Wikipédii v rôznych častiach sveta. Ak je niektorý článok často navštevovaný, Wikipédia ho dočasne uloží na serveri nachádzajúcom sa najbližšie k používateľovi. Ak sa naopak článok dlhšie neotvoril, jeho obsah sa musí stiahnuť zo vzdialenejšieho, centrálneho servera.

Kým ľudskí používatelia majú tendenciu vyhľadávať určité populárne témy, boty systematicky prechádzajú tisíce článkov vrátane tých málo čitaných. To značne zaťažuje servery a zvyšuje náklady na prevádzku.

Wikipédia v ohrození kvôli nákladom

65 % z celkového prenosu dát na Wikipédii spôsobujú rozličné boty „pracujúce“ pre AI. Zároveň však tvoria iba 35 % z celkového počtu zobrazení stránok. Wikimedia Foundation musí blokovať agresívne hromadné sťahovanie, aby zabránila negatívnemu vplyvu na dostupnosť Wikipédie pre bežných čitateľov.

„Ak naše obsahy miznú v systémoch umelej inteligencie bez uvedenia zdroja alebo odkazu, predstavuje to pre nás akútny problém. V dlhodobom horizonte však bude tento problém doliehať aj na samotné systémy umelej inteligencie, pretože ich existencia závisí od nás a od našej schopnosti tvoriť kvalitný obsah,“ vysvetlil Lane Becker z Wikimedia Foundation.

Wikipédia patrí medzi najnavštevovanejšie webové stránky sveta. Neobsahuje reklamy, financujú ju dary. Becker dúfa, že spoločnosti v oblasti umelej inteligencie budú v konečnom dôsledku prispievať na jej zachovanie, či už formou priameho financovania alebo iných dohôd.

✅ Odporúčané pre teba

🔥 Najnovšie príspevky zo skriptu

Vážna chyba v iOS. Apple aktualizuje aj 11-ročné iPhony

Autor: Slavomír Dzuričko

Na chybu upozornil bezpečnostný tím Googlu Spoločnosť Apple vydala bezpečnostnú aktualizáciu systému iOS, ktorá opravuje zraniteľnosť odhalenú expertmi z tímu…

Google Mapy ukázali historicky najväčšie vylepšenie. Zmenil sa spôsob, akým používate mapy

Autor: Slavomír Dzuričko

Navigácia dostáva 3D pohľad na reálny svet Navigačná aplikácia Google Mapy dostáva výraznú aktualizáciu, ktorá mení spôsob, akým vodiči používajú mapy…

Tisíce Slovákov zostanú bez peňazí: Veľká banka ohlásila výpadok

Autor: Kristína Sudorová

Bankomaty nepôjdu a George sa odmlčí Slovenská sporiteľňa upozornila svojich klientov na plánovanú technickú odstávku viacerých bankových služieb, ktorá sa uskutoční…

Musk im dal internet, novinári z nich urobili závislákov na porne. Teraz žalujú New York Times o 180 miliónov

Autor: Slavomír Dzuričko

Príbeh o Starlinku, médiách a miliardovej žalobe Hlboko v brazílskom pralese, ďaleko od miest, ciest a moderného sveta, žije približne…

Všetky notebooky zdražejú o 40 % a prsty v tom má aj Intel

Autor: Peter Hodal

Technologický trh sa pripravuje na ďalší nepríjemný scenár. Po prvých signáloch o zdražovaní smartfónov a pamäťových čipov prichádza varovanie aj…

Totálny fenomén. Netflix vytiahol megahit, iba jeden film je tento rok sledovanejší

Autor: Erik Košťany

Film Vojnové monštrum strhol divákov Netflix 6. marca pridal do ponuky novinku s produkcie s názvom Vojnové monštrum. Ide o…