Škandál jednej z najväčších tech firiem sveta. Revolučnú AI trénuje cez torrenty

Autor: Peter Čítanie na 3 min.

Zuckerberg o tom vedel

Spoločnosť Meta, materská firma Facebooku, sa ocitla uprostred rozsiahleho súdneho sporu kvôli používaniu pirátskych kníh pri trénovaní svojich modelov umelej inteligencie. Autori spoločnosť obviňujú z masívneho porušovania autorských práv, čo otvára diskusiu o etike a legálnosti využívania dát v technologickom sektore.

Podľa súdnych dokumentov získala Meta cez torrenty minimálne 81,7 terabajtu textov, vrátane známych pirátskych knižníc Z-Library a LibGen. Viac ako 35,7 terabajtu pochádzalo z pirátskych zdrojov. Navyše, už v minulosti získala Meta z LibGen viac ako 80 terabajtov dát. Spoločnosť tvrdí, že ide o legálnu prax spadajúcu pod „fair use,“ no žalobcovia upozorňujú, že aj malé množstvo takto získaných dát môže viesť k trestnému vyšetrovaniu.

Aj interné e-maily odhalili, že niektorí zamestnanci Mety mali vážne etické pochybnosti. Nikolay Bashlykov, výskumný inžinier spoločnosti, označil torrentovanie pirátskych kníh za neetické a právne rizikové. Meta sa údajne tieto aktivity snažila zakryť. Spoločnosť nepoužívala servery Facebooku, aby zabránila spätnému vystopovaniu. Torrentovací klienti boli nastavení tak, aby minimalizovali zdieľanie dát do výmenných sietí.

Meta AI
Zdroj: ChatGPT

Dokumenty tiež naznačujú, že o používaní pirátskych dát vedel aj samotný šéf spoločnostiMark Zuckerberg. To však protirečí jeho predchádzajúcim tvrdeniam, že s tými nemal nič spoločné. Táto skutočnosť vrhá tiež na obranu Mety v súdnom procese, kde autori rozšírili teóriu distribúcie o tvrdenie, že Meta nelegálne „seedovala“ pirátske knihy.

Meta nie je jediná, má to širší súvis

Meta však nie je vôbec jediná firma, ktorá čelí podobným obvineniam. Autori a autorky (napríklad Paula Tremblaye či Sarah Silverman) žalujú aj spoločnosti OpenAI, Nvidia a Databricks za používanie pirátskych kníh na trénovanie svojich modelov umelej inteligencie. Tento spor odhaľuje širší problém v technologickom sektore, kde firmy čerpajú dáta z neoverených zdrojov. Paradoxom je tiež to, že OpenAI nedávno obvinila čínsky DeepSeek z toho, že trénovala svoju AI na jej výstupoch, čím porušila pravidlá používania.

Slováci môžu dnes zo spomínaných nástrojov umelej inteligencie využívať ChatGPT aj DeepSeek, populárny je aj nástroj Gemini od Googlu. Meta AI na Slovensku a v krajinách Európskej únie zatiaľ dostupná nie je, dôvodom sú regulačné nejasnosti týkajúce sa práve používania dát na trénovanie AI modelov.

 

✅ Odporúčané pre teba

🔥 Najnovšie príspevky zo skriptu

Markíza čelí sankciám. Na rane sú aj ďalší veľkí hráči – čo sa stalo?

Autor: Kristína Sudorová

Veľký problém nielen pre Markízu Rada pre mediálne služby (RpMS) upozornila na porušovanie pravidiel v slovenskom mediálnom prostredí. Na svojom…

Toto je vraj jediný zaručený znak, ktorý prezradí, že text písala AI

Autor: Slavomír Dzuričko

AI znak alebo dlhá pomlčka? S rastúcou popularitou generatívnej umelej inteligencie sa čoraz častejšie objavujú snahy rozpoznať, či text napísal…

Udalosť storočia. Vedci objavili obrovský kráter na Mesiaci

Autor: Peter Hodal

Vedci pri bežnej analýze dát zo sondy Lunar Reconnaissance Orbiter narazili na niečo, čo sa síce na Mesiaci deje neustále,…

Samsung má oficiálne AirDrop. Android a iPhone sú bližšie ako kedykoľvek predtým

Autor: Slavomír Dzuričko

Samsung má podporu AirDropu Dlhé roky patrilo jednoduché bezdrôtové posielanie súborov medzi zariadeniami medzi hlavné výhody ekosystému Apple. Funkcia AirDrop…

Slováci neveria vlastným očiam: Obľúbená značka smartfónov odchádza z Európy

Autor: Kristína Sudorová

Balí kufre Budúcnosť jednej z najznámejších značiek smartfónov na svete je momentálne zahalená neistotou. Spoločnosť OnePlus, ktorá si vybudovala silné…

Nemožné realitou. Vedci z CERN naložili antihmotu do kamióna

Autor: Peter Hodal

Vedci z CERNu dosiahli prelom, ktorý znie skôr ako sci-fi než realita. V rámci experimentu BASE sa im po prvýkrát podarilo…