Škandál jednej z najväčších tech firiem sveta. Revolučnú AI trénuje cez torrenty

Autor: Peter Čítanie na 3 min.

Zuckerberg o tom vedel

Spoločnosť Meta, materská firma Facebooku, sa ocitla uprostred rozsiahleho súdneho sporu kvôli používaniu pirátskych kníh pri trénovaní svojich modelov umelej inteligencie. Autori spoločnosť obviňujú z masívneho porušovania autorských práv, čo otvára diskusiu o etike a legálnosti využívania dát v technologickom sektore.

Podľa súdnych dokumentov získala Meta cez torrenty minimálne 81,7 terabajtu textov, vrátane známych pirátskych knižníc Z-Library a LibGen. Viac ako 35,7 terabajtu pochádzalo z pirátskych zdrojov. Navyše, už v minulosti získala Meta z LibGen viac ako 80 terabajtov dát. Spoločnosť tvrdí, že ide o legálnu prax spadajúcu pod „fair use,“ no žalobcovia upozorňujú, že aj malé množstvo takto získaných dát môže viesť k trestnému vyšetrovaniu.

Aj interné e-maily odhalili, že niektorí zamestnanci Mety mali vážne etické pochybnosti. Nikolay Bashlykov, výskumný inžinier spoločnosti, označil torrentovanie pirátskych kníh za neetické a právne rizikové. Meta sa údajne tieto aktivity snažila zakryť. Spoločnosť nepoužívala servery Facebooku, aby zabránila spätnému vystopovaniu. Torrentovací klienti boli nastavení tak, aby minimalizovali zdieľanie dát do výmenných sietí.

Meta AI
Zdroj: ChatGPT

Dokumenty tiež naznačujú, že o používaní pirátskych dát vedel aj samotný šéf spoločnostiMark Zuckerberg. To však protirečí jeho predchádzajúcim tvrdeniam, že s tými nemal nič spoločné. Táto skutočnosť vrhá tiež na obranu Mety v súdnom procese, kde autori rozšírili teóriu distribúcie o tvrdenie, že Meta nelegálne „seedovala“ pirátske knihy.

Meta nie je jediná, má to širší súvis

Meta však nie je vôbec jediná firma, ktorá čelí podobným obvineniam. Autori a autorky (napríklad Paula Tremblaye či Sarah Silverman) žalujú aj spoločnosti OpenAI, Nvidia a Databricks za používanie pirátskych kníh na trénovanie svojich modelov umelej inteligencie. Tento spor odhaľuje širší problém v technologickom sektore, kde firmy čerpajú dáta z neoverených zdrojov. Paradoxom je tiež to, že OpenAI nedávno obvinila čínsky DeepSeek z toho, že trénovala svoju AI na jej výstupoch, čím porušila pravidlá používania.

Slováci môžu dnes zo spomínaných nástrojov umelej inteligencie využívať ChatGPT aj DeepSeek, populárny je aj nástroj Gemini od Googlu. Meta AI na Slovensku a v krajinách Európskej únie zatiaľ dostupná nie je, dôvodom sú regulačné nejasnosti týkajúce sa práve používania dát na trénovanie AI modelov.

 

✅ Odporúčané pre teba

🔥 Najnovšie príspevky zo skriptu

Šokujúca zmena v ChatGPT: Najhoršie obavy ľudí naplnené

Autor: Kristína Sudorová

ChatGPT začne vkladať reklamy priamo do odpovedí Aktualizované 18.1.2025: Nadišla chvíľa, ktorej sme sa všetci obávali. OpenAI potvrdila, že zavedenie reklám…

Už vie o vás všetko. Google dáva Gemini prístup k vášmu súkromiu

Autor: Kristína Sudorová

Nová Gemini vie o používateľovi viac než kedykoľvek predtým Google nedávno predstavil jednu z najzásadnejších aktualizácií svojej umelej inteligencie Gemini.…

Takúto kombináciu nikto neskúsil. John Wick s Pirátmi z Karibiku, sledujte brutálny trailer

Autor: Erik Košťany

Trailer na film The Bluff Dostávame trailer na film The Bluff, ktorý nás zavedie do roku 1846 na ostrov v…

Jadrové zbrane majú nečakanú moc. Ničivým spôsobom nás ochránia proti vesmíru

Autor: Roland Tokoly

Najničivejšími zbraňami proti vesmírnej hrozbe Keď NASA v roku 2022 úmyselne narazila sondou DART do malého mesiaca asteroidu Didymos, svet…

Nákupy v obchodoch už nebudú ako predtým: Štát spúšťa prelomový systém

Autor: Slavomír Dzuričko

Podnikatelia sa môžu pripraviť na novú povinnosť Finančná správa SR spustila otvorený pilotný projekt QR platieb, ktorý je dostupný pre…

Takto chcú zlepšiť kvalitu? Ministerstvo nakúpi drahé ChatGPT licencie pre učiteľov

Autor: Kristína Sudorová

Budúci učitelia dostanú ChatGPT Edu Slovenské školy v posledných dňoch urobili výrazný krok vpred v používaní digitálnych technológií a umelej…