Škandál jednej z najväčších tech firiem sveta. Revolučnú AI trénuje cez torrenty

Autor: Peter Čítanie na 3 min.

Zuckerberg o tom vedel

Spoločnosť Meta, materská firma Facebooku, sa ocitla uprostred rozsiahleho súdneho sporu kvôli používaniu pirátskych kníh pri trénovaní svojich modelov umelej inteligencie. Autori spoločnosť obviňujú z masívneho porušovania autorských práv, čo otvára diskusiu o etike a legálnosti využívania dát v technologickom sektore.

Podľa súdnych dokumentov získala Meta cez torrenty minimálne 81,7 terabajtu textov, vrátane známych pirátskych knižníc Z-Library a LibGen. Viac ako 35,7 terabajtu pochádzalo z pirátskych zdrojov. Navyše, už v minulosti získala Meta z LibGen viac ako 80 terabajtov dát. Spoločnosť tvrdí, že ide o legálnu prax spadajúcu pod „fair use,“ no žalobcovia upozorňujú, že aj malé množstvo takto získaných dát môže viesť k trestnému vyšetrovaniu.

Aj interné e-maily odhalili, že niektorí zamestnanci Mety mali vážne etické pochybnosti. Nikolay Bashlykov, výskumný inžinier spoločnosti, označil torrentovanie pirátskych kníh za neetické a právne rizikové. Meta sa údajne tieto aktivity snažila zakryť. Spoločnosť nepoužívala servery Facebooku, aby zabránila spätnému vystopovaniu. Torrentovací klienti boli nastavení tak, aby minimalizovali zdieľanie dát do výmenných sietí.

Meta AI
Zdroj: ChatGPT

Dokumenty tiež naznačujú, že o používaní pirátskych dát vedel aj samotný šéf spoločnostiMark Zuckerberg. To však protirečí jeho predchádzajúcim tvrdeniam, že s tými nemal nič spoločné. Táto skutočnosť vrhá tiež na obranu Mety v súdnom procese, kde autori rozšírili teóriu distribúcie o tvrdenie, že Meta nelegálne „seedovala“ pirátske knihy.

Meta nie je jediná, má to širší súvis

Meta však nie je vôbec jediná firma, ktorá čelí podobným obvineniam. Autori a autorky (napríklad Paula Tremblaye či Sarah Silverman) žalujú aj spoločnosti OpenAI, Nvidia a Databricks za používanie pirátskych kníh na trénovanie svojich modelov umelej inteligencie. Tento spor odhaľuje širší problém v technologickom sektore, kde firmy čerpajú dáta z neoverených zdrojov. Paradoxom je tiež to, že OpenAI nedávno obvinila čínsky DeepSeek z toho, že trénovala svoju AI na jej výstupoch, čím porušila pravidlá používania.

Slováci môžu dnes zo spomínaných nástrojov umelej inteligencie využívať ChatGPT aj DeepSeek, populárny je aj nástroj Gemini od Googlu. Meta AI na Slovensku a v krajinách Európskej únie zatiaľ dostupná nie je, dôvodom sú regulačné nejasnosti týkajúce sa práve používania dát na trénovanie AI modelov.

 

✅ Odporúčané pre teba

🔥 Najnovšie príspevky zo skriptu

Google tajne zapol v Androide novú funkciu. Začala vás sledovať

Autor: Slavomír Dzuričko

Reaguje ešte skôr než kliknete Google začal do Androidu potichu nasadzovať novú AI funkciu s názvom „Contextual Suggestions“. Tá analyzuje…

Multifunkčný pomocník z Lidl príjemne prekvapil. Keď teplomer zvládne viac ako ukázať číslo

Autor: Dávid Igaz

Niektoré produkty si kúpite len „pre istotu“. A potom príde moment, keď ich začnete používať každý deň. Presne taký dojem…

Rysuje sa bleskový projekt Windows K2. Vyrieši najväčšie prúsery „11ky“

Autor: Slavomír Dzuričko

Microsoft priznáva problém Microsoft údajne spustil interný projekt s názvom Windows K2, ktorý má vyriešiť najväčšie problémy Windows 11. Firma…

Ukrajinský laser dostal masívne vylepšenie. „Maže“ ruské drony z oblohy v priebehu sekúnd

Autor: Roland Tokoly

Zneškodní aj najodolnejšie drony Ukrajina pokračuje vo vývoji vlastných zbraní určených na boj proti dronom a jedným z najzaujímavejších projektov…

Obrovský škandál. Dátové centrum tajne ľuďom „vysalo“ vodu z kohútikov

Autor: Peter

V luxusnej štvrti Annelise Park v meste Fayetteville v americkom štáte Georgia začali obyvatelia minulý rok pociťovať niečo nezvyčajné –…

Tento robotický vysávač má brutálny výkon a je inteligentnejší ako čokoľvek, čo máte doma

Autor: Peter

Svet domácich technológií sa hýbe vpred míľovými krokmi, no málokedy príde zariadenie, ktoré skutočne prekope zavedené štandardy. Deebot X12 OmniCyclone…