Nová AI bola taká dobrá, že ju ihneď po spustení museli obmedziť

Schopnosti prekvapili aj tvorcov

Spoločnosť Anthropic predstavila nový experimentálny jazykový model Claude Mythos Preview, ktorý už v prvých hodinách po nasadení ukázal, že schopnosti moderných LLM prekračujú hranice bežného spracovania textu.

Model sa totiž okamžite pustil do analýzy reálneho softvéru a identifikoval zraniteľnosti v projektoch. Tie sa pritom dlhodobo považujú za extrémne bezpečné, vysvetľuje Anthropic v tlačovej správe.

Jedným z najvýraznejších prípadov je objavenie takmer tri desaťročia starej chyby v operačnom systéme OpenBSD. Tento systém je dlhodobo známy dôrazom na bezpečnostné audity a konzervatívny vývoj, no Mythos dokázal odhaliť kritickú slabinu umožňujúcu vzdialené zhodenie systému. Ešte znepokojivejší je fakt, že podobné chyby prešli bez povšimnutia aj cez masívne automatizované testovanie.

Model zároveň identifikoval 16 rokov starú zraniteľnosť v multimediálnej knižnici FFmpeg, konkrétne v implementácii kodeku H.264, vo veľkom využívaný takmer všade.

Mythos dokázal kombinovať viaceré slabiny naprieč systémami, napríklad v prostredí Linux, kde reťazením exploitov eskaloval práva z bežného používateľa na plnú kontrolu nad systémom. V inom prípade získal root prístup k serveru bežiacom na FreeBSD cez zraniteľnosť v sieťovom protokole NFS, a to bez potreby autentifikácie.

Takéto schopnosti dramaticky menia bezpečnostnú rovnováhu. Kým doteraz boli podobné zraniteľnosti objavované najmä bezpečnostnými expertmi alebo špecializovanými nástrojmi, nový typ AI ich dokáže hľadať systematicky, vo veľkom rozsahu a najmä s pochopením širších súvislostí v kóde. To znamená, že dokáže objaviť aj komplexné reťazce chýb, ktoré by tradičné nástroje analyzujúce jednotlivé komponenty izolovane nikdy nenašli.

Zatiaľ len pre vyvolených

Anthropic si zjavne uvedomuje riziká, ktoré by vypustenie takéhoto modelu mohlo priniesť. Namiesto okamžitého sprístupnenia preto spustil iniciatívu Glasswing, v rámci ktorej poskytne prístup k modelu len vybraným technologickým lídrom, medzi ktorých patria Amazon Web Services, Apple, Cisco, Microsoft či NVIDIA.

Tieto firmy získajú AI kredity, ktoré môžu využiť na audit vlastného softvéru a infraštruktúry ešte pred tým, než sa model dostane do širšieho obehu.

Dôležitou súčasťou projektu je aj podpora open source ekosystému. Ten tvorí chrbticu internetu a zároveň je často podfinancovaný, pokiaľ ide o bezpečnostné audity. Práve preto Anthropic vyčlenil milióny dolárov na podporu organizácií, ktoré spravujú kľúčové open source komponenty.

Zaujímavý je aj širší geopolitický kontext. Napriek tomu, že americké úrady v minulosti pristupovali k spoločnosti Anthropic opatrne. V niektorých prípadoch dokonca obmedzili jej zapojenie do vládnych projektov, Glasswing naznačuje snahu o opätovné prepojenie s verejným sektorom. Dôvod je pragmatický. Kritická infraštruktúra štátov často stojí na rovnakých technológiách ako komerčné systémy, a teda čelí identickým rizikám.

Zverejnené benchmarky ukazujú, že Mythos mierne prekonáva predchádzajúcu generáciu modelov Claude, no v tomto prípade ide skôr o vedľajší detail. Skutočný posun spočíva v schopnosti aplikovať jazykové modely na bezpečnostný výskum na úrovni, ktorá sa približuje práci elitných expertov.

Ak sa Claude Mythos dostane do verejnej distribúcie, môže to spustiť bezprecedentnú vlnu bezpečnostných aktualizácií. Výrobcovia síce budú schopní rýchlo publikovať záplaty, no reálny problém nastane na strane používateľov a organizácií, ktoré ich musia implementovať. V praxi to znamená, že v relatívne krátkom období sa môže objaviť veľké množstvo nových exploitov, ktoré budú cieliť na systémy bez aktuálnych aktualizácií.