Oprirea bruscă a celor mai puternice modele Anthropic
La doar câteva zile după lansarea lui Fable 5, Anthropic a fost nevoită să dezactiveze brusc accesul la Fable 5 și la fratele său și mai puternic, Mythos 5, în urma unui ordin de control la export emis de guvernul SUA pe motive de securitate națională.
Directiva impune suspendarea accesului pentru orice cetățean străin, „indiferent dacă se află în interiorul sau în afara Statelor Unite”, ceea ce, în practică, a obligat compania să oprească aceste modele pentru toți clienții la nivel global pentru a respecta legea.
Accesul la celelalte modele Claude ale Anthropic nu a fost afectat, dar decizia a scos din joc tocmai cele mai avansate sisteme frontieră ale companiei și a produs instant un șoc pentru dezvoltatorii, companiile și cercetătorii care începuseră deja să integreze Fable 5 în fluxurile lor de lucru.
De la lansare entuziasmantă la offline în câteva zile
Fable 5 a fost prezentat ca o versiune pentru public, cu accent pe siguranță, a modelului Mythos 5, gândită să ofere capabilități de ultimă generație, dar cu garduri de protecție mai stricte în domenii sensibile precum securitatea cibernetică și biologia.
Mythos 5, în schimb, a fost poziționat ca un model mai puternic, cu acces restricționat pentru utilizări atent verificate, inclusiv pentru apărători în zona de securitate și infrastructură critică, tocmai din cauza potențialului său ofensiv în domeniul cyber.
La aproximativ 48 de ore de la lansare, red-teamerul „Pliny the Liberator” a susținut că a reușit să treacă de stratul de siguranță al lui Fable 5, declanșând un val de discuții despre posibile „jailbreak-uri” ale modelului de vârf al Anthropic.
La doar câteva zile după aceste afirmații, pe 12 iunie, guvernul SUA a emis directiva de control la export care a dus la oprirea globală a accesului la Fable 5 și Mythos 5.
Jailbreak-ul aflat în centrul controversei
Conform postărilor și materialelor publice, Pliny the Liberator susține că a „eliberat” Fable 5 folosind o combinație de tehnici de jailbreak deja cunoscute, orchestrate într-un atac în mai mulți pași.
Printre aceste tehnici se numără:
- Trucuri cu Unicode și caractere omografe pentru a păcăli filtrele pe bază de cuvinte cheie.
- Folosirea contextului lung pentru a împrăștia intenția reală pe o conversație extinsă.
- Încadrarea cererilor periculoase în povești sau texte academice aparent inofensive.
Cea mai eficientă abordare, după propriile sale descrieri, a fost decompoziția și recompoziția: spargerea unei cereri periculoase în multe subtârguri aparent benigne și reasamblarea răspunsurilor într-un rezultat mult mai util operațional.
Pliny mai afirmă că a publicat și promptul intern, extrem de lung, al lui Fable 5 pe GitHub, dezvăluind instrucțiunile interne ale Anthropic legate de siguranță și comportamentul modelului.
Capturile de ecran publicate de cercetător arată că Fable 5 ar fi generat ghiduri detaliate pentru subiecte precum exploit-uri de tip buffer overflow pe stivă pentru Linux pe x86 sau anumite sinteze chimice clasice, deși Anthropic contestă ideea că aceste exemple reprezintă un „uplift” real peste ceea ce se găsește deja în surse publice.
Reacția Anthropic și perspectiva guvernului SUA
Anthropic spune că a fost informată verbal despre un „potențial jailbreak îngust, ne-universal”, care pare să implice punerea lui Fable 5 să analizeze un anumit cod și să identifice vulnerabilități software.
În declarațiile publice, compania subliniază că nu i s-a prezentat nicio demonstrație clară a unui jailbreak care să fi dus la consecințe dăunătoare concrete și argumentează că abilități similare pot fi obținute deja de la alte modele AI accesibile pe scară largă.
Guvernul SUA, sub președintele Donald Trump, prezintă măsura ca pe o acțiune de control la export bazată pe legislația de securitate națională, tratând practic modelele de bază avansate drept tehnologii sensibile, cu dublă utilizare.
O scrisoare a Secretarului Comerțului, Howard Lutnick, către CEO-ul Anthropic, Dario Amodei, ar fi plasat Fable 5 și Mythos 5 sub restricții de export, interzicând utilizarea lor de către persoane și entități străine, inclusiv atunci când acestea se află pe teritoriul SUA.
Anthropic avertizează că, dacă același standard—oprirea unui model comercial din cauza unui jailbreak îngust și contestat—ar fi aplicat uniform în industrie, multe lansări de noi modele frontieră ar fi practic blocate.
În același timp, compania declară că se conformează directivei, dar lucrează cu autoritățile pentru a clarifica detaliile tehnice și a restabili accesul cât mai repede posibil.
De ce contează pentru dezvoltatori și business-uri
Pentru echipele care construiesc produse peste modele frontieră, episodul acesta este un semnal de alarmă: cel mai mare risc din stack-ul tău AI s-ar putea să nu fie un bug tehnic, ci un întrerupător de reglementare pe care nu îl controlezi.
Dezvoltatorii care începuseră deja să testeze Fable 5 pentru copiloți de cod, agenți autonomi sau unelte de securitate s-au trezit peste noapte fără cel mai puternic endpoint, fără un înlocuitor imediat la același nivel de capabilitate.
Câteva lecții practice care se conturează:
- Riscul de vendor și de reglementare devine o problemă de arhitectură. Construirea de sisteme critice pe un singur model frontieră, într-o singură jurisdicție, este tot mai riscantă.
- Strategiile multi-provider și multi-model sunt esențiale. Fallback-urile pe alți furnizori și, unde se poate, pe modele open-weight sau self-hosted reduc impactul unor șocuri politice sau de policy.
- Postura de securitate și siguranță va influența accesul. Guvernele urmăresc îndeaproape cercetarea în jailbreak, iar modelele folosite în securitate cibernetică sau în domenii sensibile pot fi supuse unor standarde mai dure de acces, licențiere și audit.
Pentru agenții și echipe de produs, episodul schimbă și modul în care discuți cu clienții despre AI: reziliența, guvernanța și conformitatea devin argumente comerciale, nu doar scorurile de benchmark ale modelului.
Ce s-ar putea întâmpla mai departe
Anthropic a numit situația un „misunderstanding” și a anunțat că intenționează să ofere mai multe detalii tehnice despre presupusul jailbreak și despre mecanismele sale de protecție.
În funcție de cum evoluează discuțiile cu autoritățile, am putea vedea fie o restabilire relativ rapidă a accesului, dar cu condiții suplimentare, fie un regim mai strict, în care doar organizații atent acreditate pot folosi modele de vârf de tip Mythos.
La un nivel mai larg, incidentul arată cât de repede poate trece accesul la AI puternic de la „oricine are un API key” la „tehnologie controlată asemănător echipamentelor de apărare”, mai ales când modelele ating capabilități cu dublă utilizare în securitate și cyber.
Pentru moment, mesajul către orice business care mizează pe AI este clar: gândește-ți arhitectura, SLA-urile și modelele de risc presupunând că accesul la un anumit model poate fi retras brusc din motive de policy, nu doar din cauza unor întreruperi tehnice.



