
Dacă Anthropic nu-ți va arăta ce se află în interiorul celei mai periculoase inteligențe artificiale a sa, cineva pe GitHub va ghici.
Un dezvoltator pe nume Kye Gomez a publicat OpenMythos, o reconstrucție open-source a ceea ce crede el că ar arăta Claude Mythos pe dinăuntru. Depozitul a acumulat peste 10.000 de stele pe GitHub în câteva săptămâni de la lansare și vine cu un fișier „readme” exhaustiv plin de ecuații, citări și o declarație politicoasă că nu are nicio legătură cu Anthropic.
Este speculație. Dar este speculație structurată, în cod.
Iată o scurtă recapitulare despre ce este Mythos: Mythos a ajuns în atenția publicului la sfârșitul lunii martie, când Anthropic a publicat accidental materiale preliminare care îl descriau ca fiind cel mai capabil model al companiei până în prezent – un nivel peste Opus. Următorul, Mythos Preview, s-a dovedit a fi extraordinar de bun în securitate cibernetică, într-un mod care împiedică lansarea.
Conform Anthropic, Mythos a găsit 271 de vulnerabilități în Firefox în timpul testelor Mozilla. A devenit primul model AI care a finalizat o simulare de atac de rețea corporativă în 32 de pași. Anthropic l-a izolat în cadrul Proiectului Glasswing, o coaliție verificată de aproximativ 40 de parteneri, inclusiv Microsoft, Apple, Amazon și NSA.
Publicul nu are niciodată acces la el. Așa că Gomez a încercat să înțeleagă cum funcționează.
Ipoteza centrală a OpenMythos este că Mythos este un Transformer cu Adâncime Recurentă – numit și transformer buclat. Modelele standard stivuiesc sute de straturi unice. Modelele buclate iau un set mai mic de straturi și îl rulează prin el însuși de mai multe ori pe parcursul unei treceri înainte.
Cu alte cuvinte, sunt aceleași ponderi care trec prin mai multe iterații. O gândire mai profundă, într-un spațiu latent continuu, înainte ca orice token să fie emis.
Depozitul susține că aceasta ar explica cele două cele mai ciudate calități ale Mythos: raționează prin probleme noi pe care niciun alt model nu le poate rezolva, dar memorarea sa brută este inegală. Aceasta este amprenta arhitecturală a buclării – compoziție în detrimentul stocării.
OpenMythos citează Parcae, o lucrare din aprilie 2026 de la Universitatea din California San Diego și Together AI, care a rezolvat problema instabilității de lungă durată în modelele buclate – un model Parcae cu 770 de milioane de parametri se potrivește cu un transformer cu adâncime fixă de 1,3 miliarde în ceea ce privește calitatea, cu legi de scalare previzibile pentru numărul de bucle de rulat. Depozitul împrumută, de asemenea, Multi-Latent Attention de la DeepSeek pentru a comprima memoria și o configurație Mixture-of-Experts pentru a gestiona lățimea în diverse domenii.
Ceea ce nu are sunt ponderile, deci, practic, este o tehnică fără un executor.
OpenMythos este teoretic. Codul definește variante de modele de la 1 miliard la 1 trilion de parametri, dar trebuie să le antrenezi singur – fișierul readme indică un script de antrenare cu 3 miliarde de parametri pe FineWeb-Edu și o țintă de 30 de miliarde de tokeni ajustată la Chinchilla, ceea ce reprezintă genul de cost de calcul care se ridică la sute de mii de dolari pe H100. Nimeni nu a făcut-o încă.
Deci, de ce contează?
Deoarece este a doua oară într-o lună când cineva a spart zidul din jurul Mythos. Primul a fost un studiu al Vidoc Security, care a reprodus mai multe dintre cele mai alarmante descoperiri de vulnerabilități ale Mythos folosind GPT-5.4 și Claude Opus 4.6 în cadrul unui agent open-source. Fără acces la Glasswing și la mai puțin de 30 de dolari per scanare. Un unghi diferit, aceeași concluzie: șanțul din jurul Mythos ar putea fi mai subțire decât a sugerat marketingul.
OpenMythos și replicarea Vidoc fac lucruri diferite. Vidoc a reprodus rezultatele Mythos – descoperirile de vulnerabilități în sine – folosind modele existente. OpenMythos încearcă să reproducă arhitectura – mașina reală care produce acele rezultate. Unul spune că nu ai nevoie de Mythos pentru a găsi erorile pe care Mythos le-a găsit. Celălalt spune că, în cele din urmă, s-ar putea să poți construi tu însuți ceva asemănător cu Mythos.
Anthropic aproape sigur nu împărtășește public presupunerile arhitecturale ale lui Gomez, iar mai multe dintre alegerile de design din OpenMythos sunt hedging-uri explicite – fișierul readme se asigură să fie suficient de vag pentru ca utilizatorii să știe că aceasta este doar o abordare. Spune în mod repetat „probabil”, „suspectat” și „aproape sigur”. Adevăratul Mythos s-ar putea să nu fie deloc un transformer buclat. Sau ar putea fi unul cu detalii pe care Gomez nu le-a dezasamblat încă.
Ceea ce demonstrează OpenMythos este că literatura de cercetare conține deja majoritatea pieselor. Transformerele buclate, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, soluția de stabilitate Parcae – nimic din toate acestea nu este proprietar. Depozitul este, mai mult decât orice, un inventar al ceea ce se știe public despre cum să construiești un model de clasă Mythos.
Depozitul este licențiat MIT și are deja 2.700 de fork-uri. Scriptul de antrenament este acolo, așteptând pe cineva cu un cluster GPU și o teză de demonstrat.