
Jeśli Anthropic nie pokaże, co kryje się w jego najniebezpieczniejszej sztucznej inteligencji, ktoś na GitHubie będzie zgadywał.
Deweloper Kye Gomez opublikował OpenMythos, otwartoźródłową rekonstrukcję tego, jak jego zdaniem wygląda Claude Mythos „pod maską”. Repozytorium zdobyło ponad 10 000 gwiazdek na GitHubie w ciągu kilku tygodni od premiery i zawiera obszerny plik „readme” pełen równań, cytatów i uprzejmego zastrzeżenia, że nie ma nic wspólnego z Anthropic.
To spekulacja. Ale to ustrukturyzowana spekulacja, w kodzie.
Oto szybkie przypomnienie, czym jest Mythos: Mythos wyciekł do publicznej wiadomości pod koniec marca, gdy Anthropic przypadkowo opublikował materiały robocze, opisujące go jako najzdolniejszy model firmy do tej pory – o poziom wyżej niż Opus. Kolejny model, Mythos Preview, okazał się niemożliwie dobry w cyberbezpieczeństwie.
Według Anthropic, Mythos znalazł 271 luk w Firefoksie podczas testów Mozilli. Stał się pierwszym modelem AI, który ukończył 32-etapową symulację ataku na sieć korporacyjną. Anthropic zablokował go w Projekcie Glasswing, sprawdzonej koalicji około 40 partnerów, w tym Microsoftu, Apple, Amazona i NSA.
Społeczeństwo nigdy nie ma do niego dostępu. Więc Gomez spróbował dowiedzieć się, jak to działa.
Centralne przypuszczenie OpenMythos jest takie, że Mythos to transformator rekurencyjnej głębokości – zwany również transformatorem pętlowym. Standardowe modele składają się z setek unikalnych warstw. Modele pętlowe biorą mniejszy stos i przepuszczają go przez siebie wiele razy w jednym przejściu do przodu.
Innymi słowy, to te same wagi przechodzące przez więcej iteracji. Głębsze myślenie, w ciągłej przestrzeni utajonej, zanim jakikolwiek token zostanie wyemitowany.
Repozytorium argumentuje, że to wyjaśniałoby dwie najdziwniejsze cechy Mythos: rozwiązuje on nowe problemy, których żaden inny model nie potrafi złamać, ale jego surowe zapamiętywanie jest nierówne. To jest odcisk architektoniczny pętli – kompozycja nad przechowywaniem.
OpenMythos cytuje Parcae, artykuł z kwietnia 2026 roku z Uniwersytetu Kalifornijskiego w San Diego i Together AI, który rozwiązał długotrwały problem niestabilności w modelach pętlowych – model Parcae o 770 milionach parametrów dorównuje jakością transformatorowi o stałej głębokości z 1,3 miliarda parametrów, z przewidywalnymi prawami skalowania dla liczby pętli do uruchomienia. Repozytorium zapożycza również DeepSeek's Multi-Latent Attention do kompresowania pamięci oraz konfigurację Mixture-of-Experts do obsługi szerokiego zakresu dziedzin.
Czego nie ma, to wag, więc w zasadzie jest to technika bez wykonawcy.
OpenMythos jest teoretyczny. Kod definiuje warianty modeli od 1 miliarda do 1 biliona parametrów, ale musisz je wytrenować samodzielnie – plik readme wskazuje na skrypt treningowy z 3 miliardami parametrów na FineWeb-Edu i cel 30 miliardów tokenów dostosowany do Chinchilli, co generuje rachunek za obliczenia w setkach tysięcy dolarów na H100. Nikt jeszcze tego nie zrobił.
Więc dlaczego to ma znaczenie?
Ponieważ to już drugi raz w ciągu miesiąca, gdy ktoś nadwątlił mur wokół Mythos. Pierwszym było badanie Vidoc Security, które odtworzyło kilka najbardziej alarmujących odkryć luk w zabezpieczeniach Mythos przy użyciu GPT-5.4 i Claude Opus 4.6 w ramach otwartoźródłowego agenta. Bez dostępu do Glasswing i za mniej niż 30 dolarów za skan. Inny kąt, ten sam wniosek: fosa wokół Mythos może być cieńsza, niż sugerował marketing.
OpenMythos i replikacja Vidoc wykonują różne zadania. Vidoc odtworzyło wyniki Mythos – same odkrycia luk w zabezpieczeniach – używając istniejących modeli. OpenMythos próbuje odtworzyć architekturę – rzeczywistą maszynę, która wytwarza te wyniki. Jeden mówi, że nie potrzebujesz Mythos, aby znaleźć błędy, które znalazł Mythos. Drugi mówi, że w końcu możesz być w stanie zbudować coś podobnego do Mythos samodzielnie.
Anthropic prawie na pewno nie dzieli się publicznie domysłami architektonicznymi Gomeza, a kilka wyborów projektowych w OpenMythos to wyraźne zabezpieczenia – plik readme dba o to, by być wystarczająco nieprecyzyjnym, aby użytkownicy wiedzieli, że to tylko jedno z podejść. Wielokrotnie powtarza słowa „prawdopodobnie”, „podejrzewa się” i „prawie na pewno”. Prawdziwy Mythos może wcale nie być transformatorem pętlowym. Albo może nim być, z detalami, których Gomez jeszcze nie odtworzył inżynieryjnie.
To, co pokazuje OpenMythos, to że literatura badawcza zawiera już większość elementów. Transformatory pętlowe, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, poprawka stabilności Parcae – nic z tego nie jest zastrzeżone. Repozytorium jest przede wszystkim spisem tego, co jest publicznie wiadomo o tym, jak zbudować model klasy Mythos.
Repozytorium jest licencjonowane na licencji MIT i ma już 2700 forków. Skrypt treningowy czeka tam na kogoś z klastrem GPU i tezą do udowodnienia.