openmythos-claude-mythos-architecture-open-source-reconstruction
May Isang Nagtayo ng Open-Source na 'Theoretical Mythos' para I-reverse Engineer ang Pinakamapanganib na AI ng Anthropic
Ang OpenMythos ay isang pagsisimulang muli na pagtatangka upang muling buuin ang arkitektura sa likod ng Claude Mythos, ang modelo na may kakayahang cyber na tinatangging ilabas ng Anthropic. Ito ay spekulasyon sa anyo ng code.
2026-05-04 Pinagmulan:decrypt.co

Sa maikli

  • Ang OpenMythos ay isang mula-sa-simulang muling pagbuo ng arkitektura ng Claude Mythos, na binuo lamang mula sa pampublikong research papers at batay sa matatalinong hula.
  • Ang Claude Mythos ang pinakamakapangyarihang modelo ng Anthropic, na ikinulong sa Project Glasswing dahil awtomatiko nitong natagpuan ang 271 kahinaan sa Firefox at 32-hakbang na pag-atake sa network.
  • Ang repositoryo (repo) ay isang teoretikal na balangkas—code na walang sinanay na weights. Ito ay sumasalamin sa isang hiwalay na pagsisikap ng Vidoc Security na nag-reproduce ng mga natuklasang kahinaan ng Mythos gamit ang mga standard na modelo.

Kung hindi ipapakita ng Anthropic kung ano ang nasa loob ng pinakamapanganib nitong AI, may isang tao sa GitHub ang huhula.

Isang developer na nagngangalang Kye Gomez ang naglathala ng OpenMythos, isang open-source na muling pagbuo ng sa tingin niya ay hitsura ng Claude Mythos sa ilalim ng makina. Ang repo ay nakakuha ng higit sa 10,000 GitHub stars sa loob ng ilang linggo mula nang ilabas, at may kasama itong komprehensibong “readme” file na puno ng equation, citation, at isang magalang na disclaimer na wala itong kinalaman sa Anthropic.

Ito ay espekulasyon. Ngunit ito ay nakabalangkas na espekulasyon, sa code.

Narito ang mabilis na pagre-refresh kung ano ang Mythos: Ang Mythos ay lumabas sa publiko noong huling bahagi ng Marso, nang aksidenteng maglathala ang Anthropic ng draft materials na naglalarawan dito bilang pinakamahusay na modelo ng kumpanya hanggang sa kasalukuyan—isang antas na mas mataas kaysa Opus. Ang sumunod, ang Mythos Preview, ay napatunayang hindi mailabas dahil sa galing nito sa cybersecurity.

Ayon sa Anthropic, natagpuan ng Mythos ang 271 kahinaan sa Firefox sa panahon ng pagsubok ng Mozilla. Ito ang naging unang modelo ng AI na nakakumpleto ng isang 32-hakbang na simulasyon ng pag-atake sa corporate network. Ikinulong ito ng Anthropic sa loob ng Project Glasswing, isang sinuring koalisyon ng humigit-kumulang 40 kasosyo, kabilang ang Microsoft, Apple, Amazon, at ang NSA.

Hindi ito kailanman nahahawakan ng publiko. Kaya sinubukan ni Gomez na alamin kung paano ito gumagana.

Ang pangunahing hula ng OpenMythos ay ang Mythos ay isang Recurrent-Depth Transformer—tinatawag ding looped transformer. Ang mga karaniwang modelo ay nagpapatong ng daan-daang natatanging layer. Ang mga looped model ay kumukuha ng mas maliit na stack at pinapatakbo ito nang paulit-ulit sa bawat forward pass.

Sa madaling salita, ito ang parehong weights na dumadaan sa mas maraming iterations. Mas malalim na pag-iisip, sa continuous latent space, bago pa man maglabas ng anumang token.

Ang repo ay nagtatalo na ito ang magpapaliwanag sa dalawang pinakakakaibang katangian ng Mythos: Ito ay nakakapag-reason sa mga bagong problema na hindi kayang lutasin ng ibang modelo, ngunit ang hilaw na memorization nito ay hindi pantay. Iyan ang arkitektural na fingerprint ng looping—komposisyon higit sa imbakan.

Binanggit ng OpenMythos ang Parcae, isang Abril 2026 na papel mula sa University of California San Diego at Together AI na lumutas sa matagal nang problema sa kawalang-tatag sa mga looped model—isang 770 milyong-parameter na modelong Parcae ang tumutugma sa isang 1.3 bilyong fixed-depth transformer sa kalidad, na may predictable na batas sa scaling para sa kung gaano karaming loops ang patatakbuhin. Humiram din ang repo ng Multi-Latent Attention ng DeepSeek para i-compress ang memorya, at isang Mixture-of-Experts setup para mahawakan ang lawak sa iba't ibang domain.

Ang wala dito ay weights, kaya't sa esensya ito ay isang teknik na walang tagapagpatupad.

Ang OpenMythos ay teoretikal. Ang code ay tumutukoy sa mga variant ng modelo mula 1 bilyon hanggang 1 trilyong parameter, ngunit kailangan mong sanayin ang mga ito sa sarili mo—ang readme file ay tumutukoy sa isang 3 bilyong parameter na training script sa FineWeb-Edu at isang Chinchilla-adjusted na 30 bilyong-token na target, na uri ng singil sa compute na umaabot sa daan-daang libong dolyar sa mga H100. Wala pa ring nakagawa nito.

Kaya bakit ito mahalaga?

Dahil ito ang pangalawang pagkakataon sa isang buwan na may sumubok sirain ang hadlang sa paligid ng Mythos. Ang una ay isang pag-aaral mula sa Vidoc Security, na nag-reproduce ng ilan sa mga pinaka nakakaalarmang natuklasang kahinaan ng Mythos gamit ang GPT-5.4 at Claude Opus 4.6 sa loob ng isang open-source na ahente. Walang Glasswing access, at sa ilalim ng $30 bawat scan. Iba't ibang anggulo, parehong konklusyon: Ang proteksyon sa paligid ng Mythos ay maaaring mas manipis kaysa sa ipinahihiwatig ng marketing.

Magkaiba ang trabaho ng OpenMythos at Vidoc replication. Nag-reproduce ang Vidoc ng mga output ng Mythos—ang mga pagtuklas ng kahinaan mismo—gamit ang mga kasalukuyang modelo. Sinusubukan ng OpenMythos na mag-reproduce ng arkitektura—ang mismong makina na gumagawa ng mga output na iyon. Ang isa ay nagsasabing hindi mo kailangan ng Mythos para mahanap ang mga bug na natagpuan ng Mythos. Ang isa naman ay nagsasabing, kalaunan, maaari kang makabuo ng isang bagay na tulad ng Mythos sa sarili mo.

Halos tiyak na hindi ibinabahagi ng Anthropic ang mga hula sa arkitektura ni Gomez sa publiko, at ilan sa mga pagpipilian sa disenyo sa OpenMythos ay malinaw na pag-iingat—sinisiguro ng readme file na maging sapat na malabo upang malaman ng mga user na ito ay isa lamang diskarte. Paulit-ulit na sinasabing "malamang," "pinaghihinalaan," at "halos tiyak." Ang totoong Mythos ay maaaring hindi looped transformer. O maaaring isa ito na may mga detalye na hindi pa na-reverse-engineer ni Gomez.

Ang ipinapakita ng OpenMythos ay naglalaman na ang mga literature sa pananaliksik ng karamihan sa mga bahagi. Looped transformers, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, Parcae's stability fix—wala sa mga ito ang proprietary. Ang repo ay, higit sa lahat, isang imbentaryo ng kung ano ang pampublikong nalalaman tungkol sa kung paano bumuo ng isang modelong Class-Mythos.

Ang repo ay lisensyadong MIT, at mayroon na itong 2,700 na forks. Ang training script ay nakaupo doon, naghihintay ng isang may GPU cluster at isang thesis na patunayan.