openmythos-claude-mythos-architecture-open-source-reconstruction
Iemand Heeft een Open-Source 'Theoretisch Mythos' Gebouwd om de Gevaarlijkste AI van Anthropic te Reverse-Engineeren
OpenMythos is een poging vanaf nul om de architectuur achter Claude Mythos te reconstrueren, het cybervaardige model dat Anthropic weigert vrij te geven. Het is speculatie in codevorm.
2026-05-04 Bron:decrypt.co

Kort samengevat

  • OpenMythos is een van nul af aan opgebouwde reconstructie van de Claude Mythos-architectuur, gebouwd uitsluitend op basis van openbare onderzoekspaper en gefundeerde gissingen.
  • Claude Mythos is Anthropic's krachtigste model, opgesloten in Project Glasswing omdat het autonoom 271 Firefox-kwetsbaarheden en netwerkaanvallen in 32 stappen heeft gevonden.
  • De repository is theoretisch raamwerk — code zonder getrainde gewichten. Het weerspiegelt een afzonderlijke inspanning van Vidoc Security die de kwetsbaarheidsbevindingen van Mythos reproduceerde met behulp van standaardmodellen.

Als Anthropic je niet laat zien wat er in zijn gevaarlijkste AI zit, zal iemand op GitHub wel gissen.

Een ontwikkelaar genaamd Kye Gomez heeft OpenMythos gepubliceerd, een open-source reconstructie van hoe hij denkt dat Claude Mythos er onder de motorkap uitziet. De repository heeft binnen enkele weken na de release meer dan 10.000 GitHub-sterren verzameld en wordt geleverd met een uitgebreid "readme"-bestand vol vergelijkingen, citaten en een beleefde disclaimer dat het niets te maken heeft met Anthropic.

Het is speculatie. Maar het is gestructureerde speculatie, in code.

Hier is een korte opfriscursus over wat Mythos is: Mythos lekte eind maart in het openbaar, toen Anthropic per ongeluk conceptmateriaal publiceerde waarin het werd beschreven als het meest capabele model van het bedrijf tot nu toe - een niveau boven Opus. De opvolger, Mythos Preview, bleek onuitgeefbaar goed in cybersecurity te zijn.

Volgens Anthropic vond Mythos 271 kwetsbaarheden in Firefox tijdens Mozilla-testen. Het werd het eerste AI-model dat een 32-stappen durende simulatie van een bedrijfsnetwerkaanval voltooide. Anthropic sloot het op in Project Glasswing, een gecontroleerde coalitie van ongeveer 40 partners, waaronder Microsoft, Apple, Amazon en de NSA.

Het publiek mag het nooit aanraken. Dus probeerde Gomez uit te zoeken hoe het werkt.

De centrale aanname van OpenMythos is dat Mythos een Recurrent-Depth Transformer is – ook wel een "looped transformer" genoemd. Standaardmodellen stapelen honderden unieke lagen op. Looped modellen nemen een kleinere stapel en voeren deze vele malen per forward pass door zichzelf heen.

Met andere woorden, het zijn dezelfde gewichten die meer iteraties doorlopen. Dieper denken, in continue latente ruimte, voordat er een token wordt uitgestuurd.

De repository stelt dat dit de twee vreemdste kwaliteiten van Mythos zou verklaren: het redeneert door nieuwe problemen heen die geen enkel ander model kan oplossen, maar de pure memorisatie is ongelijk. Dat is de architectonische vingerafdruk van looping – compositie boven opslag.

OpenMythos citeert Parcae, een paper uit april 2026 van de Universiteit van Californië San Diego en Together AI, die het langdurige instabiliteitsprobleem in "looped models" oploste – een Parcae-model van 770 miljoen parameters evenaart een "fixed-depth transformer" van 1,3 miljard op kwaliteit, met voorspelbare schaalwetten voor het aantal loops. De repository leent ook DeepSeek's Multi-Latent Attention om geheugen te comprimeren, en een Mixture-of-Experts-opzet om breedte over domeinen heen te beheren.

Wat het niet heeft, zijn gewichten, dus in principe is het een techniek zonder uitvoerder.

OpenMythos is theoretisch. De code definieert modelvarianten van 1 miljard tot 1 biljoen parameters, maar je moet ze zelf trainen — het readme-bestand verwijst naar een trainingsscript van 3 miljard parameters op FineWeb-Edu en een Chinchilla-aangepast doel van 30 miljard tokens, wat het soort rekenkosten is dat oploopt tot honderdduizenden dollars op H100s. Niemand heeft het nog gedaan.

Dus waarom is het belangrijk?

Omdat het de tweede keer in een maand is dat iemand een barst heeft gemaakt in de muur rond Mythos. De eerste was een studie van Vidoc Security, die verschillende van Mythos' meest alarmerende kwetsbaarheidsbevindingen reproduceerde met behulp van GPT-5.4 en Claude Opus 4.6 binnen een open-source agent. Geen Glasswing-toegang, en voor minder dan $30 per scan. Een andere invalshoek, dezelfde conclusie: de gracht rond Mythos is misschien dunner dan de marketing deed vermoeden.

OpenMythos en de Vidoc-replicatie hebben verschillende taken. Vidoc reproduceerde de outputs van Mythos — de kwetsbaarheidsontdekkingen zelf — met behulp van bestaande modellen. OpenMythos probeert de architectuur te reproduceren — de eigenlijke machine die die outputs produceert. De één zegt dat je Mythos niet nodig hebt om de bugs te vinden die Mythos vond. De ander zegt dat je uiteindelijk misschien zelf iets vergelijkbaars als Mythos kunt bouwen.

Anthropic deelt Gomez' architecturale vermoedens vrijwel zeker niet publiekelijk, en verschillende ontwerpleuzen in OpenMythos zijn expliciete voorzorgsmaatregelen — het readme-bestand zorgt ervoor dat het vaag genoeg is, zodat gebruikers weten dat dit slechts een benadering is. Het herhaalt herhaaldelijk "waarschijnlijk", "vermoedelijk" en "vrijwel zeker". Echte Mythos is misschien helemaal geen "looped transformer". Of het zou er een kunnen zijn met details die Gomez nog niet heeft reverse-engineered.

Wat OpenMythos aantoont, is dat de onderzoeksliteratuur de meeste onderdelen al bevat. "Looped transformers", "Mixture of Experts", "Multi-Latent Attention", "Adaptive Computation Time", Parcae's stabiliteitsoplossing — niets daarvan is eigendom. De repository is, meer dan wat dan ook, een inventaris van wat publiekelijk bekend is over hoe je een Mythos-klasse model bouwt.

De repository is gelicenseerd onder MIT en heeft al 2.700 forks. Het trainingsscript ligt er klaar, wachtend op iemand met een GPU-cluster en een scriptie om te bewijzen.