Page d'accueilCentre d'actualités LBank
Quelqu'un a créé un « Mythe Théorique » open-source pour rétroconcevoir l'IA la plus dangereuse d'Anthropic
openmythos-claude-mythos-architecture-open-source-reconstruction
Quelqu'un a créé un « Mythe Théorique » open-source pour rétroconcevoir l'IA la plus dangereuse d'Anthropic
OpenMythos est une tentative construite de zéro pour reconstruire l'architecture derrière Claude Mythos, le modèle cyber-capable qu'Anthropic refuse de dévoiler. C'est une spéculation sous forme de code.
2026-05-04 Source:decrypt.co

En bref

  • OpenMythos est une reconstruction à partir de zéro de l'architecture Claude Mythos, construite uniquement à partir d'articles de recherche publics et d'hypothèses éclairées.
  • Claude Mythos est le modèle le plus puissant d'Anthropic, mis sous clé dans le Projet Glasswing parce qu'il a trouvé de manière autonome 271 vulnérabilités dans Firefox et des attaques réseau en 32 étapes.
  • Le dépôt est un échafaudage théorique — du code sans poids entraînés. Il reflète un effort distinct de Vidoc Security qui a reproduit les découvertes de vulnérabilités de Mythos en utilisant des modèles disponibles sur étagère.

Si Anthropic ne vous montre pas ce qu'il y a à l'intérieur de son IA la plus dangereuse, quelqu'un sur GitHub devinera.

Un développeur nommé Kye Gomez a publié OpenMythos, une reconstruction open-source de ce à quoi il pense que Claude Mythos ressemble sous le capot. Le dépôt a recueilli plus de 10 000 étoiles sur GitHub en quelques semaines après sa publication, et est livré avec un fichier « readme » exhaustif rempli d'équations, de citations et d'une clause de non-responsabilité polie précisant qu'il n'a rien à voir avec Anthropic.

C'est de la spéculation. Mais c'est de la spéculation structurée, en code.

Voici un petit rappel sur ce qu'est Mythos : Mythos a été divulgué au public fin mars, lorsqu'Anthropic a accidentellement publié des documents préliminaires le décrivant comme le modèle le plus performant de l'entreprise à ce jour — un cran au-dessus d'Opus. Le suivi, Mythos Preview, s'est avéré être incroyablement bon en cybersécurité, au point de ne pas pouvoir être publié.

Selon Anthropic, Mythos a trouvé 271 vulnérabilités dans Firefox lors des tests Mozilla. Il est devenu le premier modèle d'IA à réaliser une simulation d'attaque de réseau d'entreprise en 32 étapes. Anthropic l'a mis sous clé au sein du Projet Glasswing, une coalition vérifiée d'environ 40 partenaires, incluant Microsoft, Apple, Amazon et la NSA.

Le public n'a jamais accès à ce modèle. Gomez a donc tenté de comprendre son fonctionnement.

L'hypothèse centrale d'OpenMythos est que Mythos est un Transformateur à Profondeur Récurrente — également appelé transformateur bouclé. Les modèles standards empilent des centaines de couches uniques. Les modèles bouclés prennent une pile plus petite et la font passer par elle-même plusieurs fois par passe avant.

En d'autres termes, ce sont les mêmes poids passant par plus d'itérations. Une réflexion plus profonde, dans un espace latent continu, avant qu'un jeton ne soit émis.

Le dépôt soutient que cela expliquerait les deux qualités les plus étranges de Mythos : il raisonne à travers des problèmes nouveaux qu'aucun autre modèle ne peut résoudre, mais sa mémorisation brute est inégale. C'est l'empreinte architecturale du bouclage — composition plutôt que stockage.

OpenMythos cite Parcae, un article d'avril 2026 de l'Université de Californie à San Diego et Together AI qui a résolu le problème d'instabilité de longue date dans les modèles bouclés — un modèle Parcae de 770 millions de paramètres correspond à un transformateur à profondeur fixe de 1,3 milliard en termes de qualité, avec des lois de mise à l'échelle prévisibles pour le nombre de boucles à exécuter. Le dépôt emprunte également l'Attention Multi-Latente de DeepSeek pour compresser la mémoire, et une configuration Mixture-of-Experts pour gérer l'étendue des domaines.

Ce qu'il n'a pas, ce sont les poids, donc fondamentalement, c'est une technique sans exécutant.

OpenMythos est théorique. Le code définit des variantes de modèle de 1 milliard à 1 billion de paramètres, mais vous devez les entraîner vous-même — le fichier readme pointe vers un script d'entraînement de 3 milliards de paramètres sur FineWeb-Edu et une cible de 30 milliards de jetons ajustée Chinchilla, ce qui représente un coût de calcul se chiffrant en centaines de milliers de dollars sur des H100. Personne ne l'a encore fait.

Alors, pourquoi est-ce important ?

Parce que c'est la deuxième fois en un mois que quelqu'un s'attaque au mur autour de Mythos. La première était une étude de Vidoc Security, qui a reproduit plusieurs des découvertes de vulnérabilités les plus alarmantes de Mythos en utilisant GPT-5.4 et Claude Opus 4.6 au sein d'un agent open-source. Sans accès à Glasswing, et pour moins de 30 $ par scan. Angle différent, même conclusion : le fossé autour de Mythos pourrait être plus mince que ne le suggérait le marketing.

OpenMythos et la reproduction de Vidoc font un travail différent. Vidoc a reproduit les sorties de Mythos — les découvertes de vulnérabilités elles-mêmes — en utilisant des modèles existants. OpenMythos tente de reproduire l'architecture — la machine réelle qui produit ces sorties. L'un dit que vous n'avez pas besoin de Mythos pour trouver les bugs que Mythos a trouvés. L'autre dit que, éventuellement, vous pourriez être capable de construire quelque chose comme Mythos vous-même.

Anthropic ne partage presque certainement pas publiquement les hypothèses architecturales de Gomez, et plusieurs des choix de conception d'OpenMythos sont des réserves explicites — le fichier readme s'assure d'être suffisamment vague pour que les utilisateurs sachent qu'il ne s'agit que d'une approche. Il répète sans cesse "probable", "suspecté" et "presque certainement". Le vrai Mythos pourrait ne pas être un transformateur bouclé du tout. Ou il pourrait en être un avec des détails que Gomez n'a pas encore rétro-ingénierisés.

Ce qu'OpenMythos démontre, c'est que la littérature de recherche contient déjà la plupart des pièces. Les transformateurs bouclés, Mixture of Experts, Multi-Latent Attention, Adaptive Computation Time, la solution de stabilité de Parcae — rien de tout cela n'est propriétaire. Le dépôt est, plus que tout, un inventaire de ce qui est publiquement connu sur la façon de construire un modèle de la classe Mythos.

Le dépôt est sous licence MIT, et il compte déjà 2 700 forks. Le script d'entraînement est là, attendant quelqu'un avec un cluster de GPU et une thèse à prouver.

Crypto populaire
Inscrivez-vous maintenant pour ne manquer aucune mise à jour !