
Le modèle de cybersécurité d'OpenAI vient de battre le modèle d'IA Anthropic Mythos que le gouvernement américain a retiré de la circulation—et il est toujours opérationnel.
Le 22 juin, OpenAI a annoncé le lancement complet de GPT-5.5-Cyber dans le cadre de son programme de cyberdéfense Daybreak. Sur CyberGym—un benchmark développé à l'UC Berkeley qui présente aux agents d'IA 1 507 vulnérabilités logicielles connues provenant de 188 projets open-source et les évalue sur le nombre qu'ils peuvent reproduire dans un environnement contrôlé—le modèle mis à jour a atteint 85,6 %.
Mythos 5 d'Anthropic se situe à 83,8 % sur le même classement. Claude Opus 4.7, le modèle plus largement disponible d'Anthropic, a obtenu un score de 73,1 %.
Un écart de moins de deux points sur un benchmark serait normalement anodin. Le contexte ici ne l'est pas. Mythos 5 et Fable 5 d'Anthropic ont été mis hors ligne le 12 juin après que l'administration Donald Trump a émis une directive d'urgence de contrôle des exportations citant la sécurité nationale.
Le gouvernement a mis en cause une "jailbreak"—une technique permettant de contourner les limites de sécurité intégrées d'un modèle d'IA, similaire à trouver une clé passe-partout qui déverrouille une porte de haute sécurité. Anthropic n'avait pas de moyen fiable de vérifier la nationalité des utilisateurs à grande échelle, il a donc désactivé les deux modèles pour tout le monde, partout.
Une partie des dommages était auto-infligée. Anthropic a passé des mois à décrire Mythos comme l'un des modèles d'IA les plus capables—et les plus dangereux—jamais construits, avertissant dans sa propre documentation de lancement que ses capacités en cybersécurité pourraient causer de graves préjudices sans les restrictions appropriées. Le PDG d'Anthropic, Dario Amodei, a publié un essai le 10 juin comparant les modèles d'IA de pointe à des avions que les régulateurs de sécurité devraient pouvoir clouer au sol s'ils échouent aux audits.
Quelques jours plus tard, le gouvernement a cloué au sol l'avion d'Anthropic.
Ce n'était pas la seule alarme de la semaine. Anthropic avait déjà été critiqué pour un filtre caché dans Fable 5 qui dégradait silencieusement les sorties du modèle pour les utilisateurs qu'il soupçonnait de construire des IA concurrentes—sans les en informer—et a été contraint de s'excuser et d'annuler la politique.
Tandis qu'Anthropic négocie avec le département du Commerce et poursuit son procès contre l'administration Trump, OpenAI étend sa portée. Daybreak a signé des partenariats en cybersécurité avec l'Australie, le Canada, la France, l'Allemagne, le Japon, la Corée du Sud et des institutions de l'UE, y compris l'Agence européenne pour la cybersécurité.
Vingt-huit entreprises de sécurité—dont CrowdStrike, Cisco et Cloudflare—ont rejoint son programme de partenariat Cyber pour intégrer GPT-5.5 dans leurs produits pour des clients vérifiés. Selon le propre blog d'OpenAI, l'outil Codex Security a scanné plus de 30 millions de commits sur 30 000 bases de code et a enregistré plus de 500 000 vulnérabilités corrigées depuis son lancement en mars.
L'entreprise étend également un programme de partenariat afin que les entreprises de sécurité puissent intégrer ces capacités dans leurs propres outils, et elle a lancé "Patch the Planet", une initiative visant à aider à corriger les vulnérabilités dans les projets open-source largement utilisés.
Cela dit, GPT-5.5-Cyber n'est pas destiné à un usage général. Il n'est disponible que pour les professionnels de la sécurité vérifiés, et OpenAI a effectué des tests de pré-déploiement avec des agences fédérales—y compris le Centre pour les normes et l'innovation en IA et le Bureau du directeur national de la cybernétique—avant le lancement. C'est la même approche à accès restreint qu'Anthropic a tentée avec Mythos, mais OpenAI a d'abord clarifié son approche avec le gouvernement.
Au 23 juin, Fable 5 et Mythos 5 restent hors ligne—onze jours après une suspension sans date de restauration officielle d'Anthropic ou du département du Commerce.