
Anthropic étend l'accès à son modèle d'IA Claude Mythos via le Projet Glasswing, un programme visant à permettre aux entreprises technologiques et de sécurité, ainsi qu'aux gouvernements, de découvrir et de corriger les bogues et les exploits potentiels avant la publication publique du puissant modèle.
Dans un billet de blog publié mardi, Anthropic a déclaré ajouter environ 150 organisations à son programme contrôlé, l'entreprise se préparant à une diffusion plus large du modèle controversé.
Cette expansion intervient après qu'Anthropic a déclaré s'attendre à proposer des modèles de classe Mythos aux clients « dans les prochaines semaines » une fois que des mesures de protection supplémentaires seront mises en place. Cette nouvelle survient également alors qu'Anthropic se prépare à entrer en bourse après avoir déposé confidentiellement une demande d'IPO lundi auprès de la Securities and Exchange Commission (Commission des valeurs mobilières des États-Unis).
« Après plusieurs semaines de collaboration étroite avec nos partenaires du Projet Glasswing, l'industrie de la sécurité, les mainteneurs de logiciels open-source et le gouvernement américain, nous étendons le partenariat à environ 150 nouvelles organisations », a écrit Anthropic. « Chacune d'entre elles devra satisfaire à nos exigences de sécurité avant d'obtenir l'accès. »
La dernière expansion du Projet Glasswing inclut des organisations issues de secteurs d'infrastructures critiques, notamment l'énergie, l'eau, la santé, les communications et le matériel. Anthropic a déclaré que bon nombre des nouvelles organisations maintiennent des logiciels utilisés par les gouvernements et des centaines de millions de personnes.
« Ce que chaque partenaire a en commun, c'est qu'une attaque réussie sur leur base de code pourrait être catastrophique », a écrit Anthropic. « Pour la plupart des partenaires, nous estimons qu'une attaque majeure pourrait affecter plus de 100 millions de personnes, avec d'importantes ramifications pour la sécurité mondiale et nationale. »
Claude Mythos est apparu publiquement en mars après que des documents préliminaires d'Anthropic aient fuité en ligne. Selon Anthropic, les organisations ayant précédemment obtenu l'accès ont déjà utilisé Mythos Preview pour identifier plus de 10 000 vulnérabilités logicielles de gravité élevée ou critique. Les partenaires utilisent également le modèle pour écrire des correctifs, effectuer des audits de sécurité et tester des logiciels avant leur publication.
Les capacités du modèle ont suscité des inquiétudes chez les chercheurs et les agences gouvernementales, craignant que des systèmes d'IA de plus en plus performants ne facilitent l'exécution de cyberattaques.
Le U.K. AI Security Institute a rapporté que Mythos a mené de manière autonome une attaque simulée de réseau d'entreprise en 32 étapes lors de tests. Mozilla a déclaré que le modèle avait identifié 271 vulnérabilités qu'il a corrigées dans le navigateur web Firefox, tandis que la startup de sécurité Calif a affirmé qu'une version préliminaire avait aidé les chercheurs à développer une chaîne d'exploitation ciblant les puces informatiques M5 d'Apple.
Anthropic a déclaré étendre l'accès à Mythos car l'entreprise estime que les défenseurs ont besoin d'outils d'IA de plus en plus performants avant que les attaquants n'acquièrent des capacités similaires. L'entreprise a ajouté qu'elle s'attend à ce que d'autres développeurs lancent des modèles de classe Mythos dans les six à douze prochains mois, potentiellement sans protections comparables, ce qui soulève la perspective de cyberattaques plus fréquentes et moins prévisibles.
« À l'avenir, les lancements de modèles de pointe deviendront de plus en plus critiques. Les capacités continueront de s'améliorer dans tous les domaines, y compris de nombreux domaines qui — comme la cybersécurité — peuvent renforcer les attaquants comme les défenseurs », a écrit Anthropic. « Si nous réussissons, nous espérons offrir un avantage permanent aux défenseurs. »
Anthropic n'a pas immédiatement répondu à une demande de commentaire de Decrypt.
Avec l'accès privé étendu, les utilisateurs de Myriad – une plateforme de marché de prédiction exploitée par Dastan, la société mère de Decrypt – perdent confiance quant à la publication de Claude Mythos au public d'ici fin juin. Ils n'estiment qu'à 26,5 % la probabilité de cette publication à l'heure actuelle, contre un pic de 58,5 % la semaine dernière.