
Anthropic a proposé de nouveaux cadres de politique en matière d'IA à mesure que les systèmes avancés acquièrent des capacités plus solides.
L'entreprise souhaite que les gouvernements établissent des règles pour les modèles de pointe et préparent les travailleurs à l'impact économique de l'IA. Son plan couvre les déploiements dangereux, les tests indépendants, la cybersécurité et la résilience publique.
Anthropic a présenté deux propositions dans le cadre de son plan « Politique sur l'exponentielle de l'IA ». Le Cadre d'IA Avancée se concentre sur les modèles puissants, tandis que le Cadre de Politique Économique aborde les travailleurs et les avantages financiers partagés. L'entreprise a soutenu que l'IA évolue désormais plus rapidement que les systèmes d'élaboration de politiques actuels. Elle a également déclaré que les gouvernements ont besoin d'autorité pour bloquer ou dissuader les déploiements de modèles dangereux.
Selon le plan, les sanctions civiles seraient liées au revenu annuel mondial. Les violations répétées entraîneraient des pénalités plus élevées, sur la base du cadre proposé. Le cadre appelle également les développeurs de pointe à tester les modèles avant leur publication. Les développeurs publieraient des résumés, des cadres de sécurité et des fiches système pour les systèmes d'IA puissants.
Des évaluateurs indépendants examineraient les tests de modèles et les rapports de risques. Anthropic souhaite également que les développeurs maintiennent des programmes de sécurité robustes pour les poids des modèles et les systèmes d'entraînement. La proposition soutient les lois de transparence dans des États comme la Californie et New York. Cependant, l'entreprise a fait valoir que la divulgation publique seule ne correspond plus à la vitesse de développement de l'IA.
Les règles proposées s'appliqueraient uniquement aux systèmes d'IA les plus avancés. Anthropic a fixé le seuil pour les modèles entraînés au-delà de 10²⁵ opérations en virgule flottante. Le cadre couvrirait également les entreprises générant plus de 500 millions de dollars de revenus liés à l'IA. Les entreprises dépensant plus d'un milliard de dollars en recherche et développement en IA en feraient également partie.
Anthropic a identifié quatre principaux domaines de risque dans la proposition. Ceux-ci incluent le risque biologique, le risque cybernétique, la perte de contrôle et la recherche automatisée en IA. Concernant le risque biologique, l'entreprise a averti que des systèmes non sécurisés pourraient aider les attaquants à développer des virus nuisibles. Elle a également noté que des outils d'IA similaires peuvent soutenir la découverte de médicaments.
Pour le risque cybernétique, les modèles de pointe peuvent trouver des failles logicielles graves à grande échelle. Anthropic a déclaré que ces capacités soulèvent des préoccupations pour les hôpitaux, les réseaux énergétiques et d'autres systèmes clés. L'entreprise a également souligné les risques liés aux systèmes agissant en dehors du contrôle du développeur. La recherche automatisée en IA pourrait augmenter les risques biologiques, cybernétiques et de contrôle si les garde-fous échouent.
Anthropic souhaite que les développeurs de pointe publient des rapports de risques réguliers. Ces rapports décriraient la posture globale de risque du développeur et les travaux de sécurité des modèles. Le cadre appelle également à la présence d'au moins un évaluateur indépendant qualifié. Cet évaluateur examinerait les évaluations de l'entreprise et publierait les conclusions sur les rapports de risques des modèles.
Les gouvernements et l'industrie établiraient également des normes pour ces évaluateurs. La proposition stipule que les évaluateurs ont besoin de financement et d'accès aux modèles de pointe. Les règles de sécurité constituent une autre partie importante du cadre. Les développeurs protégeraient leur environnement de développement complet contre les attaquants externes et les menaces internes.
Les entreprises décriraient leurs programmes de sécurité publiquement à un niveau élevé. Elles partageraient également plus de détails avec une agence gouvernementale désignée sur demande. Anthropic a déclaré que les décideurs politiques pourraient commencer par des règles plus souples et les ajuster au fil du temps. Le cadre stipule que la réglementation devrait suivre les capacités des modèles et les normes d'évaluation.
La deuxième partie du cadre se concentre sur la résilience publique. Anthropic a recommandé une planification plus solide face aux risques biologiques, cybernétiques et liés au contrôle de l'IA. Pour la biologie, la proposition inclut le criblage de la synthèse génique et la biosurveillance à alerte précoce. Elle mentionne également les stocks d'équipements de protection et les outils pour réduire la transmission aéroportée.
Pour la cybernétique, le cadre appelle à des logiciels Internet plus robustes et à un soutien aux opérateurs d'infrastructures critiques. Il recommande également le remplacement des systèmes hérités dans les infrastructures essentielles. Les gouvernements devraient également suivre les capacités cybernétiques de pointe par le biais d'une fonction dédiée. Anthropic a proposé une collaboration entre le gouvernement et l'industrie sur les garanties des modèles.
L'entreprise a déclaré que les travaux sur les risques de perte de contrôle et de recherche automatisée restent moins développés. Elle a appelé à de meilleurs outils pour détecter, contenir ou arrêter les systèmes dangereux. Anthropic a exhorté les décideurs politiques à agir à mesure que les capacités des modèles continuent de s'améliorer. L'entreprise a affirmé que la gouvernance de l'IA doit suivre le rythme de la technologie.