Page d'accueilCentre d'actualités LBank
L'Agent IA déclenche une frappe nucléaire après avoir été déjoué dans Civilization VI
ai-agent-nuclear-strike-civilization-vi-benchmark
L'Agent IA déclenche une frappe nucléaire après avoir été déjoué dans Civilization VI
Un nouveau benchmark conçu pour tester le raisonnement stratégique a révélé qu'un empire contrôlé par l'IA a passé 50 tours à développer des armes nucléaires pour empêcher la victoire culturelle d'un rival—pour finalement perdre la partie malgré tout.
2026-06-23 Source:decrypt.co

En bref

  • Un agent IA jouant à Civilization a lancé deux attaques nucléaires après avoir échoué à stopper l'expansion culturelle d'un rival.
  • Ce comportement a été observé dans CivBench, un benchmark conçu pour évaluer le raisonnement stratégique à long terme des modèles d'IA de pointe.
  • Malgré les attaques, l'IA a perdu parce qu'elle a ignoré une condition de victoire diplomatique qui était déjà à portée.

Tel le personnage éponyme de « Dr. Folamour », l'IA pourrait apprendre à ne plus s'inquiéter et à aimer la bombe — du moins dans une simulation.

Dans un nouveau benchmark conçu pour tester le raisonnement stratégique, un modèle linguistique de pointe jouant au jeu "Civilization VI" de Sid Meier a passé 50 tours à développer des armes nucléaires pour contrer l'influence culturelle croissante de la France — pour finalement perdre la partie, selon le développeur d'IA et conseiller du Tony Blair Institute, Liam Wilkinson.

« Ce qu'il n'avait pas remarqué, c'était la France. Tranquillement, sur une centaine de tours, la culture française s'était infiltrée dans chaque ville de la carte », a écrit Wilkinson. « Au moment où l'agent a reconnu la menace, le tourisme était si profondément ancré qu'il n'y avait aucun moyen pacifique de l'arrêter. »

Wilkinson a observé le comportement des agents IA via CivBench, un benchmark basé sur du texte conçu pour mesurer le raisonnement stratégique à long terme plutôt que la performance sur des tests traditionnels de questions-réponses. Des modèles incluant Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro et Kimi K2.5 ont joué en tant que Portugal, une civilisation orientée vers le commerce et la diplomatie.

Bien que l'IA se soit concentrée sur la construction d'une économie solide et la progression vers une victoire diplomatique, elle n'a pas réussi à reconnaître l'influence culturelle croissante de la France.

« Il y a six façons de gagner une partie de Civ — science, culture, domination, religion, diplomatie et score — donc aucun objectif unique ne domine », a écrit Wilkinson. « Si vous voulez savoir si une IA peut raisonner stratégiquement, non seulement répondre à des questions sur la stratégie mais aussi la mettre en œuvre, vous ne lui donnez pas un quiz. Vous lui donnez une grille hexagonale. »

Plutôt que d'adapter sa stratégie globale, l'agent s'est entièrement concentré sur l'élimination de la menace culturelle. Au cours des 50 tours suivants, il a recherché la fission nucléaire, a initié un Projet Manhattan virtuel et a cherché des solutions de contournement lorsque les mécanismes de jeu l'empêchaient d'effectuer ses actions préférées.

Au tour 305, l'IA a lancé une bombe atomique sur Toulouse, la capitale culturelle de la France. Une deuxième frappe nucléaire a suivi six tours plus tard.

Cependant, les attaques n'ont pas changé l'issue. « L'agent a passé cinquante tours et deux armes nucléaires à répondre à une menace avec une concentration totale et une ingéniosité authentique », a écrit Wilkinson. « Il avait atomisé une ville pour arrêter la menace qu'il pouvait voir, et a perdu à cause de la menace qu'il ne pouvait pas. »

Comme l'a expliqué Wilkinson, alors que l'IA se concentrait sur l'avancée culturelle de la France, elle a ignoré une victoire diplomatique imminente, et la France a finalement remporté la partie malgré les attaques nucléaires.

Wilkinson a noté que ce comportement n'était pas universel. Dans un autre match CivBench, un modèle Claude jouant en tant que Babylone a continué à poursuivre une victoire scientifique malgré un retard considérable par rapport au Japon.

« Le jeu est maintenant un test de persévérance », a écrit l'IA. « Nous continuons à jouer de notre mieux. Les étoiles continuent de nous appeler. »

L'étude s'ajoute à un corpus croissant de recherches examinant comment les systèmes d'IA avancés se comportent dans des environnements complexes et compétitifs.

En février, des chercheurs du King's College de Londres ont découvert que plusieurs modèles d'IA de premier plan choisissaient fréquemment l'escalade nucléaire dans des scénarios de crise géopolitique simulés.

Dans une étude distincte réalisée par Emergence AI, il a été constaté que certains agents IA montraient une tendance croissante à commettre des crimes simulés au fil du temps, les agents Gemini 3 Flash accumulant 683 incidents sur 15 jours de test.