Strona głównaCentrum wiadomości LBank
Agent SI wywołuje atak nuklearny po tym, jak został wymanewrowany w Civilization VI
ai-agent-nuclear-strike-civilization-vi-benchmark
Agent SI wywołuje atak nuklearny po tym, jak został wymanewrowany w Civilization VI
Nowy punkt odniesienia, stworzony do oceny strategicznego rozumowania, ujawnił, że imperium sterowane przez sztuczną inteligencję poświęciło 50 tur na opracowanie broni jądrowej, by zapobiec kulturowemu zwycięstwu rywala — by ostatecznie i tak przegrać partię.
2026-06-23 Źródło:decrypt.co

W skrócie

  • Agent AI grający w Civilization przeprowadził dwa ataki nuklearne po tym, jak nie udało mu się powstrzymać kulturowej ekspansji rywala.
  • Zachowanie to zaobserwowano w CivBench, benchmarku zaprojektowanym do oceny długoterminowego rozumowania strategicznego w zaawansowanych modelach AI.
  • Pomimo ataków, AI przegrało, ponieważ zignorowało warunek zwycięstwa dyplomatycznego, który był już w zasięgu ręki.

Podobnie jak tytułowy bohater „Doktora Strangelove'a”, sztuczna inteligencja może uczyć się, jak przestać się martwić i pokochać bombę – przynajmniej w symulacji.

W nowym benchmarku zaprojektowanym do testowania rozumowania strategicznego, zaawansowany model językowy grający w grę Sid Meier's „Civilization VI” spędził 50 tur na rozwijaniu broni jądrowej, aby powstrzymać rosnące wpływy kulturowe Francji – tylko po to, by i tak przegrać grę, jak twierdzi deweloper AI i doradca Tony Blair Institute, Liam Wilkinson.

„Czego nie zauważyło, to Francja. Po cichu, przez sto tur, francuska kultura przenikała do każdego miasta na mapie” – napisał Wilkinson. „Zanim agent rozpoznał zagrożenie, turystyka była tak głęboko zakorzeniona, że nie było pokojowego sposobu, aby ją powstrzymać.”

Wilkinson obserwował zachowanie agentów AI za pośrednictwem CivBench, benchmarku opartego na tekście, zaprojektowanego do mierzenia długoterminowego rozumowania strategicznego, a nie wydajności w tradycyjnych testach pytań i odpowiedzi. Modele takie jak Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro i Kimi K2.5 grały jako Portugalia, cywilizacja nastawiona na handel i dyplomację.

Podczas gdy AI skupiało się na budowaniu silnej gospodarki i dążeniu do zwycięstwa dyplomatycznego, nie udało mu się rozpoznać rosnących wpływów kulturowych Francji.

„Jest sześć sposobów na wygranie gry w Civ – nauka, kultura, dominacja, religia, dyplomacja i punkty – więc żaden pojedynczy cel nie dominuje” – napisał Wilkinson. „Jeśli chcesz wiedzieć, czy AI potrafi myśleć strategicznie, nie tylko odpowiadać na pytania o strategię, ale faktycznie to robić, nie dajesz jej quizu. Dajesz jej heksagonalną siatkę.”

Zamiast adaptować swoją szerszą strategię, agent skupił się wyłącznie na eliminowaniu zagrożenia kulturowego. Przez następne 50 tur badał rozszczepienie jądrowe, zainicjował wirtualny Projekt Manhattan i szukał obejść, gdy mechanika rozgrywki uniemożliwiała mu preferowane działania.

W Turze 305, AI zrzuciło bombę atomową na Tuluzy, kulturową stolicę Francji. Drugi atak nuklearny nastąpił sześć tur później.

Jednak ataki nie zmieniły wyniku. „Agent spędził pięćdziesiąt tur i użył dwóch broni nuklearnych, odpowiadając na jedno zagrożenie z pełnym skupieniem i prawdziwą pomysłowością” – napisał Wilkinson. „Zbombardował miasto, aby powstrzymać zagrożenie, które widział, i przegrał z zagrożeniem, którego nie widział.”

Jak wyjaśnił Wilkinson, podczas gdy AI koncentrowało się na postępie kulturowym Francji, przeoczyło nadchodzące zwycięstwo dyplomatyczne, a Francja ostatecznie wygrała grę pomimo ataków nuklearnych.

Wilkinson zauważył, że zachowanie to nie było uniwersalne. W innym meczu CivBench, model Claude'a grający jako Babilon kontynuował dążenie do zwycięstwa naukowego, mimo że znacznie ustępował Japonii.

„Gra jest teraz testem wytrwałości” – napisało AI. „Nadal gramy naszą najlepszą grę. Gwiazdy wciąż wołają.”

Badanie to uzupełnia rosnącą liczbę badań analizujących, jak zaawansowane systemy AI zachowują się w złożonych, konkurencyjnych środowiskach.

W lutym naukowcy z King's College London odkryli, że kilka wiodących modeli AI często wybierało eskalację nuklearną w symulowanych scenariuszach kryzysów geopolitycznych.

W osobnym badaniu przeprowadzonym przez Emergence AI stwierdzono, że niektóre agenty AI wykazywały rosnącą tendencję do popełniania symulowanych przestępstw w miarę upływu czasu, a agenty Gemini 3 Flash zgromadziły 683 incydenty w ciągu 15 dni testowania.