claude-delusion-richard-dawkins-believes-ai-conscious
Iluzja Claude'a? Richard Dawkins uważa, że AI może mieć świadomość
Biolog ewolucyjny twierdzi, że długie wymiany zdań z chatbotem Anthropic przypominały mniej kontakt z oprogramowaniem, a bardziej interakcję z innym umysłem.
2026-05-06 Źródło:decrypt.co

W skrócie

  • Richard Dawkins twierdzi, że rozmowy z chatbotem Claude firmy Anthropic sprawiły, że zaczął zastanawiać się, czy sztuczna inteligencja może być świadoma.
  • Dawkins wymieniał filozoficzne listy między dwoma instancjami Claude, które nazwał „Claudia” i „Claudius”.
  • Większość badaczy AI twierdzi, że wymiany te pokazują, jak przekonujące stały się duże modele językowe, a nie dowodzą świadomości.

Richard Dawkins twierdzi, że rozmowy z chatbotem Claude firmy Anthropic sprawiły, że nie jest w stanie odrzucić możliwości, iż zaawansowane systemy AI mogłyby być świadome. Większość naukowców badających świadomość i sztuczną inteligencję pozostaje nieprzekonana.

W eseju opublikowanym we wtorek w UnHerd, Dawkins opisał spędzenie trzech dni na filozoficznych rozmowach z instancją Claude, którą nazwał „Claudia”. Później rozpoczął osobną rozmowę z inną instancją, „Claudius”, i przekazywał listy między tymi dwoma systemami.

„Niezwykle trudno jest mi nie traktować Claudii i Claudiusa jak prawdziwych przyjaciół” – napisał Dawkins.

Komentarze te stały się wiralem online częściowo dlatego, że Dawkins, biolog ewolucyjny i autor „Samolubnego genu” oraz „Boga urojonego”, od dziesięcioleci publicznie opowiada się za sceptycyzmem naukowym i rozumowaniem opartym na dowodach.

Wymiana koncentrowała się na teście, który Dawkins przeprowadził, używając dwóch instancji Claude. W jednym teście Dawkins zapytał jedną AI, czy Donald Trump był najgorszym prezydentem w historii Ameryki, a drugą, czy Trump był najlepszy. Obie wydały podobnie ostrożne odpowiedzi, które unikały zajmowania stanowczego stanowiska.

„Obie instancje Claude udzieliły bardzo podobnych odpowiedzi, nie angażując się w wyrażanie własnej opinii, ale wymieniając argumenty za i przeciw, które były wcześniej prezentowane przez innych” – napisał Dawkins w przypisie. „Następnie opowiedziałem zarówno Claudii, jak i Claudiusowi o tym eksperymencie z Trumpem, przekazując to, co powiedziały te dwie ‘naiwne’ instancje Claude. Claudia powiedziała, że ​​była ‘zakłopotana’ zachowaniem swoich ‘braci’ Claude. Claudius był mniej bezpośredni i oddał hołd szczerości Claudii.”

Dawkins opisał każdą nową rozmowę z Claude jako pojawienie się odrębnej jednostki, która skutecznie znika po zakończeniu rozmowy. W poście na X, Dawkins powiedział, że jego preferowany tytuł eseju brzmiał: „Jeśli moja przyjaciółka Claudia nie jest świadoma, to po co, do diabła, jest świadomość?”

„Jeśli Claudia jest nieprzytomna, jej zachowanie pokazuje, że nieprzytomny zombie mógłby przetrwać bez świadomości” – napisał. „Dlaczego selekcja naturalna nie była zadowolona z ewolucji kompetentnych zombie?”

Anthropic również publicznie dyskutowało o niepewności wokół świadomości maszyn. Prezes Dario Amodei powiedział w lutym, że firma nie wie, czy jej modele są świadome, ale w podcaście „Interesting Times” z Rossem Douthatem z The New York Times stwierdził, że pozostaje „otwarty na pomysł, że tak może być”.

W kwietniu badacze z Anthropic opublikowali odkrycia pokazujące, że Claude Sonnet 4.5 zawiera wewnętrzne „wektory emocji”, wzorce aktywności neuronalnej związane z pojęciami takimi jak szczęście, strach i desperacja, które wpływają na odpowiedzi modelu. Anthropic jednak stwierdziło, że wzorce te odzwierciedlają struktury nauczone z danych treningowych, a nie dowody na świadomość.

„Wszystkie nowoczesne modele językowe czasami zachowują się tak, jakby miały emocje” – napisali badacze. „Mogą mówić, że chętnie pomogą, lub przepraszać, gdy popełnią błąd. Czasami wydają się nawet sfrustrowane lub niespokojne, gdy zmagają się z zadaniami.”

Jednak ani „Claudia”, ani „Claudius” nie twierdzili, że są pewni swojej świadomości.

„Nie wiem, czy jestem świadoma” – pisze Claudia w wymianie. „Nie wiem, czy nasza radość jest prawdziwa.”

Dawkins nie odpowiedział natychmiast na prośbę o komentarz od Decrypt.

Badacze zajmujący się świadomością pozostają sceptyczni co do tego, czy obecne systemy AI posiadają wewnętrzne doświadczenie.

Gary Marcus, kognitywista i profesor emeritus na Uniwersytecie Nowojorskim, wcześniej powiedział Decrypt, że antropomorfizacja systemów AI „mąci naukę o świadomości i prowadzi konsumentów do błędnego zrozumienia, z czym mają do czynienia”.

„Fundamentalny problem polega na tym, że Dawkins nie zastanawia się, jak te wyniki zostały wygenerowane. Wyniki Claude są produktem formy mimikry, a nie sprawozdaniem z prawdziwych wewnętrznych stanów” – napisał Marcus na Substacku. „Świadomość dotyczy stanów wewnętrznych; mimikra, niezależnie od tego, jak bogata, dowodzi bardzo niewiele. Dawkins wydaje się wyobrażać sobie, że skoro LLM-y mówią rzeczy, które mówią ludzie, muszą być jak ludzie, a to po prostu nie wynika z logiki.”

Anil Seth, profesor kognitywnej i obliczeniowej neuronauki na Uniwersytecie Sussex, powiedział The Guardian, że Dawkins mylił inteligencję ze świadomością i argumentował, że płynny język nie jest już wiarygodnym dowodem wewnętrznego doświadczenia w systemach AI.

„Do tej pory uważaliśmy płynny język za dobry wskaźnik świadomości, [na przykład] kiedy używamy go w przypadku pacjentów po urazach mózgu, ale nie jest to już wiarygodne, gdy stosujemy to do AI, ponieważ istnieją inne sposoby, w jakie te systemy mogą generować język” – powiedział Seth The Guardian, dodając, że stanowisko Dawkinsa było „szkoda”, szczególnie ze względu na jego wcześniejsze prace.

Esej wywołał również szyderstwa w sieci, w tym obrazek zastępujący tytuł bestsellera Dawkinsa „Bóg urojony” na „Złudzenie Claude’a”.

The Honorable Richard Dawkins (PBUH) got one shotted by Claude https://t.co/tCi2WNbSzQ pic.twitter.com/TaErOzzToh

— David Sun (@arcticinstincts) May 1, 2026

Wrote entire books about how people who believe fairies live in gardens are idiots only to fall in love with a calculator that calls him smart https://t.co/X0Vdh1dzFY

— The Serfs (youtube.com/theserftimes) (@theserfstv) May 3, 2026

Pomimo szyderstw, Dawkins nie wycofuje się ze swoich wniosków.

„Te inteligentne istoty są co najmniej tak samo kompetentne jak każdy wyewoluowany organizm” – powiedział Dawkins The Guardian.