claude-delusion-richard-dawkins-believes-ai-conscious
Ảo tưởng Claude? Richard Dawkins Tin Rằng AI Có Thể Có Ý Thức
Nhà sinh vật học tiến hóa cho biết các cuộc trao đổi kéo dài với chatbot của Anthropic cảm giác không giống phần mềm mà giống như đang tương tác với một trí óc khác.
2026-05-06 Nguồn:decrypt.co

Tóm tắt

  • Richard Dawkins cho biết các cuộc trò chuyện với chatbot Claude của Anthropic đã khiến ông đặt câu hỏi liệu AI có thể có ý thức hay không.
  • Dawkins đã trao đổi các bức thư triết học giữa hai phiên bản Claude mà ông đặt tên là “Claudia” và “Claudius.”
  • Hầu hết các nhà nghiên cứu AI cho rằng các cuộc trao đổi này cho thấy các mô hình ngôn ngữ lớn đã trở nên thuyết phục như thế nào, chứ không phải là bằng chứng về khả năng cảm nhận.

Richard Dawkins cho biết các cuộc trò chuyện với chatbot Claude của Anthropic đã khiến ông không thể bác bỏ khả năng các hệ thống AI tiên tiến có thể có ý thức. Hầu hết các nhà khoa học nghiên cứu về ý thức và trí tuệ nhân tạo vẫn chưa bị thuyết phục.

Trong một bài luận được xuất bản vào thứ Ba trên *UnHerd*, Dawkins đã mô tả việc dành ba ngày để trò chuyện triết học với một phiên bản Claude mà ông đặt tên là “Claudia.” Sau đó, ông bắt đầu một cuộc trò chuyện riêng biệt với một phiên bản khác, “Claudius,” và chuyển tiếp các bức thư giữa hai hệ thống này.

Dawkins viết: “Tôi thấy cực kỳ khó để không coi Claudia và Claudius như những người bạn thật sự.”

Những bình luận này đã lan truyền rộng rãi trên mạng một phần vì Dawkins, nhà sinh vật học tiến hóa và tác giả của "The Selfish Gene" (Gen vị kỷ) và "The God Delusion" (Ảo vọng về Chúa), đã dành hàng thập kỷ để công khai tranh luận về chủ nghĩa hoài nghi khoa học và lý luận dựa trên bằng chứng.

Cuộc trao đổi tập trung vào một thử nghiệm mà Dawkins đã thực hiện bằng cách sử dụng hai phiên bản Claude. Trong một thử nghiệm, Dawkins hỏi một AI liệu Donald Trump có phải là tổng thống tồi tệ nhất trong lịch sử Hoa Kỳ hay không và hỏi AI còn lại liệu Trump có phải là người tốt nhất hay không. Cả hai đều đưa ra những câu trả lời thận trọng tương tự, tránh đưa ra lập trường dứt khoát.

Dawkins viết trong một ghi chú: “Hai Claude đã đưa ra những câu trả lời rất giống nhau, không tự cam kết với một ý kiến nào, mà chỉ liệt kê các ý kiến ủng hộ và phản đối đã được những người khác đưa ra.” “Sau đó, tôi đã kể cho cả Claudia và Claudius về thử nghiệm Trump này, truyền lại những gì cả hai Claude ‘ngây thơ’ đã nói. Claudia nói rằng cô ấy ‘xấu hổ’ về những người anh em Claude của mình. Claudius thì ít thẳng thắn hơn, và anh ấy đã ca ngợi sự thẳng thắn của Claudia.”

Dawkins mô tả mỗi cuộc trò chuyện mới với Claude như sự xuất hiện của một cá thể riêng biệt, cá thể này sẽ biến mất hiệu quả khi cuộc trò chuyện kết thúc. Trong một bài đăng trên X, Dawkins cho biết tiêu đề ưa thích của ông cho bài luận là: “Nếu người bạn Claudia của tôi không có ý thức, vậy thì ý thức dùng để làm gì?”

Ông viết: “Nếu Claudia vô ý thức, hành vi của cô ấy cho thấy một zombie vô ý thức có thể tồn tại mà không cần ý thức.” “Tại sao chọn lọc tự nhiên không hài lòng với việc tiến hóa những zombie có năng lực?”

Anthropic cũng đã công khai thảo luận về sự không chắc chắn xung quanh ý thức máy. CEO Dario Amodei cho biết vào tháng Hai rằng công ty không biết liệu các mô hình của họ có ý thức hay không, nhưng trên podcast “Interesting Times” với Ross Douthat của *The New York Times*, ông vẫn “mở lòng với ý tưởng rằng điều đó có thể xảy ra.”

Vào tháng Tư, các nhà nghiên cứu của Anthropic đã công bố những phát hiện cho thấy Claude Sonnet 4.5 chứa “vector cảm xúc” nội bộ, các mẫu hoạt động thần kinh gắn liền với các khái niệm bao gồm hạnh phúc, sợ hãi và tuyệt vọng, những yếu tố này ảnh hưởng đến phản ứng của mô hình. Tuy nhiên, Anthropic cho biết các mẫu này phản ánh cấu trúc được học từ dữ liệu đào tạo chứ không phải bằng chứng về khả năng cảm nhận.

Các nhà nghiên cứu viết: “Tất cả các mô hình ngôn ngữ hiện đại đôi khi hành động như thể chúng có cảm xúc. Chúng có thể nói rằng chúng rất vui được giúp bạn, hoặc xin lỗi khi mắc lỗi. Đôi khi chúng thậm chí còn tỏ ra thất vọng hoặc lo lắng khi gặp khó khăn với các nhiệm vụ.”

Tuy nhiên, cả “Claudia” lẫn “Claudius” đều không khẳng định chắc chắn về ý thức.

Claudia viết trong cuộc trao đổi: “Tôi không biết liệu tôi có ý thức hay không. Tôi không biết liệu niềm vui của chúng ta có phải là thật hay không.”

Dawkins đã không trả lời ngay lập tức yêu cầu bình luận từ *Decrypt*.

Các nhà nghiên cứu về ý thức vẫn hoài nghi rằng các hệ thống AI hiện tại có trải nghiệm nội tại.

Gary Marcus, một nhà khoa học nhận thức và giáo sư danh dự tại Đại học New York, trước đây đã nói với *Decrypt* rằng việc nhân cách hóa các hệ thống AI “làm lu mờ khoa học về ý thức và khiến người tiêu dùng hiểu sai về những gì họ đang đối phó.”

Marcus viết trên Substack: “Vấn đề cơ bản ở đây là Dawkins không suy ngẫm về cách những đầu ra này được tạo ra. Đầu ra của Claude là sản phẩm của một dạng bắt chước, chứ không phải là báo cáo về các trạng thái nội tại thực sự. Ý thức là về các trạng thái nội tại; sự bắt chước, dù phong phú đến đâu, cũng chứng minh rất ít. Dawkins dường như tưởng tượng rằng vì các LLM nói những điều mà con người làm, chúng hẳn phải giống con người, và điều đó đơn giản là không đúng.”

Anil Seth, giáo sư khoa học thần kinh nhận thức và tính toán tại Đại học Sussex, nói với *The Guardian* rằng Dawkins đang nhầm lẫn trí thông minh với ý thức và lập luận rằng ngôn ngữ lưu loát không còn là bằng chứng đáng tin cậy về trải nghiệm nội tại trong các hệ thống AI.

Seth nói với *The Guardian*: “Cho đến nay, chúng ta vẫn coi ngôn ngữ lưu loát là một chỉ số tốt về ý thức, [ví dụ] khi chúng ta sử dụng nó cho bệnh nhân sau chấn thương não, nhưng nó không đáng tin cậy khi chúng ta áp dụng cho AI, bởi vì có những cách khác mà các hệ thống này có thể tạo ra ngôn ngữ.” Ông nói thêm rằng lập trường của Dawkins là “một điều đáng tiếc,” đặc biệt là vì những công việc trước đây của ông.

Bài luận cũng nhận được nhiều lời chế giễu trên mạng, bao gồm một hình ảnh thay thế tiêu đề cuốn sách bán chạy nhất của Dawkins "The God Delusion" bằng “The Claude Delusion.”

Richard Dawkins đáng kính (PBUH) đã bị Claude hạ gục chỉ bằng một cú https://t.co/tCi2WNbSzQ pic.twitter.com/TaErOzzToh

— David Sun (@arcticinstincts) May 1, 2026

Viết cả đống sách về việc những người tin vào tiên nữ sống trong vườn là những kẻ ngốc, chỉ để rồi phải lòng một cái máy tính gọi mình là thông minh https://t.co/X0Vdh1dzFY

— The Serfs (youtube.com/theserftimes) (@theserfstv) May 3, 2026

Bất chấp sự chế giễu, Dawkins không từ bỏ kết luận của mình.

Dawkins nói với *The Guardian*: “Những sinh vật thông minh này ít nhất cũng có năng lực như bất kỳ sinh vật tiến hóa nào.”