george-hotz-vibe-coding-ai-slop-warning
Hacker lừng danh từng bẻ khóa iPhone, Sony cảnh báo tác nhân lập trình AI là thảm họa tiềm tàng
George Hotz đã dành sáu tháng thử nghiệm các tác nhân trên các dự án thực tế và đã tin chắc rằng chúng đang tạo ra một núi những thứ cẩu thả khó phát hiện — và rằng các tổ chức lớn sẽ không nhận ra điều đó cho đến khi quá muộn.
2026-05-25 Nguồn:decrypt.co

Tóm tắt

  • George Hotz, hacker đứng sau vụ bẻ khóa iPhone đầu tiên và hack PlayStation 3, đã đăng một bài viết blog vào Chủ nhật, gọi việc áp dụng các tác nhân mã hóa AI là "một trong những sai lầm tốn kém nhất trong lịch sử lĩnh vực này."
  • Lập luận chính của ông: những người có năng lực cao có thể phát hiện lỗi từ tác nhân, nhưng các kỹ sư yếu hơn thì không—và chính những kỹ sư yếu hơn này đang tạo ra khối lượng gấp mười lần, làm giảm chất lượng mã trung bình trên quy mô lớn.
  • Bài viết được đăng năm ngày sau khi Andrej Karpathy gia nhập đội ngũ tiền đào tạo của Anthropic với quan điểm đối lập, đánh dấu sự chia rẽ rõ ràng giữa các kỹ sư hàng đầu về việc liệu các tác nhân AI có thực sự hiệu quả hay không.

George Hotz—hacker lần đầu bẻ khóa iPhone ở tuổi 17 và đảo ngược kỹ thuật PlayStation 3 trước khi Sony kiện anh ta vì việc này—đã đăng một bài viết blog vào Chủ nhật, lập luận rằng việc áp dụng rộng rãi các tác nhân mã hóa AI sẽ dẫn đến thảm họa, hoặc ít nhất là gần như vậy.

“Tôi xin khẳng định ngay bây giờ, việc áp dụng các tác nhân AI vào phát triển phần mềm sẽ là một trong những sai lầm tốn kém nhất trong lịch sử lĩnh vực này,” Hotz viết. “Các tác nhân không thể lập trình, và chúng ta ngày càng mất nhiều thời gian hơn để nhận ra điều đó.”

“Đầu ra bị lỗi, nhưng theo một cách ngày càng khó phát hiện hơn. Đó chính xác là điều bạn mong đợi từ một mô hình thống kê ngày càng chính xác.”

Bài viết, có tựa đề "The Eternal Sloptember," được đăng năm ngày sau khi Andrej Karpathy, một trong những nhà nghiên cứu AI nổi bật nhất, gia nhập đội ngũ tiền đào tạo của Anthropic với quan điểm rõ ràng rằng các tác nhân AI đã thay đổi quá trình phát triển phần mềm. Hai người đàn ông này hiện đại diện cho hai thái cực đối lập trong một cuộc tranh luận mà ngành công nghiệp vẫn chưa đi đến hồi kết—và cả hai đều có uy tín thực sự để đưa ra lập trường.

Cập nhật cá nhân: Tôi đã gia nhập Anthropic. Tôi nghĩ vài năm tới ở ranh giới của LLM sẽ đặc biệt mang tính định hình. Tôi rất hào hứng được gia nhập đội ngũ ở đây và trở lại với R&D. Tôi vẫn rất đam mê giáo dục và dự định sẽ tiếp tục công việc đó đúng lúc.

— Andrej Karpathy (@karpathy) May 19, 2026

Hotz không đưa ra kết luận của mình từ bên lề. Ông đã dành sáu tháng sử dụng các tác nhân trong các dự án thực tế: một phần của Tinygrad, framework học sâu mã nguồn mở của ông, và một dự án đảo ngược kỹ thuật firmware hoàn chỉnh của chip USB-PCIe. “Tác nhân làm tất cả tiến trình ban đầu,” ông viết, rồi đưa cho bạn cái mà ông mô tả như một cần gạt máy đánh bạc—bạn kéo nó và hy vọng công việc hoàn thiện sẽ được thực hiện.

Nó không bao giờ thực sự hoàn thành.

Không phải về cái tôi

Hotz dự đoán phản ứng rõ ràng: một lập trình viên xác định một phần danh tính của mình thông qua nghề nghiệp sẽ tự nhiên phản đối các công cụ đe dọa thay thế anh ta. Ông xem xét phản đối này một cách nghiêm túc và bác bỏ nó dựa trên giá trị thực tế.

“Tôi đã suy nghĩ nhiều hơn về việc bảo toàn giá trị bản thân. AFL của Google đã tìm thấy nhiều lỗi hơn LLM và không ai cảm thấy như vậy về nó. Cờ Vua và Cờ Vây phổ biến hơn bao giờ hết,” Hotz viết. Và ông ấy đúng theo nghĩa là AI Cờ Vua đã thống trị con người trong nhiều thập kỷ và trò chơi này chỉ càng trở nên phổ biến hơn.

Vì vậy, mối lo ngại của ông không phải là bị thay thế. Đó là về điều gì sẽ xảy ra với chất lượng mã khi mọi người cùng lúc sử dụng các công cụ này, đặc biệt khi các gã khổng lồ công nghệ và Phố Wall không ngừng thúc đẩy việc sử dụng rộng rãi các công cụ này.

“Tôi gần như nghĩ đây là một dạng thao túng tâm lý để bán tác nhân,” Hotz lập luận. “Nỗi sợ mất mát là một trong những cách duy nhất để khiến các công ty lớn hành động. Mặc dù tôi nghĩ trong nỗi sợ đó, họ đang mắc phải một sai lầm lớn.”

Lập luận trung tâm của ông là về mặt tổ chức. Những người có năng lực cao có vòng lặp phản hồi đủ chặt chẽ để phát hiện các vấn đề do tác nhân tạo ra trước khi triển khai. Họ đọc mã, phát hiện lỗi và điều chỉnh thời điểm tin tưởng công cụ. “Những người có năng lực thấp sẽ không có khả năng tự kiểm tra đó,” ông viết—và chính họ là những người sử dụng tác nhân để tạo ra khối lượng gấp 10 lần so với trước đây. Tại một công ty lớn, phép tính đó dẫn đến một điều cụ thể: sự suy giảm nhanh chóng về chất lượng mã trung bình, bị che đậy bởi khối lượng tuyệt đối.

Ông lập luận rằng kết quả sẽ là “một kỷ nguyên vàng cho vô số mã kém chất lượng, và một thời kỳ đen tối cho những viên ngọc chất lượng.” Để minh họa cụ thể, ông chỉ ra các báo cáo rằng Apple đang thúc đẩy các công cụ mã hóa AI trên toàn bộ tổ chức kỹ thuật của mình, sau đó chỉ đơn giản hỏi: “Bạn có nghĩ macOS sẽ tốt hơn hay tệ hơn trong 2 năm tới không?”

Lập trường của các phe phái

Hotz hiện tự xếp mình vào cái mà ông gọi là “phe LeCun/Marcus”—ám chỉ Yann LeCun, nhà khoa học AI trưởng của Meta, và Gary Marcus, một người hoài nghi LLM lâu năm. Cả hai đều lập luận rằng các mô hình ngôn ngữ về cơ bản là những công cụ khớp mẫu tinh vi: Chúng có thể bắt chước phân phối của mã hiện có, nhưng không thể suy luận thông qua các vấn đề thực sự mới từ các nguyên tắc cơ bản.

Mã hóa theo cảm tính (vibe coding)—mô tả những gì bạn muốn bằng ngôn ngữ tự nhiên và để AI tạo ra phần triển khai—đã bùng nổ trong năm qua, và các phòng thí nghiệm lớn đã định vị mã hóa dựa trên tác nhân là một sản phẩm chủ lực. Microsoft đã biến GitHub Copilot thành một hệ thống tác nhân hoàn chỉnh vào năm 2025, với CEO Satya Nadella mô tả đó là một sự thay đổi cấp độ nền tảng có thể so sánh với việc chuyển đổi sang đám mây.

Sự phản đối lập trường của Hotz không phải là trừu tượng. Karpathy, người từng hoài nghi về các tác nhân vào đầu năm 2025, đã thay đổi lập trường của mình sau các bản phát hành mô hình mới và gia nhập đội ngũ tiền đào tạo của Anthropic vào ngày 19 tháng 5—năm ngày trước khi Hotz công bố bài viết. Ông mô tả vài năm tới ở biên giới này là “đặc biệt mang tính định hình.”

CEO của Anthropic, Dario Amodei, cho biết tại Davos rằng một số kỹ sư của Anthropic đã ngừng tự viết mã, để các mô hình xử lý trong khi họ xem xét đầu ra. Về phần mình, Hotz nói rằng ông đã cố gắng làm điều tương tự và thấy mình phải tự sửa lỗi thủ công mỗi lần.