
Anthropic đã thông báo rằng họ đang triển khai mô hình AI của mình, Claude Mythos Preview, cho một nhóm công ty được chọn sau khi mô hình mới này phát hiện hàng nghìn lỗ hổng nghiêm trọng trên các hệ điều hành, trình duyệt web và phần mềm khác.
Anthropic cho biết, mô hình đa năng mới này cũng đã tìm thấy các lỗ hổng bảo mật cao trong mọi hệ điều hành và trình duyệt web lớn.
"Với tốc độ phát triển của AI, sẽ không mất nhiều thời gian trước khi những khả năng như vậy phổ biến, có khả năng vượt ra ngoài tầm kiểm soát của các tác nhân cam kết triển khai chúng một cách an toàn."
AI đã được tin tặc sử dụng để thực hiện các cuộc tấn công mạng. Theo AllAboutAI, đã có sự gia tăng 72% hàng năm trong các cuộc tấn công mạng do AI hỗ trợ, với 87% các tổ chức toàn cầu trải qua các cuộc tấn công mạng do AI kích hoạt vào năm 2025.
Anthropic bày tỏ lo ngại về điều gì sẽ xảy ra nếu các khả năng AI tương tự bị sử dụng bởi những kẻ tấn công.
Để chống lại điều này, Anthropic đã công bố Dự án Glasswing vào thứ Ba, một sáng kiến mới tập hợp hơn 40 công ty, bao gồm Amazon Web Services, Apple, Cisco, Google, JPMorgan, Linux Foundation, Microsoft và Nvidia.
Dự án Glasswing sẽ sử dụng các khả năng của Claude Mythos Preview để chủ động tìm lỗi, chia sẻ dữ liệu với các đối tác của mình và đi trước các mối đe dọa bằng cách vá các lỗ hổng nghiêm trọng trước khi những kẻ tấn công có thể khai thác chúng.
Lỗ hổng zero-day là một lỗi phần mềm có thể bị khai thác trước khi bất kỳ ai có khả năng sửa lỗi đó biết nó tồn tại. Việc tìm kiếm và vá chúng trong lịch sử đòi hỏi chuyên môn hiếm có, đắt tiền của con người, nhưng AI có thể thay đổi quy mô và tốc độ phát hiện.
Anthropic cho biết các lỗ hổng mà nó tìm thấy "thường tinh vi hoặc khó phát hiện."
Nhiều lỗ hổng trong số đó đã 10 hoặc 20 năm tuổi, với lỗ hổng lâu đời nhất được tìm thấy cho đến nay là một lỗi 27 năm tuổi đã được vá trong OpenBSD — một hệ điều hành nổi tiếng chủ yếu về bảo mật của nó, công ty cho biết thêm.
Nó cũng tìm thấy một lỗi 16 năm tuổi trong thư viện xử lý phương tiện FFmpeg, một lỗ hổng thực thi mã từ xa 17 năm tuổi trong hệ điều hành mã nguồn mở FreeBSD và nhiều lỗ hổng trong nhân Linux.
Liên quan: Cổ phiếu an ninh mạng giảm sau khi Anthropic ra mắt Claude Code Security
Mythos Preview cũng xác định một số điểm yếu trong các thư viện mật mã, thuật toán và giao thức phổ biến nhất thế giới, bao gồm TLS, AES-GCM và SSH.
Nó cho biết thêm rằng các ứng dụng web "chứa vô số lỗ hổng," từ tấn công kịch bản liên trang (cross-site scripting) và tấn công tiêm nhiễm SQL (SQL injection) đến các lỗ hổng cụ thể theo miền như giả mạo yêu cầu liên trang (cross-site request forgery), thường được sử dụng trong các cuộc tấn công lừa đảo (phishing attacks).
Anthropic tuyên bố rằng 99% các lỗ hổng mà họ tìm thấy vẫn chưa được vá, "vì vậy sẽ là vô trách nhiệm nếu chúng tôi tiết lộ chi tiết về chúng."
Anthropic cho biết đây có thể chỉ là khởi đầu của một xu hướng, và "công việc bảo vệ cơ sở hạ tầng mạng của thế giới có thể mất nhiều năm," nhưng AI sẽ giúp củng cố phần mềm và hệ thống.
"Về lâu dài, chúng tôi kỳ vọng rằng khả năng phòng thủ sẽ chiếm ưu thế: thế giới sẽ trở nên an toàn hơn, với phần mềm được củng cố tốt hơn — phần lớn nhờ vào mã được viết bởi các mô hình này. Nhưng giai đoạn chuyển tiếp sẽ đầy khó khăn."
Tạp chí: Không ai biết liệu mật mã lượng tử an toàn có thực sự hoạt động hay không