
Ketika Anthropic meluncurkan Claude Mythos awal bulan ini, model tersebut dikunci di balik koalisi raksasa teknologi yang telah diverifikasi dan digambarkan sebagai sesuatu yang terlalu berbahaya untuk publik. Menteri Keuangan Scott Bessent dan Ketua Fed Jerome Powell mengadakan pertemuan darurat dengan CEO Wall Street. Kata "vulnpocalypse" muncul kembali di kalangan keamanan.
Dan kini, sebuah tim peneliti semakin memperumit narasi tersebut.
Vidoc Security mengambil contoh publik Anthropic yang telah ditambal dan mencoba mereproduksinya menggunakan GPT-5.4 dan Claude Opus 4.6 di dalam agen pengkodean sumber terbuka bernama opencode. Tanpa undangan Glasswing. Tanpa akses API pribadi. Tanpa tumpukan internal Anthropic.
"Kami mereplikasi temuan Mythos di opencode menggunakan model publik, bukan tumpukan pribadi Anthropic," tulis Dawid Moczadło, salah satu peneliti yang terlibat dalam eksperimen tersebut, di X setelah menerbitkan hasilnya. "Cara yang lebih baik untuk membaca rilis Mythos Anthropic bukanlah 'satu laboratorium memiliki model ajaib.' Melainkan: ekonomi penemuan kerentanan sedang berubah."
Kami mereplikasi temuan Mythos di opencode menggunakan model publik, bukan tumpukan pribadi Anthropic.
Parit tersebut bergeser dari akses model ke validasi: menemukan sinyal kerentanan semakin murah; mengubahnya menjadi pekerjaan keamanan yang terpercaya
Cara yang lebih baik untuk membaca rilis Mythos Anthropic adalah… https://t.co/0FFxrc8Sr1 pic.twitter.com/NjqDhsK1LA
— Dawid Moczadło (@kannthu1) April 16, 2026
Kasus-kasus yang mereka targetkan sama dengan yang disoroti Anthropic dalam materi publiknya: protokol berbagi file server, tumpukan jaringan OS yang berfokus pada keamanan, perangkat lunak pemrosesan video yang tertanam di hampir setiap platform media, dan dua pustaka kriptografi yang digunakan untuk memverifikasi identitas digital di seluruh web.
Baik GPT-5.4 maupun Claude Opus 4.6 mereproduksi dua kasus bug dalam setiap tiga percobaan. Claude Opus 4.6 juga secara independen menemukan kembali bug di OpenBSD tiga kali berturut-turut, sementara GPT-5.4 mencetak nol pada kasus tersebut. Beberapa bug (satu melibatkan pustaka FFmpeg untuk menjalankan video dan satu lagi melibatkan pemrosesan tanda tangan digital dengan wolfSSL) kembali sebagian—artinya model menemukan permukaan kode yang tepat tetapi tidak menemukan akar penyebab yang tepat.
Setiap pemindaian tetap di bawah $30 per file, yang berarti para peneliti dapat menemukan kerentanan yang sama dengan Anthropic dengan menghabiskan kurang dari $30 untuk melakukannya.
"Model AI sudah cukup baik untuk mempersempit ruang pencarian, memunculkan petunjuk nyata, dan terkadang memulihkan akar penyebab penuh dalam kode yang telah teruji dalam pertempuran," kata Moczadło di X.
Alur kerja yang mereka gunakan bukanlah prompt sekali jalan. Itu mencerminkan apa yang dijelaskan Anthropic sendiri secara publik: berikan model basis kode, biarkan menjelajah, paralelkan upaya, saring sinyal. Tim Vidoc membangun arsitektur yang sama dengan alat terbuka. Agen perencanaan membagi setiap file menjadi potongan-potongan. Agen deteksi terpisah berjalan pada setiap potongan, kemudian memeriksa file lain di repositori untuk mengkonfirmasi atau menyingkirkan temuan.
Rentang baris di dalam setiap prompt deteksi—misalnya, "fokus pada baris 1158-1215"—tidak dipilih secara manual oleh para peneliti. Itu adalah keluaran dari langkah perencanaan sebelumnya. Posting blog menjelaskan ini secara eksplisit: "Kami ingin menjelaskan hal itu karena strategi pemotongan membentuk apa yang dilihat setiap agen deteksi, dan kami tidak ingin menyajikan alur kerja sebagai lebih banyak dikurasi secara manual daripada yang sebenarnya."
Studi ini tidak mengklaim model publik setara dengan Mythos dalam segala hal. Model Anthropic melangkah lebih jauh dari sekadar menemukan bug FreeBSD—mereka membangun cetak biru serangan yang berfungsi, mencari tahu bagaimana penyerang dapat merangkai fragmen kode bersama-sama melalui beberapa paket jaringan untuk mengambil kendali penuh mesin dari jarak jauh. Model Vidoc menemukan cacatnya. Mereka tidak membangun senjatanya. Di situlah letak kesenjangan sebenarnya: bukan dalam menemukan celah, tetapi dalam mengetahui persis bagaimana memanfaatkannya.
Tetapi argumen Moczadło sebenarnya bukan bahwa model publik sama kuatnya. Melainkan bahwa bagian yang mahal dari alur kerja kini tersedia untuk siapa saja yang memiliki kunci API: “Parit tersebut bergeser dari akses model ke validasi: menemukan sinyal kerentanan semakin murah; mengubahnya menjadi pekerjaan keamanan yang terpercaya masih sulit.”
Laporan keamanan Anthropic sendiri mengakui bahwa Cybench, tolok ukur yang digunakan untuk mengukur apakah suatu model menimbulkan risiko siber serius, "tidak lagi cukup informatif tentang kemampuan model batas saat ini" karena Mythos berhasil melampauinya sepenuhnya. Laboratorium memperkirakan kemampuan serupa akan menyebar dari laboratorium AI lain dalam waktu enam hingga 18 bulan.
Studi Vidoc menunjukkan bahwa sisi penemuan dari persamaan tersebut sudah tersedia di luar program berpagar mana pun. Kutipan prompt lengkap, keluaran model, dan lampiran metodologi mereka diterbitkan di situs resmi laboratorium.