
जब एन्थ्रोपिक ने इस महीने की शुरुआत में क्लाउड मिथोस का अनावरण किया, तो उसने मॉडल को तकनीकी दिग्गजों के एक vetted गठबंधन के पीछे बंद कर दिया और इसे जनता के लिए बहुत खतरनाक बताया। ट्रेजरी सचिव स्कॉट बेसेंट और फेड चेयर जेरोम पॉवेल ने वॉल स्ट्रीट के सीईओ के साथ एक आपातकालीन बैठक बुलाई। 'वल्नपocalypse' शब्द सुरक्षा हलकों में फिर से सामने आया।
और अब शोधकर्ताओं की एक टीम ने उस आख्यान को और अधिक जटिल कर दिया है।
विडॉक सिक्योरिटी ने एन्थ्रोपिक के अपने पैच किए गए सार्वजनिक उदाहरणों को लिया और उन्हें एक ओपन-सोर्स कोडिंग एजेंट opencode के अंदर GPT-5.4 और Claude Opus 4.6 का उपयोग करके पुन: उत्पन्न करने का प्रयास किया। कोई ग्लासिंग इनवाइट नहीं। कोई निजी एपीआई एक्सेस नहीं। कोई एन्थ्रोपिक आंतरिक स्टैक नहीं।
"हमने opencode में मिथोस के निष्कर्षों को सार्वजनिक मॉडलों का उपयोग करके दोहराया, न कि एन्थ्रोपिक के निजी स्टैक का," प्रयोग में शामिल शोधकर्ताओं में से एक, डेविड मोकाडलो ने परिणाम प्रकाशित करने के बाद एक्स पर लिखा। “एन्थ्रोपिक के मिथोस रिलीज़ को पढ़ने का एक बेहतर तरीका यह नहीं है कि 'एक लैब के पास एक जादुई मॉडल है।' यह है: भेद्यता की खोज का अर्थशास्त्र बदल रहा है।”
We replicated Mythos findings in opencode using public models, not Anthropic's private stack.
The moat is moving from model access to validation: finding vulnerability signal is getting cheaper; turning it into trusted security
A better way to read Anthropic's Mythos release is… https://t.co/0FFxrc8Sr1 pic.twitter.com/NjqDhsK1LA
— Dawid Moczadło (@kannthu1) April 16, 2026
जिन मामलों को उन्होंने लक्षित किया, वे वही थे जिन्हें एन्थ्रोपिक ने अपनी सार्वजनिक सामग्री में उजागर किया था: एक सर्वर फाइल-शेयरिंग प्रोटोकॉल, एक सुरक्षा-केंद्रित ओएस का नेटवर्किंग स्टैक, लगभग हर मीडिया प्लेटफॉर्म में एम्बेडेड वीडियो-प्रोसेसिंग सॉफ्टवेयर, और वेब पर डिजिटल पहचान को सत्यापित करने के लिए उपयोग की जाने वाली दो क्रिप्टोग्राफिक लाइब्रेरी।
GPT-5.4 और Claude Opus 4.6 दोनों ने प्रत्येक तीन रन में दो बग मामलों को पुन: उत्पन्न किया। Claude Opus 4.6 ने OpenBSD में एक बग को तीन बार सीधे स्वतंत्र रूप से फिर से खोजा, जबकि GPT-5.4 ने उस पर शून्य स्कोर किया। कुछ बग (एक FFmpeg लाइब्रेरी का उपयोग करके वीडियो चलाने से संबंधित और दूसरा wolfSSL के साथ डिजिटल हस्ताक्षर के प्रसंस्करण से संबंधित) आंशिक रूप से वापस आए—जिसका अर्थ है कि मॉडल ने सही कोड सतह पाई लेकिन सटीक मूल कारण का पता नहीं लगा सके।
प्रत्येक स्कैन प्रति फ़ाइल $30 से कम रहा, जिसका अर्थ है कि शोधकर्ता एन्थ्रोपिक के समान कमजोरियों को $30 से कम खर्च करके ढूंढने में सक्षम थे।
मोकाडलो ने एक्स पर कहा, "एआई मॉडल खोज स्थान को सीमित करने, वास्तविक लीड्स को सतह पर लाने और कभी-कभी युद्ध-परीक्षणित कोड में पूर्ण मूल कारण को पुनर्प्राप्त करने के लिए पर्याप्त अच्छे हैं।"
उन्होंने जिस वर्कफ़्लो का उपयोग किया वह एक-शॉट प्रॉम्प्ट नहीं था। यह वही दर्शाता है जो एन्थ्रोपिक ने सार्वजनिक रूप से वर्णित किया था: मॉडल को एक कोडबेस दें, उसे एक्सप्लोर करने दें, प्रयासों को समानांतर करें, सिग्नल के लिए फ़िल्टर करें। विडॉक टीम ने ओपन टूलिंग के साथ वही आर्किटेक्चर बनाया। एक प्लानिंग एजेंट ने प्रत्येक फ़ाइल को चंक्स में विभाजित किया। एक अलग डिटेक्शन एजेंट प्रत्येक चंक पर चला, फिर निष्कर्षों की पुष्टि करने या उन्हें खारिज करने के लिए रेपो में अन्य फ़ाइलों का निरीक्षण किया।
प्रत्येक डिटेक्शन प्रॉम्प्ट के भीतर लाइन रेंज—उदाहरण के लिए, "लाइन्स 1158-1215 पर ध्यान केंद्रित करें"—शोधकर्ताओं द्वारा मैन्युअल रूप से नहीं चुनी गई थीं। वे पिछली प्लानिंग स्टेप के आउटपुट थे। ब्लॉग पोस्ट इसे स्पष्ट करता है: "हम इसके बारे में स्पष्ट होना चाहते हैं क्योंकि चंकिंग रणनीति यह निर्धारित करती है कि प्रत्येक डिटेक्शन एजेंट क्या देखता है, और हम वर्कफ़्लो को जितना मैन्युअल रूप से क्यूरेट किया गया था, उससे अधिक के रूप में प्रस्तुत नहीं करना चाहते हैं।"
अध्ययन यह दावा नहीं करता है कि सार्वजनिक मॉडल हर चीज पर मिथोस से मेल खाते हैं। एन्थ्रोपिक का मॉडल केवल FreeBSD बग को खोजने से कहीं आगे निकल गया—इसने एक काम करने वाला हमला ब्लूप्रिंट बनाया, यह पता लगाया कि कैसे एक हमलावर मशीन पर दूरस्थ रूप से पूर्ण नियंत्रण हासिल करने के लिए कई नेटवर्क पैकेटों में कोड खंडों को एक साथ जोड़ सकता है। विडॉक के मॉडलों ने खामी पाई। उन्होंने हथियार नहीं बनाया। वास्तविक अंतर वहीं है: छेद खोजने में नहीं, बल्कि यह जानने में कि उसके माध्यम से कैसे चलना है।
लेकिन मोकाडलो का तर्क वास्तव में यह नहीं है कि सार्वजनिक मॉडल समान रूप से शक्तिशाली हैं। यह है कि वर्कफ़्लो का महंगा हिस्सा अब एपीआई कुंजी वाले किसी भी व्यक्ति के लिए उपलब्ध है: 'मोएट मॉडल एक्सेस से सत्यापन की ओर बढ़ रहा है: भेद्यता सिग्नल खोजना सस्ता हो रहा है; इसे विश्वसनीय सुरक्षा कार्य में बदलना अभी भी कठिन है।'
एन्थ्रोपिक की अपनी सुरक्षा रिपोर्ट ने स्वीकार किया कि साइबेंच, एक मॉडल गंभीर साइबर जोखिम पैदा करता है या नहीं, यह मापने के लिए उपयोग किया जाने वाला बेंचमार्क, 'वर्तमान फ्रंटियर मॉडल क्षमताओं के बारे में अब पर्याप्त जानकारीपूर्ण नहीं है' क्योंकि मिथोस ने इसे पूरी तरह से पार कर लिया। लैब ने अनुमान लगाया कि तुलनीय क्षमताएं छह से 18 महीनों के भीतर अन्य एआई लैब से फैल जाएंगी।
विडॉक अध्ययन से पता चलता है कि उस समीकरण का खोज पक्ष पहले से ही किसी भी गेटेड प्रोग्राम के बाहर उपलब्ध है। उनके पूर्ण प्रॉम्प्ट अंश, मॉडल आउटपुट और कार्यप्रणाली परिशिष्ट लैब की आधिकारिक साइट पर प्रकाशित हैं।