
रविवार को जेन्सन हुआंग ताइपे में कंप्यूटैक्स मंच पर चमड़े की जैकेट पहनकर आए और नेमोट्रॉन 3 अल्ट्रा का अनावरण किया – यह एनवीआईडीआईए का अब तक का सबसे बड़ा ओपन एआई मॉडल है और, कम से कम अभी के लिए, अमेरिका में निर्मित सबसे स्मार्ट ओपन-वेट मॉडल है। यह अच्छा है। लेकिन यह चीन को हराने के लिए पर्याप्त अच्छा नहीं है।
इस मॉडल में मोटे तौर पर कुल 550 अरब पैरामीटर हैं, लेकिन यह मिश्रण-ऑफ-एक्सपर्ट्स नामक डिज़ाइन का उपयोग करके किसी भी समय केवल 55 अरब सक्रिय पैरामीटर पर चलता है। पैरामीटर यह निर्धारित करते हैं कि एक एआई मॉडल की ज्ञान की व्यापकता कितनी है, जिसमें अधिक संख्या का अर्थ आमतौर पर अधिक शक्तिशाली होता है।
यह समझने के लिए कि मिश्रण-ऑफ-एक्सपर्ट्स मॉडल कैसे काम करता है, इसे सैकड़ों विशेषज्ञों वाले अस्पताल की तरह सोचें: जब कोई मरीज आता है, तो केवल प्रासंगिक डॉक्टर ही आते हैं – सभी कर्मचारी नहीं। यह दृष्टिकोण मॉडल को चलाने की लागत को उसके मुख्य पैरामीटर गणना की तुलना में बहुत कम रखता है, यही कारण है कि एनवीआईडीआईए 5 गुना तेज अनुमान और तुलनीय ओपन-वेट विकल्पों की तुलना में 30% कम लागत का दावा कर सकता है।
स्वतंत्र मूल्यांकक आर्टिफिशियल एनालिसिस, जिसने प्री-रिलीज़ मूल्यांकन पर एनवीआईडीआईए के साथ साझेदारी की थी, ने नेमोट्रॉन 3 अल्ट्रा को अपने इंटेलिजेंस इंडेक्स पर 48 अंक दिए – यह एक समग्र बेंचमार्क है जो तर्क, कोडिंग, सामान्य ज्ञान और एजेंटिक प्रदर्शन को कवर करने वाले 10 मूल्यांकनों को एकत्रित करता है, जिसे एक संख्यात्मक पैमाने पर स्कोर किया जाता है जहाँ उच्च का अर्थ स्मार्टर होता है।
यह इसे आरामदायक अंतर से शीर्ष अमेरिकी ओपन-वेट मॉडल बनाता है। अगले सबसे करीब अमेरिकी विकल्प Google का जेम्मा 4 31B 39 पर, नेमोट्रॉन 3 सुपर 36 पर, और OpenAI का gpt-oss-120b 33 पर हैं।
एनवीआईडीआईए ने अभी जेन्सन हुआंग के कंप्यूटैक्स कीनोट में नेमोट्रॉन 3 अल्ट्रा की रिलीज की घोषणा की: 550बी पैरामीटर (55बी सक्रिय) पर, यह अब तक का सबसे बड़ा नेमोट्रॉन 3 मॉडल है, और यह सबसे बुद्धिमान अमेरिकी ओपन वेट्स मॉडल है
हमने @nvidia के साथ इस मॉडल का मूल्यांकन करने के लिए साझेदारी की…
— Artificial Analysis (@ArtificialAnlys) जून 1, 2026
अपने पूर्ववर्ती की तुलना में यह अंतर चौंकाने वाला है। नेमोट्रॉन 3 सुपर, जो मार्च 2026 में 120 अरब पैरामीटर के साथ जारी किया गया था, उसे पहले से ही स्वायत्त एजेंटों के लिए एक ठोस ओपन मॉडल माना जाता था। अल्ट्रा इससे 12 इंडेक्स पॉइंट ऊपर कूदता है, जो इस बेंचमार्किंग परिदृश्य में एक बड़ी छलांग है।
एनवीआईडीआईए अधिकांश लोगों की तुलना में लंबे समय से मॉडल व्यवसाय में है। पहला नेमोट्रॉन-ब्रांडेड मॉडल नवंबर 2023 में आया था, जिसमें तीसरी पीढ़ी की घोषणा दिसंबर 2025 में की गई थी।
यह परिवार तीन आकारों में आता है: हल्के कार्यों के लिए नैनो, मध्यम-श्रेणी के उद्यम अनुप्रयोगों के लिए सुपर, और जटिल तर्क वर्कलोड के लिए अल्ट्रा। तीनों एक ही हाइब्रिड आर्किटेक्चर साझा करते हैं जो मम्बा-2 लेयर, मानक ट्रांसफॉर्मर अटेंशन और मिश्रण-ऑफ-एक्सपर्ट्स रूटिंग को जोड़ता है।
मम्बा-2 मानक अटेंशन का एक विकल्प है जो लंबी अनुक्रमों को लागत के एक अंश पर संसाधित करता है – यह तब प्रासंगिक होता है जब आप एक मॉडल चाहते हैं जो एक बार में दस लाख टोकन को मेमोरी में रख सके। नेमोट्रॉन 3 अल्ट्रा 1-मिलियन-टोकन संदर्भ विंडो का समर्थन करता है, जिसका अर्थ है कि एक एजेंट, सिद्धांत रूप में, एक ही समय में एक पूरा बड़ा कोडबेस या सैकड़ों शोध दस्तावेज देख सकता है।
अल्ट्रा मॉडल में मल्टी-टोकन प्रेडिक्शन (MTP) नामक एक तकनीक भी शामिल है, जो मॉडल को एक बार में एक के बजाय कई भविष्य के टोकन की भविष्यवाणी करने की अनुमति देती है, जिससे जनरेशन तेज होती है। तीनों नेमोट्रॉन 3 मॉडल को कई इंटरैक्टिव वातावरणों में रीइन्फोर्समेंट लर्निंग का उपयोग करके पोस्ट-ट्रेन किया गया था, उन्हें केवल प्रश्नों का उत्तर देने के बजाय बहु-चरणीय कार्यों की योजना बनाने और निष्पादित करने के लिए सिखाया गया था।
अल्ट्रा के वेट सार्वजनिक हैं और इसके प्रशिक्षण व्यंजनों को जारी किया जा रहा है। क्या इसे चलाने के लिए आपको सुपरकंप्यूटर की आवश्यकता है? अनिवार्य रूप से, हाँ — एक 550-अरब-पैरामीटर मॉडल डेटासेंटर क्षेत्र में रहता है। लेकिन आप इसे एनवीआईडीआईए के एपीआई या क्लाउड प्रोवाइडर्स के माध्यम से एक्सेस कर सकते हैं, बिना हार्डवेयर के मालिक हुए, उसी तरह जैसे कोई भी पहले से ही ब्राउज़र के माध्यम से जीपीटी या क्लाउड का उपयोग करता है।
गति की कहानी वह जगह है जहाँ नेमोट्रॉन 3 अल्ट्रा वास्तव में अलग खड़ा है। एक प्री-रिलीज़ डीपइंफ्रा एंडपॉइंट पर, मॉडल ने प्रति सेकंड 300 से अधिक आउटपुट टोकन दिए। इसके इंटेलिजेंस क्लास में चीनी मॉडल – डीपसीक वी4 प्रो और किमी के2.6 – आज अपने वाणिज्यिक एपीआई के माध्यम से प्रति सेकंड 50-100 टोकन पर दिए जाते हैं। यह गति अंतर वास्तविक दुनिया के डिप्लॉयमेंट के लिए मायने रखता है, खासकर स्वायत्त एजेंटों के लिए जो लंबे बहु-चरणीय कार्यों को निष्पादित करते हैं जहाँ प्रत्येक चरण के लिए प्रतीक्षा तेजी से बढ़ती है।
लेकिन कच्ची गति बुद्धिमत्ता प्रतियोगिता का फैसला नहीं करती। आर्टिफिशियल एनालिसिस द्वारा प्रकाशित चार्ट वास्तविक कहानी को स्पष्ट रूप से बताता है। वर्टिकल अक्ष पर – बुद्धिमत्ता – नेमोट्रॉन 3 अल्ट्रा 48 पर है जो अच्छा है, लेकिन मूनशॉट एआई का चीन का किमी के2.6 54 पर है। इंडेक्स पर यह छह-बिंदु का अंतर एक सार्थक अंतर का प्रतिनिधित्व करता है: किमी के2.6 अप्रैल 2026 में जारी किया गया था और वर्तमान में विश्व स्तर पर सभी एआई मॉडलों में, बंद या खुले, चौथे स्थान पर है, एंथ्रोपिक, Google और OpenAI के मालिकाना फ्लैगशिप से केवल तीन अंक पीछे है – सभी 57 पर बंधे हुए हैं।
अमेरिकी ओपन-वेट स्थिति नई नहीं है। चीनी लैब मजबूत मॉडलों के साथ ओपन इकोसिस्टम को भर रही हैं, जबकि अमेरिकी कंपनियां – OpenAI, एंथ्रोपिक, Google – अपने सर्वश्रेष्ठ सिस्टम को एपीआई के पीछे रखती हैं। जैसा कि डिक्रिप्ट ने मार्च में रिपोर्ट किया था, चीनी ओपन-सोर्स मॉडल 2024 के अंत में वैश्विक ओपन-मॉडल उपयोग के लगभग 1.2% से बढ़कर 2025 के अंत तक लगभग 30% हो गए। एनवीआईडीआईए इस प्रवृत्ति को उलटने के लिए सक्रिय रूप से प्रयास करने वाला सबसे बड़ा अमेरिकी नाम है, जिसमें ओपन-वेट एआई डेवलपमेंट पर $26 बिलियन खर्च करने की सार्वजनिक रूप से घोषित पांच साल की योजना है।
नेमोट्रॉन 3 अल्ट्रा अब तक उस शर्त का सबसे दृश्यमान परिणाम है। एनवीआईडीआईए ने यह भी घोषणा की कि वह पहले से ही नेमोट्रॉन 4 – अगली पीढ़ी – पर काम कर रहा है, जिसे नेमोट्रॉन गठबंधन के माध्यम से विकसित किया गया है, जो मिस्ट्रल एआई और परप्लेक्सिटी सहित आठ एआई लैब का एक समूह है जिसे एनवीआईडीआईए ने मार्च 2026 में डीजीएक्स क्लाउड इन्फ्रास्ट्रक्चर पर ओपन फ्रंटियर मॉडल को सह-विकसित करने के लिए इकट्ठा किया था। नेमोट्रॉन 3 अल्ट्रा 4 जून को शिप होगा।