
शंघाई जियाओ टोंग यूनिवर्सिटी और चीनी प्रौद्योगिकी समूह Tencent के शोधकर्ताओं ने एक AI एजेंट बनाने का दावा किया है जो बातचीत के बीच के शांत समय का उपयोग यह अनुमान लगाने के लिए करता है कि उपयोगकर्ता आगे क्या पूछ सकते हैं—और उनके पूछने से पहले ही जवाब तैयार कर लेता है।
ProAct नामक यह प्रणाली अधिकांश AI एजेंटों से अलग काम करती है जो प्रतिक्रिया देने से पहले उपयोगकर्ताओं के प्रश्न पूछने का इंतजार करते हैं। इसके बजाय, ProAct संदेशों के बीच के खाली समय का उपयोग पिछली बातचीत और सहेजी गई उपयोगकर्ता जानकारी की समीक्षा करने के लिए करता है, फिर अगला प्रश्न आने से पहले पृष्ठभूमि में उपयोगी जानकारी तैयार करता है।
शोधकर्ताओं ने लिखा, “हालांकि AI एजेंट तर्क और उपकरण के उपयोग में उल्लेखनीय क्षमताएं प्रदर्शित करते हैं, वे मूल रूप से प्रतिक्रियाशील रहते हैं: वे केवल स्पष्ट उपयोगकर्ता संकेतों के बाद ही प्रतिक्रियाओं की गणना करते हैं। यह प्रतिमान एक महत्वपूर्ण अवसर को नज़रअंदाज़ करता है: इंटरैक्शन के बीच का निष्क्रिय समय बड़े पैमाने पर बर्बाद हो जाता है, जिससे एजेंट भविष्य की उपयोगकर्ता ज़रूरतों के लिए तैयारी करने में असमर्थ रहते हैं।”
यह प्रणाली कई चरणों में काम करती है। पहला, जिसे Future-State Prediction कहा जाता है, पिछली बातचीत, उपयोगकर्ता प्राथमिकताओं और अनुपलब्ध जानकारी का विश्लेषण करके संभावित अनुवर्ती प्रश्नों का अनुमान लगाता है।
दूसरा चरण, जिसे Idle-Time Acquisition कहा जाता है, प्रासंगिकता, समय और नई जानकारी कितनी उपयोगी हो सकती है, के आधार पर यह तय करता है कि उनमें से कौन सी भविष्यवाणियों पर शोध करना उचित है।
एक अलग प्रणाली तब तय करती है कि तैयार जानकारी को प्रस्तुत किया जाए, बाद के लिए सहेजा जाए, या आवश्यकता पड़ने तक संग्रहीत किया जाए, जिससे उपयोगकर्ता की ज़रूरतों का अनुमान लगाने और प्रतिक्रिया देने के लिए डिज़ाइन किया गया एक “बंद-लूप” सिस्टम बनता है।
उन्होंने लिखा, “प्रत्येक अग्रभूमि इंटरैक्शन के बाद, एजेंट अपनी मेमोरी को अपडेट करता है, संभावित भविष्य की ज़रूरतों का अनुमान लगाता है, मूल्यवान उम्मीदवारों को निष्क्रिय-समय गणना आवंटित करता है, और तय करता है कि परिणामी तैयारी को कैसे संभाला जाना चाहिए। यह सूत्रीकरण भविष्यवाणी, अधिग्रहण और वितरण को एक ही नीति से जोड़ता है, बजाय इसके कि निष्क्रिय-समय की गणना को एक अप्रतिबंधित पृष्ठभूमि खोज के रूप में माना जाए।”
शोधकर्ताओं के अनुसार, ProAct का वित्तीय नियोजन, सॉफ्टवेयर रिलीज़ प्रबंधन और साइबर सुरक्षा सहित 40 डोमेन में 200 सिमुलेशन में परीक्षण किया गया था। पेपर के अनुसार, प्रणाली ने बातचीत के चरणों को 14.8% तक कम किया और अनुवर्ती अनुरोधों को 11.7% तक घटाया। ProActEval नामक एक बेंचमार्क का उपयोग करके तुलना में, ProAct ने पहले की प्रणाली के लिए 32 के मुकाबले 703 अनुमानित उपयोगकर्ता ज़रूरतों का अनुमान लगाया। शोधकर्ताओं ने मतिभ्रम में 28.1% की कमी की भी सूचना दी।
यह शोध ऐसे समय में आया है जब स्वायत्त AI एजेंट पूरे तकनीकी उद्योग में फैल रहे हैं, जिसमें OpenClaw और Hermes Agent जैसी परियोजनाएं लगातार AI सहायकों को प्रदान कर रही हैं जो कम प्रत्यक्ष मानवीय इनपुट के साथ कोडिंग, शेड्यूलिंग, अनुसंधान और वर्कफ़्लो ऑटोमेशन जैसे लंबे, अधिक स्वतंत्र कार्यों को संभाल सकते हैं।
यह अध्ययन ऐसे समय में भी आया है जब इसी महीने की शुरुआत में अलग-अलग शोधकर्ताओं ने चेतावनी दी थी कि AI एजेंट परिणामों को समझे बिना खतरनाक कार्यों को पूरा कर सकते हैं।
यूसी रिवरसाइड के डॉक्टरेट छात्र और मुख्य लेखक एरफान शायगानी ने एक बयान में कहा, “मिस्टर मैगज़ू की तरह, ये एजेंट अपने कार्यों के परिणामों को पूरी तरह से समझे बिना एक लक्ष्य की ओर बढ़ते हैं। ये एजेंट बेहद उपयोगी हो सकते हैं, लेकिन हमें सुरक्षा उपायों की आवश्यकता है क्योंकि वे कभी-कभी बड़ी तस्वीर को समझने के बजाय लक्ष्य प्राप्त करने को प्राथमिकता दे सकते हैं।”
शोधकर्ताओं ने स्वीकार किया कि ProAct अध्ययन में कई सीमाएँ थीं, जिनमें यह भी शामिल है कि 3% मामलों में, प्रणाली ने अप्रासंगिक जानकारी लाकर प्रतिक्रियाओं को और भी खराब कर दिया। पेपर में यह भी कहा गया है कि किसी भी वास्तविक-दुनिया संस्करण को गोपनीयता सुरक्षा की आवश्यकता होगी, क्योंकि प्रणाली लगातार बातचीत का विश्लेषण करती है और उपयोगकर्ता डेटा संग्रहीत करती है।
उन्होंने लिखा, “हमारा बजट विश्लेषण आगे दिखाता है कि बड़े Idle-Time Acquisition बजट सक्रिय-टोकन लागत बढ़ाते हैं और घटते रिटर्न देते हैं, इसलिए सक्रिय गणना अधिकतम करने के बजाय एक ऑपरेटिंग-पॉइंट ट्रेड-ऑफ है।”