मुंबई, 8 अक्टूबर, (न्यूज़ हेल्पलाइन) गूगल ने आर्टिफिशियल इंटेलिजेंस (AI) के क्षेत्र में एक महत्वपूर्ण कदम उठाते हुए अपने नए विशेष AI मॉडल 'जेमिनी 2.5 कंप्यूटर यूज़' (Gemini 2.5 Computer Use) को लॉन्च किया है। यह मॉडल इंटरनेट पर बिल्कुल इंसानों की तरह नेविगेट और इंटरैक्ट करने में सक्षम है।
जेमिनी 2.5 प्रो (Gemini 2.5 Pro) द्वारा संचालित, यह नया मॉडल वेब ब्राउज़र के यूज़र इंटरफ़ेस के साथ बातचीत करने की क्षमता रखता है। गूगल का दावा है कि यह मॉडल मौजूदा प्रतिस्पर्धी विकल्पों की तुलना में बेंचमार्क में बेहतर प्रदर्शन करता है और इसकी प्रतिक्रिया गति (latency) भी कम है।
इंसानों की तरह कार्य करने की क्षमता
गूगल के अनुसार, जेमिनी 2.5 कंप्यूटर यूज़ एक आभासी ब्राउज़र (virtual browser) का उपयोग करता है और यूज़र के निर्देशों को समझकर कई तरह के कार्य पूरे कर सकता है, जैसे:
फॉर्म भरना और सबमिट करना: यह किसी वेबसाइट पर रजिस्ट्रेशन या लॉग-इन फॉर्म को स्वयं भर सकता है।
इंटरैक्शन: यह क्लिक (clicking) करना, टाइप (typing) करना, स्क्रॉल (scrolling) करना, कीबोर्ड के संयोजन (keyboard combinations) का उपयोग करना, कर्सर को घुमाना (cursor hovering) और ड्रॉपडाउन मेनू खोलना जैसे कार्य कर सकता है, ठीक वैसे ही जैसे कोई मानव करता है।
जटिल कार्य: गूगल ने प्रदर्शन वीडियो साझा किए हैं, जिनमें यह मॉडल यूज़र द्वारा दिए गए जटिल निर्देशों को पूरा कर रहा है, जैसे कि किसी 'स्टिक-नोट-जैम' बोर्ड पर अराजक नोट्स को विशिष्ट श्रेणियों में व्यवस्थित करना।
उपलब्धता और सीमाएं
उपलब्धता: यह मॉडल वर्तमान में गूगल AI स्टूडियो और वर्टेक्स AI (Vertex AI) के माध्यम से डेवलपर्स के लिए उपलब्ध कराया गया है।
सीमाएं: हालांकि गूगल इस मॉडल के बेहतर प्रदर्शन का दावा करता है, लेकिन यह वर्तमान में केवल 13 क्रियाओं (actions) का समर्थन करता है। कंपनी ने यह भी स्पष्ट किया है कि यह मॉडल केवल ब्राउज़र तक ही पहुंच सकता है और इसे अभी तक डेस्कटॉप OS-स्तर के नियंत्रण के लिए अनुकूलित नहीं किया गया है।
भविष्य की संभावनाएं
गूगल की टीमें पहले ही इस मॉडल का उपयोग यूआई (UI) परीक्षण जैसे कार्यों के लिए कर रही हैं, जिससे सॉफ्टवेयर परीक्षण (software testing) बहुत तेज़ हो सकता है। इस AI मॉडल के कुछ रूपांतरण (variations) गूगल सर्च (Search) में AI मोड, फायरबेस टेस्टिंग एजेंट (Firebase Testing Agent) और प्रोजेक्ट मैरिनर (Project Mariner) जैसी एजेंट क्षमताओं को भी शक्ति प्रदान कर रहे हैं। प्रोजेक्ट मैरिनर एक AI-संचालित परियोजना है जो यूज़र्स को प्राकृतिक भाषा (natural language) में बात करके AI एजेंटों को शोध, योजना और डेटा एंट्री जैसे कार्य सौंपने की अनुमति देती है।
यह नया मॉडल डिजिटल दुनिया में जटिल कार्यों को स्वचालित (automate) करने और AI को हमारे कंप्यूटिंग अनुभव का एक अधिक सक्रिय और सहायक हिस्सा बनाने की दिशा में गूगल के प्रयासों को रेखांकित करता है।