कैड मेट्ज़ और निको ग्रांट द्वारा लिखित
आज, चैटबॉट प्रश्नों का उत्तर दे सकते हैं, कविताएँ लिख सकते हैं और चित्र बना सकते हैं। भविष्य में, वे ऑनलाइन शॉपिंग जैसे कार्य भी स्वायत्त रूप से कर सकेंगे और स्प्रेडशीट जैसे टूल के साथ भी काम कर सकेंगे।
Google ने बुधवार को इस तकनीक के एक प्रोटोटाइप का अनावरण किया, जिसे कृत्रिम बुद्धिमत्ता शोधकर्ता AI एजेंट कहते हैं।
Google AI एजेंट बनाने वाली कई तकनीकी कंपनियों में से एक है। ओपनएआई और एंथ्रोपिक सहित विभिन्न एआई स्टार्टअप ने समान प्रोटोटाइप का अनावरण किया है जो सॉफ्टवेयर ऐप, वेबसाइट और अन्य ऑनलाइन टूल का उपयोग कर सकते हैं।
Google का नया प्रोटोटाइप, जिसे मेरिनर कहा जाता है, जेमिनी 2.0 पर आधारित है, जिसका कंपनी ने बुधवार को अनावरण भी किया। जेमिनी वह मुख्य तकनीक है जो कंपनी के कई एआई उत्पादों और अनुसंधान प्रयोगों को रेखांकित करती है। सिस्टम के संस्करण कंपनी के इसी नाम के चैटबॉट और एआई ओवरव्यूज़ को शक्ति प्रदान करेंगे, जो एक Google खोज उपकरण है जो सीधे उपयोगकर्ता के सवालों का जवाब देता है।
Google प्रोजेक्ट मैनेजर जैकलिन कोन्ज़ेलमैन ने द न्यूयॉर्क टाइम्स के साथ एक साक्षात्कार में कहा, “हम मूल रूप से उपयोगकर्ताओं को अपने वेब ब्राउज़र में अनुरोध टाइप करने और मेरिनर को उनकी ओर से कार्रवाई करने की अनुमति दे रहे हैं।”
जेमिनी वह है जिसे एआई शोधकर्ता न्यूरल नेटवर्क कहते हैं – एक गणितीय प्रणाली जो भारी मात्रा में डेटा का विश्लेषण करके कौशल सीख सकती है। उदाहरण के लिए, इंटरनेट से लिए गए लेखों और पुस्तकों के पैटर्न को पहचानकर, एक तंत्रिका नेटवर्क स्वयं पाठ उत्पन्न करना सीख सकता है।
जेमिनी का नवीनतम संस्करण पाठ से लेकर छवियों और ध्वनियों तक, डेटा की एक विस्तृत श्रृंखला से सीखता है। इसमें वे छवियां शामिल हो सकती हैं जो दिखाती हैं कि लोग स्प्रेडशीट, शॉपिंग साइट और अन्य ऑनलाइन सेवाओं का उपयोग कैसे करते हैं। जेमिनी ने जो सीखा है, उसके आधार पर मेरिनर कंप्यूटर उपयोगकर्ताओं की ओर से समान सेवाओं का उपयोग कर सकता है।
गूगल की कोर एआई लैब की देखरेख करने वाले डेमिस हसाबिस ने टाइम्स के साथ एक साक्षात्कार में कहा, “यह समझ सकता है कि कुछ करने के लिए इसे एक बटन दबाने की जरूरत है।” “यह दुनिया में कार्रवाई कर सकता है।”
कोन्ज़ेलमैन ने कहा, मेरिनर को “लूप में एक इंसान के साथ” उपयोग करने के लिए डिज़ाइन किया गया है। उदाहरण के लिए, यदि कोई उपयोगकर्ता सक्रिय ब्राउज़र टैब में है तो यह किराने के सामान से एक वर्चुअल शॉपिंग कार्ट भर सकता है, लेकिन यह वास्तव में किराने का सामान नहीं खरीदेगा। उपयोगकर्ता को खरीदारी करनी होगी.
गूगल के सीईओ सुंदर पिचाई ने एक ब्लॉग पोस्ट में कहा कि यह घटनाक्रम “हमें एक सार्वभौमिक सहायक के हमारे दृष्टिकोण के करीब लाता है।”
इस परियोजना को Google के लोकप्रिय वेब ब्राउज़र, क्रोम के विस्तार के रूप में विकसित किया गया था, जिससे यह कंपनी की भविष्य की AI महत्वाकांक्षाओं के लिए एक महत्वपूर्ण मंच बन गया। लेकिन उन योजनाओं को झटका लग सकता है. न्याय विभाग ने एक संघीय न्यायाधीश से Google को क्रोम को बेचने या बंद करने के लिए मजबूर करने के लिए कहा है, एक ऐतिहासिक फैसले के बाद कि कंपनी का खोज इंजन एक अवैध एकाधिकार है।
अन्य चुनौतियाँ भी हैं। कोन्ज़ेलमैन ने स्वीकार किया कि, अन्य चैटबॉट्स की तरह, मेरिनर गलतियाँ करता है। चूँकि ऐसी प्रणालियाँ विशाल मात्रा में डेटा में पाए जाने वाले पैटर्न के अनुसार काम करती हैं, इसलिए वे कभी-कभी गड़बड़ा जाती हैं। टेक्स्ट बनाते समय चैटबॉट्स द्वारा की जाने वाली गलतियाँ कभी-कभी ध्यान में नहीं आती हैं, लेकिन त्रुटियाँ तब अधिक समस्याग्रस्त होती हैं जब सिस्टम वेबसाइटों का उपयोग करने और अन्य कार्रवाई करने का प्रयास कर रहे होते हैं।
“क्या यह हमेशा सटीक होता है? अभी तक नहीं,” कोन्ज़ेलमैन ने कहा। “यह अभी भी एक प्रायोगिक तकनीक है।”
Google मेरिनर को कंपनी के बाहर कम संख्या में परीक्षकों के साथ साझा कर रहा है लेकिन अभी तक व्यापक रिलीज़ की योजना साझा नहीं की है।
बुधवार को, कंपनी ने प्रोजेक्ट एस्ट्रा का एक नया संस्करण भी दिखाया, जो एक स्मार्टफोन डिजिटल सहायक है जो छवियों और पाठ के साथ-साथ मौखिक आदेशों का जवाब देता है। इस साल की शुरुआत में OpenAI द्वारा अनावरण की गई तकनीक की तरह, एस्ट्रा Apple के सिरी जैसे डिजिटल सहायक का अधिक शक्तिशाली संस्करण है।