'सामान्य बुद्धिमत्ता' के परीक्षण में एआई प्रणाली मानव स्तर पर पहुंची और इसके मायने

'सामान्य बुद्धिमत्ता' के परीक्षण में एआई प्रणाली मानव स्तर पर पहुंची और इसके मायने

(माइकल टिमोथी बेनेट, ऑस्ट्रेलियन नेशनल यूनिवर्सिटी और एलिजा पेरियर, स्टैनफोर्ड यूनिवर्सिटी)

कैनबरा, 25 दिसंबर (द कन्वरसेशन) एक नए कृत्रिम बुद्धिमत्ता (एआई) मॉडल ने ‘सामान्य बुद्धिमत्ता’ मापने के लिए डिजाइन किए गए परीक्षण में मानव-स्तर के परिणाम दिये हैं।

ओपनएआई की ओ3 प्रणाली ने 20 दिसंबर को एआरसी-एजीआई मानक पर 85 प्रतिशत अंक प्राप्त किये हैं जो पिछले एआई के सर्वश्रेष्ठ अंक 55 प्रतिशत से काफी अधिक है और औसत मानव द्वारा प्राप्त अंक के बराबर है। इसने गणित की एक बहुत ही कठिन परीक्षा में भी अच्छे अंक प्राप्त किये हैं।

कृत्रिम सामान्य बुद्धिमत्ता या एजीआई बनाना सभी प्रमुख एआई अनुसंधान प्रयोगशालाओं का घोषित लक्ष्य है। पहली नजर में, ऐसा लगता है कि ‘ओपनएआई’ ने कम से कम इस लक्ष्य की ओर एक महत्वपूर्ण कदम बढ़ाया है।

इसे लेकर संदेह अभी भी बना हुआ है, लेकिन कई एआई अनुसंधानकर्ताओं और ‘डेवलपर्स’ को लगता है कि कुछ बदल गया है। कई लोगों के लिए एजीआई की संभावना अब अनुमान से ज्यादा वास्तविक, ज़रूरी और नज़दीक लगती है। क्या वे सही हैं?

सामान्यीकरण और बुद्धिमत्ता

ओ3 से आए परिणाम के क्या मायने है, यह समझने के लिए आपको एआरसी-एजीआई परीक्षण के बारे में समझना होगा। तकनीकी भाषा में, यह किसी नई चीज के अनुकूल होने में एआई प्रणाली की ‘नमूना दक्षता’ का परीक्षण है। यह, प्रणाली द्वारा कैसे काम करता है और किसी नयी चीज को समझने के लिए उसके पास कितने उदाहरण होने चाहिए, इसका परीक्षण है।

चैटजीपीटी (जीपीटी-4) जैसी एआई प्रणाली बहुत अधिक नमूना कुशल नहीं है। इसे मानव पाठ के लाखों उदाहरणों के आधार पर ‘प्रशिक्षित’ किया गया था, जिससे शब्दों के कौन से संयोजन सबसे अधिक संभावित हैं, इसके बारे में संभाव्य ‘नियम’ तैयार किए गए।

सामान्य कार्यों में इसका परिणाम बहुत अच्छा है। असामान्य कार्यों में यह खराब है, क्योंकि इसमें उन कार्यों के बारे में कम डेटा (कम नमूने) हैं।

जब तक एआई प्रणालियां छोटी संख्या में उदाहरणों से सीख नहीं सकतीं और अधिक नमूना दक्षता के साथ अनुकूलन नहीं कर सकतीं, तब तक उनका उपयोग केवल बहुत ही दोहराव वाले कार्यों के लिए और उन कार्यों के लिए किया जाएगा जहां कभी-कभार विफलता स्वीकार्य हो।

सीमित डेटा नमूनों की मदद से पहले से अज्ञात या नई समस्याओं को सटीक रूप से हल करने की क्षमता को सामान्यीकरण की क्षमता के रूप में जाना जाता है। इसे व्यापक रूप से बुद्धिमत्ता का एक आवश्यक, यहां तक कि मौलिक तत्व माना जाता है।

ग्रिड और पैटर्न

एआरसी-एजीआई मानक नीचे दिए गए जैसे छोटे ग्रिड वर्ग समस्याओं का उपयोग करके नमूना कुशल अनुकूलन के लिए परीक्षण करता है। एआई को उस पैटर्न का पता लगाने की आवश्यकता है जो बाईं ओर के ग्रिड को दाईं ओर के ग्रिड में बदल देता है।

प्रत्येक प्रश्न में सीखने के लिए तीन उदाहरण दिए गए हैं। फिर एआई प्रणाली को उन नियमों का पता लगाना होगा जो तीन उदाहरणों से चौथे तक ‘‘सामान्यीकृत’’ होते हैं।

कमजोर नियम और अनुकूलन

हम सटीक तरीके से नहीं जानते कि ‘ओपन एआई’ ने यह कैसे किया है, लेकिन परिणाम बताते हैं कि ओ3 मॉडल अत्यधिक अनुकूलनीय है। कुछ उदाहरणों से ही यह ऐसे नियम खोज लेता है जिन्हें सामान्यीकृत किया जा सकता है।

किसी पैटर्न को समझने के लिए हमें कोई अनावश्यक धारणा नहीं बनानी चाहिए, या जितना हमें वास्तव में होना चाहिए, उससे अधिक विशिष्ट नहीं होना चाहिए। सैद्धांतिक रूप से यदि आप ‘सबसे कमज़ोर’ नियमों की पहचान कर सकते हैं जो आपकी इच्छा के अनुसार काम करते हैं, तो आपने नई परिस्थितियों के अनुकूल होने की अपनी क्षमता को अधिकतम कर लिया है।

सबसे कमजोर नियमों से क्या अभिप्राय है? तकनीकी परिभाषा जटिल है, लेकिन सामन्य बोलचाल में कमजोर नियम आमतौर पर वे होते हैं जिन्हें सरल कथनों में वर्णित किया जा सकता है।

विचार की शृंखलाओं की खोज?

हालांकि हम अभी तक नहीं जानते कि ‘ओपनएआई’ ने यह परिणाम कैसे प्राप्त किया, लेकिन ऐसा लगता है कि उन्होंने जानबूझकर ओ3 प्रणाली को कमजोर नियमों को खोजने के लिए अनुकूलित नहीं किया। हालांकि, एआरसी-एजीआई कार्यों में सफल होने के लिए उन्हें खोजना होगा।

हम जानते हैं कि ओपनएआई ने ओ3 मॉडल के सामान्य-उद्देश्य वाले संस्करण के साथ शुरुआत की (जो कि अधिकांश अन्य मॉडलों से अलग है, क्योंकि यह कठिन प्रश्नों के बारे में ‘सोचने’ में अधिक समय लगा सकता है) और फिर इसे विशेष रूप से एआरसी-एजीआई परीक्षण के लिए प्रशिक्षित किया।

मानक को डिजाइन करने वाले फ्रांसीसी एआई अनुसंधानकर्ता फ्रेंकोइस चोलेट का मानना ​​है कि ओ3 चरणों का वर्णन करते हुए विभिन्न ‘विचार श्रृंखलाओं’ के माध्यम से खोज करता है। फिर यह कुछ शिथिल रूप से परिभाषित नियम, या ‘अनुमान’ के अनुसार ‘सर्वश्रेष्ठ’ का चयन करेगा।

यह उससे ‘भिन्न नहीं’ होगा जिससे गूगल की अल्फागो प्रणाली ने विश्व गो चैंपियन को हराने के लिए विभिन्न संभावित चालों के अनुक्रमों की तलाश की थी।

क्या हम अभी भी नहीं जानते

तो सवाल यह है कि क्या यह वाकई एजीआई के करीब है? अगर ओ3 इसी तरह काम करता है, तो रेखांकित मॉडल पिछले मॉडलों से ज्यादा बेहतर नहीं हो सकता है।

मॉडल भाषा से जो अवधारणाएं सीखता है, वे पहले की तुलना में सामान्यीकरण के लिए अधिक उपयुक्त नहीं हो सकती हैं। इसके बजाय, हम इस परीक्षण के लिए विशेषीकृत एक अनुमानी प्रशिक्षण के अतिरिक्त चरणों के माध्यम से प्राप्त एक अधिक सामान्यीकृत ‘विचार श्रृंखला’ देख सकते हैं।

ओ3 के बारे में लगभग सब कुछ अज्ञात है। ओपनएआई ने कुछ मीडिया प्रस्तुतियों और मुट्ठी भर अनुसंधानकर्ताओं, प्रयोगशालाओं और एआई सुरक्षा संस्थानों के लिए प्रारंभिक परीक्षण तक ही जानकारी का खुलासा किया है।

(द कन्वरवेशन)