रविवार, 12 मई 2024

डेस्कटॉप v4.2.1

Root Nationसमाचारआईटी अखबारMicrosoft मानव-स्तरीय एआई का मार्ग प्रशस्त करने वाला एक मल्टीमॉडल दृष्टिकोण प्रस्तुत किया

Microsoft मानव-स्तरीय एआई का मार्ग प्रशस्त करने वाला एक मल्टीमॉडल दृष्टिकोण प्रस्तुत किया

-

इस सप्ताह की शुरुआत में, शोधकर्ताओं ने Microsoft कोस्मोस-1 प्रस्तुत किया गया, जो एक मल्टीमॉडल कृत्रिम बुद्धिमत्ता मॉडल है जो सामग्री के लिए छवियों का विश्लेषण कर सकता है, दृश्य पहेलियों को हल कर सकता है, दृश्य पाठ पहचान कर सकता है, दृश्य आईक्यू परीक्षण कर सकता है और प्राकृतिक भाषा के निर्देशों को समझ सकता है। शोधकर्ताओं के अनुसार, ऐसे एआई मॉडल एक कृत्रिम सामान्य बुद्धि (एआई) बनाने की दिशा में पहला कदम हैं जो संयुक्त मानव-स्तरीय कार्य कर सकते हैं। यानी यह तकनीक किसी भी बौद्धिक कार्य में व्यक्ति की जगह ले सकेगी। और यह एक प्रमुख व्यावसायिक भागीदार OpenAI का घोषित लक्ष्य है Microsoft कृत्रिम बुद्धि के क्षेत्र में.

कॉसमॉस -1

इस मामले में, कॉसमॉस-1 कंपनी का विशुद्ध रूप से व्यक्तिगत विकास है Microsoft. शोधकर्ता अपनी रचना को "मल्टीमॉडल ब्रॉड लैंग्वेज मॉडल" (एमएलएलएम) कहते हैं क्योंकि इसकी जड़ें केवल टेक्स्ट-प्राकृतिक भाषा प्रसंस्करण जैसे एलएलएम, जैसे चैटजीपीटी में निहित हैं। मॉडल द्वारा इनपुट छवियों को स्वीकार करने के लिए, शोधकर्ताओं को पहले छवियों को टोकन (मुख्य रूप से पाठ) की एक विशेष श्रृंखला में परिवर्तित करना होगा जिसे एलएलएम समझ सके।

कॉसमॉस -1

कोस्मोस-1 को इंटरनेट से एक डेटाबेस पर प्रशिक्षित किया गया था, जिसमें द पाइल (एक 800 जीबी अंग्रेजी भाषा पाठ संसाधन) और कॉमन क्रॉल के अंश शामिल थे। फिर मॉडल को भाषण समझ, भाषण निर्माण, ऑप्टिकल चरित्र पहचान के बिना पाठ वर्गीकरण, छवि कैप्शनिंग, दृश्य प्रश्न उत्तर, वेब पेज प्रश्न उत्तर और स्थानीयकरण के साथ छवि वर्गीकरण के लिए कई परीक्षणों के साथ परीक्षण किया गया था। के अनुसार Microsoftइनमें से कई परीक्षणों में कॉसमॉस-1 ने मौजूदा मॉडलों से बेहतर प्रदर्शन किया।

कॉसमॉस -1

विशेष रूप से दिलचस्प था रेवेन का प्रोग्रेसिव रीजनिंग टेस्ट, जो आकृतियों के अनुक्रम को प्रस्तुत करके और विषय को अनुक्रम पूरा करने के लिए कहकर दृश्य बुद्धि को मापता है। कॉसमॉस-1 22% मामलों में सही उत्तर देने में सक्षम था।

कॉसमॉस -1

ये शुरुआती कदम, जो भविष्य के अनुकूलन के साथ, और भी अधिक महत्वपूर्ण परिणाम दे सकते हैं, एआई मॉडल को मीडिया के किसी भी रूप को देखने और प्रभावित करने की अनुमति देते हैं, कृत्रिम सहायकों की क्षमताओं का बहुत विस्तार करते हैं।

यह भी पढ़ें:

स्रोतArsTechnica
साइन अप करें
के बारे में सूचित करें
अतिथि

0 टिप्पणियाँ
एंबेडेड समीक्षा
सभी टिप्पणियाँ देखें
अपडेट के लिए सब्सक्राइब करें