बुधवार, 8 मई 2024

डेस्कटॉप v4.2.1

Root Nationउत्तरप्रौद्योगिकियोंजेमिनी क्या है: Google के नए AI मॉडल के बारे में सब कुछ

जेमिनी क्या है: Google के नए AI मॉडल के बारे में सब कुछ

-

Google ने हाल ही में अपना अब तक का सबसे शक्तिशाली AI मॉडल जारी किया है मिथुन राशि. वह क्या है और क्या कर सकती है? हमारे लेख में हर चीज़ के बारे में।

Google वर्षों से अपने स्वयं के AI उपकरण विकसित कर रहा है। OpenAI से ChatGPT-3 की सार्वजनिक रिलीज के साथ, दुनिया का सबसे लोकप्रिय सर्च इंजन चलाने वाली कंपनी ने एक समान टूल, बार्ड भी बनाया है। लेकिन यह टूल फिर भी प्रतिस्पर्धियों से हार गया, जिसकी अनुमति Google नहीं दे सका। इसलिए, यह आश्चर्य की बात नहीं है कि दुनिया ने हाल ही में Google का एक नया भाषा मॉडल जेमिनी देखा, जिसके बारे में हमने प्रेजेंटेशन के दौरान सीखा।

इसे न केवल दिग्गज के पिछले एलएलएम (बड़े भाषा मॉडल) को बेहतर बनाने के लिए डिज़ाइन किया गया है, बल्कि टेक्स्ट प्रोसेसिंग, ग्राफिक्स और ध्वनि के क्षेत्र में पूरी तरह से नई संभावनाएं प्रदान करने के लिए भी डिज़ाइन किया गया है।

तो आइए नए Google जेमिनी भाषा मॉडल पर करीब से नज़र डालें।

यह भी दिलचस्प: ओपनएआई प्रोजेक्ट प्रश्न*: यह क्या है और यह प्रोजेक्ट चिंता का विषय क्यों है

गूगल जेमिनी क्या है?

यह Google का आर्टिफिशियल इंटेलिजेंस का एक नया और शक्तिशाली मॉडल है, जो न केवल टेक्स्ट, बल्कि इमेज, वीडियो और ऑडियो को भी समझ सकता है। इस मल्टीमॉडल मॉडल को गणित, भौतिकी और अन्य डोमेन में जटिल कार्यों को करने में सक्षम होने के साथ-साथ विभिन्न प्रोग्रामिंग भाषाओं में उच्च गुणवत्ता वाले कोड को समझने और उत्पन्न करने में सक्षम बताया गया है।

गूगल मिथुन

जेमिनी वर्तमान में Google बार्ड और Google Pixel 8 के साथ एकीकरण के माध्यम से उपलब्ध है और धीरे-धीरे इसे अन्य Google सेवाओं में शामिल किया जाएगा।

"मिथुन Google अनुसंधान में हमारे सहयोगियों सहित Google टीमों के व्यापक सहयोगात्मक प्रयास का परिणाम है," - Google DeepMind के सीईओ और सह-संस्थापक डेनिस हसाबिस ने कहा। "यह मूल रूप से मल्टीमॉडल होने के लिए बनाया गया था, जिसका अर्थ है कि यह टेक्स्ट, कोड, ऑडियो, छवियों और वीडियो सहित विभिन्न प्रकार की जानकारी को सामान्यीकृत और निर्बाध रूप से समझ सकता है, संचालित कर सकता है और संयोजित कर सकता है।"

- विज्ञापन -

यह भी दिलचस्प: हम जो कुछ भी एआई कहते हैं वह वास्तव में कृत्रिम बुद्धिमत्ता नहीं है। यहाँ आपको जानने की आवश्यकता है

मॉडल किसने बनाया?

गूगल मिथुन

जैसा कि आप शायद पहले ही अनुमान लगा चुके हैं, जेमिनी को Google और Google की मूल कंपनी Alphabet द्वारा बनाया गया था, और यह कंपनी का अब तक का सबसे उन्नत AI मॉडल है। Google के DeepMind डिवीजन ने भी इसके विकास में महत्वपूर्ण योगदान दिया। यह अभी तक ज्ञात नहीं है कि कितने कर्मचारियों ने विकास में भाग लिया और इसके लिए कितना धन आवंटित किया गया था, लेकिन Google की क्षमताओं को जानकर, हम यह सुनिश्चित कर सकते हैं कि इसमें बहुत बड़ी राशि है।

यह भी दिलचस्प: Windows 12: नया OS क्या होगा?

अवसर

जैसा कि मैंने ऊपर उल्लेख किया है, यह एक मल्टीमॉडल मॉडल है, जिसका अर्थ है कि यह टेक्स्ट, कोड, ऑडियो, चित्र और वीडियो सहित विभिन्न प्रकार के डेटा को समझ सकता है, संचालित कर सकता है और संयोजित कर सकता है। यह पिछले AI सिस्टम की तुलना में बेहतर समझ, सोच और कोडिंग कौशल प्रदान करता है।

गूगल मिथुन

मॉडल की मुख्य क्षमताएं हैं:

  • अनुवाद, सारांशीकरण और संवाद जैसे कार्यों के लिए प्राकृतिक भाषा प्रसंस्करण
  • गणितीय सोच और समस्या समाधान
  • कोड और दस्तावेज़ तैयार करने की क्षमता
  • छवियों, ऑडियो और वीडियो को समझना
  • विभिन्न डोमेन में मल्टीटास्किंग

जैसा कि आप देख सकते हैं, क्षमताएं अन्य मॉडलों से बेहतर हैं।

भाषा की समझ, गणितीय सोच और कोडिंग के परीक्षणों में, जेमिनी अल्ट्रा ने जीपीटी-4 जैसे मॉडल से बेहतर प्रदर्शन किया। विशेष रूप से, यह मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (एमएमएलयू) परीक्षण पर मानव-स्तर के प्रदर्शन से बेहतर प्रदर्शन करने वाला पहला मॉडल है, जिसने 90% से अधिक सटीकता हासिल की है।

एक बड़े भाषा मॉडल अध्ययन के 32 शैक्षणिक परीक्षणों में, जेमिनी ने GPT-4 से बेहतर प्रदर्शन किया। 30 मामलों में, Google का नया भाषा मॉडल प्रतिस्पर्धी से बेहतर था। यह भाषा को पूरी तरह से समझने की मॉडल की क्षमता को प्रदर्शित करता है।

यह भी पढ़ें: मानव मस्तिष्क परियोजना: मानव मस्तिष्क की नकल करने का एक प्रयास

क्या अलग-अलग संस्करण हैं?

Google इस AI को एक लचीले मॉडल के रूप में वर्णित करता है जो किसी भी डिवाइस पर काम कर सकता है: Google डेटा सेंटर से लेकर मोबाइल डिवाइस तक। इस मापनीयता को प्राप्त करने के लिए, जेमिनी तीन संस्करणों में आता है: नैनो, प्रो और अल्ट्रा।

गूगल मिथुन

आइए मिथुन राशि के विभिन्न संस्करणों के बारे में अधिक विस्तार से बात करें।

  • जेमिनी नैनो: स्मार्टफोन पर काम करने के लिए डिज़ाइन किया गया है, विशेष रूप से Google Pixel 8। यह उन कार्यों को करने के लिए डिज़ाइन किया गया है जिनके लिए बाहरी सर्वर से कनेक्ट किए बिना कृत्रिम बुद्धिमत्ता द्वारा कुशल प्रसंस्करण की आवश्यकता होती है, जैसे चैट प्रोग्राम में उत्तर सुझाना या पाठ का सारांश देना। इस कॉम्पैक्ट डिवाइस मॉडल में लगभग 6 बिलियन पैरामीटर हैं।
  • मिथुन प्रो: Google डेटा केंद्रों में चलता है। प्रो को बार्ड एआई चैटबॉट के नवीनतम संस्करण के साथ काम करने के लिए डिज़ाइन किया गया है। यह तीव्र प्रतिक्रिया समय प्रदान करने और जटिल प्रश्नों को समझने में सक्षम है। एक मध्यम आकार के मॉडल में लगभग 100 बिलियन पैरामीटर होते हैं और यह बार्ड के संवादी एआई का मूल है। प्रो Google क्लाउड के माध्यम से उपलब्ध होगा।
  • जेमिनी अल्ट्रा: हालांकि अल्ट्रा संस्करण अभी तक व्यापक रूप से उपलब्ध नहीं है, Google इसे अपने सबसे अच्छे प्रदर्शन वाले मॉडल के रूप में वर्णित करता है, जो बड़े भाषा मॉडल (एलएलएम) अनुसंधान में उपयोग किए जाने वाले 30 व्यापक रूप से उपयोग किए जाने वाले अकादमिक परीक्षणों में से 32 के लिए वर्तमान अत्याधुनिक से अधिक है। " सबसे बड़े और सबसे शक्तिशाली संस्करण के रूप में, अल्ट्रा को 1 ट्रिलियन से अधिक पैरामीटर प्राप्त होंगे। यह डेटा सेंटरों में स्थित होगा. अल्ट्रा को कॉर्पोरेट उपयोग के लिए अनुकूलित किया गया है। संस्करण को बहुत जटिल कार्य करने के लिए डिज़ाइन किया गया है। Google की योजना मौजूदा परीक्षण चरण की समाप्ति के बाद इसे जारी करने की है। यानी सबसे पावरफुल वर्जन अभी यूजर्स के लिए उपलब्ध नहीं है.

यह भी दिलचस्प: Google Bard AI: वह सब कुछ जो आपको जानना आवश्यक है

- विज्ञापन -

जेमिनी तक कैसे पहुंचें?

नैनो और प्रो संस्करणों में AI अब क्रमशः Google Pixel 8 स्मार्टफोन और बार्ड चैटबॉट जैसे Google उत्पादों में उपलब्ध है। Google अंततः इसे अपने खोज इंजन, विज्ञापन, जीमेल ईमेल सेवा, क्रोम ब्राउज़र और अन्य सेवाओं में एकीकृत करने की योजना बना रहा है।

डेवलपर्स और एंटरप्राइज़ ग्राहक 13 दिसंबर, 2023 से Google AI स्टूडियो और Google क्लाउड वर्टेक्स AI में जेमिनी एपीआई के माध्यम से प्रो तक पहुंच सकेंगे। डेवलपर्स Android AICore के माध्यम से नैनो संस्करण मॉडल तक पहुंच होगी, जो प्रारंभिक पूर्वावलोकन में उपलब्ध होगी।

यह भी पढ़ें: Samsung Galaxy फ्लिप5 बनाम Motorola रेज़र 40 अल्ट्रा: दो योकोज़ुन की लड़ाई

गूगल बार्ड पर मिथुन: क्या बदलेगा?

प्रस्तुति के दौरान दी गई जानकारी के अनुसार, मॉडल Google बार्ड को अधिक जटिल समस्याओं को बेहतर ढंग से संभालने की अनुमति देगा, जैसा कि कहा गया है:

“हमने जेमिनी को डिज़ाइन किया ताकि मॉडल स्वाभाविक रूप से मल्टी-मोडल हो और शुरू से ही कई तौर-तरीकों पर पूर्व-प्रशिक्षित हो। फिर हमने प्रदर्शन को बेहतर बनाने के लिए अधिक मल्टीमॉडल डेटा जोड़कर इसे परिष्कृत किया। नतीजतन, जेमिनी पिछले मल्टीमॉडल मॉडल की तुलना में आसानी से समझता है और बेहतर अनुमान लगाता है, और लगभग सभी क्षेत्रों में अत्याधुनिक क्षमताओं का दावा करता है।

जेमिनी की असाधारण मल्टीमॉडल क्षमताएं आपको जटिल पाठ्य और दृश्य जानकारी को समझने में मदद करती हैं। जब विशाल डेटा सेट से विशिष्ट जानकारी निकालने की बात आती है तो वे विशेष रूप से उपयोगी होते हैं। सैकड़ों-हजारों दस्तावेज़ों को पढ़कर, फ़िल्टर करके और उनका विश्लेषण करके उनमें से जानकारी का सार निकालने की इस मॉडल की असाधारण क्षमता निस्संदेह विज्ञान से लेकर वित्त तक विभिन्न क्षेत्रों में नई, बिजली-तेज़ खोजों में योगदान देगी।"

प्रस्तुति के दौरान, एक जटिल अध्ययन का एक उदाहरण प्रदर्शित किया गया, जिसमें 200 हजार से अधिक रिकॉर्ड शामिल हैं, जिनमें से कुछ को नए डेटा के अनुसार अद्यतन किया जाना था। जैसा कि आपने अनुमान लगाया होगा, इसे मैन्युअल रूप से करने में बहुत समय लगेगा, इसलिए अध्ययन लेखकों ने कोड तैयार करने के लिए जेमिनी का उपयोग किया जिसने इनपुट लिया और आवश्यक अपडेट किए। एक और, अधिक वास्तविक दुनिया का उदाहरण गणित या भौतिकी की समस्याओं को समझाने के लिए Google के भाषा मॉडल का उपयोग करना है।

गूगल मिथुन

यहां इनपुट डेटा एक स्कूल पाठ के असाइनमेंट का फोटो/स्कैन था। सिस्टम वहां संग्रहीत ग्राफिक्स और पाठ को संसाधित करने में सक्षम था और फिर इंगित करता था कि होमवर्क के कौन से हिस्से सही ढंग से किए गए थे और किस पर अधिक ध्यान देने की आवश्यकता थी। प्रेजेंटेशन से पता चला कि एक उपयोगकर्ता बार-बार जेमिनी से किसी कार्य को समझाने के लिए कह सकता है, और प्रत्येक बाद के प्रयास को सरल भाषा में समझाया जाना चाहिए। जेमिनी कितना सटीक और सही होगा, यह निश्चित रूप से रुचि रखने वालों द्वारा जांचा जाएगा, लेकिन तस्वीरों से सीधे पाठ को पढ़ने और संसाधित करने की क्षमता प्रभावशाली है। जैसा कि प्रेजेंटेशन के दौरान जोड़ा गया:

"मिथुन को एक ही समय में पाठ, छवियों, ध्वनियों और बहुत कुछ को पहचानना और समझना सिखाया गया है। इसके लिए धन्यवाद, वह जानकारी की बारीकियों को बेहतर ढंग से समझता है और जटिल सवालों का जवाब दे सकता है। यह गणित और भौतिकी से संबंधित विषयों को समझाने में विशेष रूप से प्रभावी है, इसलिए यह व्यक्तिगत होमवर्क सहायक के रूप में काम कर सकता है".

Google Pixel स्मार्टफोन में मिथुन राशि

Google ने यह भी दावा किया कि जेमिनी नए TPUv5 चिपसेट पर "सीख" रहा था, और 2024 की शुरुआत में जेमिनी अल्ट्रा को पेश करने की योजना बना रहा है, जो दिग्गज के स्पीच मॉडल के उपभोक्ता संस्करण के एक नए संस्करण, बार्ड एडवांस्ड का उपयोग करेगा। जेमिनी अल्ट्रा अभी परीक्षण में है और चुनिंदा सुरक्षा विशेषज्ञों के लिए पहले से ही उपलब्ध है।

गूगल मिथुन

अंतिम महत्वपूर्ण जानकारी Google Pixel 8 स्मार्टफोन में जेमिनी की शुरूआत है। यह अन्य चीजों के अलावा, मैसेंजर में Gboard एप्लिकेशन के माध्यम से त्वरित उत्तर बनाने की अनुमति देगा। पहला व्हाट्सएप है, लेकिन अगले साल संचार से संबंधित अन्य अनुप्रयोगों में ऐसे समाधान दिखाई देंगे। हालाँकि, यह केवल शुरुआत है, क्योंकि Google ने Pixel 8 स्मार्टफोन के लिए कई नए AI टूल की घोषणा की है, और वे भविष्य में कुछ अन्य डिवाइस पर उपलब्ध होंगे। Android. हालाँकि, ये आगे की योजनाएँ हैं और इस समय कोई विवरण नहीं दिया गया है।

जेमिनी अन्य AI मॉडल, जैसे GPT-4, से किस प्रकार भिन्न है?

Google का नया जेमिनी मॉडल अब तक के सबसे बड़े और सबसे उन्नत AI मॉडल में से एक प्रतीत होता है, हालाँकि अल्ट्रा मॉडल की रिलीज़ यह निश्चित रूप से निर्धारित करेगी। वर्तमान में एआई चैटबॉट्स का उपयोग करने वाले अन्य लोकप्रिय मॉडलों की तुलना में, जेमिनी अपनी मल्टीमॉडल सुविधा के साथ खड़ा है, जबकि जीपीटी -4 जैसे अन्य मॉडल वास्तव में मल्टीमॉडल होने के लिए प्लगइन्स और एकीकरण पर भरोसा करते हैं।

सटीकता और निष्पक्षता के बारे में चिंताएँ

हालाँकि जेमिनी कृत्रिम बुद्धिमत्ता क्षमताओं के विकास में एक बड़ी छलांग है, लेकिन इसमें अन्य प्रमुख भाषा मॉडलों की तरह ही कमियाँ हैं। सबसे पहले, यह गलत जानकारी बनाने की संभावना है। पूर्वाग्रह नए भाषा मॉडल के लिए उपलब्ध प्रशिक्षण डेटा पर भी आधारित हैं। वास्तविक दुनिया की सीमित समझ का भी उल्लेख करना उचित है। Google स्वीकार करता है कि नया जेमिनी मॉडल गलतियाँ कर सकता है, ऐसे तथ्य प्रदान कर सकता है जो साक्ष्य पर आधारित नहीं हैं और सामान्य ज्ञान के विपरीत हैं।

गूगल मिथुन

अधिक परीक्षणों की आवश्यकता है, विशेष रूप से जेमिनी अल्ट्रा के लिए, जिसमें नई क्षमताएं हैं जिनका अभी तक पूरी तरह से पता नहीं लगाया गया है। Google संभावित नुकसान को कम करने के लिए जेमिनी का सावधानीपूर्वक मूल्यांकन करने के लिए प्रतिबद्ध है।

यह भी दिलचस्प: इसके बारे में सबकुछ Microsoft सहपायलट: भविष्य या गलत तरीका?

भविष्य मिथुन राशि का है

Google द्वारा जेमिनी के लॉन्च ने AI विकास के एक नए युग की शुरुआत की। पिछले मॉडलों और मानव आधार रेखाओं की तुलना में अपने सर्वश्रेष्ठ प्रदर्शन के साथ, जेमिनी कृत्रिम बुद्धिमत्ता की भविष्य की संभावनाओं की ओर इशारा करता है, लेकिन कुछ कमियों को दूर करने के लिए अभी भी अधिक शोध की आवश्यकता है।

भविष्य में, आप उम्मीद कर सकते हैं कि जेमिनी Google उत्पादों में अधिक उपयोगी और बुद्धिमान सुविधाएँ प्रदान करेगा। आगे बढ़ते हुए, कंपनी की योजना अंग्रेजी से परे जेमिनी का विस्तार जारी रखने और अपनी मुख्य मॉडल कार्यप्रणाली पर निर्माण करने की है।

हम केवल देख सकते हैं और आशा कर सकते हैं कि Google जानता है कि वह क्या कर रहा है।

यह भी पढ़ें: 

Yuri Svitlyk
Yuri Svitlyk
कार्पेथियन पर्वत के पुत्र, गणित की अपरिचित प्रतिभा, "वकील"Microsoft, व्यावहारिक परोपकारी, बाएँ-दाएँ
- विज्ञापन -
साइन अप करें
के बारे में सूचित करें
अतिथि

0 टिप्पणियाँ
एंबेडेड समीक्षा
सभी टिप्पणियाँ देखें
अपडेट के लिए सब्सक्राइब करें