मेटा ने एक नया शक्तिशाली एआई मॉडल लामा 2 लॉन्ग प्रस्तुत किया

कैलिफ़ोर्निया में वार्षिक मेटा कनेक्ट इवेंट में मेटा प्लेटफ़ॉर्म प्रस्तुत इसके लोकप्रिय ऐप्स के लिए कई नई AI सुविधाएँ Facebook, Instagram और व्हाट्सएप, लेकिन तकनीकी दिग्गज के सबसे प्रभावशाली नवाचार पर कई लोगों का ध्यान नहीं गया होगा। हम बात कर रहे हैं लामा 2 लॉन्ग एआई मॉडल की।

मेटा कंपनी के शोधकर्ताओं की एक टीम ने किसी तरह चुपचाप एक लेख प्रकाशित किया जिसमें उन्होंने एक नया कृत्रिम बुद्धिमत्ता मॉडल, लामा 2 लॉन्ग प्रस्तुत किया, जो लंबे उपयोगकर्ता प्रश्नों के सुसंगत और प्रासंगिक उत्तर उत्पन्न करने में सक्षम है। वे कहते हैं, अधिक से अधिक यह उद्योग के कुछ सर्वोत्तम प्रतिस्पर्धियों से बेहतर प्रदर्शन करता है।

लामा 2 लॉन्ग एक विस्तार है लामा 2, गर्मियों में जारी किया गया एक ओपन-सोर्स एआई मॉडल मेटा जो विभिन्न डेटा स्रोतों से सीख सकता है और कोडिंग, गणित, भाषा समझ और बहुत कुछ जैसे विभिन्न कार्य कर सकता है। हालाँकि, लामा 2 लॉन्ग को लंबे टेक्स्ट वाले अधिक डेटा पर प्रशिक्षित किया गया था, और इस एल्गोरिदम को सूचना के लंबे अनुक्रमों को संभालने के लिए संशोधित किया गया था। यह इसे OpenAI के GPT-3.5 टर्बो और क्लाउड 2 से बेहतर प्रदर्शन करने की अनुमति देता है, जिसमें प्रतिक्रिया उत्पन्न करने के लिए संदर्भ की मात्रा की सीमा होती है।

शोधकर्ताओं मेटा लामा 2 के विभिन्न संस्करणों का उपयोग किया गया - 7 बिलियन से 70 बिलियन पैरामीटर तक, यानी वे मान जिन्हें एआई मॉडल डेटा से सीखकर बदल सकता है। उन्होंने डेटा के अन्य 400 बिलियन टोकन (पाठ की इकाइयाँ) जोड़े जिनमें मूल मॉडल डेटासेट की तुलना में लंबे पाठ शामिल थे। उन्होंने रोटरी पोजिशनल एंबेडिंग (आरओपीई) तकनीक का उपयोग करके एआई मॉडल की वास्तुकला में थोड़ा बदलाव किया ताकि मॉडल अन्य तरीकों की तुलना में कम जानकारी और मेमोरी का उपयोग करके सटीक और उपयोगी उत्तर उत्पन्न कर सके।

लामा 2

टीम ने मानव फीडबैक (आरएलएचएफ) से सुदृढीकरण सीखने का उपयोग किया, एक ऐसी विधि जहां एआई मॉडल को सही उत्तरों के लिए पुरस्कृत किया जाता है और मानव मूल्यांकनकर्ताओं द्वारा सही किया जाता है, और सिंथेटिक डेटा लामा 2 चैट द्वारा ही उत्पन्न किया जाता है। विभिन्न कार्यों में अपने प्रदर्शन को बेहतर बनाने के लिए .

पेपर का दावा है कि मॉडल 200 अक्षरों तक के उपयोगकर्ता संकेतों के लिए उच्च-गुणवत्ता वाली प्रतिक्रियाएं उत्पन्न कर सकता है, जो लगभग 40 पृष्ठों के पाठ के बराबर है। शोधकर्ताओं का कहना है कि लामा 2 लॉन्ग अधिक सामान्य और बहुमुखी एआई मॉडल बनाने की दिशा में एक कदम है जो उपयोगकर्ताओं की जटिल और विविध आवश्यकताओं को पूरा कर सकता है। वे ऐसे मॉडलों के संभावित नैतिक और सामाजिक निहितार्थों को भी पहचानते हैं और उन्हें जिम्मेदारीपूर्वक और लाभकारी तरीके से उपयोग करने के तरीके पर आगे के शोध और संवाद का आह्वान करते हैं।

यह भी पढ़ें:

स्रोतदिलचस्पइंजीनियरिंग

साइन अप करें

0 टिप्पणियाँ

एंबेडेड समीक्षा

सभी टिप्पणियाँ देखें

अन्य लेख

मेटा ने लामा 2 लॉन्ग एआई मॉडल पेश किया, जो लंबी क्वेरी के साथ बेहतर काम करता है

हाल की टिप्पणियाँ