रविवार, 12 मई 2024

डेस्कटॉप v4.2.1

Root Nationसमाचारआईटी अखबारटोक्यो में, GPT-3 पर आधारित Alter4 ह्यूमनॉइड रोबोट की सफलताएँ दिखाई गईं

टोक्यो में, GPT-3 पर आधारित Alter4 ह्यूमनॉइड रोबोट की सफलताएँ दिखाई गईं

-

टोक्यो विश्वविद्यालय की एक टीम ने एक ह्यूमनॉइड रोबोट Alter3 का अनावरण किया है जो GPT-4 लार्ज लैंग्वेज मॉडल (LLM) का उपयोग करके गतिविधियां कर सकता है। Alter3 नवीनतम टूल का उपयोग करता है AI खोलें पूर्व-क्रमादेशित डेटाबेस प्रविष्टियों की आवश्यकता के बिना, सेल्फी पोज़ से लेकर घोस्टिंग तक, गतिशील रूप से विभिन्न पोज़ ग्रहण करना।

शोधकर्ताओं ने कहा, "चेहरे के भाव और हावभाव का उपयोग करके बातचीत की सामग्री पर Alter3 की प्रतिक्रिया ह्यूमनॉइड रोबोटिक्स में एक महत्वपूर्ण प्रगति है जो न्यूनतम परिवर्तनों के साथ अन्य एंड्रॉइड के लिए आसानी से अनुकूल है।"

परिवर्तन3

रोबोट के साथ एलएलएम एकीकरण के क्षेत्र में, बुनियादी संचार में सुधार और यथार्थवादी प्रतिक्रियाओं के मॉडलिंग पर ध्यान केंद्रित किया गया है। शोधकर्ता रोबोटों को जटिल निर्देशों को समझने और निष्पादित करने में सक्षम बनाने के लिए एलएलएम की क्षमताओं पर भी काम कर रहे हैं, जिससे उनकी कार्यक्षमता में वृद्धि हो सके।

परंपरागत रूप से, निम्न-स्तरीय प्रबंधन रोबोटों हार्डवेयर से जुड़ा है और एलएलएम निगमों के दायरे से बाहर है। इससे एलएलएम-आधारित कार्यों के प्रत्यक्ष प्रबंधन में कठिनाइयाँ पैदा होती हैं। इस समस्या को हल करते हुए, जापानी टीम ने मानव आंदोलनों की अभिव्यक्तियों को एंड्रॉइड के लिए समझने योग्य कोड में परिवर्तित करने की एक विधि विकसित की है। इसका मतलब यह है कि रोबोट स्वतंत्र रूप से प्रत्येक शरीर के हिस्से को व्यक्तिगत रूप से प्रोग्राम करने के लिए डेवलपर्स की आवश्यकता के बिना समय के साथ कार्यों के अनुक्रम उत्पन्न कर सकता है।

बातचीत के दौरान, एक व्यक्ति Alter3 कमांड दे सकता है जैसे "अपने iPhone के साथ एक सेल्फी लें"। इसके बाद, रोबोट आवश्यक कदमों पर मार्गदर्शन प्राप्त करने के लिए GPT-4 के लिए अनुरोधों की एक श्रृंखला शुरू करता है। GPT-4 इसे पायथन कोड में अनुवादित किया जाएगा जो कार्य को "समझने" और आवश्यक गतिविधियों को निष्पादित करने की अनुमति देता है। यह नवप्रवर्तन Alter3 को अपने ऊपरी शरीर को हिलाने की अनुमति देता है जबकि उसका निचला शरीर स्टैंड से जुड़ा हुआ स्थिर रहता है।

Alter3, 2016 के बाद से Alter की ह्यूमनॉइड रोबोटों की श्रृंखला में तीसरा पुनरावृत्ति है, जिसमें संपीड़ित हवा द्वारा संचालित चेहरे के भाव और अंग आंदोलनों के लिए जिम्मेदार 43 एक्चुएटर्स हैं। यह कॉन्फ़िगरेशन अभिव्यंजक इशारों की एक विस्तृत श्रृंखला प्रदान करता है। रोबोट चल नहीं सकता, लेकिन यह सामान्य चलने और दौड़ने की गतिविधियों की नकल कर सकता है।

Alter3 ने कैमरे और OpenPose फ्रेमवर्क का उपयोग करके मानव मुद्राओं की प्रतिलिपि बनाने की क्षमता का भी प्रदर्शन किया। रोबोट अपने जोड़ों को प्रेक्षित मुद्राओं के अनुसार समायोजित करता है और बाद में उपयोग के लिए सफल नकलें बचाता है। मानव के साथ बातचीत से अधिक विविध मुद्राएं उत्पन्न हुईं, जिससे इस विचार का समर्थन हुआ कि विभिन्न गतिविधियां मानव की नकल करने से आती हैं, जैसे नवजात शिशु नकल के माध्यम से सीखते हैं।

एलएलएम से पहले, शोधकर्ताओं को किसी व्यक्ति की मुद्रा को फिर से बनाने या चाय परोसने या शतरंज खेलने जैसे व्यवहार का अनुकरण करने के लिए सभी 43 एक्चुएटर्स को सावधानीपूर्वक नियंत्रित करना पड़ता था। इसके लिए कई मैन्युअल समायोजन की आवश्यकता थी, लेकिन टीम को इस दिनचर्या से मुक्त करने में मदद की। “हम उम्मीद करते हैं कि Alter3 संदर्भ-प्रासंगिक चेहरे के भाव और हावभाव प्रदर्शित करके संवाद में प्रभावी ढंग से संलग्न होगा। शोधकर्ताओं का कहना है, "इसने भावनाओं को प्रतिबिंबित करने की क्षमता प्रदर्शित की, उदाहरण के लिए, प्रतिक्रिया में दुख या खुशी दिखाना, जिससे भावनाओं को हमारे साथ साझा किया जा सके।"

यह भी पढ़ें:

साइन अप करें
के बारे में सूचित करें
अतिथि

0 टिप्पणियाँ
एंबेडेड समीक्षा
सभी टिप्पणियाँ देखें
अपडेट के लिए सब्सक्राइब करें