बुधवार, 8 मई 2024

डेस्कटॉप v4.2.1

Root Nationसमाचारआईटी अखबारमेटा का भाषण एआई 4 से अधिक बोली जाने वाली भाषाओं को पहचानता है

मेटा का भाषण एआई 4 से अधिक बोली जाने वाली भाषाओं को पहचानता है

-

मेटा एक एआई भाषा मॉडल बनाया जो चैटजीपीटी क्लोन नहीं है। कंपनी का मैसिवली मल्टीलिंगुअल स्पीच (MMS) प्रोजेक्ट 4 से अधिक बोली जाने वाली भाषाओं को पहचान सकता है और 000 से अधिक भाषाओं में स्पीच (टेक्स्ट-टू-स्पीच) को पुन: पेश कर सकता है। अपनी अधिकांश सार्वजनिक रूप से घोषित एआई परियोजनाओं की तरह, मेटा आज भाषाई विविधता को बनाए रखने में मदद करने और शोधकर्ताओं को इसे विकसित करने के लिए प्रोत्साहित करने के लिए एमएमएस को खुली पहुंच प्रदान करता है। "आज हम सार्वजनिक रूप से अपने मॉडल और कोड साझा कर रहे हैं ताकि अनुसंधान समुदाय के अन्य सदस्य हमारे काम पर निर्माण कर सकें," कंपनी ने लिखा। "इस काम के लिए धन्यवाद, हम दुनिया की अविश्वसनीय भाषाई विविधता के संरक्षण में एक छोटा सा योगदान करने की उम्मीद करते हैं।"

मेटा

वाक् पहचान और टेक्स्ट-टू-स्पीच मॉडल को आमतौर पर ट्रांसक्रिप्शन लेबल के साथ हजारों घंटे की ऑडियो रिकॉर्डिंग पर प्रशिक्षण की आवश्यकता होती है। लेकिन उन भाषाओं के लिए जो औद्योगिक देशों में व्यापक रूप से बोली नहीं जाती हैं – जिनमें से कई आने वाले दशकों में विलुप्त होने का खतरा है – “यह डेटा बस मौजूद नहीं है,” मेटा कहते हैं।

मेटा ने ऑडियो डेटा संग्रह के लिए एक अपरंपरागत दृष्टिकोण अपनाया: अनुवादित धार्मिक ग्रंथों की ऑडियो रिकॉर्डिंग सुनना। कंपनी ने कहा, "हमने बाइबिल जैसे धार्मिक ग्रंथों की ओर रुख किया, जिनका कई अलग-अलग भाषाओं में अनुवाद किया गया है और जिनके अनुवादों का पाठ-आधारित अनुवाद अनुसंधान के लिए व्यापक रूप से अध्ययन किया गया है।" "इन अनुवादों में विभिन्न भाषाओं में इन ग्रंथों को पढ़ने वाले लोगों की ऑडियो रिकॉर्डिंग सार्वजनिक रूप से उपलब्ध है।" बाइबिल और इसी तरह के ग्रंथों से अचिह्नित प्रविष्टियों को शामिल करके, मेटा शोधकर्ताओं ने मॉडल के लिए उपलब्ध भाषाओं की संख्या को बढ़ाकर 4 से अधिक कर दिया।

"हालांकि ऑडियो रिकॉर्डिंग की सामग्री धार्मिक है, हमारे विश्लेषण से पता चलता है कि यह मॉडल के अधिक धार्मिक भाषण के उत्पादन को प्रभावित नहीं करता है," मेटा लिखता है। "हम मानते हैं कि यह इसलिए है क्योंकि हम एक कनेक्शनवादी अस्थायी वर्गीकरण (सीटीसी) दृष्टिकोण का उपयोग करते हैं, जो बड़े भाषा मॉडल (एलएलएम) या भाषण मान्यता के अनुक्रम मॉडल की तुलना में बहुत अधिक सीमित है।" इसके अलावा, इस तथ्य के बावजूद कि अधिकांश धार्मिक ग्रंथ पुरुषों द्वारा पढ़े जाते थे, इससे पुरुष पूर्वाग्रह नहीं हुआ - प्रणाली महिला और पुरुष दोनों स्वरों को समान रूप से पहचानती थी।

डेटा को अधिक उपयोग करने योग्य बनाने के लिए संरेखण मॉडल को प्रशिक्षित करने के बाद, मेटा ने wav2vec 2.0 का उपयोग किया, कंपनी का "स्व-पर्यवेक्षित भाषा प्रतिनिधित्व शिक्षण" मॉडल जो बिना लेबल वाले डेटा पर सीख सकता है। गैर-पारंपरिक डेटा स्रोतों और स्व-निर्देशित भाषण मॉडल के संयोजन से प्रभावशाली परिणाम प्राप्त हुए। "हमारे नतीजे बताते हैं कि बड़े पैमाने पर बहुभाषी प्रसारण के मॉडल मौजूदा मॉडलों की तुलना में अच्छा प्रदर्शन करते हैं और 10 गुना अधिक भाषाओं को कवर करते हैं।" विशेष रूप से, मेटा ने MMS की तुलना OpenAI के व्हिस्पर से की, और परिणाम अपेक्षाओं से अधिक हो गए। "हमने पाया कि बड़े पैमाने पर बहुभाषी भाषण डेटा पर प्रशिक्षित मॉडल में शब्द त्रुटियों का आधा प्रतिशत है, लेकिन व्यापक बहुभाषी भाषण में 11 गुना अधिक भाषाएं शामिल हैं।"

मेटा ने चेतावनी दी है कि उसके नए मॉडल सही नहीं हैं। "उदाहरण के लिए, कुछ जोखिम है कि भाषण-से-पाठ मॉडल व्यक्तिगत शब्दों या वाक्यांशों का गलत अनुवाद कर सकता है," कंपनी लिखती है। "परिणाम के आधार पर, यह आपत्तिजनक और/या गलत भाषा का कारण बन सकता है। हम मानते हैं कि एआई प्रौद्योगिकियों के जिम्मेदार विकास के लिए एआई समुदाय के भीतर सहयोग महत्वपूर्ण है।

मेटा

अब जबकि मेटा ने ओपन-सोर्स रिसर्च के लिए एमएमएस जारी किया है, यह दुनिया में भाषाओं की संख्या को 100 या उससे कम करने की प्रवृत्ति को उलटने की उम्मीद करता है, जिनमें से अधिकांश प्रमुख तकनीकों द्वारा समर्थित हैं। वह एक ऐसी दुनिया देखती हैं जहां सहायक तकनीक, टीटीएस और यहां तक ​​कि वीआर/एआर तकनीकें हर किसी को अपनी मूल भाषा में बोलने और सीखने की अनुमति देती हैं। इसमें कहा गया है: "हम एक ऐसी दुनिया की कल्पना करते हैं जहां तकनीक का विपरीत प्रभाव पड़ता है, लोगों को अपनी भाषाओं को जीवित रखने के लिए प्रोत्साहित किया जाता है क्योंकि वे अपनी मूल भाषा बोलते समय सूचना तक पहुंच सकते हैं और प्रौद्योगिकी का उपयोग कर सकते हैं।"

यह भी पढ़ें:

स्रोतEngadget
साइन अप करें
के बारे में सूचित करें
अतिथि

0 टिप्पणियाँ
एंबेडेड समीक्षा
सभी टिप्पणियाँ देखें
अपडेट के लिए सब्सक्राइब करें