Google जूमिंग और फोटो एन्हांसमेंट को एक वास्तविकता बनाता है

आपने शायद फंतासी फिल्में या टीवी शो देखे हैं जहां मुख्य पात्र छवि को बड़ा करने और परिणाम में सुधार करने के लिए कहता है - एक चेहरा, या लाइसेंस प्लेट, या कोई अन्य महत्वपूर्ण विवरण दिखाने के लिए। तथाकथित . पर आधारित Google की नवीनतम कृत्रिम बुद्धिमत्ता (AI) प्रणाली प्रसार मॉडल, इस चाल को करने में सक्षम हैं।

यह मास्टर करने के लिए एक मुश्किल प्रक्रिया है क्योंकि यह अनिवार्य रूप से उस छवि में विवरण जोड़ रहा है जिसे कैमरे ने मूल रूप से कैप्चर नहीं किया था, अन्य समान छवियों के आधार पर सुपर-स्मार्ट अनुमानों का उपयोग करके।

गूगल

Google में, इस तकनीक को प्राकृतिक छवि संश्लेषण कहा जाता है, और इस विशेष परिदृश्य में, अति-उच्च छवि रिज़ॉल्यूशन। आप एक छोटी, पिक्सलेटेड तस्वीर से शुरू करते हैं और कुछ तेज, स्पष्ट और प्राकृतिक के साथ समाप्त होते हैं। यह बिल्कुल मूल नहीं हो सकता है, लेकिन यह मानव आंखों के लिए वास्तविक दिखने के लिए काफी करीब है।

Google ने इस काम के लिए दो नए AI टूल पेश किए हैं। पहले को SR3, या दोहराए गए शोधन के माध्यम से सुपर-रिज़ॉल्यूशन कहा जाता है, और यह एक छवि में शोर जोड़कर और फिर इसे हटाकर काम करता है। छवियों के एक बड़े डेटाबेस और कुछ मशीन लर्निंग जादू के आधार पर संभाव्य गणनाओं की एक श्रृंखला के माध्यम से, SR3 कल्पना कर सकता है कि कम-रिज़ॉल्यूशन पिक्सेल छवि का सुपर-हाई-रिज़ॉल्यूशन संस्करण कैसा दिखता है।

दूसरा उपकरण सीडीएम, या कैस्केड डिफ्यूजन मॉडल है। Google इन्हें "पाइपलाइन" के रूप में वर्णित करता है जिसके साथ-साथ प्रसार मॉडल - SR3 सहित - को उच्च-गुणवत्ता वाली छवि अपसंस्कृति के लिए निर्देशित किया जा सकता है। यह सुधार मॉडल लेता है और उन्हें बड़ी छवियों में बनाता है।

गूगल

Google के अनुसार, अलग-अलग रिज़ॉल्यूशन पर अलग-अलग एन्हांसमेंट मॉडल का उपयोग करके, सीडीएम दृष्टिकोण वैकल्पिक छवि अपसंस्कृति विधियों को बेहतर बनाने में सक्षम है। नए एआई इंजन का परीक्षण इमेजनेट पर किया गया था, जो आमतौर पर विज़ुअल ऑब्जेक्ट रिकग्निशन में अनुसंधान के लिए उपयोग की जाने वाली प्रशिक्षण छवियों का एक विशाल डेटाबेस है।

SR3 और CDM के अंतिम परिणाम प्रभावशाली हैं। 50 मानव स्वयंसेवकों के साथ एक मानक परीक्षण में, SR3 द्वारा उत्पन्न मानव चेहरों की छवियों को वास्तविक तस्वीरों के लिए लगभग 50% समय गलत समझा गया था - और यह देखते हुए कि एक आदर्श एल्गोरिथ्म को 50% प्राप्त करना चाहिए, यह प्रभावशाली है। यह दोहराने योग्य है कि ये बढ़ी हुई छवियां मूल के सटीक मिलान नहीं हैं, वे संभाव्यता के गणित के आधार पर सावधानीपूर्वक गणना किए गए सिमुलेशन हैं।

गूगल

Google अपने नए AI इंजन और संबंधित तकनीकों से बहुत अधिक वादा करता है - न केवल चेहरों और अन्य प्राकृतिक वस्तुओं की छवियों को बढ़ाने के मामले में, बल्कि संभाव्य मॉडलिंग के अन्य क्षेत्रों में भी।

यह भी पढ़ें:

स्रोतकटिस्नायुशूल

साइन अप करें

0 टिप्पणियाँ

एंबेडेड समीक्षा

सभी टिप्पणियाँ देखें

अन्य लेख

फिल्मों की तरह: Google का नया फोटो प्रोसेसिंग AI स्केलिंग और उन्हें एक वास्तविकता बनाता है

हाल की टिप्पणियाँ