गूगल की नई एआई तकनीक खराब फोटो को भी बनाए साफ

|

Published: 12 Sep 2021, 07:18 PM IST

यह ठीक वैसा ही है जैसे हम इंस्टाग्राम या वॉट्स ऐप स्टेटस को अपडेट करने से पहले उन्हें एडिट और एन्हांस करते हैं।

साइंस-फिक्शन फिल्मों की तर्ज पर गूगल ने दो नए टूल इंजन लॉन्च किए हैं। जेम्स बांड जैसी जासूसी फिल्मों में hero जिस तरह से किसी धुंधली तस्वीर या कार की नंबर प्लेट को तकनीक की मदद से एन्हांस कर के देखता है, अब आप भी अपनी ब्लर और बेहद खराब क्वालिटी की फोटो को ऐसे ही साफ कर सकेंगे यानी उसकी क्वालिटी को इम्प्रूव कर सकेंगे। गूगल के इस नवीनतम आर्टिफिशियल इंटेलिजेंस आधारित इंजन जिसे डिफ्यूजन मॉडल प्रसार मॉडल के रूप में जाना जाता है, यह सब करने में सक्षम हैं।

यह तकनीक वासतव में एक जटिल प्रक्रिया है क्योंकि खींची गई तस्वीर या वीडियो डिटेल में डिफ्यूजन मॉडल जो कुछ भी नया जोड़ता है वह कैमरे के द्वारा कभी खींचा ही नहीं गया। यह तकनीक दरअसल, आर्टिफिशियल इंटेलिजेंस आधारित इंजन की मदद से कुछ सुपर-स्मार्ट अनुमानों का उपयोग करके तस्वीरों को एन्हांस करने का करमी है। गूगल अपनी इस तकनीक को 'नेचुरल इमेज सिंथेसिस' कहता है जो खबरा से खराब तस्वीर को भी अच्छी क्वालिटी के साथ सुपर-रेजोल्यूशन में पेश करती है। यह बेहद खराब पिक्सल वाली तस्वीर को भी शार्प, क्रिस्टल क्लियर और नेचुरल फोटोग्राफ में तब्दील कर देती है। हालांकि, यह मूल तस्वीर से थोड़ी अलग हो सकती है लेकिन यह उसकी हूबहू कॉपी ही नजर आती है।

गूगल ने हाल ही दो नए एआइ टूल पेश किए हैं। पहला है सुपर रेजोल्यूशन या SR3 जो रिपीटेड रिफउइनमेंट की मदद से किसी फोटो की कमियोंं को दूर करने के लिए जरूरी तत्वों का समावेश करता है और फिर इस प्रक्रिया को उलट देता है। यह ठीक वैसा ही है जैसे आप अपने इंस्टाग्राम या वॉट्स ऐप स्टेटस को अपडेट करने से पहले उन्हें एडिट और एन्हांस करते हैं। गूगल के रिसर्च टीम के वैज्ञानिक जोनाथन हो और सॉफ्टवेयर इंजीनियर चितवन सहरिया बताते हैं कि एसआर३ फोटो के एक विशाल डेटाबेस और गूगल की अन्य मशीन लर्निंग तकनीकों की मदद से एक लो-रेजोल्यूशन फोटो को उसके हाई-रेजोल्यूशन वर्जन में पेश करता है।

वहीं गूगल का दूसरा टूल है, सीडीएमए या कैस्केडेड डिफ्यूजन मॉडल है। चितवन के अनुसार, यह किसी पाइपलाइन की तरह काम करता है, जिसका इस्तेमाल कर एसआर३ समेत अन्य डिफ्यूजन मॉडल्स हाई क्वालिटी इमेज रेजोल्यूशन अपग्रेड करते हैं। गूगल ने इन दोनों टूल्स पर पेपर भी प्रकाशित किए हैं। गूगल के दोनों नए एआई इंजन का परीक्षण इमेजनेट पर किया गया, जो आमतौर पर विजुअल ऑब्जेक्ट रिकग्निशन रिसर्च के लिए उपयोग की जाने वाली प्रशिक्षण छवियों का एक विशाल डेटाबेस है। परीक्षण में दोनों ही टूल ने अपनी ५० फीसदी गणनाएं बिल्कुल सटीक कीं। गूगल का कहना है कि उसके डिफ्यूजन मॉडल्स वैकल्पिक विकल्पों की तुलना में बेहतर परिणाम देते हैं, जिसमें जनरेटिव एडवरसैरियल नेटवर्क (जीएएन) भी शामिल हैं।