Google व्हिस्क AI ने समझाया: रीमिक्सिंग कैसे काम करती है, उपलब्धता, और यह जेमिनी से कैसे भिन्न है

Google ने अपने नवीनतम AI प्रयोग का अनावरण किया है, धीरेछवियों को बनाने और विज़ुअलाइज़ करने के लिए एक अभूतपूर्व उपकरण जनरेटिव एआई. पारंपरिक एआई टूल के विपरीत, जो विस्तृत पाठ्य संकेतों पर बहुत अधिक निर्भर करते हैं, व्हिस्क उपयोगकर्ताओं को संकेत के रूप में अन्य छवियों का उपयोग करके छवियां बनाने में सक्षम बनाता है. केवल संदर्भ दृश्यों को खींचकर और छोड़कर, उपयोगकर्ता विषयों, दृश्यों और शैलियों को सहजता से मिश्रित कर सकते हैं, जिससे पूरी तरह से नए दृश्य बन सकते हैं।

गूगल व्हिस्क
गूगल व्हिस्क
Social Media Follow Buttons

गूगल व्हिस्क कैसे काम करता है?

व्हिस्क एक उन्नत रीमिक्सिंग टूल के रूप में काम करता है, जो Google की शक्तियों का लाभ उठाता है मिथुन और इमेजन 3 मॉडल पर्दे के पीछे। यहां बताया गया है कि प्रक्रिया कैसे सामने आती है:

  1. इनपुट छवियाँ: उपयोगकर्ता तीन छवियाँ सबमिट करते हैं—एक के लिए विषयके लिए एक और दृश्यऔर के लिए एक तिहाई शैली.
  2. एआई रीमिक्सिंग: Google व्हिस्क इन छवियों का विश्लेषण करता है और एक नया, अद्वितीय आउटपुट उत्पन्न करने के लिए उनकी विशेषताओं को मिश्रित करता है।
  3. मिथुन की भूमिका: गूगल का जेमिनी एआई प्रस्तुत दृश्यों का अनुवाद करता है विस्तृत पाठ संकेत. फिर ये संकेत भेज दिए जाते हैं चित्र 3Google का छवि-पीढ़ी मॉडल, जो अंतिम रचना को जीवंत बनाता है।

व्हिस्क के परिणाम कितने सटीक हैं?

जबकि व्हिस्क प्रभावी ढंग से पकड़ लेता है सार आपके विषय के, परिणाम इनपुट छवियों की सटीक प्रतिकृतियां नहीं हो सकते हैं। Google स्वीकार करता है कि कुछ विशेषताएँ—जैसे ऊंचाई, वजन, केशया और भी त्वचा का रंग-उत्पन्न आउटपुट में थोड़ा अंतर हो सकता है। इसे संबोधित करने के लिए, व्हिस्क उपयोगकर्ताओं को अनुमति देता है AI-जनित संकेतों को संपादित करेंअंतिम छवि पर अधिक नियंत्रण प्रदान करता है।

व्हिस्क गूगल जेमिनी से किस प्रकार भिन्न है?

व्हिस्क और जेमिनी के बीच मुख्य अंतर इनपुट पद्धति में है:

  • गूगल जेमिनी उपयोगकर्ताओं को लिखने की आवश्यकता है विस्तृत, पाठ-आधारित संकेत छवियाँ उत्पन्न करने के लिए. इन संकेतों को तैयार करना कठिन हो सकता है, और परिणाम हमेशा उपयोगकर्ता की कल्पना से मेल नहीं खा सकते हैं।
  • गूगल व्हिस्कदूसरी ओर, का उपयोग करके प्रक्रिया को सरल बनाता है इनपुट के रूप में छवियाँ. दृश्य संदर्भों को मिश्रित करके, व्हिस्क छवियां बनाने के लिए एक अधिक सहज, कुशल तरीका प्रदान करता है – पाठ संकेतों के अनुमान को समाप्त करता है।

यह व्हिस्क को उन उपयोगकर्ताओं के लिए विशेष रूप से उपयोगी बनाता है जिनके मन में स्पष्ट दृश्य संदर्भ है लेकिन उन्हें शब्दों में वर्णित करने में कठिनाई होती है।

उपलब्धता

अभी के लिए, Google व्हिस्क अपने में बना हुआ है प्रायोगिक चरण और विशेष रूप से उपलब्ध है संयुक्त राज्य अमेरिका. जबकि वैश्विक उपयोगकर्ता, जिनमें वे भी शामिल हैं भारतइसकी रिलीज का बेसब्री से इंतजार करते हुए, अमेरिकी उपयोगकर्ता Google के आधिकारिक प्लेटफॉर्म के माध्यम से व्हिस्क को आज़मा सकते हैं।