सिलिकॉन वैली, कैलिफ़ोर्निया: आर्टिफिशियल इंटेलिजेंस (Artificial Intelligence) की दुनिया में अपना दबदबा मजबूत करते हुए वैश्विक टेक दिग्गज गूगल (Google) ने अपने सालाना डेवलपर्स कॉन्फ्रेंस आई/ओ (Google I/O Conference) में तकनीकी क्रांति का एक नया अध्याय लिख दिया है। कंपनी ने दुनिया के सामने अपनी सबसे आधुनिक और शक्तिशाली एआई तकनीक को पेश करते हुए Gemini 3.5 मॉडल का एक बेहद अनोखा वीडियो क्रिएटर टूल Gemini Omni लॉन्च कर दिया है। गूगल का दावा है कि ये नए टूल्स न केवल इंसानी आदेशों को पलक झपकते ही समझेंगे, बल्कि वीडियो निर्माण और कोडिंग के क्षेत्र में ऐसे कारनामे करेंगे जिनकी कल्पना अब तक असंभव मानी जाती थी।
गूगल ने इस नए एआई परिवार के अंतर्गत सबसे पहले Gemini 3.5 Flash (Gemini 3.5 Flash) को बाजार में उतारा है। सबसे खास बात यह है कि इस मॉडल को दुनिया भर के आम उपयोगकर्ताओं के लिए गूगल जेमिनी ऐप और गूगल सर्च के एआई मोड (AI Mode) में तुरंत लाइव कर दिया गया है। कंपनी के शीर्ष अधिकारियों ने मंच से घोषणा करते हुए बताया कि Gemini 3.5 Flash को इस तरह से तैयार किया गया है कि यह दुनिया के बड़े-बड़े फ्लैगशिप एआई मॉडल्स को बुद्धिमत्ता और तार्किकता के मामले में कड़ी टक्कर देता है, वह भी उस रफ्तार के साथ जिसकी उम्मीद सिर्फ फ्लैश सीरीज से की जा सकती है।
तकनीकी विशेषज्ञों की मानें तो कोडिंग (Coding) और एआई एजेंटिक वर्कफ़्लो (Agentic Workflow) के मामले में यह गूगल का अब तक का सबसे बेहतरीन और मजबूत मॉडल साबित होने वाला है। इसने आंतरिक टेस्टिंग और बेंचमार्क में गूगल के ही पुराने शक्तिशाली मॉडल जेमिनी 3.1 प्रो को भी पछाड़ दिया है। कठिन कोडिंग चुनौतियों को सुलझाने, सॉफ्टवेयर की कमियों को दूर करने और मल्टीमॉडल समझ यानी एक साथ टेक्स्ट, फोटो और आवाज को प्रोसेस करने में Gemini 3.5 Flash सबसे आगे निकल गया है। इसी वजह से कंपनी ने इसे अब अपना डिफॉल्ट एआई मॉडल बना दिया है, यानी अब जब भी कोई यूजर जेमिनी का इस्तेमाल करेगा, तो उसे इसी सुपरफास्ट तकनीक का अनुभव मिलेगा।
इस शानदार लॉन्चिंग के दौरान जिस दूसरी तकनीक ने सबसे ज्यादा सुर्खियां बटोरीं, वह है Gemini Omni (Gemini Omni) मॉडल। यह एक ऐसी जादुई तकनीक है जो किसी भी तरह के इनपुट से सीधे हाई-क्वालिटी वीडियो तैयार कर सकती है। इसका मतलब यह है कि अगर आप इस एआई को कोई तस्वीर, कोई ऑडियो फाइल, पुराना वीडियो या सामान्य लिखित टेक्स्ट देते हैं, तो यह इन सबको आपस में मिलाकर एक बेहतरीन और असली दिलाखने वा वीडियो जनरेट कर देगा। गूगल का कहना है कि यह मॉडल दुनिया की वास्तविक समझ (Real-World Knowledge) पर आधारित है, जिससे इसके द्वारा बनाए गए वीडियो पूरी तरह से प्राकृतिक लगते हैं। इतना ही नहीं, वीडियो बनने के बाद यूजर केवल साधारण बातचीत या चैट के जरिए उसमें मनमुताबिक बदलाव या एडिटिंग भी कर सकते हैं।
इस नए वीडियो मॉडल की सीरीज में सबसे पहले Gemini Omni Flash (Gemini Omni Flash) को पेश किया गया है। यह मॉडल वीडियो के भीतर किसी एक खास चीज को बदलने या फिर पूरे के पूरे बैकग्राउंड को बदलने की अद्भुत क्षमता रखता है। बातचीत के दौरान कई राउंड के सुधारों के बाद भी यह एआई मूल सीन की थीम और निरंतरता को गायब नहीं होने देता। इस मॉडल की सबसे बड़ी खूबी यह है कि इसे गुरुत्वाकर्षण (Gravity), गतिज ऊर्जा (Kinetic Energy) और तरल गतिकी (Fluid Dynamics) जैसे भौतिकी के नियमों की गहरी और प्राकृतिक समझ है। यही वजह है कि इसके द्वारा बनाए गए दृश्यों में पानी का बहना या किसी चीज का गिरना बिल्कुल असली जैसा दिखाई देता है। इसके अलावा, इसकी मदद से यूजर्स अपनी खुद की आवाज और डिजिटल अवतार (Avatars) भी बना सकते हैं, जो बिल्कुल आपकी तरह दिखेंगे और बोलेंगे। सुरक्षा को ध्यान में रखते हुए गूगल ने इसमें 'सिंथ आईडी' (SynthID) नामक डिजिटल वॉटरमार्किंग तकनीक को जोड़ा है, जिससे एआई द्वारा बनाए गए वीडियो की पहचान आसानी से की जा सकेगी।
फिलहाल, Gemini Omni Flash को कंपनी ने अपने प्रीमियम ग्राहकों के लिए उपलब्ध कराया है। गूगल एआई प्लस, प्रो और अल्ट्रा प्लान लेने वाले दुनिया भर के यूजर्स इसका इस्तेमाल जेमिनी ऐप और गूगल फ्लो (Google Flow) प्लेटफॉर्म पर कर सकते हैं। इसके साथ ही, आम जनता और कंटेंट क्रिएटर्स को तोहफा देते हुए कंपनी इसे यूट्यूब शॉट्स (YouTube Shorts) और यूट्यूब क्रिएट (YouTube Create) ऐप पर भी बिल्कुल मुफ्त में रोलआउट कर रही है।
अन्य प्रमुख खबरें
Realme 16टी 5जी: 50MP Sony AI कैमरा के साथ कंटेंट क्रिएटर्स के लिए नया गेम-चेंजर
स्मार्टफोन नहीं, यह तो प्रोफेशनल कैमरा है: sony xperia 1 viii के साथ फिर पलटी बाजी
अब AI करेगा आपकी ट्रिप प्लान! इक्सिगो ने लॉन्च किया स्मार्ट ट्रैवल असिस्टेंट ‘तारा’
गूगल-एप्पल की बड़ी पहल: अब iPhone और Android चैट होगी पूरी तरह सुरक्षित