Avataar AI ने 'वार्या' नावाचे Video Generation AI एक नवीन व्हिडिओ निर्मिती एआय मॉडेल सादर केले आहे. कंपनीचा दावा आहे की, हे मॉडेल भारतीय संदर्भ अधिक चांगल्या प्रकारे समजून घेते आणि अधिक वेगाने व कमी खर्चात व्हिडिओ तयार करू शकते.
Photo Credit: AI Generated
Avataar AI का Varya मॉडल भारतीय संदर्भ के लिए तैयार किया गया है
भारत आर्टिफिशियल इंटेलिजेंस (AI) क्षेत्रात वेगाने आपली उपस्थिती मजबूत करत आहे आणि आता देशातील एका स्टार्टअपने नवीन व्हिडिओ जनरेशन AI मॉडेल लॉन्च केले आहे. Avataar AI ने Varya नावाचे AI मॉडेल सादर केले आहे, जे खास भारतीय संदर्भ अधिक चांगल्या प्रकारे समजून घेण्यासाठी तयार करण्यात आले आहे. कंपनीचा दावा आहे की हे मॉडेल व्हिडिओ तयार करण्याची प्रक्रिया अधिक वेगवान, स्वस्त आणि भारतीय वापरकर्त्यांसाठी अधिक उपयुक्त बनवू शकते.
Avataar AI ही भारत सरकारच्या India AI Mission अंतर्गत निवडलेल्या 12 स्टार्टअप्सपैकी एक आहे. कंपनीने सांगितले की Varya हे Alibaba ने सादर केलेल्या ओपन-सोर्स व्हिडिओ जनरेशन मॉडेल Wan 2.2 वर आधारित आहे. मात्र, Avataar AI ने ते आपल्या गरजेनुसार अधिक हलके आणि वेगवान बनवले आहे. कंपनीच्या म्हणण्यानुसार यासाठी Model Distillation तंत्रज्ञानाचा वापर करण्यात आला असून, त्यामुळे संगणकीय गरजा कमी करताना मॉडेलच्या बहुतांश क्षमता कायम ठेवण्यात आल्या आहेत.
कंपनीचा दावा आहे की या ऑप्टिमायझेशनमुळे Varya अतिशय वेगाने व्हिडिओ तयार करू शकते. जिथे Wan 2.2 ला व्हिडिओ तयार करण्यासाठी 50 स्टेप्सची आवश्यकता असते, तिथे Varya हे काम केवळ 4 स्टेप्समध्ये पूर्ण करू शकते. Avataar AI च्या मते, यामुळे व्हिडिओ जनरेशनचा वेग 10 पट वाढतो आणि खर्चही मोठ्या प्रमाणात कमी होतो.
कंपनीने उदाहरण देत सांगितले की NVIDIA H200 GPU वर Varya सुमारे 45 सेकंदांत 720p रिझोल्यूशनचा 5 सेकंदांचा व्हिडिओ तयार करू शकते. तर Wan 2.2 ला याच कामासाठी सुमारे 1,230 सेकंद लागू शकतात. Avataar AI चा आणखी एक दावा आहे की Varya सुमारे 48 पैशे प्रति सेकंद या खर्चात व्हिडिओ तयार करू शकते, त्यामुळे ते अनेक जागतिक व्हिडिओ AI मॉडेल्सच्या तुलनेत अधिक किफायतशीर ठरते.
Avataar AI च्या मते, Varya ची सर्वात मोठी खासियत म्हणजे भारताविषयी संदर्भ समजून घेण्याची क्षमता. कंपनीने हे मॉडेल खास तयार केलेल्या डेटासेट्सवर प्रशिक्षित केले आहे, ज्यामुळे ते भारतीय सण-उत्सव, पारंपरिक पोशाख, स्थानिक खाद्यसंस्कृती आणि वास्तुकलेशी संबंधित बारकावे अधिक चांगल्या प्रकारे ओळखू शकते. कंपनीचे मत आहे की त्यामुळे AI द्वारे तयार केलेले व्हिडिओ अधिक नैसर्गिक आणि भारतीय वातावरणाशी सुसंगत दिसतील.
या मॉडेलचा वापरही अतिशय सोपा ठेवण्यात आला आहे. वापरकर्ते टेक्स्ट प्रॉम्प्ट लिहून किंवा एखादी प्रतिमा अपलोड करून व्हिडिओ तयार करू शकतात. त्यानंतर गरजेनुसार त्याच व्हिडिओला पुढे वाढवण्यासाठी अतिरिक्त क्लिप्सदेखील जनरेट करता येतात.
जाहिरात
जाहिरात