Avataar AI, una de las doce startups seleccionadas por la India AI Mission —iniciativa gubernamental de unos 1.200 millones de dólares que ofrece acceso a GPUs subvencionadas—, ha presentado Varya, un modelo de generación de vídeo optimizado para el contexto cultural indio. La compañía, respaldada por Peak XV y centrada en herramientas de vídeo para comercio electrónico, no construyó Varya desde cero: partió de Wan 2.2, modelo de código abierto de Alibaba, y aplicó destilación para comprimir sus capacidades en una versión más ágil.
El resultado es un modelo que ejecuta la generación en cuatro pasos frente a los 50 de Wan 2.2, produciendo vídeos diez veces más rápido. Sobre una GPU Nvidia H200, Varya genera un clip de cinco segundos en 720p en 45 segundos, frente a los 1.230 segundos de Wan 2.2. Avataar planea cobrar 0,48 rupias (0,005 dólares) por segundo, unas veinte veces menos que Veo, Kling, Luma o Runway, que suelen cobrar 0,10 dólares o más.
Varya fue entrenado con datos seleccionados para reconocer matices culturales como gastronomía, vestimenta, arquitectura y festividades, un ámbito donde los modelos generativos suelen producir resultados estereotipados. El modelo se publicará como open-weight en el portal AIKosh del gobierno indio, junto con sus datos de entrenamiento, y Avataar estudia partenariats con Higgsfield y Adobe Firefly. Rajan Anandan, director general de Peak XV, sostiene que el coste es el principal desbloqueo para que la IA de vídeo llegue a estudiantes, docentes, pymes, creadores y servicios públicos en India.
