Sarvam AI libera modelos de lenguaje hechos en India

Fuentes: Open-Sourcing Sarvam 30B and 105B | Sarvam AI

Sarvam AI ha lanzado de forma abierta los modelos de lenguaje Sarvam 30B y Sarvam 105B, diseñados para razonamiento y optimizados para el despliegue eficiente en una amplia gama de hardware, desde GPUs de alto rendimiento hasta dispositivos personales. El entrenamiento se llevó a cabo íntegramente en India, utilizando recursos proporcionados por la misión IndiaAI. Estos modelos, que ya están en producción, impulsan la plataforma de agentes conversacionales Samvaad (30B) y el asistente de IA Indus (105B), destacando por su rendimiento competitivo a nivel mundial, especialmente en tareas de razonamiento, programación y en benchmarks de idiomas indios, superando a modelos mucho más grandes. La arquitectura MoE (Mixture-of-Experts) permite escalar la capacidad sin aumentar el costo computacional. Sarvam AI enfatiza el control total sobre el proceso de desarrollo, desde la curación de datos hasta el despliegue del producto, sentando las bases para el desarrollo de modelos aún más avanzados en el futuro, incluyendo capacidades multimodales y especializadas en codificación. Los modelos están disponibles para descarga y uso a través de diversas plataformas, incluyendo AI Kosh, Hugging Face y una API pública.