Mistral AI ha lanzado Voxtral Transcribe 2, una nueva generación de modelos de conversión de voz a texto, incluyendo Voxtral Mini Transcribe V2 para transcripciones por lotes y Voxtral Realtime para aplicaciones en tiempo real con latencia muy baja (menos de 200ms). Voxtral Realtime se ofrece con pesos abiertos bajo la licencia Apache 2.0, permitiendo su despliegue en entornos de borde para mayor privacidad. La empresa también ha lanzado un audio playground en Mistral Studio para probar la transcripción. Voxtral destaca por su eficiencia, precisión y precio competitivo, superando a modelos como GPT-4o mini Transcribe, Gemini 2.5 Flash y ElevenLabs Scribe v2. Los modelos admiten 13 idiomas y ofrecen características empresariales como diarización de hablantes, sesgo de contexto y marcas de tiempo a nivel de palabra. Mistral AI busca personal para su equipo de IA de voz.
