Moonshine AI: voz sin nube, toolkit de código abierto

Fuentes: Moonshine AI launches open-source on-device speech recognition toolkit

Moonshine AI ha lanzado Moonshine Voice, un toolkit de código abierto para desarrolladores que buscan crear interfaces de voz en tiempo real. La herramienta, disponible en múltiples plataformas (Python, iOS, Android, macOS, Linux, Windows, Raspberry Pi, IoT y wearables), se distingue por funcionar completamente en el dispositivo, garantizando velocidad, privacidad y eliminando la necesidad de cuentas o API. A diferencia de Whisper, el modelo de OpenAI, Moonshine está optimizado para aplicaciones de streaming en vivo, ofreciendo menor latencia y modelos más pequeños (hasta 26MB) con una precisión comparable o superior en algunos casos. El toolkit soporta varios idiomas, incluyendo español, y ofrece funcionalidades como transcripción, identificación de hablantes y reconocimiento de comandos. Moonshine AI destaca que su investigación se centra en superar las limitaciones de Whisper, como su ventana de entrada fija de 30 segundos y la falta de almacenamiento en caché, mejorando significativamente la experiencia del usuario en aplicaciones de voz interactivas. La comunidad puede unirse al servidor de Discord para obtener soporte y se han proporcionado ejemplos de código y guías de inicio rápido.