24 Feb 2026 · Original en inglés · Resumen IA

Moonshine AI: voz sin nube, toolkit de código abierto

Fuentes: Moonshine AI launches open-source on-device speech recognition toolkit

Moonshine AI ha lanzado Moonshine Voice, un toolkit de código abierto para desarrolladores que buscan crear interfaces de voz en tiempo real. La herramienta, disponible en múltiples plataformas (Python, iOS, Android, macOS, Linux, Windows, Raspberry Pi, IoT y wearables), se distingue por funcionar completamente en el dispositivo, garantizando velocidad, privacidad y eliminando la necesidad de cuentas o API. A diferencia de Whisper, el modelo de OpenAI, Moonshine está optimizado para aplicaciones de streaming en vivo, ofreciendo menor latencia y modelos más pequeños (hasta 26MB) con una precisión comparable o superior en algunos casos. El toolkit soporta varios idiomas, incluyendo español, y ofrece funcionalidades como transcripción, identificación de hablantes y reconocimiento de comandos. Moonshine AI destaca que su investigación se centra en superar las limitaciones de Whisper, como su ventana de entrada fija de 30 segundos y la falta de almacenamiento en caché, mejorando significativamente la experiencia del usuario en aplicaciones de voz interactivas. La comunidad puede unirse al servidor de Discord para obtener soporte y se han proporcionado ejemplos de código y guías de inicio rápido.

Temas

desarrollo

Etiquetas

moonshine ai voice interfaces open source whisper speech recognition raspberry pi python ios android

Entidades mencionadas

Spanish location

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Linux software

GNU/Linux es una familia de sistemas operativos tipo Unix compuesto por software libre y de código abierto. GNU/Linux surge de las contribuciones de varios proyectos de software, entre los cuales dest

Ver en Wikipedia

Windows software

iOS software

Xcode software

Visual Studio software

YouTube organization

YouTube es una red social y plataforma de video online de Estados Unidos propiedad de Google. YouTube fue fundada el 14 de febrero de 2005 por Steve Chen, Chad Hurley y Jawed Karim, tres antiguos empl

Ver en Wikipedia

English location

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

Android Studio software

Discord organization

Discord es un servicio de mensajería instantánea y chat de voz VolP. En esta plataforma, los usuarios tienen la capacidad de comunicarse por llamadas de voz, videollamadas, mensajes de texto, o con ar

Ver en Wikipedia

Android software

Android es un sistema operativo móvil basado en el núcleo Linux y otros componentes software de código abierto. Está diseñado para dispositivos móviles con pantalla táctil, como teléfonos inteligentes

Ver en Wikipedia

macOS software

macOS es una serie de sistemas operativos gráficos desarrollados y comercializados por Apple desde 2001. Es el sistema operativo principal para la familia de computadoras Macintosh de Apple. Dentro de

Ver en Wikipedia

Ukrainian location

Vietnamese location

Moonshine organization

Moonshine fue el nombre dado al whisky destilado ilegalmente. En realidad, el moonshine no es más que un tipo particular de whisky estadounidense. Es un alcohol destilado a menudo de unos 95°. El térm

Ver en Wikipedia

Whisper Large V3 software

Raspberry Pis hardware

Mandarin location

Japanese location

Korean location

Arabic location

Apple organization

Apple, Inc. es una empresa tecnológica multinacional con sede en Cupertino, California, Estados Unidos. Es la empresa de tecnologías de la información y la comunicación más grande del mundo por ingres

Ver en Wikipedia

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia