12 Jun 2026 · Original en inglés · Artículo

Erm: una herramienta de línea de comandos para eliminar muletillas del habla

Fuentes: erm: A Local CLI That Strips Ums, Uhs, and Erms From Speech

Erm es una herramienta de línea de comandos de código abierto diseñada para eliminar disfluencias como “um”, “uh” y “er” de archivos de audio de voz. Desarrollada por Doug Calobrisi y disponible en GitHub, se ejecuta completamente en local, lo que garantiza la privacidad de las grabaciones. La interfaz es simple: el comando uvx erm input.wav produce un archivo de audio limpio y una lista de cortes en JSON. A diferencia de enfoques ingenuos que solo producen recortes burdos con clics y saltos de ruido de fondo, Erm enfrenta tres problemas técnicos: las omisiones de Whisper (modelo de transcripción), los cortes que generan chasquidos y las diferencias en el ruido ambiental entre fragmentos. Para ello, utiliza el modelo faster-whisper para transcripción con marcas de tiempo, y realiza cuatro pasadas de detección: una basada en palabras conocidas (um, uh, etc.) y tres análisis directos del audio para detectar pausas rellenas, muletillas incrustadas en palabras vecinas y segmentos excesivamente largos. Los puntos de corte se refinan deslizándolos hasta zonas de silencio y alineándolos con cruces por cero de la onda, evitando clics. Luego se aplica un crossfade adaptativo que varía según la duración del corte, y se inserta un bucle de ruido ambiente original para uniformar el fondo. Además, Erm incluye un sistema de desnoisado híbrido (detección en audio original, cortes en versión desruidizada). También ofrece un subcomando de validación que verifica la integridad del archivo, la duración y la ausencia de muletillas en la nueva transcripción. Esta herramienta es especialmente útil para podcasters, editores de video, investigadores de voz y cualquier persona que necesite limpiar grabaciones de manera eficiente sin enviar datos a servidores externos.

Etiquetas

open source software audio processing speech recognition command line tool whisper faster-whisper pipeline tool disfluency removal

Entidades mencionadas

erm software

Doug Calobrisi person

“Doug is a rare breed that falls in the intersection of technology and business, and this makes him extremely valuable to any enterprise. He is strategic and business driven but is also capable of exe

Whisper software

faster-whisper software

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

FFmpeg software

Enlaces

erm github.com

Whisper github.com

faster-whisper github.com

uv github.com