16 Mar 2026 · Original en inglés · Artículo

Control por voz local: la alternativa a Google Assistant

Fuentes: My Journey to a reliable and enjoyable locally hosted voice assistant

Este artículo describe el viaje de un usuario (Crzynik) para crear un asistente de voz local y fiable en su hogar, utilizando Home Assistant. La motivación principal fue la creciente insatisfacción con Google Assistant (debido a su rendimiento decreciente y preocupaciones de privacidad) y el deseo de tener un sistema de control por voz completamente local, sin depender de servicios en la nube.

El sistema se basa en Home Assistant (HA), un sistema de automatización del hogar de código abierto. Crzynik ha reemplazado la integración con Google Home por una solución completamente local, utilizando 'Assist' de Home Assistant, impulsado por 'llama.cpp' (anteriormente 'Ollama') para el procesamiento del lenguaje natural. Esto permite que el asistente de voz comprenda y responda a comandos sin enviar datos a servidores externos.

La configuración es compleja y requiere hardware específico: un servidor Home Assistant (ejecutándose en un UnRaid NAS), un mini-PC Beelink con USB4 y un recinto eGPU USB4 para albergar una GPU potente (como una RTX 3090 o RX 7900XTX). La GPU es crucial para el rendimiento, con modelos más grandes requiriendo más potencia de procesamiento. También se utilizan 'Voice Preview Edition' de Home Assistant y dispositivos Pixel 7a como hubs de voz.

El artículo detalla la importancia de elegir el modelo de lenguaje adecuado. Los modelos más pequeños (4B) son suficientes para tareas básicas, mientras que modelos más grandes (20B-30B) ofrecen mejor comprensión del contexto, manejo de comandos ambiguos y capacidad de realizar llamadas a herramientas (como buscar información meteorológica o realizar búsquedas web). Se proporcionan tablas comparativas de diferentes modelos y GPUs, mostrando el impacto en el tiempo de respuesta.

Crzynik también comparte mejoras implementadas, como la optimización de los prompts para reducir el uso de tokens, la corrección automática de errores de transcripción y la mejora del manejo de solicitudes poco claras. Además, se mencionan integraciones como 'LLM Conversation' y 'LLM Intents' para mejorar la experiencia del usuario y ampliar las funcionalidades de Assist. El artículo concluye enfatizando que el objetivo no es proporcionar una receta exacta, sino compartir las lecciones aprendidas y ofrecer una guía para aquellos que deseen explorar la creación de un asistente de voz local.

Etiquetas

home-assistant llama.cpp ollama voice assistant local hosting gpu automation unraid assist voice preview edition

Entidades mencionadas

RTX 3090 hardware

llama.cpp software

Google Assistant software

Pixel 7a hardware

Ollama software

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

AWS organization

AWStats es una herramienta open source de informes de análisis web, apta para analizar datos de servicios de Internet como un servidor web, streaming, mail y FTP. AWstats analiza los archivos de log d

Ver en Wikipedia

HomeAssistant software

Nest Minis hardware

USB4 protocol_standard

RTX 3050 hardware

UnRaid software

RTX 5060Ti hardware

RX 9060XT hardware

GGML GPT-OSS software

Unsloth Qwen3.5-35B-A3B software

Unsloth Qwen3-VL software

Unsloth Qwen3-30B-A3B-Instruct software

Unsloth GLM 4.7 Flash software

Unsloth Qwen3:4b-Instruct software

Rhasspy Faster Whisper software

Piper software

LLM Conversation software

LLM Intents software