Claude Code, la herramienta de codificación asistida por inteligencia artificial de Anthropic, puede ejecutarse en un entorno completamente local y aislado (air-gapped) sin necesidad de conexión a internet. El artículo describe la configuración necesaria para lograrlo, utilizando un modelo local como Qwen3.6, un modelo de 35.100 millones de parámetros con arquitectura mixture-of-experts (MoE) que activa solo 3000 millones por token, lo que permite su ejecución en hardware de consumo. El runtime empleado es Ollama 0.24.0 con el backend nativo MLX para Apple Silicon, y el cliente es Claude Code v2.1.84 apuntando al punto final local. La clave del éxito reside en cuatro ajustes cruciales que solucionan problemas comunes: desactivar el razonamiento (thinking) del modelo, ya que de lo contrario consume todo el presupuesto de tokens sin realizar llamadas a herramientas; actualizar Ollama a la versión 0.24.0 para que los parámetros de configuración funcionen correctamente; no confiar en los Modelfile para controlar el razonamiento porque el runner MLX ignora la plantilla; e ignorar los errores 404 generados por las sondas de Anthropic en endpoints que Ollama no maneja. Una vez aplicados estos ajustes, el sistema puede investigar incidencias de Kubernetes y generar pull requests completas sin que los datos salgan de la máquina. El rendimiento, sin embargo, está limitado por el hardware: la tasa de prefill (carga del contexto) domina el tiempo de respuesta, ocupando más del 90% del tiempo por turno. En un M3 Pro con 36 GiB, la memoria ocupada por el modelo es de unos 20 GiB, y la ventana de contexto alcanza los 32.000 tokens. El cuello de botella es el ancho de banda de memoria, que en el M3 Pro es de ~150 GB/s. Hardware con mayor ancho de banda, como los chips Apple Silicon Max o Ultra, o generaciones más recientes (M5), mejoran directamente la velocidad. La alternativa más sencilla para acelerar el proceso es usar un modelo más pequeño. El artículo forma parte de una serie y promete abordar comparativas con modelos frontera en entregas posteriores.
Ejecutar Claude Code sin conexión: ajustes y hardware
Fuentes:
06 — Air-Gapped Claude Code
