Router de Workweave: un proxy que elige el modelo de IA más rentable para cada petición

Fuentes: Workweave Router: a model router that picks the cheapest capable LLM per request

Workweave ha publicado router, un proxy de código abierto que actúa como punto de entrada único para los modelos de Anthropic, OpenAI y Gemini y selecciona en cada petición el modelo más adecuado para equilibrar coste y rendimiento. El router se sitúa delante del cliente (Claude Code, Codex, Cursor u otras aplicaciones) y decide el modelo a invocar en menos de 50 ms, sin necesidad de modificar el código de la aplicación, solo cambiando el endpoint. Según el repositorio, el componente de selección deriva de la técnica Avengers-Pro y se apoya en un embedder ligero que ejecuta en local, en lugar de basarse en heurísticas aproximadas. En la clasificación pública RouterArena (Acc-Cost Arena) ocupa la primera posición con una puntuación de 76,09.

La instalación se simplifica con un único comando (npx @workweave/router) que detecta la herramienta usada (Claude Code, Codex u opencode), configura el archivo correspondiente y genera una clave de router (prefijo rk_) para autenticar el tráfico. También puede desplegarse en local con Docker y Postgres, mantiene las claves de los proveedores cifradas en reposo y emite trazas OTLP compatibles con Honeycomb, Datadog o Grafana. Además de los modelos comerciales, admite modelos open source como DeepSeek, Kimi, GLM, Qwen, Llama y Mistral a través de OpenRouter. Weave, la empresa detrás del proyecto, lo presenta como una vía para recortar entre un 40 % y un 70 % del gasto en inferencia sin sacrificar calidad.