23 Jun 2026 · Original en inglés · Artículo

HALO: optimizador jerárquico de bucles para agentes de IA auto-mejorables

Fuentes: HALO: Hierarchical Agent Loop Optimizer for self-improving AI agents

HALO es una metodología de código abierto para construir harnesses de agentes que se mejoran a sí mismos de forma recursiva mediante RLMs (Reinforcement Learning Models). El proyecto, desarrollado por context-labs y disponible en GitHub, ofrece una aplicación de escritorio multiplataforma, un paquete Python instalable desde PyPI (halo-engine) y ejemplos de integración con marcos como el SDK de OpenAI Agents.

El flujo principal funciona en cinco pasos: primero se recopilan trazas de ejecución del agente mediante tracing compatible con OpenTelemetry; después se introducen en el motor HALO-RLM, que las descompone para identificar patrones de fallo sistémicos; a continuación, el informe generado se envía a un agente de programación como Cursor o Claude Code para producir y aplicar cambios al harness; finalmente, el harness se redespliega y el ciclo se repite.

Según los autores, los entornos con alto tráfico generan más datos y mayor varianza entre ejecuciones, condiciones en las que HALO resulta especialmente eficaz. Sus creadores argumentan que herramientas de propósito general como Claude Code tienden a sobreajustar errores puntuales de trazas individuales en lugar de generalizar problemas a nivel de harness, lo que motivó el diseño de un RLM especializado.

El motor expone seis funciones de entrada —cuatro asíncronas y dos síncronas— que ofrecen distintos compromisos entre observabilidad y simplicidad. La configuración por defecto emplea el modelo gpt-5.4-mini, con recomendaciones explícitas de usar modelos más pequeños y baratos para síntesis y compactación. HALO admite cualquier proveedor compatible con la API de OpenAI, permite reintentos ante refusals del modelo y opcionalmente emite trazas OpenInference, ya sea a un endpoint OTLP o a un archivo JSONL local.

Temas

ia desarrollo

Etiquetas

ai agents rlm opentelemetry openai agents sdk halo-engine context-labs github python cursor claude code

Entidades mencionadas

PyPI organization

El Python Package Index o PyPI es el repositorio de software oficial para aplicaciones de terceros en el lenguaje de programación Python. Los desarrolladores de Python pretenden que sea un catálogo e

Ver en Wikipedia

Cursor software

Cursor es un entorno de desarrollo integrado impulsado por IA para Windows, macOS y Linux, diseñado para mejorar la productividad de los desarrolladores al integrar funciones avanzadas de inteligencia

Ver en Wikipedia

Claude Code software

Claude Monet fue un pintor francés, uno de los creadores del impresionismo. El término impresionismo deriva del título de su obra Impresión, sol naciente (1872).

OpenTelemetry protocol_standard

HALO software

HALO-RLM software

halo-engine software

OpenInference protocol_standard

OpenAI Agents SDK software

gpt-5.4-mini software

inference.net organization

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Enlaces

inference.net inference.net

here docs.inference.net

HALO Desktop App inference.net

View on PyPI pypi.org