Un nuevo protocolo llamado Agent Browser Protocol (ABP) ha sido desarrollado para facilitar la interacción de agentes de inteligencia artificial con la web. El problema que aborda es la incompatibilidad entre la naturaleza asíncrona y continua de la navegación web y la forma en que los agentes de IA, que operan por pasos, procesan la información. ABP reformatea la navegación web en un formato de chat discreto y multimodal, permitiendo que los agentes trabajen de manera más eficiente. El protocolo, construido sobre Chromium, ofrece una respuesta consistente con cada acción (captura de pantalla, registro de eventos, estado de la página) a través de una API HTTP simple, eliminando la necesidad de WebSockets o gestión de sesiones. Las pruebas iniciales en Online Mind2Web muestran una efectividad del 90.53%. ABP introduce una pausa en la ejecución de JavaScript y el tiempo virtual entre acciones, evitando que los agentes 'corran' contra el navegador y permitiendo una observación y decisión más precisa. El objetivo es crear una experiencia de navegación más determinista y controlable para los agentes de IA, donde cada paso es un evento observable y predecible. El código fuente y documentación están disponibles en GitHub.
