Microsoft ha lanzado en vista previa pública el Agent Governance Toolkit (AGT), un conjunto de herramientas open source para gobernar agentes de inteligencia artificial autónomos. El kit aborda tres problemas fundamentales: determinar si una acción está permitida (por ejemplo, que un agente con acceso a enviar correos no pueda borrar tablas), identificar qué agente realizó una acción en sistemas multiagente (donde varios agentes comparten una misma clave API) y generar registros a prueba de manipulaciones para auditorías. AGT no se basa en indicaciones a nivel de modelo ("sigue las reglas"), que son vulnerables a inyecciones de prompt — estudios citados muestran un 100% de éxito en ataques adaptativos contra GPT-4o, GPT-3.5, Claude 3 y Llama-3. En cambio, AGT intercepta cada llamada a herramientas, envío de mensajes y delegación en código de aplicación determinista antes de que la intención del modelo llegue al destino. Las acciones denegadas son estructuralmente imposibles, no simplemente improbables. La instalación es simple: pip install agent-governance-toolkit[full] (requiere Python 3.10+). Se puede gobernar cualquier función con dos líneas de código usando el decorador govern o la API PolicyEvaluator para control programático. También incluye una interfaz de línea de comandos con herramientas como agt doctor, agt verify (comprobación de cumplimiento OWASP) y agt red-team scan (auditoría de inyecciones de prompt). El toolkit se compone de varios paquetes: Agent Mesh (enrutamiento zero-trust), Agent SRE (fiabilidad), Agent Compliance (cumplimiento normativo), entre otros. Soporta múltiples lenguajes (Python, TypeScript, .NET, Rust, Go) y se integra con el protocolo MCP (Model Context Protocol). Los equipos pueden empezar solo con la capa de políticas y registro de auditoría, y añadir más capas según su perfil de riesgo. Este lanzamiento representa un avance concreto en la gobernanza de agentes autónomos, ofreciendo controles deterministas frente a las limitaciones probadas de las defensas a nivel de modelo.
Agent Governance Toolkit: control de políticas y seguridad para agentes autónomos de IA
