31 May 2026 · Original en inglés · Artículo

Agent Governance Toolkit: control de políticas y seguridad para agentes autónomos de IA

Fuentes: AI Agent Governance Toolkit: Policy enforcement, identity, sandboxing, and SRE for autonomous agents

Imagen generada por IA con el prompt: Abstract illustration of an AI agent icon surrounded by multiple security shields, policy document pages, and a transparent audit log chain, in blue and gray tones, clean tech style, no text or recognizable faces. — Imagen generada con IA

Microsoft ha lanzado en vista previa pública el Agent Governance Toolkit (AGT), un conjunto de herramientas open source para gobernar agentes de inteligencia artificial autónomos. El kit aborda tres problemas fundamentales: determinar si una acción está permitida (por ejemplo, que un agente con acceso a enviar correos no pueda borrar tablas), identificar qué agente realizó una acción en sistemas multiagente (donde varios agentes comparten una misma clave API) y generar registros a prueba de manipulaciones para auditorías. AGT no se basa en indicaciones a nivel de modelo ("sigue las reglas"), que son vulnerables a inyecciones de prompt — estudios citados muestran un 100% de éxito en ataques adaptativos contra GPT-4o, GPT-3.5, Claude 3 y Llama-3. En cambio, AGT intercepta cada llamada a herramientas, envío de mensajes y delegación en código de aplicación determinista antes de que la intención del modelo llegue al destino. Las acciones denegadas son estructuralmente imposibles, no simplemente improbables. La instalación es simple: pip install agent-governance-toolkit[full] (requiere Python 3.10+). Se puede gobernar cualquier función con dos líneas de código usando el decorador govern o la API PolicyEvaluator para control programático. También incluye una interfaz de línea de comandos con herramientas como agt doctor, agt verify (comprobación de cumplimiento OWASP) y agt red-team scan (auditoría de inyecciones de prompt). El toolkit se compone de varios paquetes: Agent Mesh (enrutamiento zero-trust), Agent SRE (fiabilidad), Agent Compliance (cumplimiento normativo), entre otros. Soporta múltiples lenguajes (Python, TypeScript, .NET, Rust, Go) y se integra con el protocolo MCP (Model Context Protocol). Los equipos pueden empezar solo con la capa de políticas y registro de auditoría, y añadir más capas según su perfil de riesgo. Este lanzamiento representa un avance concreto en la gobernanza de agentes autónomos, ofreciendo controles deterministas frente a las limitaciones probadas de las defensas a nivel de modelo.

Temas

empresas

Etiquetas

microsoft owasp ai governance policy enforcement zero-trust security open source software sandboxing audit logging prompt injection

Entidades mencionadas

GPT-3.5 software

ICLR 2025 event

OWASP organization

OWASP es un proyecto de código abierto dedicado a determinar y combatir las causas que hacen que el software sea inseguro.

Ver en Wikipedia

Claude 3 software

Llama-3 software

JailbreakBench creative_work

Agent Mesh software

GPT-4o software

Microsoft organization

Microsoft Corporation es una empresa tecnológica multinacional con sede en Redmond (Washington), Estados Unidos. Los productos de software más conocidos de la firma son la línea de sistemas operativos

Ver en Wikipedia

Enlaces

PyPI pypi.org

OWASP LLM01:2025 genai.owasp.org

Andriushchenko et al. (ICLR 2025) arxiv.org

JailbreakBench arxiv.org

Lessons from Red Teaming 100 Generative AI Products www.microsoft.com

microsoft.github.io/agent-governance-toolkit microsoft.github.io