Automatizar el sello de goma: un agente de IA en la puerta de despliegue a producción

Fuentes: Automating the Rubber Stamp: What If an Agent Ran Your Deployment Gate?

Matthew van Bird describe un problema habitual en ingeniería de software: la revisión humana previa al paso a producción se ha convertido en un trámite sin valor real. Tras revisar los registros de un mes en su equipo, constató 31 aprobaciones de producción, cero rechazos y una mediana de 47 segundos entre la solicitud de revisión y la aprobación, incluyendo validaciones firmadas desde un aparcamiento de Tesco, un tren y un vestuario de piscina. La puerta existe por motivos de auditoría, pero ya nadie la ejerce de verdad.

La propuesta es sustituir ese paso por un agente automatizado que ejecute la lista de comprobaciones que la revisión debía cubrir: resultado de los tests end-to-end sobre el build exacto, tasa de errores en staging frente a la línea base, incidencias Sev1 abiertas, ventanas de cambio congelado y presencia de personal de guardia. Cada comprobación se alimenta desde la API de GitHub, CloudWatch, PagerDuty y un calendario en YAML. El autor plantea implementar la lógica como regla de protección de despliegue personalizada en GitHub Actions, respaldada por una GitHub App y ejecutada sobre Amazon Bedrock AgentCore Runtime, con Claude como modelo, Strands como SDK y herramientas expuestas vía Gateway y Identity.

El artículo también advierte del riesgo central: un modelo que apruebe un despliegue con una justificación plausible pero fabricada —por ejemplo, atribuir una subida de errores a una prueba de carga inexistente— es más peligroso que un humano que escribe "lgtm" sin mirar. La recomendación es diseñar el sistema de modo que el agente solo aplique reglas explícitas y deje las decisiones de juicio fuera de su alcance.