Un creciente uso de herramientas de generación de código con IA, como Claude Code, está revelando desafíos inesperados en el proceso de revisión de código. Abhishek Ray, de Opslane, ha observado que los equipos están generando un volumen significativamente mayor de código (40-50 PRs semanales), pero la confianza en su corrección es baja. El problema radica en que las pruebas generadas por la IA para verificar el código también son creadas por la misma IA, lo que resulta en una “máquina de autocomplacencia” que no detecta errores fundamentales de comprensión de los requisitos. Ray propone un enfoque inspirado en el Desarrollo Guiado por Pruebas (TDD): definir criterios de aceptación claros antes de escribir el código. Esto implica detallar el comportamiento esperado de la función (ej. cómo se autentica un usuario, qué mensajes de error se muestran). Opslane ha desarrollado un plugin para Claude Code, llamado 'verify', que automatiza este proceso, generando pruebas y verificaciones basadas en estos criterios de aceptación, y permitiendo a los revisores centrarse únicamente en los fallos. Este sistema utiliza Claude Opus y Sonnet para la planificación, ejecución de pruebas y evaluación, ofreciendo una alternativa más efectiva a las revisiones de código tradicionales.
