Revisión de código: principal sumidero de tokens en sistemas multiagente de IA

Fuentes: Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering
Imagen generada por IA con el prompt: Abstract editorial illustration of glowing code blocks flowing through a circuit-like pipeline, with a magnifying glass highlighting a review loop, cool blue and teal palette, minimal tech aesthetic
Imagen generada con IA

Un estudio reciente publicado en arXiv, titulado "Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering", cuantifica por primera vez de forma sistemática dónde se consume el presupuesto de cómputo de los sistemas multiagente basados en modelos de lenguaje de gran tamaño (LLM-MA) aplicados al ciclo de vida del desarrollo de software (SDLC). El trabajo responde a una laguna clave: aunque estos sistemas se utilizan cada vez más para automatizar tareas como la ingeniería de requisitos, la generación de código y las pruebas, su eficiencia operativa y su huella de recursos seguían sin caracterizarse, lo que dificultaba predecir costes y dimensionar su adopción.

La metodología se apoya en la traza de ejecución de 30 tareas de desarrollo realizadas con el marco ChatDev, respaldado por un modelo de razonamiento GPT-5. Los autores mapearon las fases internas del sistema a etapas estandarizadas del SDLC —diseño, codificación, completado de código, revisión de código, pruebas y documentación— para construir un marco de evaluación homogéneo y comparable. A continuación, midieron y desglosaron el reparto de tokens de entrada, salida y razonamiento en cada fase.

Los resultados preliminares son claros. La fase iterativa de revisión de código absorbe, de media, el 59,4 % del total de tokens consumidos por tarea, lo que la convierte en el verdadero cuello de botella económico. Además, los tokens de entrada representan de forma sostenida la mayor parte del consumo, con un 53,9 % de media, evidencia empírica de ineficiencias en la comunicación entre agentes que podrían reducirse con protocolos más ligeros.

La conclusión operativa es directa: el coste principal de la ingeniería de software agentiva no reside en la generación inicial de código, sino en los bucles de refinamiento y verificación automatizados. El artículo propone que su metodología puede servir a los equipos para anticipar gastos, ajustar el diseño de prompts y priorizar la optimización de las interacciones de revisión. Como línea futura, los autores apuntan al desarrollo de protocolos de colaboración entre agentes más eficientes en tokens, un paso necesario para que estos sistemas pasen de prototipos puntuales a cadenas de producción económicamente viables.