07 Jun 2026 · Original en inglés · Artículo

Revisión de código: principal sumidero de tokens en sistemas multiagente de IA

Fuentes: Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering

Imagen generada por IA con el prompt: Abstract editorial illustration of glowing code blocks flowing through a circuit-like pipeline, with a magnifying glass highlighting a review loop, cool blue and teal palette, minimal tech aesthetic — Imagen generada con IA

Un estudio reciente publicado en arXiv, titulado "Tokenomics: Quantifying Where Tokens Are Used in Agentic Software Engineering", cuantifica por primera vez de forma sistemática dónde se consume el presupuesto de cómputo de los sistemas multiagente basados en modelos de lenguaje de gran tamaño (LLM-MA) aplicados al ciclo de vida del desarrollo de software (SDLC). El trabajo responde a una laguna clave: aunque estos sistemas se utilizan cada vez más para automatizar tareas como la ingeniería de requisitos, la generación de código y las pruebas, su eficiencia operativa y su huella de recursos seguían sin caracterizarse, lo que dificultaba predecir costes y dimensionar su adopción.

La metodología se apoya en la traza de ejecución de 30 tareas de desarrollo realizadas con el marco ChatDev, respaldado por un modelo de razonamiento GPT-5. Los autores mapearon las fases internas del sistema a etapas estandarizadas del SDLC —diseño, codificación, completado de código, revisión de código, pruebas y documentación— para construir un marco de evaluación homogéneo y comparable. A continuación, midieron y desglosaron el reparto de tokens de entrada, salida y razonamiento en cada fase.

Los resultados preliminares son claros. La fase iterativa de revisión de código absorbe, de media, el 59,4 % del total de tokens consumidos por tarea, lo que la convierte en el verdadero cuello de botella económico. Además, los tokens de entrada representan de forma sostenida la mayor parte del consumo, con un 53,9 % de media, evidencia empírica de ineficiencias en la comunicación entre agentes que podrían reducirse con protocolos más ligeros.

La conclusión operativa es directa: el coste principal de la ingeniería de software agentiva no reside en la generación inicial de código, sino en los bucles de refinamiento y verificación automatizados. El artículo propone que su metodología puede servir a los equipos para anticipar gastos, ajustar el diseño de prompts y priorizar la optimización de las interacciones de revisión. Como línea futura, los autores apuntan al desarrollo de protocolos de colaboración entre agentes más eficientes en tokens, un paso necesario para que estos sistemas pasen de prototipos puntuales a cadenas de producción económicamente viables.

Temas

ciencia y salud

Etiquetas

arxiv software engineering llm multi-agent systems token consumption chatdev gpt-5 code review sdlc agentic ai

Entidades mencionadas

GPT-5 software

GPT-5 es un modelo de lenguaje de gran tamaño desarrollado y alojado por OpenAI. Es su modelo GPT insignia y con capacidades de agente, y fue lanzado el 7 de agosto de 2025. GPT-5 es accesible a travé

Ver en Wikipedia

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

ChatDev software