16 Feb 2026 · Original en inglés · Resumen IA

Agentes de IA: Caché Oculta Costos Elevados

Fuentes: Expensively Quadratic: the LLM Agent Cost Curve - exe.dev blog

Un nuevo análisis revela costos ocultos y significativos en el uso de agentes de codificación basados en modelos de lenguaje grandes (LLMs). Según un estudio realizado por exe.dev, los costos de lectura de caché (cache reads) crecen de forma cuadrática a medida que la longitud del contexto aumenta, llegando a dominar el costo total de la conversación. En conversaciones extensas, los costos de lectura de caché pueden representar hasta el 87% del gasto total, y alcanzar la mitad del costo de la siguiente llamada a la API ya a partir de 27,500 tokens. Este problema surge porque los LLMs cobran por la lectura de la información almacenada en caché a medida que se construye la conversación. El estudio, basado en el análisis de 250 conversaciones, sugiere que reiniciar conversaciones podría ser una estrategia más rentable que continuar con contextos extensos, y plantea interrogantes sobre la gestión de costos, el manejo del contexto y la optimización de agentes. El equipo de exe.dev está investigando soluciones, incluyendo el uso de subagentes y herramientas para iterar fuera de la ventana de contexto principal, y explorando enfoques como los modelos de lenguaje recursivos para abordar estos desafíos.

Temas

Etiquetas

llms agentes de codificación exe.dev cache reads inteligencia artificial costos optimización modelos de lenguaje contexto shelley

Entidades mencionadas

Bitcoin financial_instrument

LLM software

USB-C protocol_standard

Go software

Linux software

GNU/Linux es una familia de sistemas operativos tipo Unix compuesto por software libre y de código abierto. GNU/Linux surge de las contribuciones de varios proyectos de software, entre los cuales dest

Ver en Wikipedia

Wi-Fi 7 protocol_standard

MWC event

CES event

The Matrix creative_work

exe.dev organization

Start VMs with persistent disks in seconds. The disk persists. You have sudo.

Opus 4.5 software

Recursive Language Models creative_work

Sketch organization

Un sketch es una escena, generalmente humorística, que dura entre uno y cinco minutos aproximadamente. En ella participan actores o comediantes y puede ser montada en un teatro o difundida por televis

Ver en Wikipedia

Shelley person

Shelley Alexis Duvall, conocida como Shelley Duvall, fue una actriz estadounidense. Sus galardones incluyen un premio del Festival de Cannes a la mejor actriz, un premio Peabody, dos nominaciones al p

Ver en Wikipedia

iPhone hardware

iPhone es una línea de teléfonos inteligentes de alta gama diseñada y comercializada por Apple Inc. Ejecuta el sistema operativo móvil iOS, conocido hasta mediados de 2010 como "iPhone OS".

Ver en Wikipedia

HTTP/3 protocol_standard

El País organization

El País es un periódico español fundado en 1976. Se redacta y publica en español, y algunos contenidos en catalán, inglés y portugués. Tiene su sede social y redacción central en Madrid, y cuenta con

Ver en Wikipedia

OAuth protocol_standard

user group_movement

AI Act regulation

DMCA regulation

La Ley de Derechos de Autor de la Era Digital es una ley federal que regula los derechos de autor de Estados Unidos que implementa dos tratados del año 1996 de la OMPI.

Ver en Wikipedia

S&P 500 financial_instrument

Baldur's Gate 3 creative_work

Anthropic organization

Anthropic es una empresa emergente estadounidense de investigación y desarrollo de inteligencia artificial (IA) fundada por exmiembros de OpenAI.

Ver en Wikipedia

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia

The Verge organization

The Verge es un sitio web de noticias de tecnología estadounidense con oficinas en Manhattan, Nueva York y operado por Vox Media. La red divulga noticias, reseñas de productos y podcasts.

Ver en Wikipedia

Kubernetes software

Kubernetes es una plataforma de código abierto para la orquestación de contenedores. Permite desplegar y automatizar la gestión de sistemas distribuidos de manera que sean capaces de escalar y auto-re

Ver en Wikipedia

NVIDIA H100 hardware

Rust software

ChatGPT software

ChatGPT es una aplicación de chatbot de inteligencia artificial generativa desarrollada en 2022, por OpenAI. El chatbot es un modelo de lenguaje especializado en el diálogo que se ajusta con técnicas

Ver en Wikipedia

Gen Z group_movement

GDPR regulation

El Reglamento General de Protección de Datos (RGPD) o Reglamento (UE) 2016/679, es una ley comunitaria relativa a la protección de las personas físicas en lo que respecta al tratamiento de sus datos p

Ver en Wikipedia

WWDC event

La Conferencia Mundial de Desarrolladores de Apple es una conferencia que se celebra anualmente desde el año 1983 en California, Estados Unidos por Apple Inc. En estas conferencias suele mostrar su nu

Ver en Wikipedia