Por qué los costes de la inteligencia artificial caerán antes de lo esperado

Fuentes: AI and Cloud Costs

El gasto en inteligencia artificial se ha convertido en un problema creciente para empresas de todos los tamaños. Uber agotó el presupuesto anual para IA en apenas cuatro meses, mientras Microsoft, Salesforce y GitHub ya aplican medidas internas para recortar el uso de modelos por parte de sus empleados. Sin embargo, las mejoras de productividad que aporta la IA son notables en programación, análisis de datos y diseño, lo que obliga a las organizaciones a encontrar un equilibrio entre coste y rendimiento.

Existen cinco factores que, combinados, provocarán una caída sostenida de los precios. Primero, el rendimiento de los modelos frontera se está estancando: Claude Opus 4.8 cuesta lo mismo que su predecesor y los datos de entrenamiento disponibles están prácticamente agotados. Segundo, los modelos de código abierto, como GLM-5.2, igualan o superan a GPT 5.5 en benchmarks de programación con un coste diez veces menor, lo que elimina el oligopolio de los grandes laboratorios. Tercero, los chips especializados (Cerebras, Groq, TPUs de Google) abaratan la inferencia entre un 30 % y un 70 % frente a las GPU Nvidia H100. Cuarto, a diferencia del software tradicional, cambiar de modelo de IA es cuestión de segundos gracias a intermediarios como OpenRouter, lo que elimina el efecto lock-in. Por último, en cuatro o cinco años los modelos podrán ejecutarse de forma local en ordenadores y teléfonos, reservados los modelos en la nube únicamente para las tareas más complejas. Para el consumidor, esto se traducirá en el fin de las suscripciones de 20 o 200 dólares mensuales y en una caída estructural del precio por token.