Los modelos más grandes ya no son la solución: el sector de la IA gira hacia la eficiencia

Fuentes: Bigger models are not the way

Los principales laboratorios de inteligencia artificial muestran un escepticismo creciente ante la escalada indefinida de parámetros y datos de entrenamiento, según un análisis publicado este 18 de junio. El artículo señala que el paradigma del «cuanto más grande, mejor» quedó en entredicho cuando el modelo Claude Fable 5 fue restringido por el Gobierno estadounidense tres días después de su lanzamiento, la primera prohibición federal de un sistema de IA por motivos de seguridad nacional.

El texto destaca que GLM-5.2, un modelo de código abierto con 753.000 millones de parámetros (unos 40.000 millones activos), se sitúa a apenas cuatro puntos del GPT-5.5 y nueve del Fable 5 en el índice de inteligencia de Artificial Analysis, a pesar de ser entre 1,5 y 2 veces más pequeño que sus rivales propietarios. Esa cercanía sugiere que la inteligencia bruta se ha estancado.

El autor advierte además de un problema estructural: los modelos enormes alucinan con más frecuencia. DeepSeek V4 Pro (1,6 billones de parámetros) presenta una tasa de alucinación del 94 % en el benchmark AA-Omniscience, frente al 28 % de GLM-5.2, el 36 % de Opus 4.8 y el 86 % de GPT-5.5. En una prueba práctica de código en Python, el modelo de DeepSeek empleó diez veces más tokens de razonamiento y produjo una respuesta incorrecta, mientras que GLM-5.2 detectó la imposibilidad técnica en 12 segundos. El texto concluye que la industria debe diseñar sus modelos en torno a un trilema aún sin resolver: capacidad bruta, calibración de la incertidumbre y eficiencia computacional.