El fin del tokenmaxxing y su renacimiento bajo la economía de la corrección acumulativa

Fuentes: Tokenmaxxing is dead, long live tokenmaxxing

El artículo analiza el ciclo del llamado "tokenmaxxing", la estrategia de grandes tecnológicas como Meta que vincularon el gasto en tokens de IA al desempeño de sus empleados. Bajo la presión interna, muchos trabajadores recurrían a usos inútiles —como mantener dos agentes conversando durante horas— solo para inflar sus métricas. La autora sostiene que esas directivas, aunque burdas, sirvieron para vencer la resistencia interna al uso de IA en programación.

Con OpenAI y Anthropic preparando su salida a bolsa, los subsidios a tokens se están reduciendo y los planes ilimitados se retiran: ahí muere el primer tokenmaxxing. Sin embargo, el texto argumenta que entra una nueva era dominada por la "corrección acumulativa": gastar más tokens ya no degrada el resultado, sino que lo mejora, porque los modelos actuales pueden operar durante períodos largos sin que los errores se propaguen de forma destructiva.

Esa dinámica ya se observa en ciberseguridad. Anthropic lanzó en versión restringida el modelo Mythos, capaz de encontrar exploits; el instituto AISI presupuestó 100 millones de tokens por intento, unos 12.500 dólares, sin signos de rendimientos decrecientes. Proteger un sistema pasa a depender de gastar más en defensa que el atacante en ofensiva: una economía parecida al proof of work de las criptomonedas, donde gana quien más cómputo paga. La autora concluye que el tokenmaxxing resurge, ahora impulsado por incentivos de calidad y seguridad.