Un usuario detecta un patrón anómalo de 516 tokens de razonamiento en GPT-5.5 dentro de Codex

Fuentes: GPT-5.5 Codex reasoning-token clustering at 516/1034/1552 may be leading to degraded performance on complex tasks

Un informe publicado como issue en el repositorio de OpenAI Codex señala que el modelo GPT-5.5 presenta un agrupamiento inusual de respuestas en exactamente 516 tokens de razonamiento, con picos secundarios en 1034 y 1552. El análisis se basa en 390.195 registros de telemetría de token_count procedentes de 865 sesiones de Codex entre el 1 de febrero y el 27 de junio de 2026.

Los datos muestran que GPT-5.5 representa el 19,3 % del total de respuestas pero concentra el 82 % de los eventos con exactamente 516 tokens de razonamiento. Su ratio de respuestas en 516 frente al total de respuestas con 516 o más tokens alcanza el 44 %, frente al 1,3 % del resto de modelos. La métrica mensual pasó del 0,11 % en febrero al 53,30 % en mayo, mientras la intensidad media de tokens de razonamiento cayó desde 268 en febrero hasta 106,9 en mayo.

El autor del informe no afirma que exista un truncamiento deliberado del chain-of-thought, pero sí considera que los valores fijos 516, 1034 y 1552 parecen umbrales internos y no una distribución natural. Pide al equipo de Codex que investigue si se trata de un tope de presupuesto, un enrutamiento degradado o un comportamiento del programador, y aporta comprobaciones internas de validación sobre los datos de token_count. El issue se relaciona con la incidencia #29353, que documentó una tarea concreta en la que GPT-5.5 con nivel xhigh devolvió una respuesta incorrecta tras detenerse en 516 tokens.