El texto de «Extended Thinking» de Claude Code no es el razonamiento real del modelo

Fuentes: The text in Claude Code’s “Extended Thinking” output is not authentic

Una investigación sobre los registros locales de Claude Code, la herramienta de programación basada en Claude, revela que los bloques de razonamiento que el sistema guarda en disco no contienen el pensamiento real del modelo, sino un resumen cifrado.

Al inspeccionar los logs de sesión, el autor encontró una firma de 600 caracteres sin texto legible. Según la documentación de Anthropic, el razonamiento se cifra y la clave la conserva la empresa, por lo que la máquina del usuario no puede descifrarlo. La API devuelve un resumen del razonamiento, no el razonamiento completo, y acceder a la cadena de pensamiento íntegra requiere un acuerdo enterprise.

El criptógrafo Matt Green analizó en detalle los bloques de firma y confirmó el comportamiento. En la práctica, quien necesite una pista de auditoría del agente no puede obtenerla a partir de los archivos locales: los registros de razonamiento en el equipo del usuario son inaccesibles para él. Es posible registrar entradas, salidas y acciones mediante técnicas de scraping, pero tampoco reflejan la lógica que rigió el comportamiento del agente.

El autor critica la redacción indirecta de la documentación de Anthropic, que podría pasar desapercibida sin una lectura atenta, y la compara con guardar un JPEG como BMP, editarlo y presentarlo como JPEG: la conversión implica pérdida de datos.