pxpipe es un proxy local de código abierto que se interpone entre Claude Code y la API de Anthropic para reducir el consumo de tokens de entrada. Su técnica consiste en transformar las partes voluminosas del prompt —el system prompt, la documentación de herramientas y el historial antiguo— en imágenes PNG compactas antes de que la petición salga del equipo. El ahorro se basa en una asimetría de costes: el número de tokens de una imagen depende de sus dimensiones en píxeles, no del texto que contenga, de modo que contenido denso (código, JSON, volcados de herramientas) empaqueta alrededor de 3,1 caracteres por token de imagen frente a 1 carácter por token de texto. En pruebas reales con tráfico de Claude Code, un system prompt de unas 25 000 tokens en texto pasa a ocupar unos 2 700 tokens como imagen, y la factura total cae entre un 59% y un 70% según los precios de lista de Fable 5.
La herramienta es损失por diseño: funciona como un nivel «gist», no como almacén sin pérdidas. En una prueba de aguja en pajar, cadenas hexadecimales de 12 caracteres dentro de imágenes densas se recuperaron 0 de 15 veces con Opus y 13 de 15 con Fable 5; el modo de fallo es la confabulación silenciosa —un valor plausible pero erróneo— y no un error. Por eso, cualquier dato que deba volver exacto (identificadores, hashes, secretos, números concretos) debe permanecer como texto; los turnos recientes se mantienen en texto y se recomienda enrutar el trabajo con requisitos de recuerdo exacto a subagentes en modelos no imageneables, como Sonnet.
En un piloto de 10 instancias de SWE-bench Lite, ambas variantes resolvieron 10/10 con un coste por instancia de 27 dólares con pxpipe activado frente a 54 dólares desactivado. En SWE-bench Pro, más exigente, se completaron 14/19 con pxpipe y 15/19 sin él, con un ahorro por petición cercano al 60% y 18/19 veredictos coincidentes; la única divergencia se replicó 3/3, lo que apunta a variabilidad agente y no a la compresión. El ahorro real depende del contenido: pxpipe gana con material denso (~1 carácter/token) y pierde con prosa inglesa dispersa (~3,5 caracteres/token), por lo que un filtro interno solo convierte los fragmentos donde el cálculo compensa.
