Cómo usar Codex de OpenAI más allá de escribir código

Fuentes: Codex-maxxing - Jason Liu
Cómo usar Codex de OpenAI más allá de escribir código
Imagen generada con IA

Codex-maxxing es un artículo de Jason Liu que explora cómo utilizar Codex, el agente de programación de OpenAI, de manera más allá de la simples escritura de código. El autor describe su transición de usar agentes de IA exclusivamente para tareas de programación a integrarlos en todo su flujo de trabajo de conocimiento. El cambio fundamental que experimentado es dar a su trabajo un «bucle operativo»: un hilo durable con memoria compartida, herramientas que pueden actuar en su computadora, formas de orientar y reanudar tareas, y una superficie donde revisar el resultado. Uno de los conceptos clave es el «compaction» o compactación, que comprime hilos de conversación largos para que puedan continuar sin cargar cada mensaje anterior. Liu mantiene hilos fijados para cada flujo de trabajo importante, como su hilo de Chief of Staff o uno para monitorear Twitter, estos megahilos acumulan historia, preferencias y decisiones anteriores. La entrada de voz resulta fundamental porque permite introducir en Codex la versión sin editar del pensamiento del autor, algo demasiado vago para escribir pero natural de decir. La función de «steering» permite inyectar direcciones adicionales mientras Codex ya está trabajando, sin esperar a que cada paso termine. Sobre la memoria, cuando los hilos duran más tiempo, necesitan memoria compartida fuera de cualquier repositorio individual. Liu guarda sus hilos largos en una bóveda de Obsidian con instrucciones como «a medida que aprendas más sobre personas, haz progreso en proyectos o closes un loop abierto, actualiza las páginas relevantes en la bóveda». También mantiene esta bóveda como un repositorio GitHub para que los diffs se conviertan en una superficie de revisión de memoria. Codex también tiene funciones de memoria nativas en Settings > Personalization > Memories. En cuanto al uso del navegador, el autor distingue entre $browser para superficies web locales, @chrome para estado de navegador conectado y múltiples pestañas, y @computer para trabajo que solo existe como GUI. Los conectores extienden el alcance hacia Slack, Gmail y Calendar. Las skills hacen que los flujos de trabajo repetidos sean reutilizables.