La idea de encerrar el conocimiento de una organización dentro de complejos sistemas de RAG (recuperación y generación) y bases de datos vectoriales ha quedado obsoleta. Durante años, los equipos dedicados a entrenar agentes de inteligencia artificial dedicaban enormes recursos a fragmentar documentos, generar embeddings y montar almacenes de datos para que un modelo pudiera consultar la información de una empresa. El problema es que, al hacer esto, el conocimiento dejaba de ser un archivo legible para convertirse en algo opaco, bloqueado tras un formato que solo entendía la herramienta que lo había producido.
La alternativa ya existía, aunque de forma informal. Herramientas como Claude Code o Codex trabajan mejor cuando se les proporciona un archivo CLAUDE.md o AGENTS.md con instrucciones claras en texto plano. La comunidad también utiliza bóvedas de Obsidian o archivos DESIGN.md para estructurar la información. Es el patrón del "wiki para LLM": una carpeta de archivos markdown con metadatos básicos en YAML, enlaces cruzados y un esquema claro.
Andrej Karpathy formalizó esta intuición con el patrón "LLM Wiki", que separa los datos crudos, los resúmenes generados por el modelo y las reglas de mantenimiento. La ventaja frente a RAG es enorme: el wiki compila el conocimiento una vez, lo mantiene actualizado y se lo entrega al modelo ya organizado, sin pagar el coste de una nueva búsqueda en cada consulta.
Google Cloud ha recogido este principio en junio con el lanzamiento del Open Knowledge Format (OKF) en su versión 0.1. Se trata de un directorio estructurado de archivos markdown con un esquema de metadatos mínimo (tipo, título, descripción, recurso, etiquetas y fecha) y enlaces estándar que reconstruyen la topología de una base de datos relacional o un grafo, pero sin las herramientas.
