¿Basta con grep? Un estudio compara estrategias de búsqueda en agentes de LLM

Fuentes: Is Grep All You Need? How Agent Harnesses Reshape Agentic Search
Imagen generada por IA con el prompt: Editorial illustration of a terminal window with glowing code, a magnifying glass over a text corpus, and a stylized robot agent analyzing documents on a dark blue background.
Imagen generada con IA

Un estudio empírico reciente, publicado en arXiv, examina de forma sistemática cómo la elección de la estrategia de recuperación de información interactúa con la arquitectura del agente y el paradigma de invocación de herramientas en sistemas de búsqueda agentic basados en modelos de lenguaje de gran tamaño. El trabajo aborda una laguna en la literatura: aunque la generación aumentada por recuperación (RAG) se ha generalizado, faltan comparaciones rigurosas que consideren dimensiones prácticas como el modo en que los resultados de las herramientas se presentan al modelo o el efecto del texto circundante irrelevante.

La investigación se organiza en dos experimentos. El primero compara la recuperación basada en grep con la recuperación vectorial sobre una muestra de 116 preguntas de LongMemEval, utilizando un agente personalizado llamado Chronos y tres harnesses de interfaz de línea de comandos de proveedores comerciales: Claude Code, Codex y Gemini CLI. Se evalúan tanto resultados de herramientas en línea como resultados basados en archivos que el modelo lee por separado. El segundo experimento enfrenta grep y vectores en aislamiento, pero introduce progresivamente historial de conversación no relacionado para aumentar el ruido en torno a los pasajes relevantes.

En el primer experimento, grep ofreció de forma general mayor precisión que la búsqueda vectorial tanto en Chronos como en los CLIs de los proveedores. No obstante, los autores subrayan que las puntuaciones globales dependen fuertemente del harness empleado y del estilo de invocación de herramientas, incluso cuando los datos de la conversación son idénticos. El trabajo destaca que la decisión sobre el motor de recuperación no puede desligarse del diseño del agente que lo envuelve.