08 Mar 2026 · Original en inglés · Resumen IA

Archivos AGENTS.md: ¿Ayudan o perjudican a la IA?

Fuentes: New Research Reassesses the Value of AGENTS.md Files for AI Coding

Una reciente investigación de la ETH Zurich cuestiona la práctica común de utilizar archivos AGENTS.md para mejorar el rendimiento de los agentes de codificación con IA. Contrariamente a las recomendaciones de la industria, el estudio, publicado en arXiv, concluye que estos archivos, especialmente los generados por modelos de lenguaje grandes (LLM), a menudo perjudican el rendimiento, disminuyendo la tasa de éxito en tareas de codificación y aumentando los costos de inferencia. Los investigadores, quienes desarrollaron el conjunto de datos AGENTbench para evaluar los agentes en tareas de programación Python del mundo real, encontraron que los archivos generados por LLM reducen la tasa de éxito en un 3% y aumentan los costos en más del 20%. Los archivos escritos por humanos mostraron una ligera mejora (4% en la tasa de éxito), pero también incrementaron los costos. El análisis reveló que los agentes tienden a seguir las instrucciones de estos archivos, lo que lleva a pruebas y exploraciones innecesarias. Los autores sugieren que los desarrolladores se enfoquen en la creación de archivos AGENTS.md de alta calidad, ya que los archivos de contexto, en general, pueden ser más útiles para los desarrolladores que para los propios agentes de IA. La investigación destaca una brecha entre las recomendaciones actuales y los resultados observados, e impulsa futuras investigaciones sobre cómo generar guías concisas y relevantes para los agentes de codificación.

Temas

ia desarrollo

Etiquetas

agents.md eth zurich ai coding agents llm agentbench python artificial intelligence software development machine learning open source

Entidades mencionadas

LLM software

SWE-bench software

Qwen Code software

AGENTS.md software

GitHub organization

GitHub es una forja para alojar proyectos utilizando el sistema de control de versiones Git. Se utiliza principalmente para la creación de código fuente de programas de computadora. El software que op

Ver en Wikipedia

Reddit organization

Reddit es un sitio web de marcadores sociales y agregador de noticias donde los usuarios pueden añadir textos, imágenes, videos o enlaces. Los usuarios pueden votar a favor o en contra del contenido,

Ver en Wikipedia

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia

ETH Zurich organization

La Escuela Politécnica Federal de Zúrich es una universidad pública pionera en investigaciones en Europa y en todo el mundo. Su campus está en la ciudad suiza de Zúrich, donde se la conoce simplemente

Ver en Wikipedia

Thibaud Gloaguen person

About me Since May 2025, I am pursuing a Ph.D. at the Secure, Reliable, and Intelligent Systems Lab at ETH Zürich, advised by Prof. Martin Vechev.

Niels Mündler person

About me Since July 2024, I am pursuing a Ph.D. at the Secure, Reliable, and Intelligent Systems Lab at ETH Zürich, advised by Prof. Martin Vechev. My research focuses on enhancing the reliability and

Veselin Raychev person

About me Originally, I am from Sofia, Bulgaria. My research interests include Program Analysis, Algorithms and Machine Learning. I obtained my M.Sc. and B.Sc. from Sofia University, respectively in 20

Humanity Last Exam event

AGENTbench software

Codex GPT-5.2 software

GPT-5.1 mini software

CLAUDE.md software

Mark Müller person

Mark Alexander Milley es un general del ejército de los Estados Unidos y el vigésimo presidente del Estado Mayor Conjunto. Anteriormente se desempeñó como el 39.° jefe de Estado Mayor del Ejército.

Ver en Wikipedia

Martin Vechev person

Martín Recaredo Echegoyen Machicote fue un jurista y político uruguayo perteneciente al Partido Nacional que se desempeñó como presidente del Consejo Nacional de Gobierno entre 1959 y 1960. También f

Ver en Wikipedia

Ycombinator organization

Y Combinator (YC) es una aceleradora de startups estadounidense, fundada en marzo del 2005. Ha sido usada para lanzar más de 2 mil compañías, incluyendo Stripe, Airbnb, Reddit, Cruise Automation, Door

Ver en Wikipedia

Claude 3.5 Sonnet software