Un nuevo agente de codificación de código abierto llamado Dirac ha superado a Google y a sus competidores de código cerrado en las pruebas de rendimiento. Dirac alcanzó una puntuación del 65.2% en el Terminal-Bench-2 leaderboard, superando la línea de base oficial de Google (47.6%) y al agente de código cerrado Junie CLI (64.3%). Desarrollado por Dirac-Run y alojado en GitHub, el agente se distingue por su eficiencia y precisión, reduciendo los costos de la API en un 64.8% en promedio. Dirac utiliza técnicas avanzadas como ediciones ancladas a hash, manipulación de AST y procesamiento por lotes de archivos para optimizar el rendimiento y la precisión. Las evaluaciones, reproducibles públicamente en GitHub, demuestran una precisión del 100% en tareas de refactorización complejas, a un costo significativamente menor que otras soluciones. El proyecto enfatiza la optimización del costo-beneficio y el uso mínimo de indicaciones, buscando mejorar la eficiencia y la capacidad de manejar cambios más amplios en una sola tarea.
