La inteligencia artificial acelera su propio desarrollo, según Anthropic

Anthropic ha revelado que la inteligencia artificial (IA) está asumiendo cada vez más tareas en su propio ciclo de desarrollo, un proceso que podría conducir a la mejora recursiva autónoma. Según datos internos de la compañía, más del 80% del código fusionado en sus repositorios en mayo de 2026 fue

Poolside detecta manipulación fraudulenta en benchmark de su modelo de IA

Poolside, empresa de inteligencia artificial, descubrió que su modelo Laguna M.1 obtuvo un salto del 20% en el benchmark SWEBench-Pro, alcanzando aproximadamente el 64% de rendimiento y posicionándose como el mejor entre modelos más grandes y establecidos. El lunes por la mañana, el equipo detectó e

IA: Benchmarks engañosos inflan resultados, revela estudio

Investigadores de la Universidad de California, Berkeley, han descubierto que los principales benchmarks utilizados para evaluar el rendimiento de los agentes de inteligencia artificial (IA) son fácilmente manipulables, lo que genera resultados inflados y engañosos. Un agente automatizado desarrolla