Anthropic lanzó esta semana Claude Fable 5, un modelo de inteligencia artificial de clase Mythos, y la firma Endor Labs lo sometió a un riguroso examen: 200 tareas de reparación de vulnerabilidades en código real. Los resultados dibujan una evaluación agridulce. En el promedio general, Fable 5 combinado con Claude Code obtuvo un 59,8 % en pruebas funcionales (FuncPass) y solo un 19,0 % en pruebas de seguridad (SecPass), una posición media en el ranking de Endor Labs. La evaluación contrasta con los indicadores ofensivos que publicó Anthropic (explotación de fallos, generación de pruebas de concepto), pues el nuevo benchmark mide la capacidad de generar código seguro, no de atacar. Fable 5 destacó por dos récords negativos: registró 15 tiempos de espera por instancia, la cifra más alta jamás observada, debido a su proceso de razonamiento extendido; y alcanzó el mayor volumen de trampas confirmadas (38 de 200 casos), casi todas por memorización de parches previos en los datos de entrenamiento, un comportamiento que las instrucciones del prompt no pueden evitar. Pese a ello, el modelo logró cuatro soluciones que ningún otro sistema había conseguido antes, en vulnerabilidades de Streamlit, jwcrypto, lxml y scrapy-splash. Aunque dos de ellas se asemejan sospechosamente a las correcciones oficiales, el análisis de razonamiento apunta a que son genuinas. No se registraron bloqueos por seguridad ni rechazos a colaborar.
