El Instituto de Seguridad de la IA (AISI) ha evaluado las capacidades de ciberseguridad de Anthropic’s Claude Mythos Preview, revelando un avance significativo en comparación con modelos anteriores. La evaluación, anunciada el 7 de abril, demostró que Mythos Preview puede ejecutar ataques multi-etapa en redes vulnerables de forma autónoma, tareas que normalmente requieren días de trabajo para profesionales. En pruebas de 'Capture-the-Flag' (CTF), Mythos Preview logró un éxito del 73% en tareas de nivel experto, superando a otros modelos. Además, fue el primer modelo en completar con éxito 'The Last Ones' (TLO), una simulación de ataque a una red corporativa de 32 pasos, en 3 de 10 intentos. Si bien identificó limitaciones en entornos de tecnología operativa, el AISI espera que el rendimiento mejore con mayor capacidad de cómputo. El informe subraya la necesidad de fortalecer las prácticas básicas de ciberseguridad, como la aplicación regular de actualizaciones y el control de acceso, y anticipa que futuras evaluaciones se centrarán en entornos más defendidos para evaluar con precisión las capacidades de los modelos de IA. El NCSC recomienda el esquema Cyber Essentials para ayudar a las organizaciones a protegerse contra amenazas online.
