Un nuevo modelo de inteligencia artificial de Anthropic, llamado Mythos, ha demostrado la capacidad de generar exploits para romper las sandboxes de seguridad que protegen los dispositivos y la infraestructura en línea, lo que representa una amenaza significativa para la ciberseguridad. Mythos, comparable en tamaño a rumores sobre GPT-4.5, puede generar exploits para Firefox's JS shell con una tasa de éxito del 72.4%, un aumento drástico respecto al menos del 1% observado con modelos anteriores. Esta vulnerabilidad pone en riesgo la seguridad de la navegación web, la publicidad en línea y la infraestructura de computación en la nube, donde la virtualización y el sandboxing son fundamentales. Aunque Anthropic está siendo cautelosa con la implementación generalizada de Mythos debido a la necesidad de abordar estos riesgos, la capacidad de generar exploits probablemente se extenderá a modelos más pequeños y accesibles, lo que dificulta contener la amenaza. El incidente subraya la necesidad urgente de fortalecer las defensas de seguridad y reevaluar la dependencia actual en las sandboxes como principal barrera de protección.
