Anthropic ha restringido el acceso a su nuevo modelo de lenguaje, Claude Mythos, a un grupo selecto de investigadores de seguridad a través del proyecto Glasswing. La decisión se tomó debido a las excepcionales capacidades de Mythos en ciberseguridad, que ya han revelado miles de vulnerabilidades de alta gravedad en sistemas operativos y navegadores web importantes. El modelo supera significativamente a su predecesor, Claude Opus 4.6, en la capacidad de desarrollar exploits complejos, como la creación de exploits para navegadores web que encadenan múltiples vulnerabilidades.
Anthropic, junto con socios como AWS, Apple, Microsoft, Google y la Linux Foundation, están invirtiendo en este proyecto, que incluye 100 millones de dólares en créditos de uso y 4 millones de dólares en donaciones a organizaciones de seguridad de código abierto. El objetivo es que los investigadores identifiquen y solucionen vulnerabilidades antes de que el modelo se generalice, evitando así su uso indebido. La compañía no planea una liberación general de Mythos Preview, pero busca desarrollar salvaguardias para permitir el despliegue seguro de modelos similares en el futuro. El desarrollo de Claude Mythos ha provocado una aceleración en la identificación de vulnerabilidades en software, incluso en código con décadas de antigüedad, lo que sugiere una posible reevaluación de las estrategias de seguridad en la industria.
