Anthropic presentó el martes Fable, una versión pública y limitada de su modelo de ciberseguridad Mythos, pero la decisión ha generado críticas entre profesionales del sector. Varios investigadores han denunciado en redes sociales que las barreras de seguridad del modelo son excesivas: rechazan solicitudes tan básicas como leer una entrada de blog sobre seguridad informática, revisar código o solicitar una auditoría de ciberseguridad, por considerarlas potencialmente relacionadas con actividades maliciosas.
Valentina "Chompie" Palmiotti, investigadora de IBM X-Force, explicó que Fable bloquea "cualquier solicitud que pueda estar tangencialmente relacionada con la ciberseguridad". Matt Suiche, veterano del sector, afirmó que el sistema opera por palabras clave: "cualquier expresión del campo léxico de 'ciberseguridad' activa las restricciones". Cuando se dispara una barrera, Fable interrumpe la conversación y avisa de que sus medidas de seguridad han detectado un tema sensible, redirigiendo la consulta al modelo Claude Opus 4.8.
Las restricciones buscan evitar que el modelo facilite la creación de malware o el compromiso de sistemas, una preocupación histórica de Anthropic. La compañía limita el acceso a Mythos desde abril mediante el Proyecto Glasswing, que la semana pasada se amplió a cientos de organizaciones en 15 países. Suiche reconoció que la estrategia es comprensible en una fase temprana y que probablemente las barreras se irán ajustando. Además de los filtros internos, Anthropic exige a los profesionales de ciberseguridad solicitar acceso a su Programa de Verificación Cibernética, un esquema similar al Trusted Access for Cyber de OpenAI.
