EE.UU. ordena a Anthropic suspender acceso a Fable 5 y Mythos 5

Fuentes: stratechery.com, US export control directive suspends Fable 5 and Mythos 5 access

El Gobierno de Estados Unidos ha ordenado a Anthropic suspender de forma inmediata todo acceso a sus modelos de inteligencia artificial Fable 5 y Mythos 5, en una decisión que la compañía considera injustificada y que ha generado un fuerte debate sobre los límites de la regulación de los modelos de inteligencia artificial más avanzados. La directiva, recibida por Anthropic a las 5:21 de la tarde, hora del Este, invoca autoridades de seguridad nacional y controles de exportación, y obliga a la empresa a desactivar ambos modelos para todos sus clientes a nivel global, incluidos los empleados extranjeros de la propia compañía.

Según la información publicada por Anthropic en su blog corporativo, la orden gubernamental responde, aparentemente, a la detección de un método para eludir, o "jailbreakear", las barreras de seguridad de Fable 5. Sin embargo, la empresa sostiene que el supuesto hallazgo es mucho menos grave de lo que sugiere la reacción oficial. Anthropic explica que revisó la demostración de esta técnica y constató que solo permitía identificar "un pequeño número de vulnerabilidades menores previamente conocidas". Además, asegura que otros modelos disponibles públicamente son capaces de descubrir esas mismas vulnerabilidades sin necesidad de recurrir a ningún tipo de bypass.

Hasta la fecha, el Gobierno únicamente ha compartido con la empresa evidencia verbal de un posible jailbreak estrecho y no universal, consistente básicamente en pedirle al modelo que lea un código fuente y corrija errores de software. Anthropic revisó el informe y concluyó que ese nivel de capacidad está ampliamente disponible en otros modelos del mercado, incluido GPT-5.5 de OpenAI, y que los propios equipos de defensa lo utilizan a diario para mantener sistemas seguros. La compañía subraya, además, que en ningún caso se le ha comunicado un jailbreak no universal que haya producido un resultado dañino, y que los hallazgos compartidos son respuestas benignas o hallazgos menores que no aportan ninguna ventaja específica frente a Mythos.

La decisión supone un golpe significativo para Anthropic. Fable 5 y Mythos 5 son considerados sus modelos más avanzados: Mythos Preview fue presentado hace apenas dos meses como un modelo demasiado peligroso para ser liberado públicamente, mientras que Fable, una versión de Mythos con medidas de seguridad adicionales, fue lanzado al mercado hace semanas. El analista Ben Thompson, en su newsletter Stratechery, describe a Fable como un modelo "extremadamente impresionante" que, en su experiencia, supera en capacidad subjetiva a competidores como GPT-5.5 u Opus 4.8, y sugiere que podría representar el inicio de una nueva generación de modelos.

La estrategia de seguridad de Anthropic, detallada en su comunicado, se basaba en una estrategia de defensa en profundidad: combinar barreras de seguridad con monitorización activa para detectar y desactivar rápidamente cualquier ataque exitoso. Para ello, la empresa implantó una política de retención de datos de 30 días, una medida que, según reconoce la propia compañía, tiene costes reales con sus clientes, pero que consideraba esencial para investigar y mitigar intentos de jailbreak. Anthropic defiende que sus salvaguardas son "sustancialmente más efectivas" que las de cualquier modelo desplegado anteriormente y que ningún equipo de pruebas ha logrado encontrar un jailbreak universal, es decir, un método capaz de eludir de forma amplia las barreras del modelo.

En su comunicado, la empresa reconoce que acatará la directiva legal del Gobierno, pero manifiesta su desacuerdo con la interpretación realizada. Considera que el hallazgo de un jailbreak estrecho y no universal no debería ser motivo suficiente para retirar un modelo comercial desplegado para cientos de millones de personas. Anthropic advierte de que, si este estándar se aplicara a toda la industria, se detendría esencialmente el lanzamiento de nuevos modelos por parte de todos los proveedores de frontera tecnológica. La compañía defiende que el Gobierno debería tener la capacidad de bloquear despliegues inseguros, pero a través de un proceso legal transparente, justo, claro y basado en hechos técnicos, principios que, a su juicio, esta acción no cumple.

Por el momento, el acceso al resto de modelos de Anthropic no se ha visto afectado. La empresa ha pedido disculpas a sus clientes por las molestias y asegura que está trabajando para restablecer el servicio lo antes posible, al tiempo que ha prometido compartir más detalles técnicos en las próximas 24 horas.