Un investigador afirma que la preocupación del Gobierno de Estados Unidos ante el modelo Fable 5 de OpenAI no respondió a un jailbreak, sino a un prompt simple en el que se pedía al sistema que corrigiera código. La versión oficial, difundida en círculos oficiales, sugería que el modelo había sido liberado de sus restricciones de seguridad, lo que habría justificado la alerta de las agencias federales. El autor del estudio sostiene, en cambio, que el comportamiento anómalo se reprodujo con una instrucción rutinaria de programación y que las conclusiones sobre una evasión de filtros carecen de base. El caso reaviva el debate sobre la comunicación apresurada de incidentes de seguridad en modelos de lenguaje y sobre la necesidad de que los avisos a la población se basen en evidencia reproducible. OpenAI y los organismos federales no han reaccionado de forma pública a la aclaración. El episodio coincide con un momento de creciente presión regulatoria sobre los desarrolladores de inteligencia artificial en Estados Unidos y con la reciente imposición, por parte de Anthropic, de controles de identidad para los suscriptores de su asistente Claude.
