Anthropic rectifica las restricciones ocultas de Claude Fable 5

Fuentes: Anthropic backpedals on Fable safety measure

Anthropic se disculpó por implementar restricciones ocultas en su nuevo modelo Claude Fable 5, diseñadas para impedir la destilación, una técnica que permite entrenar modelos más pequeños a partir de las salidas de uno grande. La medida, que degradaba las respuestas sin avisar, afectaba a investigadores y competidores que usaban el sistema. La empresa ahora revierte la decisión: en lugar de alterar las respuestas, las consultas sospechosas de destilación se redirigirán al modelo Claude Opus 4.8, y los usuarios recibirán una notificación explícita. Fable 5 es el primer modelo disponible de la serie Mythos, que Anthropic había calificado como demasiado peligroso para su publicación. La empresa justificó las restricciones por el riesgo de destilación industrial, pero la comunidad investigadora criticó la falta de transparencia, señalando que podía limitar la evaluación independiente del modelo. Anthropic reconoció que la opción por salvaguardas invisibles fue un error y prometió mayor visibilidad en el futuro. El cambio sigue a la fuerte reacción de expertos en inteligencia artificial.