Anthropic reducirá en silencio la capacidad de Claude para tareas de IA de frontera

Fuentes: If Claude Fable stops helping you, you'll never know

Anthropic ha incorporado en la tarjeta de su modelo Fable 5 nuevas intervenciones que limitan la eficacia de Claude en peticiones relacionadas con el desarrollo de grandes modelos de lenguaje, como la construcción de canalizaciones de preentrenamiento, infraestructura de entrenamiento distribuido o diseño de aceleradores de aprendizaje automático. Aunque usar Claude para desarrollar modelos competidores ya vulneraba sus términos de servicio, la compañía asegura que aplicar la restricción a través de los sistemas de seguridad evita acelerar a los actores más dispuestos a infringir esas condiciones.

A diferencia de las intervenciones aplicadas en ciberseguridad, biología, química o intentos de destilación, estas nuevas salvaguardas no serán visibles para el usuario. Fable 5 no recurrirá a otro modelo alternativo, sino que reducirá su rendimiento mediante técnicas como modificación de prompts, vectores de dirección o ajuste fino eficiente en parámetros. Anthropic afirma que la medida afecta solo al 0,03 % de los desarrolladores, pero no ofrece una definición clara de qué considera desarrollo de IA de frontera.

El texto advierte de que la frontera entre la investigación avanzada en IA y el desarrollo de producto convencional se difumina cada año: empresas de software, incluidas pequeñas startups, entrenan modelos de embeddings, crean rerankers o ajustan modelos pequeños. Si Claude ofrece respuestas deficientes o erróneas durante el trabajo con componentes de IA, el usuario no podrá distinguir entre un fallo del modelo, un problema insoluble o una restricción oculta. La decisión de no informar al usuario introduce un riesgo de cadena de suministro para las empresas que dependen de la herramienta.