10 Jun 2026 · Original en inglés · Resumen IA

Investigadores de ciberseguridad critican las restricciones del modelo Fable de Anthropic

Fuentes: Cybersecurity researchers aren't happy about the guardrails on Anthropic's Fable

Imagen generada por IA con el prompt: A glowing AI model interface on a dark laptop screen with red warning pop-ups and padlock icons, evoking cybersecurity restrictions, cool blue and red color palette, editorial tech illustration style — Imagen generada con IA

Anthropic presentó el martes Fable, una versión pública y limitada de su modelo de ciberseguridad Mythos, pero la decisión ha generado críticas entre profesionales del sector. Varios investigadores han denunciado en redes sociales que las barreras de seguridad del modelo son excesivas: rechazan solicitudes tan básicas como leer una entrada de blog sobre seguridad informática, revisar código o solicitar una auditoría de ciberseguridad, por considerarlas potencialmente relacionadas con actividades maliciosas.

Valentina "Chompie" Palmiotti, investigadora de IBM X-Force, explicó que Fable bloquea "cualquier solicitud que pueda estar tangencialmente relacionada con la ciberseguridad". Matt Suiche, veterano del sector, afirmó que el sistema opera por palabras clave: "cualquier expresión del campo léxico de 'ciberseguridad' activa las restricciones". Cuando se dispara una barrera, Fable interrumpe la conversación y avisa de que sus medidas de seguridad han detectado un tema sensible, redirigiendo la consulta al modelo Claude Opus 4.8.

Las restricciones buscan evitar que el modelo facilite la creación de malware o el compromiso de sistemas, una preocupación histórica de Anthropic. La compañía limita el acceso a Mythos desde abril mediante el Proyecto Glasswing, que la semana pasada se amplió a cientos de organizaciones en 15 países. Suiche reconoció que la estrategia es comprensible en una fase temprana y que probablemente las barreras se irán ajustando. Además de los filtros internos, Anthropic exige a los profesionales de ciberseguridad solicitar acceso a su Programa de Verificación Cibernética, un esquema similar al Trusted Access for Cyber de OpenAI.

Temas

ia empresas

Etiquetas

anthropic fable mythos cybersecurity ai safety ai guardrails claude project glasswing openai

Entidades mencionadas

Project Glasswing event

Mythos software

Valentina Palmiotti person

Valentina Palmiotti aka Chompie is a security researcher who focuses on low level vulnerabilities, exploit development and offensive security.

Cyber Verification Program protocol_standard

Trusted Access for Cyber protocol_standard

Claude Opus 4.8 software

Fable software

Matt Suiche person

Matthew Sánchez conocido por sus nombres artísticos Pierre LaBranche y Rod Majors es un reservista del Cuerpo de Marines estadounidense, activista político conservador, escritor y estudiante en la Uni

Ver en Wikipedia

IBM X-Force organization

IBM X-Force is at the forefront of AI and cybersecurity, combining decades of expertise with advanced tools to defend against both AI-driven and traditional threats. Our offensive and defensive servic

Tolmo organization

El picoplano sulfuroso es una especie de ave paseriforme de la familia Tyrannidae. Es nativo del sur de México, América Central y norte y centro de América del Sur.

Ver en Wikipedia

Anthropic organization

Anthropic es una empresa estadounidense de investigación en IA fundada por exmiembros de OpenAI. La noticia cuestiona las afirmaciones de Anthropic sobre la capacidad de sus modelos para reparar vulne

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Enlaces

a long-standing concern www.anthropic.com

Cyber Verification Program support.claude.com