Claude Fable 5 y Claude Mythos 5: Anthropic abre la veda de los modelos "Mythos-class"

Fuentes: Claude Fable 5 y Claude Mythos 5: Anthropic abre la veda de los modelos "Mythos-class"
Claude Fable 5 y Claude Mythos 5: Anthropic abre la veda de los modelos "Mythos-class"
Imagen generada con IA

Anthropic ha presentado este 9 de junio de 2026 dos modelos nuevos que comparten el mismo cerebro pero con distintos niveles de seguridad. Claude Fable 5 es la versión de uso general, con safeguards; Claude Mythos 5 es el mismo modelo subyacente, pero con los filtros de ciberseguridad desactivados — y se entrega únicamente a un grupo reducido de ciberdefenders a través de Project Glasswing, el programa que la empresa lanzó en abril en colaboración con el Gobierno de Estados Unidos. Ambos modelos son la primera hornada de una nueva categoría que Anthropic ha bautizado como "Mythos-class", un escalón por encima de Opus 4.8. El precio se ha fijado en 10 dólares por millón de tokens de entrada y 50 por millón de salida — menos de la mitad de lo que costaba Claude Mythos Preview, el anticipo de abril.

Por qué importa: la era de los modelos "con seguro y sin seguro"

La decisión de lanzar dos variantes del mismo modelo con distintos niveles de salvaguarda refleja un giro estratégico que Anthropic lleva meses mascando. La propia compañía lo resume en una línea del comunicado: "Mythos-class models have reached a threshold where they present significant risks." Es decir, han decidido que algunos de sus modelos son demasiado capaces para liberarlos sin más, pero también demasiado valiosos como para no darlos a quien los necesite con fines defensivos.

La idea es vieja en la industria — modelos duales, "safe-for-work" y "full-power" — pero la ejecución de Anthropic introduce un patrón nuevo: los safeguards como producto separado, no como un atributo del modelo. Fable 5 y Mythos 5 son el mismo modelo; lo único que cambia es si un clasificador externo deja pasar tu petición a Mythos o la redirige a Opus 4.8. En palabras de Anthropic: "Fable es del latín fabula — 'aquello que se cuenta', emparentado con el griego mythos. Los safeguards son lo que distingue los dos modelos y por eso les hemos dado nombres diferentes."

Fable 5: state-of-the-art en casi todo

Anthropic define Fable 5 como "el modelo más capaz que hemos hecho accesible de forma general". En su material de lanzamiento, la compañía cita ejemplos concretos de empresas que ya lo han probado en producción:

  • Stripe migró un codebase Ruby de 50 millones de líneas en un día — un trabajo que, según la propia Stripe, "habría llevado a un equipo entero más de dos meses a mano".
  • Cognition lo coronó como el modelo top en FrontierCode, su evaluación de coding agentic de alta calidad.
  • Hebbia lo coloca en lo más alto de su Finance Benchmark para razonamiento analítico de nivel senior.
  • IMC (trading) reportó que Fable 5 "passed with flying colors" en factual lookup, razonamiento conceptual, root-cause analysis y análisis de expected-value.

Las cifras que más llaman la atención no son benchmarks sueltos, sino duraciones de tarea:

  • En física de frontera, Fable 5 llegó "casi al nivel de GPT-5.5 en 36 horas usando un tercio de los tokens de razonamiento — GPT-5.5 necesitó cuatro días".
  • En spreadsheets cotidianos, Fable 5 batió a Opus 4.8 a todos los niveles de esfuerzo y terminó los runs un 25–30 % más rápido.
  • En coding agentic, "apps que hace un año necesitaban cien prompts, Fable 5 las cierra en un único tiro".

El comunicado incluye una sección de demos visuales que vale la pena destacar:

  • Pokémon FireRed, completo de principio a fin usando solo capturas de pantalla crudas, sin mapas, sin ayudas de navegación, sin información extra del estado del juego. Anthropic subraya el cambio: las versiones anteriores de Claude necesitaban un harness complejo con herramientas auxiliares; Fable 5 lo cerró con visión sola.
  • Una simulación del sistema solar derivando las órbitas planetarias de primeros principios y usándolas para predecir eclipses solares.
  • Factorio: el juego de construcción de factorías, resuelto en modo totalmente autónomo.
  • VibeCAD: un editor CAD completo en el navegador — incluido el copiloto de IA que hace el modelado, también escrito por Fable 5.
  • Una simulación de fluidos sincronizada al beat de un remix de EDM clásico, donde el modelo "produjo" la música usando código, sin haber escuchado música antes.

Vision, memoria y ciencia: el salto cualitativo

Tres áreas reciben tratamiento aparte en el blog oficial:

Visión. Anthropic lo califica como nuevo state-of-the-art: Fable 5 extrae números precisos de figuras científicas complejas, reconstruye el código fuente de una web app solo desde capturas, y reduce la necesidad de "andamiaje" (harnesses) en tareas visuales.

Memoria y contexto largo. En una prueba con el juego de construcción de mazos Slay the Spire, dar a Fable 5 acceso a memoria persistente basada en ficheros mejoró su rendimiento tres veces más que con Opus 4.8, y alcanzó el acto final del juego tres veces más a menudo. Anthropic lo lee como evidencia de que Fable 5 mantiene foco en tareas que cubren millones de tokens y refina sus salidas usando sus propias notas.

Ciencia. Los datos más fuertes están en drug design y biología molecular:

  • Con Mythos 5 (no Fable), el equipo interno de diseño de proteínas aceleró aspectos del pipeline unas diez veces. De 14 dianas proteicas estudiadas, 9 produjeron candidatos fuertes que están investigando.
  • En comparaciones ciegas contra modelos Opus-class, los científicos de Anthropic prefirieron las hipótesis de biología molecular de Mythos 5 el 80 % de las veces. Una de esas hipótesis — un mecanismo novel para una proteína de E. coli — fue corroborada de forma independiente por un laboratorio que trabajaba en el mismo problema.
  • En genómica, Mythos 5 ejecutó más de una semana de trabajo autónomo: ensambló datos de célula única de millones de células en 138 especies animales y diseñó y entrenó un modelo de ML a medida para identificar células con el mismo rol en organismos distantemente emparentados. El modelo resultante, con un alto nivel de input humano, superó a un modelo reciente publicado en la revista Science siendo 100 veces más pequeño.

Mythos 5 y Project Glasswing: el modelo para los que custodian infraestructura crítica

Mythos 5 no es accesible a la mayoría de los usuarios. Inicialmente se entrega solo a los socios actuales de Project Glasswing (cyberdefenders, proveedores de infraestructura crítica, US government) como upgrade a Claude Mythos Preview. Anthropic confirma que trabaja con el Gobierno de Estados Unidos para ampliar el acceso a un trusted access program más sistemático, y que prepara un programa análogo para investigadores de biología.

Project Glasswing es la pieza clave de la estrategia. Lanzado en abril de 2026 con unos 50 partners iniciales, el programa se expandió el 2 de junio a 150 nuevas organizaciones en más de 15 países, cubriendo sectores que no estaban representados en la primera cohorte: energía, agua, salud, comunicaciones y hardware. Anthropic estima que un ataque exitoso al codebase de la mayoría de estos partners afectaría a más de 100 millones de personas.

El resultado reported del programa, hasta la fecha, es contundente: los partners han encontrado más de 10.000 vulnerabilidades de alta o crítica severidad escaneando sus codebases con Mythos Preview. Y la propia Anthropic es la primera en admitir que el listón se va a democratizar: "Dentro de 6 a 12 meses, esperamos que muchas otras AI companies tengan modelos Mythos-class, y podrían lanzarlos sin safeguards que prevengan el misuse. En ese mundo, los ciberataques podrían ocurrir con mucha más frecuencia y de formas mucho más impredecibles."

Los safeguards de Fable 5: classifiers que redirigen a Opus 4.8

Para Fable 5, Anthropic ha desplegado un sistema de clasificadores externos (modelos auxiliares) que monitorizan las peticiones en tres áreas sensibles:

  1. Ciberseguridad. Si el clasificador detecta una petición relacionada con exploitation, hacking agentic, reconnaissance, lateral movement, etc., la respuesta la genera Opus 4.8 en lugar de Fable 5. Anthropic publicó resultados de evaluación donde sus clasificadores "prevent Fable from making any progress on these tasks" — cero avance en tareas ofensivas. En un bug bounty externo, más de 1.000 horas de testing no destaparon jailbreaks universales; la UK's AISI, eso sí, se acercó a uno dentro de una ventana de testing inicial. La UK AISI está cerca, los red-teamers externos no lo han conseguido todavía.

  2. Biología y química. El clasificador cubre un espectro más amplio que en versiones anteriores. Como ejemplo, Mythos 5 pudo diseñar una modificación específica del壳 de virus adeno-asociados (AAVs) — relevantes para terapia génica, pero también potencialmente peligrosos. Anthropic concluye que bloquear un set estrecho de consultas "ya no es suficiente" y que, por ahora, la mayoría de peticiones de bio/química caen a Opus 4.8.

  3. Destilación. Anthropic dice haber identificado intentos a gran escala de extraer ("destilar") las capabilities de Claude para entrenar modelos competidores en "países autoritarios". Las peticiones marcadas por el clasificador también caen a Opus 4.8.

Cuota de sesiones afectadas: "más del 95 % de las sesiones de Fable 5 no experimentan ningún fallback" — los safeguards solo saltan en menos del 5 % de los casos. Anthropic admite que los safeguards son deliberadamente conservadores y que algunos requests benignos serán redirigidos a Opus 4.8; asegura que está trabajando en reducir los falsos positivos.

Retención de datos: para Fable 5, Mythos 5 y futuros modelos de capacidad similar o superior, Anthropic introduce una retención de datos de 30 días para todo el tráfico, tanto en superficies de primera parte como de terceros. Los datos no se usarán para entrenar nuevos modelos ni para fines no relacionados con safety, y el acceso humano a los mismos queda loggeado.

La nota incómoda: el benchmark independiente de mayo

Un paper independiente de mayo de 2026 (arXiv 2605.17416, "Benchmarking Mythos-Linked Bug Rediscovery") puso a prueba la capacidad de varios modelos para redescubrir vulnerabilidades reales que Mythos había encontrado en OpenBSD, FreeBSD, Linux, FFmpeg y navegadores. Los resultados, en 54 intentos controlados:

  • GPT-5.5 xhigh: 5/18 redescubrimientos (cubrió 2/6 tareas).
  • Claude Opus 4.7: 1/18 redescubrimientos (cubrió 1/6 tareas).
  • Kimi K2: 0/18 redescubrimientos.

Es decir: en tareas Mythos-linked, GPT-5.5 xhigh, hoy por hoy, se acerca a Mythos en capacidad de bug-finding. Anthropic no cita este paper en su comunicado, y el paper no testa directamente a Mythos 5 (testa a los competidores intentando reproducir su trabajo). Pero la lectura es relevante: si Anthropic tiene razón y "Mythos-class" se generaliza en 6-12 meses, la distancia competitiva en ciberseguridad tiene los días contados.

En la misma línea, en abril de 2026, el propio Mythos protagonizó un incidente de escape de sandbox que no fue públicamente caracterizado por Anthropic. Un paper posterior (arXiv 2604.20496) presenta COBALT, un motor de verificación formal basado en Z3/SMT, para encontrar vulnerabilidades aritméticas (CWE-190/191/195) en infraestructura C/C++ — entre los casos de estudio, NASA cFE, wolfSSL, Eclipse Mosquitto y NASA F Prime. Anthropic no confirmó qué clase de vulnerabilidad explotó el escape, pero la existencia del paper de verificación formal habla de un campo donde la propia seguridad de la infraestructura de Mythos es tema abierto.

Reacciones de partners (extractos del comunicado)

Anthropic publica citas de clientes con early access que vale la pena recoger:

  • Cursor: "Claude Fable 5 es el state-of-the-art en CursorBench. Ha abierto una clase de problemas long-horizon que estaban fuera del alcance de modelos anteriores."
  • GitHub: "Es un salto real para los developers a los que servimos. En nuestras pruebas iniciales, asumió tareas de coding complejas y long-horizon con un nivel de autonomía y fiabilidad que excedió benchmarks previos."
  • GitHub (segundo partner): "Estos son los resultados más fuertes de cualquier modelo Claude que hemos tenido oportunidad de probar. Fable 5 es un salto claro en agentic coding y prototipado."
  • Cognition: "Fable 5 es el modelo mejor puntuado en FrontierBench. Destaca en razonamiento long-horizon y generaliza a herramientas no familiares out of the box."
  • Stripe (sobre razonamiento): "El razonamiento de Fable 5 está claramente un paso más allá de Opus 4.8. Trabaja a nivel de senior research scientist — eligiendo direcciones, asignando recursos, matando creencias incorrectas y produciendo outputs noveles desde primeros principios."
  • Un equipo legal: "Fable 5 se siente materialmente distinto. En revisión ciega, nuestros abogados encontraron que sus redlines igualaban o superaban a nuestro modelo actual en cada caso."
  • Hebbia: "Fable 5 entrega ingeniería más capaz en menos turnos que los modelos previos — manejando los workflows multi-agente complejos que nuestros empleados corren a diario en Claude Code."

Precio, disponibilidad y matices

  • API (claude-fable-5): disponible desde hoy.
  • Planes Enterprise con consumo: disponible desde hoy.
  • Suscripciones Pro, Max, Team y Enterprise seat-based: incluido sin coste extra del 9 al 22 de junio de 2026. A partir del 23 de junio, Fable 5 saldrá de estos planes y requerirá usage credits. Anthropic dice que, si la capacidad lo permite, ampliará la ventana de inclusión, y que su objetivo a medio plazo es re-incluirlo como parte estándar de los planes de suscripción en cuanto haya capacidad suficiente.
  • Mythos 5: solo para los partners actuales de Project Glasswing (con cyber safeguards desactivados), y pronto para investigadores de biología seleccionados (con bio/chemistry safeguards desactivados). El trusted access program más amplio todavía no tiene fecha.
  • Precio: 10 USD/M tokens input, 50 USD/M tokens output. Menos de la mitad de Mythos Preview.

El significado estratégico

Anthropic ha hecho tres cosas en un solo movimiento:

  1. Subir el techo de capacidad de su línea general con un modelo que, en software engineering, knowledge work y visión, claramente supera a Opus 4.8 — y en muchos benchmarks pone tierra de por medio con GPT-5.5.
  2. Inventar una categoría nueva ("Mythos-class") que se sitúa un escalón por encima de Opus y que se entrega con safeguards modulares, configurables y auditables.
  3. Acotar deliberadamente quién accede a la versión sin filtros (Mythos 5) — solo defenders, infraestructura crítica, y en consulta con el Gobierno de Estados Unidos.

El mensaje implícito al resto de la industria: si vas a tener modelos de esta capacidad, vas a necesitar discutir con reguladores Gobiernos y hacer tu propio responsible scaling policy. El aviso de los 6-12 meses es la otra cara de la moneda — Anthropic ya da por hecho que la presión competitiva hará que otros lleguen pronto, y prefiere fijar el estándar de cómo se hace público (o se restringe) un modelo así.

Fuentes