Jack Clark, cofundador de Anthropic, estima con una probabilidad superior al 60 % que antes de que finalice 2028 existirá un sistema de inteligencia artificial capaz de entrenar de forma autónoma a su propio sucesor, sin intervención humana significativa. En su último boletín Import AI, Clark reconoce que se trata de una predicción cuyas implicaciones le abruman y para la que la sociedad no está preparada.
Su argumento se apoya en métricas recientes. En 2023, Claude 2 resolvía alrededor del 2 % de los casos de SWE-Bench; el modelo Claude Mythos Preview alcanza el 93,9 %. La organización METR documenta que el tiempo de trabajo autónomo sostenido de los modelos pasó de 30 segundos con GPT-3.5 en 2022 a 12 horas con Claude Opus 4.6 en 2026, y la investigadora Ajeya Cotra prevé que algunos sistemas alcancen las 100 horas de autonomía este año, un umbral que cubriría la mayor parte de la investigación en IA.
El avance ya se refleja en pruebas como CORE-Bench, superada en diciembre de 2025 con un 95,5 % de éxito por Opus 4.5, y en el hecho de que los sistemas actuales logran aproximadamente la mitad de la mejora que un investigador humano al entrenar modelos pequeños. Sam Altman (OpenAI) ha declarado que quiere un asistente de investigación automatizado antes de septiembre de 2026, y la startup Recursive Superintelligence ha levantado 500 millones de dólares con ese objetivo.
Clark advierte de que las técnicas de alineamiento podrían degradarse tras cientos de generaciones de autoentrenamiento y duda de que la IA aporte la creatividad necesaria para saltos conceptuales como la arquitectura de transformadores.
