23 Jun 2026 · Original en inglés · Artículo

La maldición de la inversión: los LLM no generalizan relaciones simétricas

Fuentes: The Reversal Curse: LLMs trained on "A is B" fail to learn "B is A"

Un equipo de investigación ha documentado una limitación sistemática en los grandes modelos de lenguaje autorregresivos: la bautizada como "maldición de la inversión". El fenómeno consiste en que, cuando un modelo se entrena con frases del tipo "A es B", no generaliza automáticamente hacia la dirección inversa "B es A", a pesar de que ambas formas coexisten con frecuencia en los datos de entrenamiento. Por ejemplo, un modelo entrenado con la oración "Valentina Tereshkova fue la primera mujer en viajar al espacio" no es capaz de responder correctamente a la pregunta "¿Quién fue la primera mujer en viajar al espacio?", y la probabilidad de asignar el nombre correcto no supera la de un nombre aleatorio.

Para demostrar el fallo, los autores ajustaron GPT-3 y Llama-1 con enunciados ficticios como "Uriah Hawthorne es el compositor de Abyssal Melodies" y comprobaron que ninguno de los modelos acertaba al preguntar "¿Quién compuso Abyssal Melodies?". El defecto se reproduce en distintas familias y tamaños de modelo y no se corrige con técnicas de aumento de datos.

En pruebas con celebridades reales, GPT-4 respondió correctamente al 79 % de preguntas en una dirección y solo al 33 % en la inversa, lo que evidencia la misma asimetría fuera del entorno sintético. No obstante, cuando la relación "A es B" aparece en el contexto (in-context learning), los modelos sí deducen el enunciado inverso, lo que sugiere que la limitación es del aprendizaje por entrenamiento, no de la arquitectura.

El hallazgo, publicado en arXiv con código abierto, tiene implicaciones para la construcción de bases de conocimiento, la edición de memorias en modelos y la evaluación de sus capacidades de razonamiento factual.

Temas

ciencia y salud

Etiquetas

reversal curse large language models llama gpt-3 gpt-4 arxiv deep learning natural language processing owain evans knowledge editing

Entidades mencionadas

GPT-3 software

GPT-4 software

GPT-4 es un modelo de lenguaje grande (LLM) creado por OpenAI. Se lanzó el 14 de marzo de 2023 y está disponible a través de la API y para los usuarios de ChatGPT Plus.

Ver en Wikipedia

Tom Cruise person

Thomas Cruise Mapother IV, conocido como Tom Cruise, es un actor y productor de cine estadounidense, ganador de un Premio Óscar, tres Globos de Oro, un Premio Saturn y una Palma de Oro, entre otras.

Ver en Wikipedia

arXiv protocol_standard

Llama-1 software

Uriah Hawthorne person

Mary Lee Pfeiffer person

Owain Evans person

Owain Wyn Evans (born 9 March 1984) is a Welsh broadcaster and drummer. He hosts BBC Radio 2's early breakfast show and previously presented weather bulletins on BBC Look North, North West Tonigh

Valentina Tereshkova person

Valentina Vladímirovna Tereshkova es una cosmonauta, ingeniera y política rusa. Fue la primera mujer en ir al espacio, seleccionada entre más de cuatrocientos aspirantes y cinco finalistas para pilot

Ver en Wikipedia

ChatGPT software

ChatGPT es un chatbot de inteligencia artificial desarrollado por OpenAI, y es un ejemplo clave de la tecnología que está desafiando las nociones tradicionales de la 'ventaja humana'. Su capacidad par

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Enlaces

this https URL github.com