Un estudio de la Universidad de Cornell, difundido en arXiv, ha analizado más de 20.000 relatos generados por modelos de lenguaje y ha detectado patrones repetitivos sistemáticos. Un grupo reducido de palabras aparece en el 88% de las historias, con nombres como Elias, Mara o Elara y profesiones como farero, relojero o bibliotecario. El faro es el escenario más frecuente y está presente en más de la mitad de los relatos, mientras que el nombre Elias aparece en más de una cuarta parte, una frecuencia muy superior a la registrada en la literatura humana.
Los investigadores descartan que esa repetición proceda de obras humanas ampliamente difundidas y apuntan a dos factores: el proceso de alineación, que limita las referencias disponibles para evitar personajes protegidos o temas problemáticos, y el aprendizaje por preferencias de los usuarios, que refuerza ciertos tipos de relato cuando las personas los eligen de forma consistente. Este fenómeno, conocido como mode collapse, reduce la diversidad de los resultados.
El problema se agrava porque parte de los datos de entrenamiento procede ya de textos generados por otras IAs, lo que crea un circuito cerrado que refuerza los mismos patrones. Según 404 Media, el ingeniero Daniel May detectó que las búsquedas del nombre Elias Thorne crecieron con rapidez en 2026, y ese personaje ficticio ha pasado a figurar como autor de libros, músico o creador de contenidos en distintas plataformas. Los autores concluyen que, sin nuevas fuentes o cambios en el entrenamiento, la producción tenderá a parecerse cada vez más a sí misma.
