22 Jun 2026 · Original en inglés · Artículo

Múnich 1991: el año milagroso del deep learning que anticipó los LLM

Fuentes: Munich 1991: the Roots of the Current AI Boom

Múnich 1991: el año milagroso del deep learning que anticipó los LLM. Este artículo repasa cómo el equipo de Jürgen Schmidhuber en la Universidad Técnica de Múnich publicó, entre marzo y agosto de 1991, los fundamentos de las técnicas que hoy sustentan los grandes modelos de lenguaje. En apenas cinco meses, su laboratorio introdujo la primera variante de Transformer (hoy llamada linear Transformer sin normalizar, antecesora directa de la T de ChatGPT), el concepto de preentrenamiento no supervisado (la P de ChatGPT), la destilación de redes neuronales y el aprendizaje residual profundo, pieza central de las LSTM y las ResNet. También publicó la primera revisión por pares de redes generativas adversariales para modelos del mundo entrenados con curiosidad artificial, base de la IA generativa actual. Según los autores, a enero de 2026 los dos artículos más citados de la historia (al margen de manuales) derivan directamente de aquel trabajo de 1991. Schmidhuber sitúa estas contribuciones en una línea más amplia que arrancó en 1987 con metaaprendizaje y mejora recursiva, y defiende que los grandes modelos de lenguaje por sí solos no alcanzarán la inteligencia artificial general sin planificación con modelos del mundo y robots versátiles. El texto, firmado por Schmidhuber y David Ha (Sakana AI), incluye un cronograma anotado de las publicaciones y referencias cruzadas a la historia del aprendizaje profundo.

Temas

Etiquetas

deep learning transformer lstm resnet gan knowledge distillation technical university of munich schmidhuber lab llm history of ai

Entidades mencionadas

DeepSeek software

Munich location

Ernst Dickmanns person

ResNet software

Jürgen Schmidhuber person

Jürgen Schmidhuber es un informático alemán. Desde 1995 es director científico de IDSIA, un instituto suizo de investigación de inteligencia artificial.

Ver en Wikipedia

Google Brain organization

Google Brain es un equipo de investigación de inteligencia artificial de aprendizaje profundo bajo el paraguas de Google AI, una filial de investigación de Google dedicada a la inteligencia artificial

Ver en Wikipedia

Long Short-Term Memory software

David Ha person

David Michael Hasselhoff es un actor, productor y músico estadounidense también conocido como "The Hoff".

Ver en Wikipedia

Technical University of Munich organization

In our podcast series, we talk with the people that make up our university. All episodes · Find merchandising items, conference materials and products in the corporate design online or on site. Shop o

Sakana AI person

Masafumi Sakanashi fue un artista marcial japonés que residió en la República Argentina, obteniendo el grado de séptimo dan de aikido en el 2012 y el de shihan desde el año 2007.

Ver en Wikipedia

Sepp Hochreiter person

Josef "Sepp" Hochreiter (born 14 February 1967) is a German computer scientist. Since 2018 he has led the Institute for Machine Learning at the Johannes Kepler University of Linz after havin

ChatGPT software

ChatGPT es un chatbot de inteligencia artificial desarrollado por OpenAI, y es un ejemplo clave de la tecnología que está desafiando las nociones tradicionales de la 'ventaja humana'. Su capacidad par

Ver en Wikipedia