06 May 2026 · Original en inglés · Artículo

Aprendizaje profundo: Borges y Locke revelan sus secretos

Fuentes: A Theory of Deep Learning

Este artículo, basado en la obra de Borges y Locke, explora una teoría sobre el funcionamiento del aprendizaje profundo (Deep Learning) que desafía las explicaciones tradicionales. Borges, a través de su personaje Funes, ilustra cómo la capacidad de recordar todo (datos sin filtrar) impide el pensamiento abstracto, que requiere generalización y olvido selectivo. De manera similar, las redes neuronales profundas, con su enorme cantidad de parámetros y capacidad para memorizar datos, presentan un desafío para la teoría del aprendizaje estadístico. La teoría clásica predice un sobreajuste catastrófico (benign overfitting), donde la red memoriza el conjunto de entrenamiento incluyendo el ruido, pero sorprendentemente, generaliza bien. Este fenómeno, conocido como 'double descent' y el concepto de 'grokking' (memorización inicial seguida de generalización tardía), son inconsistentes con la teoría convencional.

La investigación actual, liderada por el Diffusion Group en Stanford, propone una nueva perspectiva: abandonar el análisis del espacio de parámetros y, en cambio, examinar la red como un sistema dinámico en el espacio de salida. El enfoque se centra en cómo evolucionan las predicciones y cómo fluye el error. La clave de esta teoría reside en el Neural Tangent Kernel (eNTK), una matriz que describe cómo un cambio en un parámetro afecta a las predicciones en otros puntos de entrenamiento. El eNTK, junto con el propagador del ODE de gradiente, permite analizar la evolución de las predicciones durante el entrenamiento y, crucialmente, distinguir entre canales de señal (donde se aprende información útil) y un 'reservorio' (donde se almacena ruido y memorias irrelevantes). La teoría postula que el sobreparámetro, la profundidad y los sesgos inductivos tienen como objetivo crear un kernel que coloque la señal en el canal y el ruido en el reservorio.

Esta nueva teoría, respaldada por pruebas matemáticas y experimentales, ofrece una explicación de por qué las redes neuronales profundas generalizan a pesar de su capacidad para memorizar todo. Además, proporciona un algoritmo para entrenar modelos optimizando el riesgo de la población, abriendo nuevas vías para comprender y mejorar el aprendizaje profundo. La teoría se presenta como una simplificación radical, enfocándose en la dinámica de las predicciones en lugar de la complejidad de los parámetros, y ofrece una nueva herramienta para analizar y controlar el proceso de aprendizaje.

Etiquetas

deep learning neural networks machine learning statistical learning theory kernel methods optimization generalization benign overfitting grokking dynamical systems

Entidades mencionadas

Elon Litman person

Elon Litman is part of Stanford Profiles, official site for faculty, postdocs, students and staff information (Expertise, Bio, Research, Publications, and more). The site facilitates research and coll

Borges person

Jorge Francisco Isidoro Luis Borges fue un cuentista, poeta, ensayista y traductor argentino, extensamente considerado una figura clave tanto para la literatura en español como para la literatura univ

Ver en Wikipedia

Funes person

Rogelio Gabriel Funes Mori es un futbolista argentino-mexicano que juega de delantero en el Club León de la Primera División de México. Es hermano mellizo del también futbolista Ramiro Funes Mori.

Ver en Wikipedia

Locke person

John Locke fue un filósofo y médico inglés, considerado como uno de los más influyentes pensadores del empirismo inglés, y conocido como el «Padre del Liberalismo Clásico». Fue uno de los primeros emp

Ver en Wikipedia

Ireneo Funes person

Hijo de María Clementina Funes, una planchadora del pueblo, y un tal O'Connor, médico del saladero según algunos, aunque otros dicen que se ganaba la vida como domador o rastreador en el departam

Jorge Luis Borges person

Ver en Wikipedia

Ficciones creative_work

Stanford location

Zhang et al. person

Zhang Taiyan, también conocido como Zhang Binglin, fue un filólogo, filósofo y activista revolucionario chino.

Ver en Wikipedia

Communications of the ACM organization

Membership in ACM includes a subscription to Communications of the ACM (CACM), the computing industry's most trusted source for staying connected to the world of advanced computing · Performance

Bartlett et al. person

Hall Bartlett fue un actor, guionista y director de cine estadounidense, reconocido principalmente por dirigir la adaptación de Juan Salvador Gaviota en 1973.

Ver en Wikipedia

PNAS organization

Proceedings of the National Academy of Sciences of the United States of America, también conocida por sus siglas PNAS, es una revista científica. Publicada semanalmente, es la publicación oficial de l

Ver en Wikipedia

Belkin et al. person

Nacida en Los Ángeles, Jessica Belkin es una asidua usuario de Instagram, donde comparte su día a día con sus más de 770 mil seguidores (número que, seguramente, crecerá con su trabajo en Baywatch).

Gunasekar et al. organization

I currently work on improving language model capabilities through scale, data curation, and creative uses of synthetic data generation, while maintaining broader interests in evaluation and alignment

Soudry et al. organization

· Experience: CBL Logística · Education: Instituto Internacional San Telmo · Location: Greater Málaga Metropolitan Area · 500+ connections on LinkedIn. View Alberto Soudry’s profile on LinkedIn, a pro

JMLR organization

Jemeres Rojos es el nombre con el que fueron conocidos los miembros del Partido Comunista de Kampuchea que, tras la guerra de Vietnam, la salida de los Estados Unidos y el derrocamiento del general Lo

Ver en Wikipedia

Power et al. organization

El power metal es un subgénero del heavy metal que combina elementos del speed metal con metal tradicional en un contexto sinfónico. A diferencia del thrash metal el power metal bien definido se conce

Ver en Wikipedia

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

Litman & Guo location

Litmanová es un municipio del distrito de Stará Ľubovňa en la región de Prešov, Eslovaquia, con una población estimada a final del año 2025 de 605 habitantes.

Ver en Wikipedia

GitHub organization

GitHub es una forja para alojar proyectos utilizando el sistema de control de versiones Git. Se utiliza principalmente para la creación de código fuente de programas de computadora. El software que op

Ver en Wikipedia

elonlit organization

Elongated Man es un superhéroe que aparece en los cómics estadounidenses publicados por la editorial DC Comics. Su primera aparición fue en la colección The Flash # 112.

Ver en Wikipedia

Jacot et al. person

Louis-Julien Jacottet (1806-1880) fue un litógrafo, dibujante y pintor francés.

Ver en Wikipedia

NeurIPS organization

La neurociencia es una disciplina científica que estudia el sistema nervioso y todos sus aspectos: por ejemplo, estructura, función, desarrollo ontogenético y filogenético, bioquímica, farmacología y

Ver en Wikipedia

eNTK software