16 May 2026 · Original en inglés · Artículo

Investigadores crean memoria en línea eficiente para IA conversacional

Fuentes: $δ$-mem: Efficient Online Memory for Large Language Models

δ-mem es un mecanismo de memoria en línea propuesto para abordar una de las limitaciones más desafiantes de los grandes modelos de lenguaje (LLMs): la acumulación y reutilización de información histórica en asistentes de largo plazo y sistemas multiagente. El problema fundamental es que simplemente expandir la ventana de contexto es costoso computacionalmente y frecuentemente no garantiza una utilización efectiva de dicho contexto. La solución propuesta consiste en añadir una memoria asociativa compacta al modelo base, manteniendo este completamente congelado (sin entrenamiento adicional). El funcionamiento de δ-mem se basa en dos componentes principales: primero, comprime información pasada en una matriz de estado de memoria online de tamaño fijo (solo 8x8 elementos), actualizada mediante una regla de aprendizaje delta; segundo, utiliza esta memoria para generar correcciones de bajo rango que se inyectan en el cálculo de atención del modelo backbone durante la generación de texto. Esta arquitectura permite capturar información relevante del historial conversacional sin necesidad de expandir el contexto ni reentrenar el modelo base. Los resultados experimentales son prometedores: con solo 8 parámetros de memoria, se logra mejorar el rendimiento promedio hasta 1.10 veces respecto al modelo base congelado y 1.15 veces respecto a las mejores alternativas de memoria existentes. En benchmarks específicamente diseñados para evaluar memoria, las mejoras son aún mayores: 1.31 veces en MemoryAgentBench y 1.20 veces en LoCoMo, mientras se preservan las capacidades generales del modelo. Las aplicaciones potenciales incluyen asistentes de IA de largo plazo, sistemas multiagente, y cualquier escenario donde el modelo necesite recordar información de interacciones previas sin la sobrecarga computacional de expandir ventanas de contexto. Entre las consideraciones importantes destaca que δ-mem funciona sin necesidad de fine-tuning del backbone, sin reemplazo de arquitectura, y sin expansión explícita de contexto, lo que lo hace especialmente atractivo para implementación en sistemas existentes. Sin embargo, el sistema tiene limitaciones en el tamaño de la información que puede almacenar (dada la matrices de estado fija) y los resultados dependen de la calidad del proceso de aprendizaje delta.

Temas

Etiquetas

grandes modelos de lenguaje memoria associativa inteligencia artificial aprendizaje automático redes neuronales modelos de atención sistemas de memoria online procesamiento de lenguaje natural modelos de lenguaje transformer asistentes de ia

Entidades mencionadas

Large language models software

CORE Recommender organization

delta-mem software

MemoryAgentBench event

LoCoMo event

Influence Flower organization

arXiv organization

arXiv es un archivo en línea para las prepublicaciones de artículos científicos en el campo de las matemáticas, física, ciencias de la computación y biología cuantitativa. En muchos campos de las mate

Ver en Wikipedia

Hugging Face organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

Gotit.pub organization

An open platform to discuss research · Annotate, Q&A, discuss any article with the research community - directly on the article · Or drag and drop a PDF · Examples: · article · 2302.13971v1: · LLa

alphaXiv organization

Alphaville es un grupo musical alemán de synth pop que fue muy popular en la década de 1980. Sus canciones más populares son Forever Young, Big in Japan, Jet Set y Sounds Like a Melody, todas contenid

Ver en Wikipedia

CatalyzeX organization

Se denomina verso cataléctico a aquel métricamente incompleto, es decir, o bien le falta una sílaba, o bien, en el caso de la de la poesía griega y latina, que tiene uno de sus pies imperfecto al fina

Ver en Wikipedia

ScienceCast organization

Science Fantasy, que también apareció con los títulos Impulse y SF Impulse, fue una revista británica de fantasía y ciencia ficción lanzada en 1950 por Nova Publications como complemento de New Worlds

Ver en Wikipedia

DagsHub organization

Dash Berlin es un grupo neerlandés de trance, progressive trance, y progressive house. En un principio estaba formado por Eelke Kalberg y Sebastiaan Molijn, y poco después se unió Jeffrey Sutorius, qu

Ver en Wikipedia

Enlaces

What is the Explorer? info.arxiv.org

What is Huggingface? huggingface.co