08 May 2026 · Original en inglés · Resumen IA

Modelos de lenguaje: técnica reduce tamaño sin perder calidad

Fuentes: New technique improves embedding compression for language models

Investigadores han desarrollado una nueva técnica para comprimir incrustaciones (embeddings) de modelos de lenguaje, mejorando significativamente la eficiencia sin sacrificar la calidad de la recuperación de información. La técnica, denominada 'poly-autoencoder', combina un codificador PCA (Principal Component Analysis) con un decodificador cuadrático, permitiendo capturar información no lineal que los métodos lineales tradicionales pierden. El método es de aplicación cerrada, sin necesidad de ajuste de hiperparámetros ni entrenamiento con SGD (Stochastic Gradient Descent). Los resultados muestran que 'poly-autoencoder' puede lograr una compresión de memoria de hasta 4 veces por vector, con una pérdida mínima en el NDCG@10 (una métrica de calidad de recuperación), a veces incluso superando el rendimiento de la compresión PCA estándar. En modelos específicos, como 'mxbai-embed-large-v1', la técnica recupera hasta el 90% de la diferencia de rendimiento entre la versión sin comprimir y la comprimida con PCA. La implementación, basada en NumPy, está disponible en GitHub y puede reproducirse en aproximadamente 30-40 minutos en un MacBook M-series. Esta innovación representa un avance importante para la optimización de modelos de lenguaje, especialmente en aplicaciones de recuperación de información donde la eficiencia de memoria es crucial.

Etiquetas

machine learning embeddings pca poly-autoencoder retrieval ndcg numpy language models compression ivan pleshkov

Entidades mencionadas

PCA software

Transformers software

Jain 2017 creative_work

Geelen-Willcox 2022 creative_work

Geelen-Willcox 2023 creative_work

Schwerdtner-Peherstorfer 2024 creative_work

BEIR event

FiQA event

mxbai-embed-large-v1 software

nomic-v1.5 software

mxbai-large software

bge-base software

e5-base software

Poly-AE software

IvanPleshkov person

Ivan Pleshkov has been working in the software development industry since 2013. Ivan began their career as a Delphi Developer at Advanced Chemistry Development, Inc., (ACD/Labs) where they worked on s

MIT organization

El Instituto de Tecnología de Massachusetts es una universidad privada localizada en Cambridge, Massachusetts considerada por numerosos rankings como una de las mejores y más prestigiosas universidade

Ver en Wikipedia

GitHub organization

GitHub es una forja para alojar proyectos utilizando el sistema de control de versiones Git. Se utiliza principalmente para la creación de código fuente de programas de computadora. El software que op

Ver en Wikipedia

Macbook hardware