20 May 2026 · Original en inglés · Resumen IA

Investigación revela que LoRA регуляризует hacia pesos originales del modelo

Fuentes: irhum.github.io - LoRA and Weight Decay

Investigadores han descubierto que LoRA (Low-Rank Adaptation), una técnica popular para ajustar grandes modelos de lenguaje (LLMs), se comporta de manera diferente a lo esperado cuando interactúa con el weight decay (decaimiento de pesos). Mientras que el ajuste fino completo regulariza los pesos hacia cero, LoRA los regulariza hacia la matriz de pesos Frozen original del modelo base. Esta diferencia fundamental significa que, incluso con mayores recursos computacionales, LoRA no converge gradualmente hacia los resultados del ajuste fino completo, ya que resuelve un problema de optimización implícito distinto. Los autores proponen una modificación técnica para corregir este comportamiento, permitiendo que la matriz adaptada decaiga hacia cero en lugar de hacia los pesos originales.

Temas

Etiquetas

lora large language models machine learning ajuste fino de modelos redes neuronales optimización inteligencia artificial

Entidades mencionadas

LoRa software

Hu et al. location

Huétor Tájar es un municipio y localidad española situada en la parte central de la comarca de Loja, en la provincia de Granada, comunidad autónoma de Andalucía. Limita con los municipios de Moraleda

Ver en Wikipedia

Large language models software

LLMs software

Llissá de Vall es un municipio de la comarca del Vallés Oriental situado en la Vall del Tenes y el límite de la llanura de Granollers.

GPT-3 software

Brown et al. person

Travis Kuualiialoha Browne es un artista marcial mixto estadounidense que actualmente compite en la categoría de peso pesado en Ultimate Fighting Championship.

Ver en Wikipedia

transformer software

multihead attention network software

feedforward network software

SGD software

weight decay regulation

vanilla SGD software

Enlaces

https://arxiv.org/abs/2005.14165 arxiv.org

https://arxiv.org/abs/2106.09685 arxiv.org

http://arxiv.org/abs/1412.6980 arxiv.org

https://arxiv.org/abs/2002.05202 arxiv.org

Stochastic Gradient Descent en.wikipedia.org