07 May 2026 · Original en inglés · Resumen IA

nvidia y unsloth aceleran el entrenamiento de IA

Fuentes: nvidia and unsloth accelerate llm training by 25% with new optimizations

Nvidia y Unsloth han colaborado para acelerar el entrenamiento de modelos de lenguaje grandes (LLM) en un 25%, según un anuncio reciente. La optimización se centra en la eliminación de cuellos de botella ocultos en el proceso de entrenamiento, específicamente en tareas de metadatos y la reutilización de información en cada iteración. El enfoque principal es evitar la reconstrucción repetida de datos, aprovechando técnicas como el almacenamiento en caché de secuencias empaquetadas y la paralelización de operaciones de copia y cálculo. Las mejoras incluyen optimizaciones en argsort y bincount, reduciendo la necesidad de cálculos repetidos y minimizando las sincronizaciones entre la CPU y la GPU. Los resultados muestran mejoras significativas en el paso hacia adelante (forward pass), con aumentos de hasta el 43.3% en algunos casos, y mejoras más modestas en el paso hacia atrás (backward pass). La implementación también incluye una optimización de 'smart checkpointing' para reducir la latencia de la recarga de activaciones, utilizando un doble buffering para superponer la copia de datos con el cálculo. El aumento de velocidad es consistente en modelos más grandes, con un bajo costo adicional de memoria.

Temas

ia empresas

Etiquetas

nvidia unsloth llm gpu deep learning artificial intelligence optimization machine learning training forward pass

Entidades mencionadas

Nvidia organization

NVIDIA Corporation es una empresa tecnológica de software y fabless que desarrolla unidades de procesamientos gráficos (GPU), interfaz de programación de aplicaciones (API) para ciencia de datos y com

Ver en Wikipedia

Unsloth person

Geoffrey Gilyard Unsworth, 26 de mayo de 1914; París, Francia, 28 de octubre de 1978) fue un director de fotografía británico que trabajó en casi noventa largometrajes durante una carrera que terminó

Ver en Wikipedia

RTX hardware

DGX Spark hardware

Qwen3-14B QLoRA SFT software

argsort software

bincount software

Blackwell GPUs hardware

Llama-3.2-1B software

Qwen3-0.6B software

SDPA software