10 Mar 2026 · Original en inglés · Resumen IA

Entrenar IA de código abierto: desafíos inesperados

Fuentes: Challenges Arise in Training Large Open-Weight Models

Un ingeniero de Workshop Labs, Addie Foote, relata los desafíos encontrados al intentar entrenar y servir modelos de lenguaje grandes con pesos abiertos, específicamente el modelo Kimi-K2-Thinking de Moonshot AI. El objetivo era post-entrenar el modelo, que cuenta con 1 billón de parámetros y está cuantizado a 4 bits, utilizando código de código abierto. Foote descubrió que las herramientas disponibles, como LLaMA-Factory y Hugging Face Transformers, presentaban errores y limitaciones significativas, especialmente al escalar para modelos tan grandes. El proceso de carga y compresión del modelo resultó ser extremadamente lento, indicando problemas de eficiencia en la infraestructura de código abierto. La experiencia destaca la complejidad de trabajar con modelos de lenguaje de vanguardia y la necesidad de desarrollar código personalizado para superar las limitaciones de las herramientas existentes, incluso cuando se utilizan bibliotecas populares como PyTorch y Hugging Face. El incidente subraya que, a pesar de la disponibilidad de modelos con pesos abiertos, la infraestructura necesaria para entrenarlos y utilizarlos de manera eficiente aún presenta desafíos considerables.

Etiquetas

moonshot ai kimi-k2-thinking hugging face pytorch open-weight models large language models addie foote workshop labs transformers llama-factory

Entidades mencionadas

DeepSeek-V3 software

Transformers software

pytorch software

Torch software

HuggingFace organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

H200 hardware

Open Weights software

Kimi-K2-Thinking creative_work

LLaMA-Factory software

KTransformers software

NFL group_movement

Chicago Bears group_movement

New England Patriots group_movement

AutoTokenizer software

AutoModelForCausalLM software

LoraConfig software

TaskType software

moonshotai/Kimi-K2-Thinking software

LoRa software