Noticias que mencionan H200

Stable Audio 3: IA que genera audio de alta calidad en menos de 2 segundos

Stable Audio 3 representa un avance significativo en la generación de audio mediante inteligencia artificial. Se trata de una familia de modelos de difusión rápida (en sus versiones small, medium y large) capaces de generar y editar audio de longitud variable, desde unos segundos hasta varios minuto

Utilyze: Herramienta revela el uso real de GPUs en IA

Una nueva herramienta de código abierto llamada Utilyze, desarrollada por Systalyze, busca solucionar un problema generalizado en la industria de la inteligencia artificial: la medición engañosa de la utilización de las GPU. Las métricas estándar, proporcionadas por herramientas como nvidia-smi, nvt

Entrenan LLM gigante en una GPU: avance tecnológico

El entrenamiento de modelos de lenguaje grandes (LLMs), como GPT-3 o LaMDA, es un desafío computacional enorme. Estos modelos pueden tener cientos de miles de millones de parámetros, lo que requiere una cantidad significativa de memoria y potencia de cálculo. Tradicionalmente, el entrenamiento de es

IA acelera entrenamiento neuronal con 16 GPUs

Investigadores han logrado mejorar significativamente el entrenamiento de redes neuronales utilizando un agente de inteligencia artificial (IA) y un clúster de 16 GPUs, gracias a la herramienta SkyPilot. El agente, basado en Claude Code y conectado a la plataforma Autoresearch de Andrej Karpathy, ej

Entrenar IA de código abierto: desafíos inesperados

Un ingeniero de Workshop Labs, Addie Foote, relata los desafíos encontrados al intentar entrenar y servir modelos de lenguaje grandes con pesos abiertos, específicamente el modelo Kimi-K2-Thinking de Moonshot AI. El objetivo era post-entrenar el modelo, que cuenta con 1 billón de parámetros y está c

IA para todos: superando costos y lentitud

El artículo de taalas.com aborda un desafío crucial para la adopción generalizada de la Inteligencia Artificial (IA): la combinación de alta latencia y costos prohibitivos. Actualmente, los modelos de IA, especialmente los grandes modelos de lenguaje (LLM), requieren una infraestructura masiva y cos