DGX Spark

21 Jun 2026

Dos modelos Qwen3 en un único DGX Spark: la aritmética de la residencia para LLM locales

Ejecutar dos modelos de lenguaje grandes de forma coresidente en una sola GPU exige un cálculo de memoria preciso, algo que el parámetro gpu_memory_utilization de vLLM no resuelve por sí solo. Este artículo recoge la experiencia práctica de desplegar Qwen3-Next-80B-Instruct-FP8 y Qwen3-4B-Instruct-2

14 May 2026

Antirez lanza DwarfStar 4 para ejecutar IA local con DeepSeek v4 Flash

El creador de Redis, Antirez, lanzó DwarfStar 4 (DS4), un proyecto de integración de modelo único para experiencia de IA local que ha alcanzado una popularidad inesperada. DS4 utiliza DeepSeek v4 Flash, un modelo cuasi-fronterizo que funciona con cuantización de 2/8 bits, permitiendo ejecutarlo en s

07 May 2026

nvidia y unsloth aceleran el entrenamiento de IA

Nvidia y Unsloth han colaborado para acelerar el entrenamiento de modelos de lenguaje grandes (LLM) en un 25%, según un anuncio reciente. La optimización se centra en la eliminación de cuellos de botella ocultos en el proceso de entrenamiento, específicamente en tareas de metadatos y la reutilizació

18 Mar 2026

TiinyAI: ¿Promesas vacías o realidad? Un análisis revela dudas.

Una startup llamada TiinyAI ha generado controversia con su Kickstarter para el "Pocket Lab", un dispositivo que promete ejecutar modelos de lenguaje grandes (LLM) de hasta 120 mil millones de parámetros localmente por $1,299. Un periodista ha investigado a fondo la empresa, utilizando imágenes de m

17 Mar 2026

Unsloth Studio: IA fácil con su interfaz sin código

Unsloth AI ha lanzado Unsloth Studio (Beta), una interfaz de usuario web de código abierto y sin necesidad de programación para entrenar, ejecutar y exportar modelos de IA de código abierto localmente. La herramienta, disponible para Windows, Linux, WSL y MacOS (con soporte limitado para entrenamien

12 Mar 2026

Chrome llegará a Linux ARM64 en 2026