28 Jun 2026 · Original en inglés · Resumen IA

Los modelos de MAX ya funcionan en GPUs Apple silicon, con soporte nativo para M5

Fuentes: MAX models can now run on Apple silicon GPUs

Modular ha anunciado que, tras varios meses de trabajo, los modelos de MAX ya pueden ejecutarse en GPUs Apple silicon desde la versión 26.4. En las nightly builds actuales, las GPUs M1, M2, M3, M4 y M5 son compatibles, y en ellas corren modelos de texto (LLMs), de visión y de difusión de imagen. El rendimiento es mejor en los sistemas M5, ya que estos SoCs incorporan operaciones dedicadas de multiplicación de matrices a través de los nuevos Neural Accelerators, para los que el equipo ha desarrollado kernels específicos.

Los desarrolladores pueden probar un LLM directamente en un Mac con un comando como max generate --model-path=Qwen/Qwen3.5-0.8B o levantar un endpoint de servicio con max serve, ajustando los flags --device-memory-utilization y --max-batch-size para limitar la memoria, algo necesario porque Apple silicon usa memoria compartida entre CPU y GPU. Con al menos 15 GB de RAM libre también es posible ejecutar en local el modelo de generación de imágenes FLUX.2 [klein] de 4.000 millones de parámetros, tanto de forma offline como sirviendo un endpoint compatible con Open Responses. Modular advierte de que el soporte puede presentar regresiones temporales en las nightly builds y de que aún quedan optimizaciones pendientes, especialmente en sistemas pre-M5.

Temas

ia tecnologia

Etiquetas

max mojo modular apple silicon gpu llm image generation neural accelerators qwen3.5 flux.2

Entidades mencionadas

M4 hardware

M3 hardware

M2 hardware

Apple Silicon hardware

Max software

MLX software

Qwen3.5-0.8B software

M1 hardware

Mojo software

m5 hardware

Modular organization

Modular es una banda argentina de indie pop fundada en la ciudad de Buenos Aires en el año 2000 por Mariana Badaracco y Pablo Dahy.

Ver en Wikipedia

Neural Accelerators hardware

FLUX.2 [klein] 4B software

Preston location

Preston () es una ciudad situada en el condado de Lancashire de la que es su capital administrativa, ubicada al norte del estuario del río Ribble. El distrito obtuvo el estatus de ciudad en 2002, en e

Ver en Wikipedia

Fabio person

Fabio es un nombre propio de chico de origen latino relacionado con la variante del español Fabián, al francés Fabien, al italiano Fabiano, o al inglés y alemán Fabian, entre otros. La versión en port

Ver en Wikipedia

Enlaces

26.4 release www.modular.com

dedicated matrix-multiplication operations via the new Neural Accelerators machinelearning.apple.com

set up MAX docs.modular.com

simple_offline_generation example from the modular repo github.com