MLX

06 Jul 2026

Swarm: framework de orquestación de agentes escrito íntegramente en Swift 6.2

Swarm es un framework de orquestación de agentes implementado por completo en Swift 6.2 y distribuido como paquete Swift, con compatibilidad para macOS, iOS y Linux. Su objetivo es permitir a los desarrolladores definir agentes y flujos de trabajo con tipado fuerte, aprovechando las primitivas del l

01 Jul 2026

Generación de imágenes con un Android de 2025: el NPU frente al iPhone de 2020

El blog técnico de Duration AI documenta el intento de portar a Android el modelo Bonsai Image de PrismML, un transformador de difusión de 1 bit capaz de generar imágenes de 512×512 píxeles. Tras la experiencia con el iPhone 12 Pro de 2020, los autores probaron a ejecutar el modelo en un Samsung Gal

28 Jun 2026

Los modelos de MAX ya funcionan en GPUs Apple silicon, con soporte nativo para M5

Modular ha anunciado que, tras varios meses de trabajo, los modelos de MAX ya pueden ejecutarse en GPUs Apple silicon desde la versión 26.4. En las nightly builds actuales, las GPUs M1, M2, M3, M4 y M5 son compatibles, y en ellas corren modelos de texto (LLMs), de visión y de difusión de imagen. El

12 Jun 2026

Cómo configurar un agente de codificación local en macOS

Montar un agente de codificación local en macOS permite ejecutar modelos de lenguaje de última generación sin depender de la nube. Este artículo explica cómo configurar una solución completa usando llama.cpp, Gemma 4 26B-A4B y el agente terminal Pi, tras la experiencia del autor con cortes de intern

11 Jun 2026

Ejecutar Claude Code sin conexión: ajustes y hardware

Claude Code, la herramienta de codificación asistida por inteligencia artificial de Anthropic, puede ejecutarse en un entorno completamente local y aislado (air-gapped) sin necesidad de conexión a internet. El artículo describe la configuración necesaria para lograrlo, utilizando un modelo local com

05 Jun 2026

Google lanza versiones QAT de Gemma 4 para móviles y portátiles

Google ha presentado nuevos checkpoints de Gemma 4 optimizados con Quantization-Aware Training (QAT), una técnica que integra la cuantización durante el entrenamiento para reducir la pérdida de calidad al comprimir los modelos. La novedad permite ejecutar Gemma 4 en dispositivos móviles y GPUs de co

05 Jun 2026

Magenta RealTime 2: el modelo abierto de música en vivo para MacBook

El equipo Magenta de Google presenta Magenta RealTime 2 (MRT2), un modelo de música generativa de código abierto y un motor de inferencia en tiempo real que permite construir y tocar instrumentos musicales con IA directamente desde un portátil con chip Apple Silicon. A diferencia de otros modelos g

03 Jun 2026

Google presenta Gemma 4 12B, un modelo multimodal unificado que se ejecuta en portátiles

Google presenta Gemma 4 12B, un modelo multimodal unificado que se ejecuta en portátiles Google ha presentado Gemma 4 12B, un nuevo modelo de inteligencia artificial de código abierto que destaca por su arquitectura multimodal unificada y por su capacidad de ejecutarse en portátiles convencionales

29 May 2026

Liquid AI lanza LFM2.5 con ventana de contexto de 128k tokens

Liquid AI ha anunciado hoy el lanzamiento de LFM2.5-8B-A1B, una evolución de su modelo de 'Mixture-of-Experts' diseñada para ejecutarse de manera eficiente y privada en hardware de consumo. Esta nueva versión, disponible bajo licencia abierta, supera a su predecesor al expandir su ventana de context

05 May 2026

Gemma 4: Google acelera modelos de lenguaje

Google ha anunciado el lanzamiento de "Redactores de Predicción de Múltiples Tokens (MTP)" para la familia de modelos Gemma 4, una actualización diseñada para acelerar significativamente la inferencia de estos modelos de lenguaje de código abierto. Estos redactores utilizan una arquitectura de decod

19 Apr 2026

Apple Silicon: GPU y WebAssembly comparten memoria

Apple ha habilitado una innovadora técnica de inferencia de GPU sin copia en sus chips Silicon, permitiendo que los módulos WebAssembly (Wasm) compartan directamente su memoria lineal con la GPU. Tradicionalmente, la comunicación entre Wasm y la GPU implicaba costosas copias de datos a través de un

05 Apr 2026

Gemma 4 de Google: IA potente ahora en tu PC

Google ha lanzado la familia de modelos Gemma 4, que ahora puede ejecutarse localmente en dispositivos gracias a la nueva versión 0.4.0 de LM Studio. Esta actualización introduce 'llmster' y la CLI 'lms', permitiendo a los usuarios ejecutar modelos como Gemma 4 26B en sus propios ordenadores, elimin

03 Apr 2026

Gemma 4 en Mac Mini: Ejecuta IA localmente

Usuarios de Mac Mini con chips Apple Silicon (M1, M2, M3, M4 o M5) ahora pueden ejecutar el modelo de lenguaje Gemma 4 26B localmente gracias a una guía publicada en GitHub. El proceso, relativamente sencillo, implica la instalación de la aplicación Ollama a través de Homebrew, que gestiona las actu

01 Apr 2026

SwiftLM: LLMs nativos y rápidos en Apple Silicon

Un equipo de desarrolladores ha lanzado SwiftLM, un servidor de inferencia nativo para dispositivos Apple Silicon que ofrece compatibilidad con la API de OpenAI. Esta herramienta, de código abierto, elimina la necesidad de un entorno de ejecución de Python y el Global Interpreter Lock (GIL), lo que

31 Mar 2026

Ollama optimiza IA en Apple Silicon con MLX

Ollama ha anunciado una versión preliminar que optimiza significativamente el rendimiento de sus modelos de lenguaje en dispositivos Apple Silicon. La actualización, disponible desde el 30 de marzo de 2026, integra el framework de aprendizaje automático MLX de Apple, aprovechando su arquitectura de

02 Mar 2026

llmfit: Herramienta optimiza LLMs según tu hardware

Un nuevo terminal tool llamado `llmfit` ha sido desarrollado para simplificar la implementación de modelos de lenguaje grandes (LLM) en función del hardware disponible. Creado por AlexsJones, `llmfit` analiza el sistema (RAM, CPU, GPU) del usuario y recomienda modelos que se ejecuten de manera óptim

Noticias que mencionan MLX