04 Apr 2026 · Original en inglés · Resumen IA

TQ4_1S: LLMs más pequeños para dispositivos Apple

Fuentes: New TQ4_1S compression method shrinks LLMs for Metal devices

Un desarrollador ha presentado una nueva técnica de compresión de modelos de lenguaje grandes (LLM) llamada TQ4_1S, diseñada específicamente para dispositivos Apple con chips Metal. Esta técnica reduce el tamaño de los modelos en un 27-38%, dependiendo del modelo, sin necesidad de reentrenamiento ni modificación del modelo original. Los modelos Qwen y Llama mostraron resultados prometedores, con una reducción de tamaño significativa y un impacto mínimo en la calidad de la generación de texto (PPL, Perplexity). La técnica utiliza una combinación de rotación WHT y cuantización Lloyd-Max para comprimir los pesos del modelo. Aunque la etapa de cuantización es compatible con cualquier plataforma, los kernels de descompresión son exclusivos de Metal, lo que significa que los modelos comprimidos no funcionarán en CUDA o HIP hasta que se porten los backends correspondientes. Se están realizando pruebas adicionales para asegurar la compatibilidad con otros modelos y plataformas, y se espera que la técnica mejore el rendimiento de los LLM en dispositivos Apple.

Temas

ia empresas

Etiquetas

llama-cpp metal llm quantization apple thetom compression qwen llama

Entidades mencionadas

Qwen software

CUDA software

M5 Max hardware

QJL software

turboquant_plus software

Metal software

PHI software

TQ4_1S software

WHT software

Lloyd-Max software

Qwen2.5-1.5B software

Qwen3.5-27B software

Qwen3.5-35B MoE software

Qwen2.5-72B software

Phi-4 14B software

Llama 3.1 70B software

Hybrid software

Premium software

Q4_K_M software

llama-quantize software

M2 Pro hardware

turbo3 software

turbo4 software

TheTom organization

The Tomorrow People es una serie de televisión estadounidense de ciencia ficción creada por Phil Klemmer, Greg Berlanti y Julie Plec para la cadena The CW. Basada en la serie de televisión británica o

Ver en Wikipedia

signalnine person

Signoline Kanyamuneza es una deportista burundesa que compite en judo. Ganó una medalla de bronce en el Campeonato Africano de Judo de 2020 en la categoría de –48 kg.

Ver en Wikipedia

Apple organization

Apple es una empresa tecnológica estadounidense conocida por el diseño y desarrollo de productos como el MacBook Neo, que está siendo comparado en la noticia con el Framework 12. Su lanzamiento ha red

Ver en Wikipedia

Claude Code software

Claude Monet fue un pintor francés, uno de los creadores del impresionismo. El término impresionismo deriva del título de su obra Impresión, sol naciente (1872).

GitHub organization

GitHub es una plataforma en línea utilizada para alojar y gestionar proyectos de software, incluyendo el código fuente de Secluso, la startup de privacidad que ha lanzado un sistema de seguridad para

Ver en Wikipedia