07 Apr 2026 · Original en inglés · Resumen IA

IA multimodal en Mac: nueva herramienta facilita el ajuste

Fuentes: Toolkit Enables Multimodal AI Fine-Tuning on Apple Silicon

Un nuevo toolkit llamado 'gemma-tuner-multimodal' permite a los usuarios afinar modelos Gemma de Google para tareas de inteligencia artificial multimodal (texto, imágenes y audio) directamente en Macs con Apple Silicon. La herramienta, desarrollada por Mattmireles y disponible en GitHub, elimina la necesidad de costosas GPUs NVIDIA o la transferencia de grandes cantidades de datos a un ordenador portátil. Ofrece soporte para el ajuste fino de Gemma con datos de texto, imágenes y audio, incluyendo la capacidad de procesar datos que no caben en la memoria RAM del Mac mediante streaming desde servicios en la nube como Google Cloud Storage (GCS) o BigQuery. Esto abre la puerta a aplicaciones como la adaptación de modelos a jerga específica (por ejemplo, en dictados médicos o grabaciones de centros de llamadas), la comprensión de documentos y pantallas, y la creación de asistentes multimodales. El toolkit utiliza Hugging Face Gemma checkpoints y PEFT LoRA, y se destaca por ser la única solución nativa para Apple Silicon que admite el ajuste fino de modelos con audio. La herramienta facilita la creación de pipelines privados y en dispositivo, donde los datos y los pesos del modelo nunca abandonan el dispositivo.

Temas

empresas

Etiquetas

gemma apple silicon multimodal ai hugging face lora google machine learning finetuning macos mattmireles

Entidades mencionadas

Transformers software

pytorch software

H100 hardware

Core ML software

Whisper software

Gemma software

Apple Silicon hardware

Rosetta software

MPS software

CSV software

Hugging Face organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

BigQuery software

LoRa software

GGUF software

Apple organization

Apple, Inc. es una empresa tecnológica multinacional con sede en Cupertino, California, Estados Unidos. Es la empresa de tecnologías de la información y la comunicación más grande del mundo por ingres

Ver en Wikipedia

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia

Gemma 4 software

Nvidia organization

NVIDIA Corporation es una empresa tecnológica de software y fabless que desarrolla unidades de procesamientos gráficos (GPU), interfaz de programación de aplicaciones (API) para ciencia de datos y com

Ver en Wikipedia

PEFT software

Gemma 3n software

gemma-tuner-multimodal software

GCS regulation

El Certificado General de Educación Secundaria es un grupo de títulos británicos obtenidos a través de exámenes que llevan a cabo estudiantes de entre 15 y 16 años en las escuelas secundarias de Gales

Ver en Wikipedia