05 May 2026 · Original en inglés · Resumen IA

Gemma 4: Google acelera modelos de lenguaje

Fuentes: Accelerating Gemma 4: faster inference with multi-token prediction drafters

Google ha anunciado el lanzamiento de "Redactores de Predicción de Múltiples Tokens (MTP)" para la familia de modelos Gemma 4, una actualización diseñada para acelerar significativamente la inferencia de estos modelos de lenguaje de código abierto. Estos redactores utilizan una arquitectura de decodificación especulativa que permite hasta un 3x de aumento en la velocidad de procesamiento sin comprometer la calidad de la salida ni la lógica de razonamiento. La mejora se logra al permitir que un modelo más pequeño (el redactor) prediga múltiples tokens simultáneamente mientras el modelo principal (Gemma 4) verifica las predicciones en paralelo, optimizando el uso de la potencia de cálculo y reduciendo la latencia, especialmente en hardware de consumo.

Esta innovación aborda una limitación común en la inferencia de LLMs, donde el proceso está limitado por el ancho de banda de la memoria. Los redactores MTP ofrecen beneficios significativos para los desarrolladores, incluyendo una mayor capacidad de respuesta en aplicaciones en tiempo real, un desarrollo local más rápido y un mejor rendimiento en dispositivos de borde, como teléfonos móviles. Los modelos Gemma 4 con redactores MTP están disponibles bajo la licencia Apache 2.0 y se pueden descargar desde Hugging Face, Kaggle y otras plataformas, invitando a la comunidad a explorar y aprovechar esta mejora en la eficiencia de la IA.

Temas

ia desarrollo empresas tecnologia

Etiquetas

google gemma 4 inteligencia artificial modelos de lenguaje open source inferencia decodificación especulativa gemmaverse hardware desarrollo de software

Entidades mencionadas

Gemma 4 software

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

LiteRT-LM software

MLX software

Hugging Face Transformers software

vLLM software

NVIDIA RTX PRO 6000 hardware

Apple Silicon hardware

Nvidia A100 hardware

Google AI Edge Gallery organization

Explore, Experience, and Evaluate the Future of On-Device Generative AI with Google AI Edge. AI Edge Gallery is the premier destination for running the world's most powerful open-source Large Lan

Android software

Android es un sistema operativo móvil basado en el núcleo Linux y otros componentes software de código abierto. Está diseñado para dispositivos móviles con pantalla táctil, como teléfonos inteligentes

Ver en Wikipedia

iOS software

Apache 2.0 protocol_standard

Hugging Face organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

Kaggle organization

Kaggle, una subsidiaria de Google LLC, es una comunidad en línea de científicos de datos y profesionales del aprendizaje automático. Kaggle permite a los usuarios encontrar y publicar conjuntos de dat

Ver en Wikipedia

SGLang software

Ollama software

Gemmaverse group_movement