07 May 2026 · Original en inglés · Resumen IA

zyphra lanza modelo de lenguaje competitivo con amd

Fuentes: ZAYA1-8B Matches DeepSeek-R1 on Math with Less Than 1B Active Parameters. - Firethering

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento, acercándose a Gemini 2.5 Pro en codificación, todo ello utilizando menos de mil millones de parámetros activos. Un aspecto crucial es que el modelo fue entrenado íntegramente en hardware AMD Instinct MI300X, rompiendo con la dependencia habitual de NVIDIA en el desarrollo de IA. Zyphra ha implementado una técnica innovadora llamada Markovian RSA, que permite al modelo mejorar su rendimiento a medida que se le proporciona más potencia de cálculo, superando incluso a modelos con muchos más parámetros. Si bien ZAYA1-8B sobresale en tareas de razonamiento y codificación, presenta limitaciones en áreas como la ejecución de agentes y el seguimiento de instrucciones complejas. El modelo está disponible en Zyphra Cloud y sus pesos están disponibles en Hugging Face bajo una licencia Apache 2.0, aunque requiere una versión modificada de vLLM para su despliegue local.

Temas

ia tecnologia

Etiquetas

zyphra zaya1-8b amd deepseek-r1 inteligencia artificial markovian rsa hardware modelos de lenguaje programación matemáticas

Entidades mencionadas

Zyphra organization

Zyphra es un grupo de heavy metal originario de Madrid, España. Fue creado en 2005 por David Aldana y Juan Carlos Patón (ex-Caskärrabias).

Ver en Wikipedia

ZAYA1-8B software

DeepSeek-R1 software

Claude Sonnet 4.5 software

Gemini 2.5 Pro software

AMD organization

Advanced Micro Devices, Inc. (AMD) es una compañía tecnológica estadounidense de semiconductores con sede en Santa Clara, California, que desarrolla procesadores de computación y productos tecnológico

Ver en Wikipedia

Nvidia organization

NVIDIA Corporation es una empresa tecnológica de software y fabless que desarrolla unidades de procesamientos gráficos (GPU), interfaz de programación de aplicaciones (API) para ciencia de datos y com

Ver en Wikipedia

H100 hardware

A100 hardware

GB200 hardware

AMD Instinct MI300X GPUs hardware

IBM organization

International Business Machines Corporation (IBM) es una empresa tecnológica multinacional estadounidense con sede en Armonk, Nueva York. IBM fabrica y comercializa hardware y software para computado

Ver en Wikipedia

AMD Pensando Pollara hardware

AIME 2026 event

Mistral Small 4 software

HMMT February event

LiveCodeBench event

Qwen3-4B software

Gemma 4 E4B software

Markovian RSA software

APEX-shortlist event

DeepSeek-V3.2 software

GPT-OSS-High software

BFCL-V4 software

TAU2 software

IFEval software