OpenAI y Broadcom presentan Jalapeño, su primer chip de inferencia para modelos de lenguaje

Fuentes: OpenAI and Broadcom unveil Jalapeño, an LLM-optimized inference chip

OpenAI y Broadcom han presentado Jalapeño, el primer procesador de inteligencia artificial de la compañía, un acelerador diseñado desde cero para optimizar la inferencia de modelos de lenguaje de gran tamaño (LLM). El chip fue entregado al consejero delegado de OpenAI, Sam Altman, y al presidente Greg Brockman por el presidente de Broadcom, Hock Tan, y por Charlie Kawwas. Su desarrollo, desde el diseño inicial hasta la fabricación, se completó en nueve meses —el ciclo de desarrollo ASIC más rápido, según ambas empresas, logrado en semiconductores avanzados de alto rendimiento— gracias a la co-diseño software-hardware y al uso de los propios modelos de OpenAI para acelerar partes del diseño.

Las muestras de ingeniería de Jalapeño ya ejecutan cargas de trabajo de aprendizaje automático en el laboratorio a la frecuencia y potencia objetivo de producción, incluyendo el modelo GPT-5.3-Codex-Spark. Las pruebas iniciales indican que el chip ofrecerá una eficiencia energética por vatio sustancialmente superior a la del estado del arte actual, aunque OpenAI aún mide el rendimiento definitivo y prevé publicar un informe técnico detallado en los próximos meses.

El chip fue diseñado por OpenAI en colaboración con Broadcom y Celestica, y se desplegará a escala de gigavatios en centros de datos de socios como Microsoft a partir de finales de 2026, con ampliaciones previstas en años posteriores. La arquitectura, no adaptada de cargas de IA anteriores sino concebida para LLM modernos, reduce el movimiento de datos y equilibra computación, memoria y red para acercar el uso real al rendimiento teórico máximo. Es compatible con los LLM actuales y futuros de toda la industria y forma parte de una plataforma informática de varias generaciones dentro de la estrategia de pila completa de OpenAI.