OpenAI presentó este miércoles Jalapeño, su primer procesador de inferencia diseñado y fabricado en colaboración con Broadcom. El chip, optimizado para los sistemas de inferencia de la compañía, fue desarrollado con la asistencia de los propios modelos de inteligencia artificial de OpenAI. Según la empresa, las pruebas iniciales muestran una relación rendimiento por vatio significativamente superior a la de las alternativas más avanzadas del mercado.
El anuncio formal de la alianza con Broadcom se produjo en octubre, aunque los planes de OpenAI para fabricar silicio propio eran conocidos desde hacía meses como parte de su estrategia para reducir la dependencia de las GPU de Nvidia. Google y Amazon ya habían recorrido un camino similar con sus respectivos aceleradores de IA.
El presidente de OpenAI, Greg Brockman, enmarcó el proyecto como una búsqueda de cargas de trabajo mal atendidas: “Hemos buscado cargas de trabajo específicas que están desatendidas y nos hemos preguntado cómo construir algo que acelere lo posible”. Jalapeño está diseñado en exclusiva para inferencia, es decir, la ejecución de modelos ya entrenados en respuesta a peticiones del usuario, y la compañía destacó su bajo coste operativo al ejecutar modelos de programación en tiempo real. El entrenamiento previo de modelos seguirá dependiendo del hardware de Nvidia.
OpenAI enmarcó la iniciativa en una estrategia integral de optimización vertical que abarca arquitectura de chips, kernels, sistemas de memoria, redes, programación e implementación, con el objetivo de hacer sus modelos más rápidos, fiables y asequibles.
