AMD en MLPerf Training 6.0: la Instinct MI355X se acerca a Blackwell y escala por primera vez a múltiples servidores

Fuentes: AMD bei MLPerf Training 6.0: Instinct MI355X nähert sich Blackwell und skaliert erstmals über mehrere Server

AMD presentó el 16 de junio de 2026 sus resultados en la ronda MLPerf Training 6.0, la participación más completa de la compañía hasta la fecha, con pruebas para las GPU Instinct MI325X, MI350X y MI355X. Por primera vez, AMD envió resultados de entrenamiento distribuido en varios servidores, incluido un sistema de Oracle Cloud Infrastructure con 512 Instinct MI300X (64 servidores con 8 GPU cada uno) para entrenar el modelo de texto a imagen FLUX.1, la mayor configuración registrada en esa prueba. En los benchmarks de modelos de lenguaje, AMD comparó sistemas de 8 MI355X con sistemas de 8 NVIDIA B200: en el ajuste fino LoRA de Llama 2 70B, la MI355X se sitúa a un 5 % del sistema Blackwell, y en el preentrenamiento de Llama 3.1 8B, a un 6 %. AMD empleó el formato de precisión reducida MXFP4 en ambos tests, con una fase de "curación" en FP8 para el ajuste fino de Llama 2 70B, ya que la baja precisión no permitía por sí sola alcanzar la calidad exigida. La MI355X también完成ó el ajuste fino de Llama 2 70B 3,5 veces más rápido que la primera entrega de la MI300X en MLPerf Training 5.0, una ganancia que combina cambio de arquitectura (CDNA 3 a CDNA 4), nuevo software ROCm y el debut del framework Primus, que unifica la orquestación del entrenamiento. Frente a la ronda anterior, AMD reporta mejoras del 19 % en Llama 2 y del 13 % en Llama 3.1. La participación demuestra que ROCm y la pila de software de AMD ya sostienen cargas multi-servidor estandarizadas, aunque los benchmarks no incluyen comparaciones de coste, consumo ni cargas reales de clientes.