Wafer logra 2.626 tok/s por nodo en AMD MI355X sirviendo GLM 5.2 con la mitad de coste que Blackwell
Wafer, proveedor de inferencia, ha anunciado resultados de rendimiento del modelo GLM 5.2 sobre GPUs AMD Instinct MI355X, alcanzando 2.626 tokens por segundo por nodo en una carga agregada y 213 tokens por segundo en flujo único, con un coste por dólar más de dos veces inferior al de un sistema basa
