Arm X925: Rendimiento de Escritorio en Móviles

Fuentes: Arm's Cortex X925: Reaching Desktop Performance, osnews.com

Arm X925: Rendimiento de Escritorio en Móviles, una Realidad en Proceso

Durante años, Arm ha sido sinónimo de eficiencia energética y diseño compacto en el mundo de los procesadores móviles. Sin embargo, la compañía británica ha estado trabajando silenciosamente para desafiar el dominio de Intel y AMD en el segmento de alto rendimiento, y el nuevo núcleo Cortex X925 marca un hito significativo en esa ambición. Gracias a su implementación en el chip GB10 de Nvidia, utilizado en la serie Pro Max de Dell, el X925 está alcanzando niveles de rendimiento comparables a los de los procesadores de escritorio más potentes, como los Zen 5 de AMD y los Lion Cove de Intel.

Un Salto Cualitativo en el Diseño de Núcleos Arm

El camino de Arm hacia el alto rendimiento ha sido gradual. Desde el lanzamiento de su primer núcleo de 64 bits, el Cortex A57 en 2012, la compañía ha ido incorporando complejidad y potencia a sus diseños. Tradicionalmente, Arm ha priorizado la eficiencia energética y el tamaño reducido, mientras que Intel y AMD se han centrado en el rendimiento bruto a través de núcleos de alta frecuencia y gran capacidad de procesamiento fuera de orden. Ahora, el X925 representa un cambio radical, un núcleo diseñado desde cero para maximizar el rendimiento, sin las concesiones habituales en eficiencia.

Según chipsandcheese.com, el X925 es un núcleo “masivo” de 10 vías, con una gran cantidad de recursos dedicados a la ejecución de tareas complejas. Dell ha permitido a chipsandcheese.com probar el chip GB10 en su serie Pro Max, proporcionando datos concretos sobre su rendimiento. El chip GB10 utiliza diez núcleos X925, distribuidos en dos clusters, con uno de los núcleos alcanzando una frecuencia de 4 GHz y los demás operando a 3.9 GHz.

Arquitectura y Características Clave

El X925 se distingue por su diseño integral para el rendimiento. A diferencia de los núcleos de la serie 7, como el A725, no se realizan concesiones significativas para reducir el consumo de energía o el tamaño. Esto se refleja en su arquitectura, que incluye una capacidad de reordenamiento superior a la de Zen 5 de AMD y una capacidad de caché L2 comparable a la de los núcleos P-Cores más recientes de Intel. La configuración de la caché L2 ofrece opciones de 2 MB o 3 MB, y se pueden elegir diferentes granularidades de corrección de errores (ECC) para equilibrar el rendimiento y la fiabilidad.

El núcleo se integra con el DSU-120, un interconnect de nivel de cluster que también alberga una caché L3 de hasta 32 MB. Aunque el X925 y su DSU admiten direcciones físicas de 40 bits, lo que es suficiente para sistemas de consumo, no están diseñados para aplicaciones de servidor que requieren espacios de direcciones más grandes (48 o 52 bits).

Predicción de Ramas y Recuperación de Instrucciones: Imitando a la Competencia

Un aspecto crucial del rendimiento de cualquier procesador es la precisión en la predicción de ramas. El X925 destaca en este aspecto, con un predictor capaz de reconocer patrones complejos y repetitivos, similar al de Zen 5 de AMD. También cuenta con un sistema de caché de objetivos de rama (BTB) de gran capacidad, capaz de rastrear hasta 2048 ramas, acercándose a la capacidad de Zen 5. En pruebas SPEC CPU2017, el X925 ha demostrado una precisión en la predicción de ramas comparable o incluso superior a la de Zen 5 y ligeramente mejor que la de Lion Cove de Intel.

En cuanto a la recuperación de instrucciones, el X925 elimina la caché MOP (Micro-Op Cache) presente en generaciones anteriores de núcleos Arm, una decisión justificada por la optimización de otros aspectos de la recuperación, como la decodificación previa. El frontend puede sostener 10 instrucciones por ciclo, aunque este rendimiento puede verse afectado al usar páginas de 4 KB. El uso de páginas de 2 MB permite alcanzar el máximo rendimiento, siempre que el código quepa en la caché de instrucciones de 64 KB.

Innovaciones y Divergencias con la Línea de Núcleos Arm

El X925 introduce algunas innovaciones interesantes, como la capacidad de fusionar pares de instrucciones NOP (No Operation) en una sola MOP. Sin embargo, también presenta algunas divergencias con otros núcleos Arm. Por ejemplo, a diferencia del núcleo A725, el X925 no tiene un manejo especial para la instrucción PTRUE (Predicate TRUE), que establece un registro de predicado SVE (Scalable Vector Extension) para habilitar todas las carriles. Esta diferencia refleja la priorización del rendimiento en el X925 sobre la optimización de energía que caracteriza a otros núcleos Arm.

Implicaciones y Perspectivas Futuras

La aparición del Cortex X925 marca un punto de inflexión en la industria de los procesadores. No solo demuestra la capacidad de Arm para competir en el segmento de alto rendimiento, sino que también abre nuevas posibilidades para los dispositivos móviles y portátiles. La capacidad de ejecutar aplicaciones de escritorio exigentes en dispositivos móviles podría revolucionar la forma en que interactuamos con la tecnología. Sin embargo, es importante tener en cuenta que el X925 está diseñado para el rendimiento, lo que podría implicar un mayor consumo de energía y una menor duración de la batería en comparación con los núcleos Arm más tradicionales. Además, la falta de soporte para espacios de direcciones de memoria más grandes limita su aplicabilidad en entornos de servidor.

El futuro del X925 y sus sucesores dependerá de cómo Arm equilibre el rendimiento con la eficiencia energética y la escalabilidad. Es probable que veamos una mayor integración de esta tecnología en una gama más amplia de dispositivos, desde teléfonos inteligentes de gama alta hasta portátiles y estaciones de trabajo.

En resumen, el Arm Cortex X925 representa un avance significativo en la tecnología de procesadores, acercando el rendimiento de escritorio al mundo móvil y abriendo nuevas posibilidades para la innovación en el futuro.