Un ingeniero de RemObjects descubrió que compilar aplicaciones para AVX2 resulta en un rendimiento más lento que compilar para SSE2-4.x en Windows ARM cuando se ejecuta bajo la emulación Prism. Esta conclusión, contraintuitiva, surge de pruebas de rendimiento de benchmarks matemáticos en Windows ARM, donde se esperaba que AVX2 compensara la sobrecarga de la emulación. Windows ARM emula código x86/64 traduciéndolo a ARM en tiempo real, y recientemente ha actualizado su capa de emulación Prism para mejorar el rendimiento, apuntando a una velocidad similar a la de Rosetta 2 de Apple. Anteriormente, la emulación se limitaba a versiones x64 v2 (SSE2-4.x), pero ahora soporta v3 (AVX2). La investigación, realizada con un nuevo conjunto de benchmarks de una biblioteca de matemáticas vectorizadas, revela que, sorprendentemente, el uso de AVX2 en la emulación resulta menos eficiente que el uso de SSE2-4.x. Por lo tanto, para aplicaciones que podrían ejecutarse en Windows ARM, la recomendación es compilar para SSE2-4.x si el rendimiento es una prioridad.
