Noticias que mencionan AVX2

AVX2 frena emulación de Windows en ARM

Un ingeniero de RemObjects descubrió que compilar aplicaciones para AVX2 resulta en un rendimiento más lento que compilar para SSE2-4.x en Windows ARM cuando se ejecuta bajo la emulación Prism. Esta conclusión, contraintuitiva, surge de pruebas de rendimiento de benchmarks matemáticos en Windows ARM

Optimiza tu código C: rendimiento y portabilidad

Este artículo explora técnicas para optimizar el rendimiento de software C, especialmente en arquitecturas x86-64, donde la capacidad de la CPU juega un papel crucial. El problema radica en que el código optimizado para una CPU específica puede no funcionar bien en otras, limitando la portabilidad.

Forkrun: Nuevo Software Acelera Procesamiento en Linux

Un nuevo software llamado `forkrun` está revolucionando el procesamiento paralelo en sistemas Linux, ofreciendo mejoras de velocidad significativas en comparación con herramientas tradicionales como GNU Parallel. Desarrollado por Jkool y disponible en GitHub, `forkrun` se presenta como un reemplazo

Intel optimiza código, afecta resultados de Geekbench

Intel ha implementado una herramienta de optimización binaria (BOT) que modifica el código de ciertas aplicaciones para mejorar su rendimiento, incluyendo versiones específicas de la prueba de rendimiento Geekbench. Según un análisis realizado por Geekbench, BOT introduce un retraso inicial de 40 se

Foxing: Replicación de archivos Linux casi en tiempo real

Un nuevo sistema de replicación de sistemas de archivos para Linux, llamado Foxing, ha sido anunciado por Joel Wirāmu Pauling en codeberg.org. Foxing se distingue por utilizar eBPF (Extended Berkeley Packet Filter) para capturar eventos del sistema de archivos en el kernel y replicarlos de forma así

TurboQuant en Rust: búsqueda vectorial más veloz

Un investigador ha implementado en Rust 'TurboQuant', un algoritmo de Google Research para la búsqueda vectorial, ofreciendo una alternativa más rápida y eficiente a métodos como FAISS. La implementación, disponible en GitHub, incluye bindings para Python a través de PyO3, facilitando su uso. TurboQ

Agente IA optimiza código, mejora rendimiento en IA

Un agente de codificación ha logrado optimizar el código de Flash Attention en llama.cpp en un 15% para x86 y un 5% para ARM, gracias a la incorporación de una fase de investigación previa a la codificación. El equipo de SkyPilot, utilizando la herramienta autoresearch (y su versión generalizada, pi

Geekbench 6: ¿nueva referencia para medir rendimiento?

Este artículo de Chips and Cheese evalúa Geekbench 6, una suite de benchmarks diseñada para pruebas de rendimiento en sistemas modernos, comparándola con el estándar de la industria SPEC CPU2017. Geekbench, a diferencia de SPEC CPU2017 que se distribuye en código fuente, se entrega en formato binari

Nuevo compresor 'fc' optimiza la compresión de datos de punto flotante

Se ha publicado 'fc' (floating-point compressor), una nueva herramienta de compresión sin pérdida diseñada específicamente para streams de números en formato IEEE-754 de 64 bits. Desarrollada por Praveen Vaddadi bajo licencia Apache 2.0, la versión actual es fc 1.56. El compresor divide la entrada e