simd - ojeo.com

09 Jun 2026

transit.c: lector y escritor Transit en C11 con aceleración SIMD

transit.c es una biblioteca en C11 que implementa un lector y escritor para el formato Transit, un sistema de intercambio de datos entre aplicaciones escritas en distintos lenguajes y creado originalmente por Cognitect dentro del ecosistema Clojure. Transit se apoya en JSON y MessagePack, por lo que

09 Jun 2026

Rayforce: base de datos columnar en C puro con analítica y grafos en un único pipeline

Rayforce es un motor embebible escrito en C17 sin dependencias externas que combina analítica columnar y recorridos de grafos dentro de un mismo pipeline. Su arquitectura se articula en tres fases: construcción de un grafo de operaciones (DAG) perezoso, optimización con múltiples pases —inferencia d

05 Jun 2026

Experimentos de Go: qué son, cómo funcionan y lista actual

Los experimentos de Go son funcionalidades que el equipo de Go incorpora en sus lanzamientos para obtener retroalimentación real antes de consolidarlas. Pueden presentarse como paquetes nuevos en la biblioteca estándar, cambios en el compilador o el runtime, e incluso modificaciones de comportamient

03 Jun 2026

rscrypto: pila criptográfica en Rust puro con aceleración SIMD y ASM

rscrypto es una biblioteca criptográfica escrita en Rust puro que agrupa primitivas como RSA, Ed25519, X25519, cifrados AEAD, funciones hash, KDF, hash de contraseñas y CRCs en un único crate, sin requerir de forma predeterminada dependencias en C, OpenSSL u otras bibliotecas de sistema. Su objetivo

17 May 2026

C++26 incluye std::simd para escribir código SIMD portable entre arquitecturas

C++26 incluye std::simd (P1928), una biblioteca de abstracción SIMD portable que permite escribir código SIMD una vez y compilarlo para diferentes arquitecturas como AVX2, AVX-512, NEON y SVE. El proyecto fue iniciativa de Matthias Kretz, investigador del centro alemán GSI, quien desarrolló la bibli

11 May 2026

Swift alcanza Teraflops entrenando LLMs en Apple Silicon

Este artículo explora cómo optimizar operaciones de multiplicación de matrices en Swift para entrenar Large Language Models (LLMs) en Apple Silicon, buscando alcanzar rendimiento de Teraflop/s desde el punto de partida de Gigaflops. El autor, Matt Gallagher, toma como referencia la implementación ll

25 Apr 2026

Blender simula el cosmos: física y arte se unen

Este artículo, escrito por MohammadHossein Jamshidi (un estudiante de doctorado en Física/Cosmología y también ingeniero de animación con experiencia en la industria de los videojuegos), explora el uso innovador de Nodos de Geometría en Blender para aplicaciones cosmológicas. El objetivo principal e

20 Apr 2026

IA mejora código ensamblador y acelera rendimiento

Investigadores han demostrado que la inteligencia artificial (IA), específicamente modelos como Grok y Claude, pueden optimizar código en lenguaje ensamblador, logrando mejoras significativas en el rendimiento. Daniel Lemire, investigador, llevó a cabo un experimento donde solicitó a estas IA que op

20 Apr 2026

PlanB: Nueva Biblioteca Acelera Enrutamiento IPv6

Un nuevo desarrollador ha creado una biblioteca de código abierto llamada `planb-lpm` que mejora significativamente la eficiencia del enrutamiento IPv6. Basada en un algoritmo publicado recientemente (PlanB) y reimplementada en C++17, la biblioteca utiliza un árbol B+ linealizado con AVX-512 SIMD pa

16 Apr 2026

Entendiendo los Microprocesadores: Más allá de la Velocidad

Este artículo ofrece una introducción rápida y accesible a la arquitectura de microprocesadores modernos, desmitificando conceptos clave que a menudo se pasan por alto en los cursos de informática. El objetivo principal es explicar por qué la velocidad de reloj (megahertz) no es el único indicador d

11 Apr 2026

Menos es más: ¿cuánta memoria contigua es necesaria?

Este artículo de Solidean investiga la cantidad óptima de contigüidad de memoria lineal necesaria para un rendimiento máximo en cálculos de alta velocidad. La sabiduría convencional dicta que la memoria lineal y contigua siempre es la mejor opción, pero este estudio experimental desafía esa idea, de

04 Apr 2026

TurboQuant: Compresión vectorial veloz para navegadores

Un equipo de desarrolladores ha lanzado una nueva biblioteca llamada TurboQuant, diseñada para permitir la compresión rápida de vectores directamente en navegadores web y Node.js. La biblioteca, basada en la investigación de Google (paper a presentarse en ICLR 2026), utiliza WebAssembly (WASM) y SIM

13 Mar 2026

ARM Neon: cálculo más rápido con nueva técnica

Un nuevo método para calcular sumas de prefijos (prefix sums) en procesadores ARM Neon ha logrado velocidades de hasta 8.9 mil millones de valores por segundo en un Apple M4, superando significativamente el enfoque tradicional (3.9 mil millones de valores por segundo). La técnica, desarrollada por D

02 Mar 2026

libxml2-ee: mejora la biblioteca para XML

libxml2-ee es una versión mejorada de la popular biblioteca libxml2, un conjunto de herramientas en C para procesar documentos XML. Originalmente, libxml2 es una biblioteca fundamental para muchos proyectos que necesitan analizar, manipular y generar archivos XML. libxml2-ee se centra en optimizar e

21 Feb 2026

SIMD x86: Evolución tecnológica y estrategias corporativas

Este artículo de bgslabs.org narra la fascinante historia de la evolución de las extensiones SIMD (Single Instruction, Multiple Data) en los procesadores x86, desde MMX hasta AVX-512, revelando que su desarrollo no es solo una cuestión de tecnología, sino también de marketing, política corporativa y

14 Feb 2026

Registros x86-64: ¿Cuántos y por qué importa?

El artículo explora la complejidad de la arquitectura de registros en las CPUs x86-64, un aspecto que ha resurgido en la discusión de programación gracias a tecnologías como Rosetta 2 de Apple. A diferencia de otras arquitecturas modernas, x86-64 ofrece una gran cantidad y diversidad de registros, l

12 Feb 2026

RISC-V Vector: Acelera el Procesamiento con Paralelismo

## Entendiendo RISC-V Vector: Acelerando el Procesamiento con Instrucciones Paralelas RISC-V Vector es una extensión a la arquitectura RISC-V que introduce la capacidad de procesar múltiples datos simultáneamente, un concepto fundamental para acelerar tareas como el procesamiento de imágenes, el ap

09 Feb 2026

Llamadas a funciones: ¿Cuánto cuestan y cómo optimizarlas?

En programación, es común encadenar funciones, donde una función llama a otra. Aunque esto es una práctica habitual, cada llamada de función tiene un costo en términos de rendimiento. Este artículo explora ese costo y cómo los compiladores pueden optimizarlo a través de una técnica llamada 'inlining

08 Feb 2026

Bun: Ejecución Paralela de Scripts Acelera Desarrollo

Bun, un entorno de ejecución y gestor de paquetes JavaScript, ha lanzado la versión v1.3.9, introduciendo mejoras significativas en la ejecución de scripts y el rendimiento. La nueva versión permite la ejecución paralela y secuencial de scripts `package.json` con una salida formateada similar a Fore

07 Feb 2026

Zlob: Globbing más rápido para C, Zig y Rust

Un nuevo proyecto llamado 'zlob' ha lanzado una biblioteca de globbing (búsqueda de patrones en archivos) significativamente más rápida para C, Zig y Rust. La biblioteca, disponible como librería C, librería Zig y crate Rust, busca solucionar la lentitud y limitaciones de la función `glob()` de gli