El problema oculto de Go: abstracciones que ralentizan el código crítico

Este artículo explora un problema fundamental en la optimización de rendimiento en Go: la ausencia de abstracciones de costo cero en las rutas críticas de código (hot paths). El autor, al portar el algoritmo Brotli a Go puro para el proyecto go-brrr, descubrió que las abstracciones idiomáticas del l

pc engine: la consola de 8 bits que sorprendió

Este artículo explora la CPU del PC Engine (TurboGrafx-16), una consola de videojuegos lanzada en 1987 que se encuentra en una posición peculiar entre la tercera y cuarta generación de consolas. A pesar de su nombre, la consola no utiliza una CPU de 16 bits, sino una basada en el 65C02, un procesado

Geekbench 6: ¿nueva referencia para medir rendimiento?

Este artículo de Chips and Cheese evalúa Geekbench 6, una suite de benchmarks diseñada para pruebas de rendimiento en sistemas modernos, comparándola con el estándar de la industria SPEC CPU2017. Geekbench, a diferencia de SPEC CPU2017 que se distribuye en código fuente, se entrega en formato binari

Aficionado construye CPU casera y la comparte online

Un entusiasta de los proyectos de bricolaje ha construido y documentado una CPU de 4 bits llamada TD4, inspirándose en el libro japonés "How to Build a CPU" de Kaoru Tonami. El proyecto, que requirió traducir el libro y ensamblar los componentes, involucró la construcción de una CPU funcional utiliz

Monero: así funciona su minería resistente a ASICs

Monero utiliza un sistema de prueba de trabajo (Proof of Work - PoW) llamado RandomX para asegurar su red y crear nuevas monedas. A diferencia de Bitcoin, que emplea una función hash fija (SHA-256) que favorece la creación de hardware especializado (ASICs), Monero busca evitar la centralización mine

Procesador chino Loongson llega al mercado de consumo

Un entusiasta tecnológico ha adquirido una placa base con un procesador Loongson 3A5000LL, una CPU fabricada en China, a través de un mercado online. Loongson Technology desarrolla sus propios procesadores con arquitecturas únicas (LoongArch) que no son compatibles con los estándares Intel/AMD o ARM

Cómo funciona el 'pipelining' en las CPUs

Este artículo de timmastny.com explora en detalle el funcionamiento del 'pipelining' en CPUs, un concepto fundamental para entender cómo los procesadores modernos ejecutan instrucciones de manera eficiente. El pipelining, esencialmente, es una técnica que divide la ejecución de una instrucción en va

Pizza Tycoon: El secreto del tráfico en 25 MHz

Este artículo explora cómo el juego de 1994, Pizza Tycoon, simulaba tráfico en una CPU de tan solo 25 MHz. El autor, quien está reimplementando el juego en código abierto (Pizza Legacy), describe su frustración inicial al crear simulaciones de tráfico mucho más complejas y lentas que la original. La

Intel optimiza código, afecta resultados de Geekbench

Intel ha implementado una herramienta de optimización binaria (BOT) que modifica el código de ciertas aplicaciones para mejorar su rendimiento, incluyendo versiones específicas de la prueba de rendimiento Geekbench. Según un análisis realizado por Geekbench, BOT introduce un retraso inicial de 40 se

Arm crea su chip: Meta será el primero en usarlo

Arm Holdings, la empresa británica conocida por diseñar la arquitectura de chips utilizada en la mayoría de los smartphones, ha lanzado su primer chip de procesamiento central (CPU) propio, denominado AGI CPU. Este movimiento marca un cambio significativo para Arm, que tradicionalmente ha licenciado

Arm lanza CPU AGI: potencia para la nube de IA

Arm ha anunciado hoy el Arm AGI CPU, una nueva generación de procesadores diseñados para impulsar la infraestructura de inteligencia artificial, marcando la primera vez que Arm produce sus propios chips de silicio. Este lanzamiento extiende la plataforma Arm Neoverse más allá de la mera licencia de

Kitten TTS: voz de alta calidad sin GPU

KittenML ha lanzado la versión 0.8 de Kitten TTS, una biblioteca de texto a voz (TTS) de código abierto y ligera, diseñada para funcionar eficientemente en CPU sin necesidad de una GPU. Los modelos disponibles varían en tamaño desde 15 millones hasta 80 millones de parámetros (25-80 MB en disco), of

IA ayuda a acelerar CPU experimental con ensamblador

Un desarrollador ha logrado duplicar la velocidad de un CPU experimental al portar su código de ensamblador x86-64, utilizando la asistencia de un modelo de lenguaje de IA (Claude Code). El proyecto, parte del ecosistema 'Hundred Rabbits', implica una máquina de pila simple llamada Uxn, originalment

Construir una CPU: La realidad supera la simulación

Este artículo relata la experiencia de un desarrollador al construir una CPU personalizada (WCPU-1) a partir de un diseño previamente simulado en Logisim-Evolution. El objetivo era validar el diseño y el cableado antes de crear una placa de circuito impreso (PCB) definitiva. La construcción física

Ingeniero revela error oculto en CPU de Xbox 360

Este artículo relata la experiencia de un ingeniero que trabajó en el desarrollo del procesador de la Xbox 360 y cómo descubrió un error de diseño crítico. El error estaba relacionado con una instrucción personalizada llamada `xdcbt`, introducida para mejorar el rendimiento al permitir la transferen

Microsoft acelera IA: nuevo framework para modelos de lenguaje

Microsoft ha lanzado BitNet, un framework de código abierto diseñado para ejecutar modelos de lenguaje de 1 bit (LLM) de manera eficiente en CPUs y GPUs. Esta tecnología permite ejecutar modelos de lenguaje grandes, como un modelo de 100 mil millones de parámetros, en una sola CPU, alcanzando veloci

RVA23: Nuevo Estándar Impulsa CPUs RISC-V

Una nueva especificación, RVA23, está marcando un punto de inflexión en el diseño de CPUs de alto rendimiento, especialmente en la forma en que se escala el rendimiento. RVA23 hace que la extensión vectorial RISC-V (RVV) sea obligatoria, elevando la paralelización estructurada y explícita al mismo n

IA GLiNER2: Extrae datos con más eficiencia

Desarrolladores ahora tienen a su disposición GLiNER2, un nuevo modelo de inteligencia artificial que simplifica la extracción de información. Este modelo unificado, con 205 millones de parámetros (o 340 millones en la versión 'large'), integra el Reconocimiento de Entidades Nombradas (NER), la Clas

Datos satelitales al descubierto: riesgo de interceptación

Investigadores revelaron vulnerabilidades críticas en datos satelitales durante el Congreso de Comunicación Caótica (39C3) celebrado en Alemania. La presentación expuso cómo, con equipos de aproximadamente 500 dólares, es posible interceptar información sensible de satélites pertenecientes a compañí

CPU innovadora opera dentro de una GPU

Investigadores han desarrollado una CPU innovadora que opera completamente dentro de una GPU, eliminando la necesidad de interacción con la CPU principal del sistema. Este prototipo, denominado NeuralCPU, ejecuta instrucciones ARM64 reales y utiliza tensores de PyTorch para almacenar registros, memo

Am386: La historia detrás del retraso de AMD

El artículo de Dave Farquhar desmitifica la percepción de que AMD era inepta en la clonación de CPUs Intel, centrándose en el retraso significativo (casi seis años) en el lanzamiento del Am386 en comparación con el Intel 386. La razón principal de este retraso no fue la incapacidad técnica de AMD, s

Depuradores: Ejecución y Pausas, Guía Práctica

Este artículo de dgtlgrove.com, parte de una serie sobre depuradores, explica cómo implementar funcionalidades básicas como el 'stepping' a nivel de instrucción (ejecutar una instrucción a la vez) y los puntos de interrupción (breakpoints) en un depurador. Para entenderlo, es crucial recordar que un

Java optimiza recolección de basura con nueva API

Un nuevo API de Java, incluido en OpenJDK 26, busca optimizar la eficiencia de la recolección de basura (GC) al permitir a los ingenieros cuantificar el costo de CPU asociado. Históricamente, la optimización de GC se centraba en minimizar los tiempos de pausa, pero con los colectores modernos, la re

Compresión en Bases de Datos: Matemáticas y Rendimiento

Este artículo explora la matemática detrás de la compresión de datos en sistemas de bases de datos, desentrañando por qué y cómo se utiliza, y cómo afecta el rendimiento. Tradicionalmente, el rendimiento de una base de datos se ve limitado por el ancho de banda de I/O, la potencia de la CPU y la mem

Linux 7.0: Rendimiento y Novedades Clave Analizadas

Un análisis exhaustivo del próximo kernel de Linux 7.0 revela mejoras significativas en rendimiento, gráficos, CPU y redes. Según el canal SavvyNik, las actualizaciones incluyen optimizaciones de código heredado (alrededor de 30-40 años), mejoras en el Intel TSX, cambios en el programador de CPU pre