Noticias que mencionan CPU

El oscuro comando que puede bloquear cualquier procesador

Halt and Catch Fire (HCF) es una expresión del argot de la ingeniería informática que describe un tipo de instrucción de código máquina capable de bloquear completamente un procesador, obligando a reiniciar el sistema. Aunque suenen dramático, el término nació como un chiste entre ingenieros, inspir

Swift alcanza Teraflops entrenando LLMs en Apple Silicon

Este artículo explora cómo optimizar operaciones de multiplicación de matrices en Swift para entrenar Large Language Models (LLMs) en Apple Silicon, buscando alcanzar rendimiento de Teraflop/s desde el punto de partida de Gigaflops. El autor, Matt Gallagher, toma como referencia la implementación ll

Apple Silicon: GPU y WebAssembly comparten memoria

Apple ha habilitado una innovadora técnica de inferencia de GPU sin copia en sus chips Silicon, permitiendo que los módulos WebAssembly (Wasm) compartan directamente su memoria lineal con la GPU. Tradicionalmente, la comunicación entre Wasm y la GPU implicaba costosas copias de datos a través de un

PostgreSQL: Error Silencioso por Configuración Incorrecta

Una empresa de SaaS experimentó una interrupción total de las operaciones de escritura en su base de datos PostgreSQL debido a un problema de 'transaction ID wraparound'. Este fallo, que bloqueó la base de datos en modo de solo lectura, no fue causado por una alta carga, problemas de infraestructura

Rust ahora en GPU: VectorWare anuncia avance

VectorWare ha anunciado un hito significativo en el desarrollo de la programación de GPU: la capacidad de utilizar los hilos estándar de Rust (std::thread) directamente en la GPU. Esto representa un avance crucial hacia su visión de crear una empresa de software nativa para GPU que permita a los des

Cómo funciona el 'pipelining' en las CPUs

Este artículo de timmastny.com explora en detalle el funcionamiento del 'pipelining' en CPUs, un concepto fundamental para entender cómo los procesadores modernos ejecutan instrucciones de manera eficiente. El pipelining, esencialmente, es una técnica que divide la ejecución de una instrucción en va

Software y hardware: redescubriendo la 'simpatía mecánica'

Un artículo de martinfowler.com explora el concepto de 'simpatía mecánica' en el desarrollo de software, una práctica que busca optimizar el rendimiento al considerar las características y limitaciones del hardware subyacente. Inspirado en un principio de la Fórmula 1, la simpatía mecánica implica c

DeiMOS: Nuevo optimizador para el chip 6502

Un investigador ha desarrollado "DeiMOS", un superoptimizador para el microprocesador MOS 6502, un chip de 8 bits popular en consolas de videojuegos y ordenadores de los años 80 como el NES y el Commodore 64. Los superoptimizadores buscan generar el código máquina más eficiente para una tarea dada,

Trigger.dev impulsa rendimiento con cambio a Bun

La empresa Trigger.dev reemplazó Node.js con Bun en uno de sus servicios críticos, Firestarter, un broker de conexiones HTTP, logrando un aumento del 5 veces en el rendimiento (throughput). Firestarter es vital para la ejecución de tareas en Trigger.dev, eliminando la necesidad de arranques en frío

Linux como router: 7 ajustes clave para tu red

Este artículo explora cómo transformar un sistema Linux estándar en una infraestructura de red, como un router o un punto de acceso WiFi, detallando los cambios necesarios. La idea central es que, a pesar de la percepción de que la administración de dispositivos de red y sistemas operativos son dife

Ataques Rowhammer: Control total de PCs con Nvidia

Investigadores han descubierto dos nuevos ataques de tipo Rowhammer que permiten a un usuario malicioso obtener control de raíz en máquinas que utilizan tarjetas gráficas de alto rendimiento de Nvidia. Estos ataques explotan la creciente susceptibilidad de la memoria DRAM a los 'bit flips', donde lo

Colas Ocultas: ¿Por qué tu API se retrasa?

Este artículo explora una problemática común en sistemas distribuidos: la gestión de colas de solicitudes (queueing requests) y su impacto en la latencia percibida por los usuarios. A menudo, los dashboards muestran métricas de latencia (como el percentil 90) aparentemente saludables, mientras que l

amd lanza procesador con 208mb de caché

AMD ha anunciado el lanzamiento del Ryzen 9 9950X3D2 Dual Edition, un nuevo procesador de escritorio de alto rendimiento que destaca por su enorme capacidad de caché. La novedad, presentada recientemente, integra 208MB de caché total, superando significativamente a modelos anteriores. Este nuevo pro

Contribución al kernel Linux: la experiencia de un desarrollador

Este artículo narra la experiencia de un desarrollador al contribuir con una corrección (patch) al kernel de Linux, enfocándose en un error sutil relacionado con la gestión de tareas en sistemas x86. El autor, al intentar construir un hipervisor de Tipo 2 (un software que permite ejecutar múltiples

Procesadores 'aprenden': Impacto en pruebas de rendimiento

Un nuevo análisis revela la capacidad de los procesadores modernos para aprender y predecir patrones de ejecución, lo que afecta significativamente la precisión de las pruebas de rendimiento (benchmarking). Daniel Lemire, investigador y experto en rendimiento de software, ha descubierto que los proc

Cómo funciona el planificador de Go

El sistema de planificación (scheduler) de Go es un componente crucial del runtime que gestiona la ejecución concurrente de goroutines, que son funciones ligeras que pueden ejecutarse simultáneamente. Dado que el número de goroutines puede superar con creces el número de núcleos de CPU disponibles,

Microsoft acelera IA: nuevo framework para modelos de lenguaje

Microsoft ha lanzado BitNet, un framework de código abierto diseñado para ejecutar modelos de lenguaje de 1 bit (LLM) de manera eficiente en CPUs y GPUs. Esta tecnología permite ejecutar modelos de lenguaje grandes, como un modelo de 100 mil millones de parámetros, en una sola CPU, alcanzando veloci

Eyot: Nuevo Lenguaje Facilita Programación de GPU

Un nuevo lenguaje de programación llamado Eyot ha sido desarrollado para simplificar el uso de GPUs y aceleradores en tareas computacionales. Creado por Steele Duncan de Cowley fornia Studios, Eyot busca eliminar la complejidad tradicional de la programación GPU, como la gestión de memoria y la comp

Kula: Nuevo monitor Linux ligero y sin dependencias

Un nuevo software de monitoreo de servidores Linux de código abierto llamado Kula ha sido lanzado. Desarrollado en C, Kula se distingue por su diseño ligero y autónomo, eliminando la necesidad de dependencias externas o bases de datos. El programa recopila métricas del sistema cada segundo directame

IA GLiNER2: Extrae datos con más eficiencia

Desarrolladores ahora tienen a su disposición GLiNER2, un nuevo modelo de inteligencia artificial que simplifica la extracción de información. Este modelo unificado, con 205 millones de parámetros (o 340 millones en la versión 'large'), integra el Reconocimiento de Entidades Nombradas (NER), la Clas

Datos satelitales al descubierto: riesgo de interceptación

Investigadores revelaron vulnerabilidades críticas en datos satelitales durante el Congreso de Comunicación Caótica (39C3) celebrado en Alemania. La presentación expuso cómo, con equipos de aproximadamente 500 dólares, es posible interceptar información sensible de satélites pertenecientes a compañí

Renderizado de fuentes: guía con campos de distancia

Este artículo de redblobgames.com explica el renderizado de fuentes utilizando Campos de Distancia Firmados (SDF, por sus siglas en inglés). Los SDFs son una técnica que permite representar formas complejas, como fuentes, como una función que devuelve la distancia más corta a la forma. Esto abre la

Java optimiza recolección de basura con nueva API

Un nuevo API de Java, incluido en OpenJDK 26, busca optimizar la eficiencia de la recolección de basura (GC) al permitir a los ingenieros cuantificar el costo de CPU asociado. Históricamente, la optimización de GC se centraba en minimizar los tiempos de pausa, pero con los colectores modernos, la re

Multitarea: ¿eficiencia o ilusión?

El artículo "Estética del Enfoque Único" explora una paradoja fundamental: nuestra percepción de la productividad moderna se basa en la multitarea, pero desde una perspectiva técnica y psicológica, esta práctica es ineficiente y contraproducente. El autor utiliza una analogía ingeniosa: comparamos n

Filtros de Bloom: precisión duplicada gracias a ingenieros

Ingenieros de bases de datos en Floe han logrado mejorar la precisión de los filtros de Bloom, reduciendo los resultados falsos en un 2x. Los filtros de Bloom son estructuras de datos probabilísticas que aceleran significativamente las consultas SQL al permitir descartar rápidamente datos irrelevant

Wax: IA más fácil con nueva gestión de memoria

Un nuevo conjunto de herramientas llamado 'Wax' simplifica la gestión de la memoria para aplicaciones de inteligencia artificial, ofreciendo una alternativa radical a las complejas arquitecturas tradicionales de Retrieval-Augmented Generation (RAG). Desarrollado por Christopherkarani y disponible en