Noticias que mencionan GPUs

Jmaczan lanza tiny-vllm, motor educativo de inferencia LLM

El desarrollador Jmaczan ha lanzado en GitHub 'tiny-vllm', un motor de inferencia de alto rendimiento para modelos de lenguaje grande (LLM) desarrollado en C++ y CUDA. Esta iniciativa se presenta como una versión más compacta y educativa de vLLM, diseñada para derivar desde cero las matemáticas y ar

Kog AI alcanza 3.000 tokens/s en GPUs estándar con inferencia en tiempo real

Kog AI ha lanzado una vista previa técnica de su motor de inferencia, demostrando que las tarjetas gráficas estándar pueden alcanzar velocidades de generación de tokens de hasta 3.000 por segundo. El sistema, probado en configuraciones de 8 tarjetas AMD MI300X y NVIDIA H200, logra estos rendimientos

LocalAI y outsourcing superan en costos a las grandes IA

Las grandes empresas de inteligencia artificial (Frontier labs) han incrementado drásticamente los costos de inferencia en los últimos meses. Modelos como GPT-5.5 de OpenAI y Gemini 3.5 de Google han duplicado y triplicado sus tarifas de API, respectivamente, mientras que Anthropic ha aumentado el c

IA avanza rápido: informe de Stanford revela tendencias

El informe anual del Índice de IA de Stanford para 2026 revela una aceleración continua en las capacidades de los modelos de IA, impulsada principalmente por empresas estadounidenses como OpenAI y Anthropic, que se preparan para sus próximas ofertas públicas iniciales (IPO). A pesar de este progreso

30 años de HPC: Evolución y desafíos

Este artículo reflexiona sobre los 30 años de evolución de la computación de alto rendimiento (HPC) y la programación asociada, basándose en datos del ranking TOP500 de sistemas HPC y la evolución de los lenguajes y modelos de programación utilizados.

zml-smi: monitoriza GPUs, TPUs y NPUs en una sola herramienta

Una nueva herramienta de código abierto llamada `zml-smi` ha sido lanzada para monitorizar GPUs, TPUs y NPUs de forma universal. Desarrollada por ZML, esta utilidad combina funcionalidades de `nvidia-smi` y `nvtop`, ofreciendo información en tiempo real sobre el rendimiento y la salud del hardware.

IA en chips: CERN filtra datos del LHC en tiempo real

El CERN, el laboratorio europeo de física de partículas, está utilizando modelos de inteligencia artificial (IA) extremadamente pequeños, grabados directamente en chips de silicio, para filtrar en tiempo real los enormes volúmenes de datos generados por el Gran Colisionador de Hadrones (LHC). El LHC

IA impulsa cambio: centros de datos adoptan corriente continua

La creciente demanda de energía para centros de datos impulsados por inteligencia artificial está impulsando una transición desde los sistemas de alimentación de corriente alterna (AC) tradicionales a la corriente continua (DC) de alto voltaje. Durante la reciente conferencia Nvidia GTC, empresas co

Una década de despliegues: cómo ha cambiado la producción

Este artículo, escrito por Brandon Vincent, reflexiona sobre una década de experiencia en el despliegue de aplicaciones en producción, contrastando la situación de 2018 con la de 2026. En 2018, la empresa donde trabajaba tenía un equipo de 'Ops' (operaciones) que controlaba estrictamente el acceso a

Emacs: Desentrañando el código Lisp en C

Este artículo de The Cloudlet explora la estructura interna de GNU Emacs, específicamente cómo representa los valores de Lisp (Elisp) en C. El objetivo es comprender el diseño del sistema desde una perspectiva de bajo nivel, desglosando el tipo de dato `Lisp_Object`. La pieza se basa en el conocimie

IA al estilo cerebro: ¿fin de las matrices?

Investigadores están reevaluando la dependencia de las redes neuronales artificiales en las matemáticas matriciales, inspirándose en cómo funciona el cerebro humano. El artículo explora cómo el cerebro procesa la información a través de una combinación de percepción de arriba hacia abajo (predicción

Actualizaciones de PC: Jugadores posponen mejoras

Una reciente encuesta revela que los jugadores de PC están reconsiderando las actualizaciones de hardware, con un 41,8% admitiendo que no tenían intención de renovar sus equipos este año. Este cambio de comportamiento se debe a la inflación impulsada por la demanda de inteligencia artificial, que ha