Noticias que mencionan TPUs

Jmaczan lanza tiny-vllm, motor educativo de inferencia LLM

El desarrollador Jmaczan ha lanzado en GitHub 'tiny-vllm', un motor de inferencia de alto rendimiento para modelos de lenguaje grande (LLM) desarrollado en C++ y CUDA. Esta iniciativa se presenta como una versión más compacta y educativa de vLLM, diseñada para derivar desde cero las matemáticas y ar

AlphaEvolve: Google optimiza hardware y sistemas con IA

Google DeepMind ha anunciado AlphaEvolve, un sistema de optimización impulsado por Gemini que está transformando la eficiencia de diversas operaciones internas y externas. Inicialmente utilizado para mejorar el diseño de las TPUs (Tensor Processing Units) de Google, AlphaEvolve ha acelerado el proce

Google facilita PyTorch en TPUs con TorchTPU

Google ha anunciado el lanzamiento de TorchTPU, una nueva herramienta que permite a los desarrolladores utilizar de forma nativa y eficiente PyTorch en sus Tensor Processing Units (TPUs). TorchTPU aborda la creciente complejidad de construir modelos de IA a gran escala, que ahora requieren sistemas

EE. UU.: Debate sobre industria y exportaciones

Un análisis crítico examina la pérdida de competitividad manufacturera estadounidense y las políticas de control de exportaciones, particularmente en el sector de semiconductores. El autor argumenta que la deslocalización de la producción, impulsada por la búsqueda de mano de obra barata y la evitac

zml-smi: monitoriza GPUs, TPUs y NPUs en una sola herramienta

Una nueva herramienta de código abierto llamada `zml-smi` ha sido lanzada para monitorizar GPUs, TPUs y NPUs de forma universal. Desarrollada por ZML, esta utilidad combina funcionalidades de `nvidia-smi` y `nvtop`, ofreciendo información en tiempo real sobre el rendimiento y la salud del hardware.

IA en chips: CERN filtra datos del LHC en tiempo real

El CERN, el laboratorio europeo de física de partículas, está utilizando modelos de inteligencia artificial (IA) extremadamente pequeños, grabados directamente en chips de silicio, para filtrar en tiempo real los enormes volúmenes de datos generados por el Gran Colisionador de Hadrones (LHC). El LHC