Noticias que mencionan A100

Estudio: GPUs aceleran matrices con datos predecibles en lugar de aleatorios

Un estudio reciente revela que las multiplicaciones de matrices en GPUs, específicamente en la Nvidia A100, se ejecutan más rápido cuando se utilizan datos 'predecibles' como ceros en lugar de datos aleatorios. Esta anomalía desafía la creencia tradicional de que el rendimiento de las operaciones de

zyphra lanza modelo de lenguaje competitivo con amd

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento,

Netflix usa IA para borrar objetos de sus videos

Netflix ha lanzado VOID, un nuevo modelo de inteligencia artificial diseñado para eliminar objetos de videos de manera avanzada. VOID no solo elimina el objeto, sino también sus interacciones físicas con la escena, como objetos que caen al retirar a una persona. El modelo se basa en CogVideoX y util

IA optimiza GPUs: nuevo agente agiliza el rendimiento

RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut

Unsloth agiliza el ajuste de modelos Qwen3.5

Unsloth ha simplificado el proceso de ajuste fino (fine-tuning) de los modelos de lenguaje grandes Qwen3.5, una familia de modelos desarrollada por Alibaba. Ahora, usuarios pueden ajustar versiones de 0.8B a 122B de Qwen3.5, incluyendo soporte para ajuste fino tanto de texto como de visión. Unsloth

Nvidia cambia estrategia: ¿más potencia FP64 en GeForce?

Nvidia está reevaluando el rendimiento de doble precisión (FP64) en sus GPUs, marcando un cambio significativo en su estrategia de segmentación de mercado. Durante más de 15 años, la compañía ha reducido deliberadamente el rendimiento FP64 en sus GPUs de consumo (GeForce) en comparación con sus GPUs

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota