A100

27 May 2026

Estudio: GPUs aceleran matrices con datos predecibles en lugar de aleatorios

Un estudio reciente revela que las multiplicaciones de matrices en GPUs, específicamente en la Nvidia A100, se ejecutan más rápido cuando se utilizan datos 'predecibles' como ceros en lugar de datos aleatorios. Esta anomalía desafía la creencia tradicional de que el rendimiento de las operaciones de

21 May 2026

Ex-investigadora de FAANG construí un servidor GPU de 48.000 dólares para investigación de IA

En 2024, una investigadora independiente abandonó su trabajo en una empresa FAANG para dedicarse a la investigación de inteligencia artificial. Para llevar a cabo sus experimentos de aprendizaje profundo e inferencia en modelos de lenguaje, necesitaba un servidor GPU potente. Después de investigar o

20 May 2026

ByteDance presenta Lance, el modelo multimodal de IA más eficiente con solo 3B parámetros

Lance es un modelo de inteligencia artificial desarrollado por ByteDance que alcanza un hito importante en el campo de la IA multimodal: lograr capacidades de generación, edición y entendimiento de imágenes y videos dentro de un únicoframework unificado, utilizando únicamente 3 mil millones de parám

07 May 2026

zyphra lanza modelo de lenguaje competitivo con amd

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento,

07 Apr 2026

Netflix usa IA para borrar objetos de sus videos

Netflix ha lanzado VOID, un nuevo modelo de inteligencia artificial diseñado para eliminar objetos de videos de manera avanzada. VOID no solo elimina el objeto, sino también sus interacciones físicas con la escena, como objetos que caen al retirar a una persona. El modelo se basa en CogVideoX y util

11 Mar 2026

IA optimiza GPUs: nuevo agente agiliza el rendimiento

RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut

04 Mar 2026

Unsloth agiliza el ajuste de modelos Qwen3.5

Unsloth ha simplificado el proceso de ajuste fino (fine-tuning) de los modelos de lenguaje grandes Qwen3.5, una familia de modelos desarrollada por Alibaba. Ahora, usuarios pueden ajustar versiones de 0.8B a 122B de Qwen3.5, incluyendo soporte para ajuste fino tanto de texto como de visión. Unsloth

19 Feb 2026

Nvidia cambia estrategia: ¿más potencia FP64 en GeForce?

Nvidia está reevaluando el rendimiento de doble precisión (FP64) en sus GPUs, marcando un cambio significativo en su estrategia de segmentación de mercado. Durante más de 15 años, la compañía ha reducido deliberadamente el rendimiento FP64 en sus GPUs de consumo (GeForce) en comparación con sus GPUs

16 Feb 2026

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

Noticias que mencionan A100