H100

22 Jun 2026

Sakana presenta Fugu-Ultra, un sistema multiagente que supera a modelos frontera en investigación ML

Sakana AI presenta Fugu-Ultra, un sistema multiagente que, según sus propios experimentos, supera en varias tareas a tres modelos de frontera identificados como Model A, B y C. La compañía describe a Fugu-Ultra como un orquestador de múltiples modelos fuertes capaz de rendir por encima de cualquiera

15 Jun 2026

machine0: máquinas virtuales persistentes para tareas de larga duración desde la CLI

machine0 es un servicio de infraestructura en la nube que ofrece máquinas virtuales (VM) persistentes gestionadas íntegramente desde la línea de comandos (CLI). Está orientado a cargas de trabajo prolongadas, como compilaciones reproducibles, agentes autónomos de inteligencia artificial y hosting de

01 Jun 2026

Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU

## Cómo ejecutar Gemma 4 en un Xeon de 2016 sin GPU: la hazaña técnica que desafía el 'memory wall' Un experimento publicado en el blog técnico point.free demuestra que es posible ejecutar un modelo de inteligencia artificial de última generación, concretamente Gemma 4 en su versión 26B con arquite

21 May 2026

Ex-investigadora de FAANG construí un servidor GPU de 48.000 dólares para investigación de IA

En 2024, una investigadora independiente abandonó su trabajo en una empresa FAANG para dedicarse a la investigación de inteligencia artificial. Para llevar a cabo sus experimentos de aprendizaje profundo e inferencia en modelos de lenguaje, necesitaba un servidor GPU potente. Después de investigar o

19 May 2026

Cursor lanza Composer 2.5 con IA mejorada para programación

Cursor ha lanzado Composer 2.5, una actualización sustancial de su modelo de inteligencia artificial para programación. La nueva versión ofrece mejoras significativas en inteligencia y comportamiento, siendo más competente en tareas prolongadas y en el seguimiento de instrucciones complejas. El mode

16 May 2026

Presentan Sana-WM: modelo de código abierto que genera videos de alta fidelidad desde una imagen

Sana-WM es un modelo de mundo de código abierto con 2.600 millones de parámetros, diseñado específicamente para generar videos de alta fidelidad con resolución 720p y duración de hasta un minuto a partir de una única imagen y una trayectoria de cámara. Este sistema representa un avance significativo

09 May 2026

Modal mejora inferencia multimodal más de 10% con un simple diccionario Python

La plataforma Modal ha logrado mejorar el rendimiento de inferencia multimodal en más de un 10% mediante la implementación de un simple diccionario Python en el motor de inferencia SGLang. El cambio, ya integrado en SGLang v0.5.10, aumentó el throughput de solicitudes de 22.2 a 25.7 req/s (un 16.2%

07 May 2026

zyphra lanza modelo de lenguaje competitivo con amd

Zyphra ha lanzado un nuevo modelo de lenguaje, ZAYA1-8B, que está destacando en pruebas de matemáticas y programación con un tamaño significativamente menor que otros modelos de vanguardia. ZAYA1-8B iguala el rendimiento de DeepSeek-R1 en matemáticas y compite con Claude Sonnet 4.5 en razonamiento,

09 Apr 2026

Claude confunde instrucciones: error crítico en IA

Anthropic, la empresa detrás del modelo de lenguaje Claude, está experimentando un error crítico que confunde sus propias instrucciones con las del usuario. El fallo, descrito como el peor visto hasta ahora en un proveedor de LLM, provoca que Claude ejecute acciones basadas en indicaciones internas

07 Apr 2026

IA multimodal en Mac: nueva herramienta facilita el ajuste

Un nuevo toolkit llamado 'gemma-tuner-multimodal' permite a los usuarios afinar modelos Gemma de Google para tareas de inteligencia artificial multimodal (texto, imágenes y audio) directamente en Macs con Apple Silicon. La herramienta, desarrollada por Mattmireles y disponible en GitHub, elimina la

19 Mar 2026

IA acelera entrenamiento neuronal con 16 GPUs

Investigadores han logrado mejorar significativamente el entrenamiento de redes neuronales utilizando un agente de inteligencia artificial (IA) y un clúster de 16 GPUs, gracias a la herramienta SkyPilot. El agente, basado en Claude Code y conectado a la plataforma Autoresearch de Andrej Karpathy, ej

12 Mar 2026

ia facilita el cambio de estilos de fuentes chinas

Investigadores han desarrollado "zi2zi-JiT", un nuevo modelo de inteligencia artificial que simplifica la transferencia de estilos de fuentes chinas. Basado en el modelo JiT (Just image Transformer), zi2zi-JiT permite generar caracteres en una fuente específica a partir de un carácter fuente y una r

11 Mar 2026

IA optimiza GPUs: nuevo agente agiliza el rendimiento

RightNow AI ha presentado AutoKernel, un agente de inteligencia artificial que automatiza la optimización de kernels de GPU, inspirándose en el trabajo de autoresearch de Andrej Karpathy. AutoKernel toma cualquier modelo PyTorch, identifica los kernels de cuello de botella, los optimiza de forma aut

07 Mar 2026

IA investiga y optimiza modelos de lenguaje sola

Este repositorio de GitHub, creado por Andrej Karpathy, presenta un enfoque innovador para la investigación en inteligencia artificial: la 'autoresearch'. En lugar de la investigación tradicional, donde humanos modifican el código, este sistema permite a agentes de IA experimentar y optimizar modelo

25 Feb 2026

Linum libera código de VAE: avance para videos y IA

La empresa Linum ha abierto el código de su Variational Autoencoder (VAE) para imágenes y videos, junto con los registros de sus experimentos. El objetivo era reducir el tamaño de los archivos de video para facilitar su procesamiento con modelos de difusión basados en transformadores, que de otro mo

24 Feb 2026

IA exige: centros de datos apuestan por refrigeración líquida

El auge de la inteligencia artificial está generando una crisis de gestión térmica en los centros de datos, obligando a una transición inevitable hacia sistemas de refrigeración líquida. Según un informe de syaala.com, el aumento exponencial en la densidad de potencia de las GPU, impulsado por chips

15 Feb 2026

LLM más rápidos: Anthropic y OpenAI usan métodos distintos

Anthropic y OpenAI han anunciado recientemente una función de "modo rápido" para sus modelos de codificación, permitiendo interacciones significativamente más rápidas. Sin embargo, los enfoques difieren considerablemente. La opción de Anthropic ofrece una mejora de hasta 2.5 veces en tokens por segu

Noticias que mencionan H100