18 May 2026 · Original en inglés · Resumen IA

Modal Labs reduce arranques en frío de inteligencia artificial en gpu 40 veces más rápido

Fuentes: Cutting inference cold starts by 40x with LP, FUSE, C/R, and cuda-checkpoint

Modal Labs ha logrado reducir hasta 40 veces los tiempos de inicio en frío de aplicaciones de inferencia de inteligencia artificial sobre GPUs, pasando de varios minutos a apenas decenas de segundos. La compañía implementó cuatro optimizaciones clave: buffers de nube que mantienen GPUs inactivas disponibles, un sistema de archivos personalizado basado en FUSE que sirve imágenes de contenedores desde caché multi-nivel, checkpoint/restore para acelerar la inicialización en CPU, y cuda-checkpoint para restaurar directamente contextos CUDA en memoria. El objetivo principal es maximizar la GPU Allocation Utilization, una métrica que mide el tiempo de GPUs ejecutando código frente al tiempo contratado. Según datos del informe State of AI Infrastructure at Scale 2024, la mayoría de organizaciones logran menos del 70% de utilización durante picos de demanda, con utilizaciones reales frecuentemente cercanas al 10-20%. El problema radica en que las cargas de inferencia son altamente variables e impredecibles, impulsadas por comportamiento externo de usuarios, a diferencia del entrenamiento donde la demanda es controlable. Sin optimizaciones, provisionar nuevas réplicas de servidores puede tardar decenas de minutos, causando degradación del servicio y GPUs subutilizadas durante períodos extendidos. Modal lleva cinco años desarrollando estas soluciones.

Temas

tecnologia

Etiquetas

modal labs gpu inferencia ia serverless computing checkpoint restore cuda optimización computacional cold starts auto-scaling

Entidades mencionadas

CUDA software

B200 hardware

AWS organization

AWStats es una herramienta open source de informes de análisis web, apta para analizar datos de servicios de Internet como un servidor web, streaming, mail y FTP. AWstats analiza los archivos de log d

Ver en Wikipedia

Jonathan Belotti person

Jonathan Pablo Bottinelli es un exfutbolista argentino. Jugaba como marcador central y su primer equipo fue San Lorenzo de Almagro. Su último club antes de retirarse fue San Martín de San Juan. Es her

Ver en Wikipedia

Erik Bernhardsson organization

Erik Bernhardsson is Founder and CEO of Modal Labs, which is exploring ideas related to data and infrastructure.

Akshat Bubna organization

Akshat Bubna is CTO/Co-Founder at Modal Labs Inc. See Akshat Bubna's compensation, career history, education, & memberships.

Hebbia location

Biblia hebrea o Biblia hebraica or Tanakh, también conocida en hebreo como Miqra, es un término genérico para referirse a los libros de la Biblia escritos originalmente en hebreo y arameo antiguos. Es

Ver en Wikipedia

Marc Brooker person

Mark Brooke-Cowden es un exjugador neozelandés de rugby y rugby League que se desempeñaba como ala. Actualmente ejerce su profesión de asesor financiero.

Ver en Wikipedia

SGLang software

Modal organization

El modal, rayón HWM o «fibra polinósica» es una fibra artificial de celulosa regenerada; es decir, un tipo de rayón. Normalmente se fabrica por el proceso de la viscosa; posee alta tenacidad y alto mó

Ver en Wikipedia

Charles Frye person

Charles Francis Adams Jr. fue un autor e historiador estadounidense. Fue miembro de la prominente familia Adams e hijo de Charles Francis Adams Sr. Se desempeñó como coronel en el Ejército de la Unión

Ver en Wikipedia

xAI organization

xAI es una startup de inteligencia artificial (IA) fundada el 12 de julio de 2023 por Elon Musk. Según Musk, el objetivo de la empresa es «comprender la verdadera naturaleza del universo». La empresa

Ver en Wikipedia

Runway organization

Runway AI, Inc. es una empresa estadounidense con sede en la ciudad de Nueva York especializada en investigación y tecnologías de inteligencia artificial generativa. La empresa se centra principalment

Ver en Wikipedia