18 Jun 2026 · Original en inglés · Artículo

OpenComputer: de una sola VM en Azure a un millón de sandboxes distribuidos

Fuentes: Scaling OpenComputer from one VM to a million sandboxes

OpenComputer, un servicio de sandboxes basados en máquinas virtuales, nació con una única instancia en la región Azure US East 2 y topó pronto con un techo de 300 CPUs: el centro de datos elegido estaba saturado y el proveedor no elevó la cuota. Migrar a otra región habría desplazado el problema, ya que toda región tiene un límite finito y la arquitectura monocelular no podía absorber una demanda de 10.000, 100.000 o un millón de máquinas virtuales simultáneas. La compañía optó por rediseñar la arquitectura para que añadir capacidad sea un paso de despliegue, no una migración.

El núcleo del nuevo diseño es la celda, una unidad autosuficiente que empaqueta el plano de control (encargado únicamente de orquestar VMs: programar, rastrear, hibernar en S3, migrar) con 5-10 workers que ejecutan QEMU. Las celdas ignoran el exterior; el panel, la facturación y la lógica de usuario se extrajeron fuera. La selección del worker dentro de una celda considera ajuste de recursos, calor de plantilla, arquitectura ARM frente a amd64, afinidad organizativa y antiafinidad entre cargas. El mismo binario de celda se despliega sin cambios en AWS, Azure, GCP y OCI.

Para enrutar cada petición de creación, una capa edge en Cloudflare Workers consulta un registro global en D1 con todas las celdas y su capacidad libre, y asigna la celda menos cargada. La creación cuesta 50-100 ms adicionales (autenticación, saldo, selección); las operaciones frecuentes (ejecución, archivos, PTY, destrucción) van directas a la celda mediante un JWT firmado, sin más saltos síncronos a Cloudflare. Cada VM envía un heartbeat cada 10 segundos, agregado para facturación por segundo; los eventos de ciclo de vida (hibernación, parada, migración) se publican en Redis Streams, un forwarder los envía por HTTPS al ingest Worker, que los autentica con HMAC, deduplica en KV y los reparte al registro y a la facturación. Si Cloudflare cae, los eventos se acumulan. Con este esquema, la capacidad dejó de ser la cuota de Azure y pasó a ser la suma de todas las celdas desplegadas.

Etiquetas

opencomputer cloud infrastructure scaling virtual machines azure aws gcp cloudflare workers qemu distributed systems

Entidades mencionadas

S3 software

GCP organization

Gotham City es una ciudad ficticia que aparece en los cómics estadounidenses publicados por DC Comics, más conocida como el hogar de Batman. La ciudad fue identificada por primera vez como el lugar de

Ver en Wikipedia

Cloudflare Workers software

AWS organization

AWStats es una herramienta open source de informes de análisis web, apta para analizar datos de servicios de Internet como un servidor web, streaming, mail y FTP. AWstats analiza los archivos de log d

Ver en Wikipedia

QEMU software

OpenComputer software

Oracle Cloud Infrastructure organization

Put the entire Oracle Cloud inside your data center. Cloud@Customer includes every Oracle infrastructure service and application.

Redis Streams software

Azure US East 2 location

Mohamed Habib person

Mohamed Habib Attia es un productor de cine tunecino. Es mejor conocido como productor de las películas Falastine Stereo, It Was Better Tomorrow y Le Challat de Tunis.

Ver en Wikipedia

Cloudflare D1 software

Azure organization

El Azur A o Azure A, es un compuesto químico orgánico con la fórmula C14H14ClN3S. Es un compuesto tipo tiazina metilada, que se comporta como colorante metacromático básico, con colores de tinción que

Ver en Wikipedia

Enlaces

github.com/diggerhq/opencomputer github.com