19 Apr 2026 · Original en inglés · Resumen IA

Apple Silicon: GPU y WebAssembly comparten memoria

Fuentes: Apple Silicon Enables Zero-Copy GPU Inference with WebAssembly

Apple ha habilitado una innovadora técnica de inferencia de GPU sin copia en sus chips Silicon, permitiendo que los módulos WebAssembly (Wasm) compartan directamente su memoria lineal con la GPU. Tradicionalmente, la comunicación entre Wasm y la GPU implicaba costosas copias de datos a través de un bus, pero la arquitectura de memoria unificada de Apple Silicon elimina esta barrera. Esta nueva técnica, que el autor ha denominado 'Driftwood', permite que la CPU y la GPU accedan a la misma memoria física, reduciendo significativamente la latencia y el consumo de memoria. El proceso se compone de tres enlaces: asignación de memoria alineada, uso de Metal para acceder a la memoria sin copia y el uso de Wasmtime para controlar la asignación de memoria. Las pruebas con una multiplicación de matrices de 128x128 mostraron latencias equivalentes con y sin copia, pero una reducción drástica en el uso de memoria (de 16.78 MB a 0.03 MB). Esta innovación facilita la ejecución de modelos de inteligencia artificial como Llama 3.2, permitiendo incluso la serialización y restauración de cachés de clave-valor (KV) para mantener el contexto de la conversación entre sesiones, lo que mejora significativamente la eficiencia y la portabilidad.

Temas

ia empresas tecnologia

Etiquetas

apple apple silicon webassembly gpu inteligencia artificial llama 3.2 wasmtime metal driftwood memoria unificada

Entidades mencionadas

CPU hardware

ARM64 software

Apple Silicon hardware

wasmtime software

Metal software

mmap software

MLX software

MTLDevice software

GEMM software

Llama 3.2 1B Instruct creative_work

DRAM hardware

Wasm software

La hormiguita de fuego es una hormiga social muy pequeña, de color castaño claro a castaño dorado. Es nativa de América Central y del Sur y ahora está esparcida por partes de África, América del Norte

Ver en Wikipedia

GPU hardware

Una unidad de procesamiento gráfico o procesador gráfico es un coprocesador dedicado al procesamiento de gráficos u operaciones de coma flotante, para aligerar la carga de trabajo del procesador/CPU c

Ver en Wikipedia

WebAssembly software

WebAssembly, abreviado wasm, es un formato de código binario portable (bytecode) y un formato de texto correspondiente, así como interfaces de software para facilitar la comunicación entre dichos prog

Ver en Wikipedia

Apple organization

Apple es una empresa tecnológica estadounidense conocida por el diseño y desarrollo de productos como el MacBook Neo, que está siendo comparado en la noticia con el Framework 12. Su lanzamiento ha red

Ver en Wikipedia

AMD organization

Advanced Micro Devices, Inc. (AMD) es una compañía tecnológica estadounidense de semiconductores con sede en Santa Clara, California, que desarrolla procesadores de computación y productos tecnológico

Ver en Wikipedia

Nvidia organization

Nvidia es una empresa tecnológica líder en el desarrollo de GPUs, incluyendo las H200 utilizadas por Kog AI para demostrar inferencia de tokens a alta velocidad. La empresa es un actor clave en el mer

Ver en Wikipedia

Rust software

Rust es un lenguaje de programación compilado, de propósito general y multiparadigma que está siendo desarrollado por Fundación Rust. Es un lenguaje de programación multiparadigmático que soporta prog

Ver en Wikipedia