Polar Signals presenta muestreo de PC en CUDA de bajo coste para producción

Fuentes: Open-Source Low-Overhead NVIDIA CUDA PC Sampling | Polar Signals

Polar Signals ha incorporado soporte de muestreo de contador de programa (PC) sobre NVIDIA CUDA a su perfilador continuo de código abierto, publicado en la versión v0.48.0 de Parca Agent. La técnica, basada en CUPTI y disponible desde la arquitectura Maxwell, registra en hardware la posición de instrucción y la causa de stall de cada warp en cada ciclo de muestreo, lo que permite localizar cuellos de botella al nivel de instrucción sin reconstruir pilas de llamadas. Frente a herramientas de desarrollo como NVIDIA Nsight o Proton de Triton, optimizadas para sesiones puntuales, la propuesta de Polar Signals se orienta a uso continuo en producción con sobrecarga reducida. Para lograrlo, el agente trabaja en modo kernel-serializado y aplica un algoritmo dinámico que activa la captura durante intervalos breves de unos 50 ms, buscando por defecto 100 pares PC/causa por segundo. La transmisión al backend se realiza mediante sondas USDT colocadas en la biblioteca shim de CUPTI, que ya soportaba el registro de kernels. El artículo detalla cómo se resuelven los retos de volumen de datos —48 multiprocesadores y 48 warps por SM en chips como el DGX Spark GB10— y de consistencia cuando el agente se conecta a mitad de workload, reproduciendo mapas de causas, cubins y configuración de GPU emitidos al inicio.