TorchCodec 0.14 añade decodificación de vídeo HDR y un decodificador WAV rápido

Fuentes: TorchCodec 0.14 released with HDR video decoding for CPU and CUDA, and a fast WAV decoder

TorchCodec, la biblioteca de PyTorch para decodificar audio y vídeo, ha lanzado su versión 0.14, compatible con torch 2.11 y superiores. La actualización incorpora dos novedades principales: un decodificador específico para archivos WAV y soporte para decodificación de vídeo HDR (alto rango dinámico).

El nuevo WavDecoder procesa archivos WAV sin pasar por FFmpeg, lo que permite lecturas más rápidas. Admite varios formatos de muestra —int16, int32 y float32, entre otros— y puede decodificar desde archivos, secuencias de bytes u objetos tipo archivo. Su uso es directo: basta con instanciar la clase con la ruta del audio y obtener todas las muestras con un único método.

En el ámbito del vídeo, VideoDecoder ahora decodifica contenido HDR sin pérdida de precisión. Al indicar output_dtype=torch.float32, el decodificador entrega fotogramas RGB en float32 dentro del rango [0, 1], conservando la gama cromática completa del HDR. La función está disponible tanto en CPU como en CUDA.

La versión 0.14 incluye además una búsqueda de audio mejorada y elimina la dependencia de la biblioteca NPP de NVIDIA, lo que simplifica la instalación y el uso de TorchCodec en flujos con decodificación por CUDA. La documentación oficial detalla los cambios y proporciona ejemplos de código para cada nueva funcionalidad.