El LiDAR (Light Detection and Ranging) se ha convertido en una tecnología esencial para la conducción autónoma, proporcionando escaneos 3D de alta resolución que permiten una comprensión precisa del entorno. Tradicionalmente, los sensores LiDAR miden la intensidad de la luz láser reflejada en función del tiempo, generando lo que se conoce como 'formas de onda' (waveforms). Un procesador de señal digital (DSP) luego convierte estas formas de onda en nubes de puntos, identificando los picos que representan los retornos de la luz.
El problema radica en que los DSPs convencionales procesan cada forma de onda de manera aislada, ignorando la información valiosa que podría ofrecer el contexto de las formas de onda vecinas. Esto lleva a artefactos en las nubes de puntos, especialmente en condiciones de baja relación señal-ruido (SNR), objetos altamente reflectantes o niebla. Aunque se ha investigado el uso de formas de onda vecinas en técnicas de 'imagen transitoria', su aplicación ha sido limitada a equipos científicos o experimentales debido a la complejidad.
El artículo 'Lidar Waveforms are Worth 40x128x33 Words' presenta una solución innovadora: un DSP aprendido que procesa directamente las formas de onda completas utilizando una arquitectura Transformer. Esta arquitectura permite al sistema considerar la información de formas de onda adyacentes para generar nubes de puntos de alta fidelidad, lo que se traduce en una mejora significativa en la calidad de los datos. En esencia, el Transformer aprende a 'interpretar' el contexto de cada forma de onda para mejorar la precisión de la detección de puntos.
Los autores demostraron la efectividad de su método capturando datos en escenarios de conducción reales y en una cámara climática (para simular niebla). El sistema entrenado, utilizando datos sintéticos y reales, mejoró la distancia de Chamfer (una métrica para evaluar la similitud entre dos nubes de puntos) en 32 cm en comparación con los métodos tradicionales, y en 20 cm en comparación con las técnicas de imagen transitoria existentes. Esto se tradujo en mejoras en el alcance máximo de hasta 17 metros en niebla y 14 metros en condiciones normales. El nombre del artículo, 'Lidar Waveforms are Worth 40x128x33 Words', es una forma de expresar la cantidad de información que contienen las formas de onda, destacando su valor potencial.
Consideraciones: Aunque prometedor, este enfoque requiere una gran cantidad de datos para el entrenamiento del Transformer. Además, la complejidad computacional de la arquitectura Transformer podría ser un factor limitante para su implementación en sistemas de conducción autónoma en tiempo real, aunque los avances en hardware especializado podrían mitigar este problema.
