Investigadores de la Universidad Beihang de Beijing desarrollaron SFHformer, un nuevo marco de restauración de imágenes que combina la Transformada Rápida de Fourier (FFT) con arquitectura Transformer. El trabajo fue aceptado en la conferencia ECCV 2024 y publicado en octubre de ese año. Este framework propone una estructura híbrida de dominio dual que integra el modelado de campos receptivos multi-escala: el dominio espacial se enfoca en el modelado local, mientras que el dominio frecuencia aborda el modelado global. Incluye również codificación posicional única y convolución dinámica de frecuencia para extraer características enriched del dominio frecuencia. Los experimentos se realizaron en 31 datasets de restauración para 10 tareas diferentes: eliminación de lluvia, niebla, desenfoque de movimiento, nieve, ruido, superresolución, mejora de imágenes subacuáticas y de baja luz. Los resultados demuestran que SFHformer supera los métodos más avanzados actuales, logrando un favorable trade-off entre rendimiento, tamaño de parámetros y costo computacional.
Universidad Beihang presenta SFHformer, framework que combina FFT y Transformers
