Moebius: un modelo de inpainting ligero de 0.2B que rivaliza con sistemas de 10B parámetros

Fuentes: Moebius: 0.2B Lightweight Image Inpainting Framework with 10B-Level Performance

Moebius es un nuevo marco de inpainting de imágenes que combina un tamaño reducido, 0.2B de parámetros, con un rendimiento comparable al de modelos de 10B. La herramienta está dirigida a investigadores y desarrolladores que necesitan completar o restaurar regiones faltantes en imágenes sin requerir grandes recursos de cómputo.

El sistema se construye sobre un Latent Diffusion Model (LDM) e incorpora Latent Categories Guidance (LCG) para guiar la generación dentro del espacio latente. Su U-Net de eliminación de ruido se ha rediseñado íntegramente mediante bloques LλM I, una arquitectura propuesta por los autores para alcanzar una eficiencia estructural extrema. Durante el entrenamiento se aplica una estrategia adaptativa de destilación multi-granularidad que alinea al especialista ligero con un modelo profesor de alta capacidad, reduciendo la pérdida de rendimiento derivada de la compresión estructural.

El resultado es un especialista compacto capaz de aproximar la calidad de modelos mucho mayores. El paper (arXiv:2606.19195) está firmado por Kangsheng Duan, Ziyang Xu, Wenyu Liu, Xiaohu Ruan, Xiaoxin Chen y Xinggang Wang, y se publica como preprint en la categoría cs.CV de arXiv, lo que lo sitúa como referencia para trabajos posteriores en inpainting eficiente.