YOLO26 es una familia de modelos de visión por computador publicada por Ultralytics en enero de 2026 que cubre detección de objetos, segmentación de instancias, clasificación de imágenes, estimación de pose y detección de objetos orientados en cinco variantes de tamaño, desde Nano hasta Extra Large. Su arquitectura introduce cambios orientados al despliegue en dispositivos edge: elimina el paso de postprocesado Non-Maximum Suppression, lo que reduce la latencia, y retira el módulo Distribution Focal Loss para ampliar la compatibilidad con hardware de bajo consumo. También incorpora un optimizador propio, MuSGD, que combina técnicas de grandes modelos de lenguaje con métodos clásicos para estabilizar el entrenamiento.
Los benchmarks publicados sobre el conjunto de datos COCO muestran un rango de precisión (mAP 50-95) que va del 40,9 % en YOLO26n al 57,5 % en YOLO26x, con tamaños de 2,4 a 55,7 millones de parámetros. En CPU la latencia oscila entre 38,9 ms (Nano) y 525,8 ms (Extra Large); en GPU T4 con TensorRT 10, entre 1,7 ms y 11,8 ms. Según la documentación, la variante Nano ofrece hasta un 43 % más de velocidad en CPU que la YOLO11-N. El artículo compara además YOLO26 con alternativas como RF-DETR, LW-DETR y D-FINE para ayudar a elegir la opción adecuada según el equilibrio entre precisión, latencia y recursos disponibles.
