La versión 5 de OpenCV, la biblioteca de referencia en visión por computador con más de 86.000 estrellas en GitHub y un millón de instalaciones diarias, se publicará el 8 de junio en PyPI. Se trata de la mayor revisión del proyecto en años, coordinada por la organización sin ánimo de lucro OpenCV.org junto con Big Vision, OpenCV China y OpenCV.ai.
El cambio más relevante es un motor de deep learning reescrito desde cero, basado en un grafo tipado con inferencia de formas, plegado de constantes y fusión de operadores. El soporte de operadores ONNX pasa de alrededor del 22% en la rama 4.x a más del 80% en la 5.x, lo que permite cargar modelos con formas dinámicas, subgrafos de control (If y Loop) y grafos con Quantize/Dequantize. Además, el motor identifica el patrón de atención de los transformers y lo reemplaza por una implementación de tipo FlashAttention.
OpenCV 5 mantiene tres motores tras la misma API (clásico, nuevo y específico de CPU) para no romper proyectos existentes. La versión también incorpora tipos de datos 0D/1D, soporte nativo de FP16 y BF16, aceleración por hardware renovada, mejor calibración 3D con ChArUco, integración con Python moderno con argumentos nombrados, y documentación reescrita. Entre los próximos pasos figuran un motor DNN con GPU y una capa de abstracción de hardware no dependiente de CPU.
