Mistral lanza OCR 4 con cajas delimitadoras, clasificación de bloques y puntuaciones de confianza

Fuentes: Mistral OCR 4: SOTA OCR for Document Intelligence

Mistral ha presentado OCR 4, una nueva versión de su modelo de reconocimiento óptico de caracteres que devuelve, además del texto extraído, cajas delimitadoras, clasificación tipificada de bloques (títulos, tablas, ecuaciones, firmas) y puntuaciones de confianza por palabra y por página. El sistema soporta 170 idiomas repartidos en 10 grupos lingüísticos, con mejoras medibles en lenguas raras y de bajos recursos, y se distribuye en un único contenedor para despliegues autohospedados, una opción pensada para organizaciones con requisitos de soberanía y residencia de datos. Su tamaño compacto permite además procesamientos por lotes de alto volumen y bajo coste.

En las evaluaciones internas y externas, OCR 4 obtuvo la mejor puntuación global en OlmOCRBench (85,20) y lideró la prueba interna Crawl Multilingual (0,98), con 93,07 en OmniDocBench. Evaluadores humanos independientes, sobre más de 600 documentos en doce o más idiomas, prefirieron sus resultados frente a los principales sistemas de OCR y de inteligencia documental del mercado, con tasas de victoria medias del 72 %. Testimonios de empresas como Rogo y Anaqua destacan, respectivamente, una precisión equivalente a la competencia con un coste 8 veces menor y una latencia 17 veces menor, y una velocidad por página cuatro veces superior.

La API de OCR 4 se tarifica a 4 dólares por cada 1 000 páginas, con un descuento del 50 % en el modo por lotes (2 dólares), mientras que Document AI cuesta 5 dólares por 1 000 páginas. OCR 4 se integra como componente de ingestión en Search Toolkit, el marco de búsqueda de código abierto presentado por Mistral en el AI Now Summit, dentro de flujos de RAG y búsqueda empresarial.