Un reciente informe basado en discusiones anónimas en foros de ingeniería y comunidades de practicantes revela una desconexión significativa entre las demostraciones de rendimiento de la tecnología OCR (Reconocimiento Óptico de Caracteres) e IA (Inteligencia Artificial) y su funcionamiento en entornos de producción reales. A pesar de las promesas de eficiencia y precisión de los proveedores (como Box Extract, UiPath y SAP), los usuarios reportan problemas generalizados, incluyendo la destrucción del formato de tablas en facturas, la necesidad de reconstruir pipelines desde cero y la dificultad para mantener plantillas debido a los cambios frecuentes en los formatos de los proveedores. La confianza en un único motor OCR ha desaparecido, con una proliferación de soluciones y stacks preferidos según el tipo de documento. Se observa una degradación notable de la precisión de los modelos de IA, como GPT-4.1 y Gemini, a medida que aumenta el número de páginas, llegando a fabricar datos. Una tendencia creciente es la adopción de soluciones locales y de código abierto para reducir costos y aumentar el control sobre los datos, incluso llegando a reemplazar servicios en la nube por hardware propio. El informe sugiere que una arquitectura híbrida, combinando OCR especializado con modelos de lenguaje, es la solución más viable, y destaca la necesidad de que los compradores evalúen cuidadosamente la idoneidad de las soluciones en sus propios casos de uso específicos.
