Reducto lanza Deep Extract: extracción de datos con precisión

Fuentes: Introducing Deep Extract | Reducto

Reducto ha lanzado Deep Extract, una nueva herramienta para la extracción de datos estructurados de documentos complejos, diseñada para superar las limitaciones de los métodos tradicionales. Deep Extract utiliza un enfoque de “agente en bucle” que verifica y corrige su propia salida, logrando una precisión de entre el 99% y el 100%, incluso superando a los etiquetadores humanos expertos. La herramienta aborda el problema de la baja precisión en documentos extensos como facturas o informes financieros, donde los modelos de extracción convencionales tienden a omitir o consolidar datos.

Deep Extract divide documentos extensos en partes más pequeñas, utilizando sub-agentes para garantizar la exactitud en documentos de hasta 2.500 páginas. Además, permite definir criterios de verificación específicos, como la concordancia de los totales en facturas o la verificación de la ecuación contable de activos = pasivos + patrimonio neto. La herramienta también proporciona bounding boxes granulares para cada campo extraído, facilitando la auditoría y el seguimiento. En pruebas beta, Deep Extract ha demostrado aumentar la precisión de la extracción de datos de un 10-20% a un 99-100%, y aunque el proceso es más lento que la extracción estándar, es más rápido y económico que la revisión manual, especialmente en documentos extensos.