Noticias que mencionan Tesseract

LiteParse: el parser de documentos OSS de LlamaIndex que ejecuta todo en local

LiteParse es una herramienta de código abierto para el parseo de documentos lanzada por LlamaIndex. Diseñada para ejecutarse íntegramente en local, ofrece análisis de texto espacial con cajas delimitadoras, sin depender de servicios en la nube ni de modelos de lenguaje propietarios. La arquitectura

Vulnerabilidad Noroboto: fuentes engañan a sistemas de IA legal

El artículo de Tritium Legal Technologies explora una vulnerabilidad emergente en la forma en que los sistemas de tecnología legal modernos procesan documentos, particularmente aquellos que contienen fuentes. Se denomina “Noroboto” y se basa en la manipulación de fuentes TrueType para engañar a los

IA y OCR: La Realidad Distante de las Promesas

Un reciente informe basado en discusiones anónimas en foros de ingeniería y comunidades de practicantes revela una desconexión significativa entre las demostraciones de rendimiento de la tecnología OCR (Reconocimiento Óptico de Caracteres) e IA (Inteligencia Artificial) y su funcionamiento en entorn

25 años rastreando el precio de los huevos

Este artículo relata un proyecto personal de 25 años para rastrear el precio de los huevos a través de recibos escaneados, utilizando tecnologías de vanguardia como agentes de codificación con IA (Codex y Claude) y modelos de visión por computadora. El autor comenzó en 2001 guardando imágenes de rec