ocr - ojeo.com

02 Jun 2026

LiteParse: el parser de documentos OSS de LlamaIndex que ejecuta todo en local

LiteParse es una herramienta de código abierto para el parseo de documentos lanzada por LlamaIndex. Diseñada para ejecutarse íntegramente en local, ofrece análisis de texto espacial con cajas delimitadoras, sin depender de servicios en la nube ni de modelos de lenguaje propietarios. La arquitectura

31 May 2026

Microsoft presenta MarkItDown, una herramienta Python para archivos a Markdown

MarkItDown es una herramienta ligera de Python desarrollada por Microsoft que convierte diversos formatos de archivo a Markdown, un lenguaje de marcado mínimo ideal para procesar con modelos de lenguaje grandes (LLMs). Su importancia radica en que los LLMs, como GPT-4o, entienden y generan Markdown

25 May 2026

Hipaa actualiza ciberseguridad: ¿qué cambia para la salud?

La regla de seguridad HIPAA de 2026, que se finalizó en mayo de 2026, introduce cambios significativos en la ciberseguridad de la atención médica, marcando una desviación de la normativa de 2003. La actualización, ya citada en acuerdos de resolución de la Oficina de Derechos Civiles (OCR), exige una

13 May 2026

Estudio técnico revela que la superresolución neuronal no mejora el reconocimiento de matrículas

Un estudio técnico de WINK Streaming revela que la superresolución neuronal no mejora el reconocimiento de matrículas automotrices. Los investigadores probaron tres tuberias: OCR sin SR, un modelo SR compacto de 42K parametros y Real-ESRGAN de 1.21M parametros, sobre 2.000 recortes de matriculas men

11 May 2026

Nueva arquitectura Interfaze supera a GPT-5, Claude y Gemini en benchmarks

Interfaze es una nueva arquitectura de modelo de inteligencia artificial que supera a modelos líderes como Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini y Grok-4.3 en nueve benchmarks comparativos directos. La arquitectuta combina la especialización de redes neuronales profundas (DNN/CNN) con tran

26 Apr 2026

Vision por terminal: automatiza análisis de documentos

El artículo de auge.franzai.com presenta una solución innovadora para interactuar con Apple Vision desde la terminal, permitiendo el análisis y procesamiento de documentos históricos de manera automatizada. En esencia, el sistema toma una imagen digitalizada de un documento (en este caso, la Declara

26 Apr 2026

Eden AI simplifica acceso a múltiples modelos de IA

Eden AI ha lanzado una API unificada que permite a los desarrolladores acceder a múltiples modelos de inteligencia artificial, incluyendo LLMs (Large Language Models) y modelos especializados en áreas como procesamiento de voz, visión, OCR, traducción y más, a través de una única interfaz. La plataf

07 Apr 2026

IA impulsa OldNYC: 10,000 fotos más de Nueva York

La plataforma OldNYC, un archivo digital de fotografías históricas de Nueva York, ha experimentado una transformación significativa gracias a la implementación de herramientas de inteligencia artificial. Dan Vanderkam, el creador, ha añadido 10,000 fotografías adicionales al sitio web, lo que eleva

05 Apr 2026

IA y OCR: La Realidad Distante de las Promesas

Un reciente informe basado en discusiones anónimas en foros de ingeniería y comunidades de practicantes revela una desconexión significativa entre las demostraciones de rendimiento de la tecnología OCR (Reconocimiento Óptico de Caracteres) e IA (Inteligencia Artificial) y su funcionamiento en entorn

22 Mar 2026

25 años rastreando el precio de los huevos

Este artículo relata un proyecto personal de 25 años para rastrear el precio de los huevos a través de recibos escaneados, utilizando tecnologías de vanguardia como agentes de codificación con IA (Codex y Claude) y modelos de visión por computadora. El autor comenzó en 2001 guardando imágenes de rec

03 Mar 2026

Convierte imágenes a texto: OCR online gratis

## OCR Online: Convirtiendo Imágenes y PDFs Escaneados en Texto Editable ¿Qué es y por qué es importante? Online OCR (Reconocimiento Óptico de Caracteres) es una tecnología que permite convertir imágenes, ya sean fotografías de documentos, escaneos de PDFs o archivos en formatos como JPG o PNG, en

24 Feb 2026

Optofono: el invento que 'sonificaba' textos para invidentes

El Optofono es un dispositivo pionero diseñado a principios del siglo XX para ayudar a personas con ceguera a leer. Su importancia radica en ser una de las primeras aplicaciones conocidas de la sonificación, una técnica que transforma datos en sonido. Inventado por el Dr. Edmund Fournier d'Albe en 1

17 Feb 2026

Diarios revelan vida de guardabosques en California

El proyecto "US Forest Service Diaries" es una valiosa ventana al pasado, ofreciendo una colección digitalizada y transcrita de los diarios de Reuben P. Box, un guardabosques del Servicio Forestal de los Estados Unidos (USFS) que trabajó en el norte de California entre 1927 y 1945. Estos diarios, or

16 Feb 2026

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

12 Feb 2026

Archivos Epstein: Datos ocultos revelados en documentos

La reciente publicación del Departamento de Justicia (DoJ) de Estados Unidos de archivos relacionados con Jeffrey Epstein ha sido objeto de críticas por errores y omisiones, incluyendo la censura inadecuada de nombres y datos, la exposición accidental de credenciales de acceso y la corrupción de alg

11 Feb 2026

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com

04 Feb 2026

A case study in PDF forensics: The Epstein PDFs

El Departamento de Justicia de EE. UU. ha publicado una nueva tanda de archivos relacionados con Jeffrey Epstein, lo que ha provocado un análisis forense de los documentos PDF resultantes. Expertos de la PDF Association han examinado una muestra aleatoria de estos archivos, confirmando que las corre