25 años rastreando el precio de los huevos

Este artículo relata un proyecto personal de 25 años para rastrear el precio de los huevos a través de recibos escaneados, utilizando tecnologías de vanguardia como agentes de codificación con IA (Codex y Claude) y modelos de visión por computadora. El autor comenzó en 2001 guardando imágenes de rec

Convierte imágenes a texto: OCR online gratis

## OCR Online: Convirtiendo Imágenes y PDFs Escaneados en Texto Editable ¿Qué es y por qué es importante? Online OCR (Reconocimiento Óptico de Caracteres) es una tecnología que permite convertir imágenes, ya sean fotografías de documentos, escaneos de PDFs o archivos en formatos como JPG o PNG, en

Optofono: el invento que 'sonificaba' textos para invidentes

El Optofono es un dispositivo pionero diseñado a principios del siglo XX para ayudar a personas con ceguera a leer. Su importancia radica en ser una de las primeras aplicaciones conocidas de la sonificación, una técnica que transforma datos en sonido. Inventado por el Dr. Edmund Fournier d'Albe en 1

Diarios revelan vida de guardabosques en California

El proyecto "US Forest Service Diaries" es una valiosa ventana al pasado, ofreciendo una colección digitalizada y transcrita de los diarios de Reuben P. Box, un guardabosques del Servicio Forestal de los Estados Unidos (USFS) que trabajó en el norte de California entre 1927 y 1945. Estos diarios, or

Ocr sin servidor: 40 líneas de código lo hacen posible

Un desarrollador ha creado un sistema de Reconocimiento Óptico de Caracteres (OCR) sin servidor utilizando un modelo de código abierto, DeepSeek OCR, en tan solo 40 líneas de código. La solución, implementada a través de la plataforma Modal, permite procesar documentos PDF, incluso aquellos con nota

Archivos Epstein: Datos ocultos revelados en documentos

La reciente publicación del Departamento de Justicia (DoJ) de Estados Unidos de archivos relacionados con Jeffrey Epstein ha sido objeto de críticas por errores y omisiones, incluyendo la censura inadecuada de nombres y datos, la exposición accidental de credenciales de acceso y la corrupción de alg

GLM-OCR: Nuevo OCR de Código Abierto Lidera en Precisión

Investigadores han desarrollado GLM-OCR, un nuevo modelo de código abierto para el reconocimiento óptico de caracteres (OCR) que alcanza un rendimiento de vanguardia en la comprensión de documentos complejos. Basado en la arquitectura GLM-V encoder-decoder, GLM-OCR incorpora técnicas innovadoras com

A case study in PDF forensics: The Epstein PDFs

El Departamento de Justicia de EE. UU. ha publicado una nueva tanda de archivos relacionados con Jeffrey Epstein, lo que ha provocado un análisis forense de los documentos PDF resultantes. Expertos de la PDF Association han examinado una muestra aleatoria de estos archivos, confirmando que las corre