PDFs adaptables: humanos ven el diseño, máquinas obtienen markdown
Los archivos PDF están diseñados para la visualización humana: almacenan coordenadas y tipografía, pero rara vez incluyen información estructural como encabezados o listas. Esto no suponía un problema hasta que los modelos de lenguaje (LLM) comenzaron a procesar PDFs de forma masiva. Al carecer de e
