DjVu: el formato de archivo que aprende

Fuentes: DjVu and its connection to Deep Learning

DjVu es un formato de archivo diseñado para comprimir documentos escaneados, especialmente libros y documentos técnicos, de manera mucho más eficiente que el formato PDF. Aunque menos conocido hoy en día, su superioridad radica en su capacidad para manejar imágenes y texto de forma inteligente, a diferencia de PDF, que a menudo trata las imágenes escaneadas como fotografías de baja calidad (JPEG o TIFF). DjVu asume que el documento contiene una mezcla de texto e imágenes, permitiendo eliminar información redundante y lograr una compresión significativamente mejor.

La historia de DjVu es sorprendentemente interesante. Fue creado por figuras clave en el desarrollo del aprendizaje profundo, como Yann LeCun, Léon Bottou y Yoshua Bengio, quienes también desarrollaron Lush, un lenguaje de programación innovador de los años 90. En la época en que surgió DjVu (finales de los 90), la conexión a Internet era lenta y los archivos PDF eran grandes y poco eficientes. DjVu ofrecía una solución para compartir documentos escaneados de manera más rápida y económica.

Una de las claves de la eficiencia de DjVu es su uso de formatos de imagen internos, como IW44 (similar a JPEG2000) para las imágenes de fondo y JB2 para el texto. IW44 permite una compresión con pérdida gradual, proporcionando imágenes de baja resolución con una fracción del tamaño del archivo original. JB2 utiliza un algoritmo de clustering para identificar patrones que se asemejan a caracteres, lo que permite una compresión aún mayor. Además, DjVu emplea un innovador sistema de codificación aritmética llamado ZP-coder, optimizado para la velocidad de decodificación.

Aunque DjVu ofrece ventajas significativas, su adopción ha sido limitada debido a la falta de soporte generalizado en sistemas operativos y navegadores. Adobe se aseguró de que PDF estuviera disponible en todos los dispositivos, mientras que encontrar y configurar un lector de DjVu era más complicado. Actualmente, la falta de soporte nativo en lectores de libros electrónicos (Kindle, Kobo) obliga a muchos usuarios a recurrir a soluciones alternativas, como el rooting de dispositivos y la instalación de aplicaciones personalizadas como Koreader.

El autor sugiere que, a pesar de su falta de popularidad, DjVu sigue siendo un formato valioso, especialmente para preservar y compartir conocimiento en forma de libros escaneados, y considera que su uso podría ser más extendido si existiera un soporte más amplio para LaTeX. En esencia, DjVu se ha convertido en un formato 'punk rock' debido a su resistencia a la corriente principal y su utilidad para aquellos que buscan una solución de compresión superior.