Apache Parquet
software · 5 menciones
Noticias que mencionan Apache Parquet
Error en Shopify: Nombre de país causa interrupción de datos
Un error inesperado en el pipeline de datos de Shopify, causado por el nombre oficial del país de Moldavia, ha interrumpido temporalmente la replicación de datos a su sistema de análisis. El problema surgió porque el nombre completo de Moldavia, “Moldova, Republic of”, contenía una coma, que al ser
Vortex: Nueva compresión de datos supera a Parquet
SpiralDB ha anunciado que su sistema de compresión de datos Vortex supera significativamente a Parquet con ZSTD en términos de tamaño y velocidad de descompresión. Vortex utiliza un enfoque inspirado en el trabajo BtrBlocks de la TU Munich, que consiste en probar múltiples codecs de compresión y per
Hardwood: Parser Parquet más rápido y ligero
Un nuevo parser de código abierto llamado Hardwood ha sido lanzado para el formato de archivo Apache Parquet. Desarrollado por Gunnar Morling, Hardwood busca ofrecer una alternativa más eficiente y con menos dependencias a la biblioteca `parquet-java` existente, que es ampliamente utilizada pero inc
Apache Arrow: 10 años de intercambio de datos
El proyecto Apache Arrow celebra su décimo aniversario el 5 de febrero de 2026. Iniciado en 2016 como un esfuerzo conjunto para estandarizar el intercambio eficiente de datos columnares entre diferentes bibliotecas y sistemas, Arrow complementa a Apache Parquet al proporcionar un formato en memoria.
Lance: Nueva alternativa para Big Data
Un nuevo formato de archivo y tabla llamado Lance ha surgido como una alternativa optimizada a Apache Iceberg y Delta Lake, generando interés en el mundo del big data y el almacenamiento de objetos. Desarrollado en 2025, Lance combina un formato de archivo similar a Parquet (optimizado para lecturas
