Cassandra 5: Trie optimiza eficiencia y almacenamiento

Fuentes: Cassandra 5 Introduces Trie-Based LSM Tree for Improved Efficiency

Cassandra 5, lanzada en 2024, introduce una mejora significativa en su eficiencia gracias a la implementación de un árbol de búsqueda de Trie en el Log-Structured Merge Tree (LSM Tree), reemplazando al Skiplist tradicional. Este cambio, liderado por Branimir Lambov de IBM (a través de la adquisición de DataStax), optimiza el uso de memoria y el almacenamiento. Lambov, un committer de Cassandra con una extensa trayectoria en el desarrollo de la base de datos, inició este proyecto hace casi una década, inicialmente como una prueba de concepto para aprovechar el ordenamiento de bytes en las claves. La tecnología, previamente utilizada en la versión propietaria de DataStax (DSE 6), ahora está disponible para la comunidad de código abierto. El nuevo Trie memtable, junto con el formato BTI (Trie-Indexed Bigtable), han demostrado mejoras notables en el rendimiento de las consultas y el manejo de particiones anchas. Aunque la adopción generalizada en la comunidad Cassandra aún está por verse, estas innovaciones ya están en uso en los productos de base de datos de DataStax, incluyendo Astra Classic y HCD. El proyecto continúa evolucionando con el objetivo de modernizar aún más los mecanismos de almacenamiento y recuperación de Cassandra.