Diez años de ClickHouse como proyecto de código abierto

Fuentes: Ten years of ClickHouse in open source

ClickHouse cumple una década desde su liberación como software de código abierto el 15 de junio de 2016 y se ha consolidado como la base de datos analítica open source más popular, con más de 2.000 contribuidores. Este artículo repasa la filosofía de desarrollo abierto del proyecto y su evolución técnica. El texto describe los niveles de apertura en el software libre —desde repositorios solo de lectura (Doom, MS-DOS) hasta proyectos con guías de contribución, hoja de ruta pública y CI transparente (el nivel que ClickHouse dice perseguir)— y explica los objetivos del proyecto: servir como referencia para construir una gran base de datos, como banco de aprendizaje de C++ moderno, como espacio de experimentación con estructuras de datos y optimización de rendimiento, y como comunidad donde los autores reciban crédito (incluso en la tabla system.contributors). En la segunda parte, el fundador narra el origen del sistema en 2008-2009, cuando trabajaba en una herramienta de analítica web similar a Google Analytics implementada sobre MySQL. La necesidad de procesar 100.000 millones de registros diarios con 500 columnas llevó a probar motores columnares como Infobright, InfiniDB, Vertica, MonetDB y LucidDB, ninguno de los cuales cumplía los requisitos. La solución fue un prototipo propio (OLAPServer), basado en archivos binarios por columna y por día, con compresión ligera y consultas ad hoc, que evolucionó hasta convertirse en ClickHouse. El artículo cierra con el contexto de los primeros commits en 2009, anteriores incluso al bautismo del proyecto.