TimescaleDB incorpora un motor de compresión híbrido fila-columnar llamado Hypercore que puede reducir el espacio ocupado por datos de series temporales hasta un 98%, una cifra muy superior a la que ofrece el mecanismo TOAST de PostgreSQL. Mientras TOAST se limita a comprimir valores individuales de gran tamaño (text, jsonb, bytea, numeric) mediante algoritmos de propósito general como pglz o lz4, la compresión de TimescaleDB trabaja sobre patrones entre filas dentro de cada chunk y aplica un algoritmo distinto según el tipo de columna.
Cuando un chunk cumple la política configurada (por ejemplo, tener más de siete días), sus filas se reorganizan en lotes de hasta 1000 registros, cada uno convertido en una sola fila columnar cuyas columnas se almacenan como arrays comprimidos. Sobre esos lotes se aplican técnicas especializadas: delta encoding y delta-of-delta para timestamps y valores numéricos con cambios pequeños, simple-8b para empaquetar enteros pequeños en pocos bits, codificación XOR (estilo Gorilla) para floats de sensores, run-length encoding para columnas con valores repetidos como identificadores de máquina o tipo de sensor, y compresión por diccionario para cadenas. En cargas IoT típicas con floats y marcas temporales —columnas que TOAST no comprime— TimescaleDB logra ratios de 10 a 100×, frente al ~1× de TOAST. El artículo detalla además la sintaxis SQL para habilitar la compresión, elegir columnas a comprimir, definir el segmentby y el orderby, y convertir chunks manualmente o de forma automática.
