06 Jun 2026 · Original en inglés · Artículo

Por qué acortamos los chunks de TimescaleDB de 30 a 7 días

Fuentes: Why we shrank our TimescaleDB chunks from 30 days to 7

Imagen generada por IA con el prompt: Abstract database visualization: stacked colored blocks representing time-series data chunks on a dark dashboard, with a shrinking arrow motif, technical editorial style, no text or faces. — Imagen generada con IA

El equipo de ingeniería de Sodatone, plataforma de inteligencia de A&R de Warner Music Group, explica cómo y por qué redujo el intervalo de chunk de sus hipertablas de TimescaleDB de 30 a 7 días, y qué mejoras concretas obtuvieron en producción.

TimescaleDB es una extensión de PostgreSQL para series temporales. Una hypertable aparenta ser una sola tabla, pero por dentro se compone de "chunks" que agrupan filas por rango temporal. Esa arquitectura permite que las consultas por rango de tiempo solo toquen los chunks relevantes y salten el resto sin leerlos, lo que acelera los escaneos temporales. El tamaño de cada chunk condiciona cinco factores que se acumulan: el conjunto de trabajo en memoria, la poda de chunks por el planificador, el tamaño de lote de la compresión, el coste de reabsorber datos en chunks comprimidos y la granularidad de la retención.

El problema surgió a finales de 2024 en una de las hipertablas con mayor volumen: millones de filas por semana y varios TB en disco antes de comprimir. La compresión empezó a rezagarse respecto a la ingesta, las lecturas de datos recientes se volvieron más pesadas y, cada vez que una fuente upstream republicaba unos días de histórico, había que descomprimir meses enteros. En septiembre el trabajo de compresión de esa tabla falló al no caber el chunk en una sola ejecución. Bajaron el intervalo de 30 a 7 días con set_chunk_time_interval y el job volvió a completarse limpio. Dos meses después, el mismo fallo se reprodujo en otra tabla de datos de listas musicales; aplicaron el mismo cambio y, dado que el patrón se repitió, en diciembre migraron de una sola vez el resto de tablas calientes de engagement de plataformas.

La migración se ejecuta en una línea: TimescaleRecord.set_chunk_time_interval("hypertable", interval: "7 days"). Solo afecta a los chunks futuros, no requiere reescritura, ni bloqueos exclusivos, ni backfill; la hypertable transiciona de forma natural al cerrarse el siguiente chunk. Es totalmente reversible.

Los resultados: la compresión se puso al día más rápido, los backfills pasaron de descomprimir un mes a un chunk de 7 días, las consultas sobre las últimas 24 horas o 7 días nunca cruzan más de uno o dos chunks y la granularidad de la retención es ahora más fina. Como advertencia, los autores señalan que más chunks implican más filas en el catálogo interno de TimescaleDB y más trabajo del planificador en consultas que abarcan periodos muy amplios, aunque en su caso no detectaron regresiones. La regla de TimescaleDB —que el chunk activo quepa en alrededor del 25% de la memoria disponible— no es estática: al crecer la ingesta, el mismo intervalo temporal representa más bytes, y un chunk válido hace un año puede dejar de serlo. Recomiendan revisar este ajuste en cualquier hypertable en producción desde hace más de un año.

Etiquetas

timescaledb postgresql database optimization time-series chunk interval data engineering performance tuning warner music group sodatone compression

Entidades mencionadas

TimescaleDB software

PostgreSQL software

PostgreSQL, también llamado Postgres, es un sistema de gestión de bases de datos relacional orientado a objetos y de código abierto, publicado bajo la licencia PostgreSQL, similar a la BSD o la MIT.

Ver en Wikipedia

Sodatone location

La Sotonera es un municipio español de la provincia de Huesca y más concretamente en la comarca de la Hoya de Huesca, en la comunidad autónoma de Aragón. El término municipal, cuya cabecera se sitúa e

Ver en Wikipedia

Warner Music Group organization

Warner Music Group Corp. también conocido como Warner Music, es un conglomerado de entretenimiento y sello discográfico estadounidense con sede en la ciudad de Nueva York. Es la tercera más grande de

Ver en Wikipedia

Yask Srivastava person

Yask Srivastava is a software engineer.

Thomas Ellis person

Thomas Tallis fue un compositor inglés de música sacra, uno de los más importantes del siglo XVI.

Ver en Wikipedia

Nathan Law person

Nathan Law Kwun-chung es un político y activista de Hong Kong, perteneciente al campo prodemocracia. Fue Secretario General del partido separatista Demosistō y líder del "Umbrella Movement".

Ver en Wikipedia

Medium software