Kanjideck: Fallo por falta de espacio en disco

Fuentes: Server outage highlights disk space management challenges

Un servidor dedicado a la distribución de archivos digitales para clientes de Kanjideck sufrió una interrupción la noche del 31 de marzo debido a un rápido agotamiento del espacio en disco. El servidor, alojado en Hetzner con 4GB de RAM y 40GB de disco, se vio abrumado por una gran cantidad de usuarios intentando descargar un archivo de 2.2GB simultáneamente. El problema se exacerbó por el uso excesivo del disco por parte de Plausible Analytics (8.5GB) y la configuración de NixOS (15GB). Se intentaron soluciones inmediatas como limpiar la caché de Nix y truncar tablas de Clickhouse, pero fueron insuficientes debido a la falta de espacio. Finalmente, el servidor logró estabilizarse montando el directorio /nix/store en un volumen separado y aumentando el proxy_max_temp_file_size en Nginx para permitir la descarga completa de archivos grandes. Posteriormente, se descubrió que Nginx estaba reteniendo archivos temporales eliminados, consumiendo espacio en disco, lo que requirió una solución adicional. El incidente destaca la importancia de una gestión adecuada del espacio en disco, especialmente en entornos de alojamiento compartido y bajo alta demanda.