Cómo Fastly aplica el coeficiente de Gini a la planificación de capacidad en el edge

Fuentes: Using the Gini Coefficient to Plan Edge Capacity

Fastly, proveedor global de edge cloud, ha incorporado el coeficiente de Gini —una métrica macroeconómica usada para medir desigualdad— al núcleo de su modelo de planificación de capacidad en sus puntos de presencia (POP). La compañía necesitaba responder preguntas concretas: si un POP aguantará el lanzamiento de un videojuego, cuánta holgura hay ante un evento deportivo en directo o dónde invertir en infraestructura dentro de meses o años, en un contexto de crecimiento de cargas de inteligencia artificial y seguridad.

El equipo probó primero un arsenal estándar de inteligencia artificial y aprendizaje automático: AutoML, redes neuronales, modelos de árboles, ensembles, regresiones, modelos de series temporales e incluso modelos de lenguaje grandes. Muchos funcionaban bien con tráfico ordinario, pero fallaban en los casos raros y extremos que más importan para planificar capacidad.

La clave fue tratar la desigualdad de tráfico como señal de primera clase. La observación central es que la eficiencia del caché —en el procesador, en el servidor y en el POP completo— depende de la popularidad, que es una forma de desigualdad. Cuando unos pocos clientes concentran la mayor parte del tráfico, la caché命中率 mejora y la CPU se descarga. El coeficiente de Gini, reescalado con raíz cuadrada, correlaciona con la tasa de acierto de caché incluso en los escenarios más extremos, como un gran lanzamiento de videojuego observado en el POP de EWR.

El modelo resultante es pequeño, interpretable y lo bastante rápido para análisis interactivo de escenarios. Lleva más de un año en producción. Combina un modelo de caché (raíz del coeficiente de Gini más la fracción de tráfico de los N clientes mayores, ajustado por regresión robusta) con la predicción de utilización de CPU según la mezcla de tráfico, permitiendo responder a preguntas contraintuitivas del tipo «qué pasaría si Compute y Seguridad crecen el doble que el tráfico de entrega» o «cuánto tráfico adicional de descarga puede absorber esta región».