La curva de campana: ¿por qué es tan común?

Fuentes: The Math That Explains Why Bell Curves Are Everywhere | Quanta Magazine

El artículo de Quanta Magazine explora el origen y la importancia del Teorema del Límite Central (TLC), un principio matemático fundamental que explica por qué la curva de campana (distribución normal) aparece tan frecuentemente en diversos conjuntos de datos. La curva de campana, esa forma suave y simétrica, se observa al medir alturas de personas, tiempos de maratón, puntajes de exámenes, o incluso al contar los resultados de lanzar una moneda repetidamente. La clave para entender esto reside en el TLC.

El TLC, descubierto inicialmente por Abraham de Moivre en el siglo XVIII mientras asesoraba a jugadores de azar, establece que la media de un gran número de variables aleatorias independientes, independientemente de su distribución original, tiende a seguir una distribución normal. De Moivre se maravilló de este orden subyacente en la aparente aleatoriedad, utilizándolo para calcular probabilidades en juegos de azar. Pierre-Simon Laplace, décadas después, formalizó el TLC, revelando su alcance y poder predictivo.

Imaginemos lanzar un dado. Cada resultado (1 al 6) tiene la misma probabilidad. Si calculamos el promedio de múltiples lanzamientos, ese promedio se distribuirá alrededor de 3.5, formando una curva de campana. Lo sorprendente es que este patrón emerge incluso cuando la distribución inicial (el lanzamiento del dado) es uniforme y aparentemente sin estructura. El TLC nos dice que, al promediar suficientes observaciones, la distribución resultante se normaliza.

Este principio tiene aplicaciones vastísimas. Por ejemplo, la altura humana es el resultado de múltiples factores (genética, nutrición, etc.) que se combinan de manera independiente. El TLC explica por qué las alturas se distribuyen en una curva de campana, a pesar de la complejidad de los factores involucrados. Los científicos lo utilizan para inferir información sobre el mundo, y los estadísticos para detectar posibles fraudes (como una moneda trucada).

Sin embargo, el TLC no es una panacea. Requiere que las muestras sean independientes y numerosas. Además, a veces los valores atípicos (outliers) son más relevantes que el promedio, especialmente al analizar fenómenos extremos como inundaciones. A pesar de estas limitaciones, el Teorema del Límite Central es una piedra angular de la estadística moderna, permitiendo extraer significado y hacer predicciones a partir de la aleatoriedad.