Este artículo explica de manera didáctica las estadísticas bayesianas, un tema que a menudo resulta confuso para los científicos de datos. La estadística bayesiana se presenta como una alternativa a la estadística frecuentista, una metodología dominante pero a veces carente de intuición. La principal diferencia radica en la forma en que se conceptualiza la probabilidad: en la estadística frecuentista, la probabilidad se refiere a la frecuencia relativa de un evento en una serie de ensayos, mientras que en la estadística bayesiana, la probabilidad representa un grado de creencia.
Para ilustrar esto, se utiliza el ejemplo de un dado con un número desconocido de caras. Un estadístico frecuentista consideraría el número de caras como un parámetro fijo y desconocido, mientras que un estadístico bayesiano lo trataría como una variable aleatoria con su propia distribución de probabilidad, influenciada por la información previa (prior) y los datos observados (likelihood). La fórmula central es el Teorema de Bayes, que permite actualizar la distribución de probabilidad del parámetro a partir de los datos.
La estadística bayesiana ofrece ventajas como la incorporación de conocimiento previo, la obtención de intervalos de credibilidad (que indican la probabilidad de que el parámetro se encuentre dentro de un rango específico) y una mejor gestión de la incertidumbre. Se compara el enfoque bayesiano con el frecuentista en el ejemplo del dado, mostrando cómo ambos métodos pueden llegar a resultados similares, pero con diferentes interpretaciones. El artículo también aborda la elección del 'prior', enfatizando que no necesita ser perfecto, sino que debe ser razonable y proporcionar información inicial. Finalmente, se menciona la importancia de la normalización constante en el Teorema de Bayes y cómo a menudo se evitan cálculos complejos para simplificar el proceso. El artículo concluye que la elección del prior y la cantidad de datos disponibles influyen directamente en la incertidumbre del resultado.
