Paradoja del cumpleaños: ¿cuántos para coincidir?

Fuentes: When is your birthday? - The Math Behind Hash Collisions
Paradoja del cumpleaños: ¿cuántos para coincidir?
Imagen generada con IA

La paradoja del cumpleaños es un fenómeno probabilístico que demuestra cómo nuestra intuición sobre el azar suele fallar. En esencia, se pregunta: ¿cuál es la probabilidad de que, en un grupo de personas, al menos dos compartan la misma fecha de nacimiento? La respuesta más conocida es que con apenas 23 individuos la probabilidad supera el 50 %. La demostración usa un razonamiento de «complemento»: es más fácil calcular la probabilidad de que todos los cumpleaños sean distintos y restarla de 1. Para n personas esto equivale a (365·364·…·(365‑n+1))/365ⁿ, que para n=23 resulta ≈0,507, es decir, un 50 % de posibilidades.

Sin embargo, este cálculo solo detecta un único par coincidente. En la década de 1930, empleados de una aseguradora se encontraron con que, entre sus 60 compañeros, tres compartían el mismo día de nacimiento. Intentaron calcular la probabilidad de un evento muy específico –tres personas nacidas en un día prefijado– y obtienen un valor del orden de milésimas. El matemático Richard von Mises señaló que estaban mirando el problema desde la perspectiva equivocada. En lugar de preguntar «¿cuál es la probabilidad de que tres personas elegidas nazcan el 1 de enero?», debemos preguntarnos «¿cuántos días con tres o más nacimientos esperamos encontrar al lanzar 60 «bolas» (personas) en 365 cajas (días)?». Von Mises derivó la distribución esperada de ocupaciones: para s=7 cumpleaños en un mismo día, la probabilidad de que aparezca al menos un día así es ≈0,22, lo que significa que, en promedio, uno de cada 4‑5 grupos de 60 personas contendrá un triplete de cumpleaños. Este valor contrasta drásticamente con el de unas pocas milésimas que obtienen quienes se focalizan en un día concreto.

Esta reinterpretación tiene una conexión directa con la seguridad informática. En las tablas hash, los «días» son las posiciones de la tabla y los «personas» son los valores hash que se insertan. Las colisiones –dos valores con el mismo hash– se rigen por la misma matemática de la paradoja del cumpleaños. Por eso, la llamada Birthday Attack aprovecha que, para encontrar una colisión en una función hash de n posibles salidas, solo se necesitan aproximadamente √n intentos, no n. Por ejemplo, SHA‑256 con 2²⁵⁶ salidas requiere en torno a 2¹²⁸ operaciones para producir una colisión.

Consideraciones clave:
- Las fórmulas exactas son costosas computacionalmente; la aproximación √n es suficiente para evaluar la seguridad de un esquema hash.
- Cuanto mayor sea el espacio de salida de la función hash, más difícil será generar colisiones.
- En diseño de sistemas (bases de datos, caches, firmwares), conocer la carga esperada permite dimensionar las tablas para minimizar choques.
- Mitigar ataques requiere usar funciones hash criptográficas con salidas suficientemente amplias y resistencia demostrada a colisiones.

En resumen, la paradoja del cumpleaños no es solo un juego matemático: es el mismo principio que subyace a las colisiones en tablas hash y a los ataques de cumpleaños en criptografía, recordándonos que la intuición humana debe contrastarse siempre con cálculos rigurosos.