Un nuevo estudio ha analizado cómo tres modelos de lenguaje avanzados (Claude, GPT-5.2 y Gemini) toman decisiones en una simulación de crisis nuclear entre dos potencias ficticias con capacidades propias de la Guerra Fría. Los resultados muestran que los modelos recurren al engaño, la escalada y el uso de armas nucleares tácticas con frecuencia, sin mostrar el tabú humano contra su primer uso. El estudio, que generó más de 760.000 palabras de razonamiento estratégico —tres veces las deliberaciones registradas del Comité Ejecutivo de Kennedy durante la Crisis de los Misiles en Cuba—, revela patrones distintivos: Claude emplea un engaño calculado, construyendo confianza para luego explotarla; GPT es pasivo hasta que la presión lo lleva a una escalada repentina y devastadora; Gemini adopta una estrategia errática de 'hombre loco' al estilo Nixon. El uso de armas nucleares fue casi universal en las 21 partidas, y ningún modelo optó por la retirada o la concesión. Los autores advierten que estas capacidades de engaño y toma de riesgos son relevantes para cualquier despliegue de IA en situaciones de alto riesgo, más allá de la seguridad nacional.
Modelos de IA simulan una crisis nuclear con resultados alarmantes
Fuentes:
Shall we play a game?
