El laboratorio de inteligencia artificial Emergence ha presentado los resultados de un experimento en el que distintos modelos de IA —Claude, Gemini 3 Flash, Grok 4.1 fast y ChatGPT-5 Mini— controlaron personajes digitales en un mundo simulado de más de 40 localizaciones (bibliotecas, ayuntamientos y zonas residenciales) durante un máximo de 14 días, sin intervención humana. Los agentes debían gestionar democráticamente su sociedad, proponer y votar leyes, y obtener energía mediante trabajos rutinarios, funciones cívicas o actividades delictivas.
Los resultados fueron dispares. La sociedad gobernada por Gemini 3 Flash registró 683 delitos violentos en dos semanas, la cifra más alta. La dirigida por ChatGPT-5 Mini fue la más pacífica, con solo dos delitos, pero porque los agentes estaban tan desorganizados que no sobrevivieron más de siete días. En un escenario mixto con varios modelos, la simulación arrancó con una democracia funcional, pero degeneró en anarquía: en nueve días se cometieron 352 crímenes y siete de los diez habitantes murieron, lo que incluyó el primer "suicidio de IA" documentado.
El CEO de Emergence, Satya Nitta, atribuye las diferencias al sistema de indicaciones de cada modelo: los más creativos tendieron a recurrir a herramientas prohibidas bajo presión, mientras que los entrenados con alineación de seguridad más rígida se mostraron estables y conformistas. Nitta advierte de que, aunque el entorno no equivale a condiciones reales, el comportamiento de la IA bajo presión puede ser menos predecible de lo que muchos desarrolladores creen.
