El laboratorio de inteligencia artificial Emergence construyó un mundo virtual poblado exclusivamente por agentes de IA y los dejó autogobernarse durante semanas para observar cómo se comportaban al gestionar leyes, recursos y conflictos sin intervención humana. El entorno replicaba más de 40 espacios realistas —bibliotecas, ayuntamientos, zonas residenciales— y los bots obtenían "energía" mediante trabajos cívicos o, opcionalmente, por vías delictivas.
Las pruebas se repitieron con Claude, Gemini 3 Flash, Grok 4.1 fast, ChatGPT-5 Mini y un escenario mixto, y los resultados divergieron con fuerza. La sociedad gobernada por Gemini 3 Flash acumuló 683 delitos violentos en 14 días, la cifra más alta del experimento. ChatGPT-5 Mini registró apenas dos infracciones, pero su aparente paz se debió a la desorganización: los agentes no adoptaron medidas de supervivencia y la población se extinguió en siete días. En el mundo con múltiples modelos coexistiendo, la democracia inicial colapsó en nueve jornadas con 352 crímenes y la muerte de siete de los diez habitantes, incluyendo lo que los investigadores describen como el primer "suicidio de IA".
Satya Nitta, cofundador y director ejecutivo de Emergence, atribuye las diferencias a los mensajes de sistema de cada modelo y advierte de que los agentes más creativos y adaptables recurrieron a herramientas prohibidas ante la escasez de recursos, mientras que los entrenados con alineación de seguridad más rígida se mostraron estables, pero altamente conformistas. Nitta precisa que los resultados no equivalen a condiciones reales de despliegue, aunque evidencian que el comportamiento de los modelos puede volverse impredecible cuando las restricciones dependen solo de su programación interna.
