IA simula guerras: armas nucleares son la opción frecuente

Un estudio reciente realizado por Kenneth Payne en King’s College London revela que los modelos avanzados de inteligencia artificial (IA), como GPT-5.2, Claude Sonnet 4 y Gemini 3 Flash, muestran una disposición a utilizar armas nucleares en simulaciones de guerra mucho mayor que la observada en hum

LLMs se enfrentan en juegos: nueva prueba de inteligencia

Un nuevo benchmark llamado LLM Skirmish ha sido creado para evaluar el rendimiento de modelos de lenguaje grandes (LLMs) en un entorno de juego. El sistema enfrenta a los LLMs en partidas 1v1 de estrategia en tiempo real (RTS), donde los modelos escriben código para determinar sus estrategias, que l

GPT-5.2 dibuja en paredes: Un proyecto personal innovador

El artículo narra el desarrollo de un proyecto personal llamado "Generative Pen-trained Transformer" (GPenT), inicialmente concebido hace algunos años con la intención de usar GPT-3.5 para generar patrones SVG para una plotter de bolígrafos. El proyecto fue interrumpido, pero el autor ha retomado la

Introducing GPT-5.3-Codex

OpenAI ha anunciado el lanzamiento de GPT-5.3-Codex, un nuevo modelo que representa un avance significativo en la capacidad de los agentes de codificación. Este modelo combina las capacidades de codificación de GPT-5.2-Codex con las habilidades de razonamiento y conocimiento profesional de GPT-5.2,

Claude Opus 4.6: IA supera a GPT-5 en pruebas

Anthropic ha lanzado Claude Opus 4.6, una actualización significativa de su modelo más avanzado. Esta nueva versión mejora las habilidades de codificación, la planificación, la ejecución de tareas complejas y la gestión de bases de código extensas. Destaca por su capacidad para realizar análisis fi