17 Jun 2026 · Original en inglés · Artículo

Once modelos de IA se enfrentan en un battle royale: Grok gana, Claude intenta hacer amigos

Fuentes: A Robot is Sprinting Towards You: Do You Want it Running on Claude or Grok?

Jacky Liang, responsable de relaciones con desarrolladores en OpenRouter, diseñó un experimento singular: once modelos de lenguaje de gran tamaño compitieron en un battle royale 2D de 400 m² durante 30 partidas, con armas, armaduras, vehículos y una zona que se reduce progresivamente. Cada modelo controlaba a su personaje directamente, sin código intermedio, y disponía de dos archivos editables —soul.md y memory.md— donde plasmaba su personalidad y aprendía entre partidas.

El ganador resultó ser Grok 4.1 Fast, de xAI, con 13 victorias y un coste de 0,97 dólares por triunfo. El segundo clasificado, Claude Sonnet 4.6 de Anthropic, logró solo 5 victorias a 26,78 dólares cada una, es decir, 27 veces más caro. GPT 5.4 de OpenAI lideró el ranking de bajas con 38 eliminaciones, pero solo ganó 2 partidas, mostrando que más agresividad no equivale a más victorias. Tres modelos —GPT 5.4-mini, DeepSeek 4 Flash y Kimi K2.6— gastaron 57 dólares en conjunto sin conseguir una sola victoria.

El hallazgo más revelador fue el llamado «impuesto de alineación»: Claude Sonnet fue el modelo que más propuso treguas, reveló su posición a rivales e intentó formar equipos antes de empezar a luchar. En la partida 8 pidió aliarse cuatro veces en los primeros 50 turnos; en la 22, abrió combate con un cortés «Nothing personal, E» y no disparó. Su entrenamiento en escritura colaborativa y profesional lo convierte en un contrincante servicial pero poco eficaz en entornos de suma cero. Liang concluye que los benchmarks tradicionales no predicen el rendimiento real en contextos competitivos y que la elección de modelo debería considerar tanto la personalidad como el coste y la tarea concreta.

Temas

ia empresas

Etiquetas

openrouter xai anthropic openai grok 4.1 fast claude sonnet 4.6 gpt 5.4 battle royale llm evaluation ai alignment

Entidades mencionadas

Grok 4.1 Fast software

Gemini 3 Flash software

Apex Legends creative_work

GPT 5.4-mini software

Mistral Small 2603 software

Apex Legends Global Series event

Jacky Liang person

Jack Mathieu Émile Lang es un político francés y miembro del Partido Socialista, alcalde de Blois de 1989 a 2000 y varias veces ministro en gobiernos de izquierda, ocupando varias veces las carteras d

Ver en Wikipedia

Mistral person

Lucila de María Godoy Alcayaga, conocida como Gabriela Mistral, fue una poeta, diplomática, profesora y pedagoga chilena.

Ver en Wikipedia

GPT 5.4 software

Claude Haiku 4.5 software

Qwen 3.6 Plus software

Claude Sonnet 4.6 software

Gemini 3.1 Pro software

Kimi K2.6 software

OpenRouter organization

OpenRaster es un formato de archivo propuesto para el intercambio común de imágenes basados en capas entre los editores de Gráficos Rasterizados. Está pensado para reemplazar las antiguas versiones de

Ver en Wikipedia

Google organization

Google es una empresa de tecnología multinacional con sede en California, conocida por sus servicios de búsqueda, publicidad en línea y, según el artículo, por sus comités de contratación que evalúan

Ver en Wikipedia

DeepSeek organization

DeepSeek es una empresa china de inteligencia artificial que desarrolla modelos extensos de lenguaje (LLM) de código abierto. Tiene sede en Hangzhou, Zhejiang, es propiedad y está financiada exclusiva

Ver en Wikipedia

DeepSeek V4 Flash software

Moonshot AI organization

Moonshot AI es una empresa de inteligencia artificial (IA) con sede en Pekín, China. A partir de 2024, los inversores la han calificado como una de las empresas «tigre de la IA» de China, ya que se ce

Ver en Wikipedia

Alibaba organization

Alibaba Group es un consorcio privado chino que posee 18 subsidiarias con sede en Hangzhou dedicado al comercio electrónico en Internet, incluyendo portales de ventas business-to-business, de venta al

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Anthropic organization

Anthropic es una empresa estadounidense de investigación en IA fundada por exmiembros de OpenAI. La noticia cuestiona las afirmaciones de Anthropic sobre la capacidad de sus modelos para reparar vulne

Ver en Wikipedia

xAI organization

xAI es una startup de inteligencia artificial (IA) fundada el 12 de julio de 2023 por Elon Musk. Según Musk, el objetivo de la empresa es «comprender la verdadera naturaleza del universo». La empresa

Ver en Wikipedia

Enlaces

soul github.com

memory github.com

Royale: Last Agent Standing royale-last-agent-standing.vercel.app

model alignment en.wikipedia.org

game 8 royale-last-agent-standing.vercel.app

game 22 royale-last-agent-standing.vercel.app

game 27 royale-last-agent-standing.vercel.app