25 Apr 2026 · Original en inglés · Resumen IA

LamBench: Nuevos LLMs compiten por el liderazgo

Fuentes: Nuevos modelos de lenguaje grandes compiten en LamBench

Una nueva evaluación comparativa llamada LamBench ha revelado un panorama competitivo entre los modelos de lenguaje grandes (LLMs). La prueba, publicada recientemente, evalúa el rendimiento de estos modelos en tareas de inferencia. El modelo 'gpt-5.4' lidera la clasificación con un 91.7% de precisión, seguido de cerca por 'opus-4.6' (90.0%) y 'gpt-5.3-codex' (89.2%). Otros modelos notables incluyen 'gemini-3.1-pro-preview' y 'opus-4.7', ambos con un 88.3%.

La relevancia de esta evaluación radica en la creciente importancia de los LLMs en diversas aplicaciones, desde chatbots hasta generación de contenido. LamBench proporciona una métrica estandarizada para comparar el rendimiento de estos modelos, lo que ayuda a los desarrolladores y usuarios a elegir la opción más adecuada para sus necesidades. La prueba también destaca la rápida evolución del campo de la inteligencia artificial, con nuevos modelos y mejoras constantes en el rendimiento. Modelos como 'kimi' y 'qwen' se sitúan más abajo en la clasificación, mostrando una brecha de rendimiento significativa con los líderes. La prueba incluye una amplia gama de modelos, desde los más potentes hasta versiones más ligeras como 'gpt-5.4-mini' y 'gemini-3.1-flash-lite-preview'.

Temas

ia empresas

Etiquetas

openai lambench llm inteligencia artificial google gemini opus kimi qwen deepseek

Entidades mencionadas

GPT-5.4 software

opus-4.6 software

GPT-5.3-Codex software

opus-4.7 software

gemini-3.1-pro-preview software

sonnet-4.6 software

GPT-5.5 software

GPT-5.2 software

GPT-5.1 software

kimi-k2.6 software

GPT-5 software

GPT-5 es un modelo de lenguaje de gran tamaño desarrollado y alojado por OpenAI. Es su modelo GPT insignia y con capacidades de agente, y fue lanzado el 7 de agosto de 2025. GPT-5 es accesible a travé

Ver en Wikipedia

gpt-5.4-mini software

deepseek-v4-pro software

qwen/qwen3.6-plus software

x-ai/grok-4.20 software

z-ai/glm-5.1 software

gemini-3.1-flash-lite-preview software

kimi-k2-thinking software

moonshotai/kimi-k2.6 software

google/gemma-4-31b-it software

GPT-5.3-Codex-Spark software