13 Apr 2026 · Original en inglés · Resumen IA

IA: Nuevo test revela quién 'inventa' más información

Fuentes: AI Hallucination Benchmark — Fabrication Rankings

Un nuevo análisis comparativo realizado por BridgeBench.ai ha evaluado la propensión a la "alucinación" en 27 modelos de inteligencia artificial, revelando la frecuencia con la que estos sistemas inventan información falsa al analizar código. La prueba, actualizada el 12 de abril de 2024, se basa en 30 tareas y 175 preguntas, verificadas a través de la ejecución de código y la comparación con datos de referencia. El modelo Claude Opus 4.6 de Anthropic lidera la clasificación, seguido de GPT-5.4 de OpenAI y Qwen 3.6 Plus de OpenRouter. Los modelos Grok de xAI, incluyendo Grok 4 y Grok 3, ocupan posiciones intermedias, mientras que otros modelos como GLM 5 y GPT-4.1 se encuentran más abajo en la lista. El estudio destaca la importancia de evaluar la fiabilidad de los modelos de IA, especialmente en tareas que requieren precisión y veracidad, como el análisis de código. La "alucinación" en IA es un problema creciente que puede llevar a resultados incorrectos y decisiones erróneas, por lo que este tipo de evaluaciones son cruciales para el desarrollo de sistemas más confiables.

Temas

empresas ia

Etiquetas

openai anthropic xai bridgebench.ai inteligencia artificial gpt-4 claude opus grok alucinación ia análisis de código

Entidades mencionadas

GPT-4.1 software

GPT-4o mini software

Grok 3 software

Claude Sonnet 4.6 software

Gemini 3.1 Pro software

Claude Opus 4.6 software

Kimi K2.5 software

Gemini 3 Pro software

GPT-5.4 software

Anthropic organization

Anthropic es una empresa emergente estadounidense de investigación y desarrollo de inteligencia artificial (IA) fundada por exmiembros de OpenAI.

Ver en Wikipedia

MiniMax M2.5 software

MiniMax organization

MiniMax es una empresa de inteligencia artificial (IA) con sede en Shanghái, China. A partir de 2024, los inversores la han denominado una de las empresas "Tigres de la IA" de China.

Ver en Wikipedia

OpenAI organization

OpenAI, LLC es una empresa estadounidense de investigación y despliegue de inteligencia artificial fundada en 2015 e, inicialmente, sin ánimo de lucro. Su misión original era asegurar que la inteligen

Ver en Wikipedia

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

OpenRouter organization

OpenRaster es un formato de archivo propuesto para el intercambio común de imágenes basados en capas entre los editores de Gráficos Rasterizados. Está pensado para reemplazar las antiguas versiones de

Ver en Wikipedia

GPT-4o software

Claude Haiku 4.5 software

Qwen 3.6 Plus software

Qwen3.5 Plus software

Grok 4.20 (Non-Reasoning) software

Claude Opus 4.6 (April 12) software

GLM 5.1 software

GPT-5.4 Mini software

GLM 5V Turbo software

Grok 3 Mini software

Gemma 4 31B software

GLM 5 Turbo software

Grok 4 software

GPT-5.4 Nano software

GLM 5 software

MiniMax M2.7 software

Moonshot AI organization

Moonshot AI es una empresa de inteligencia artificial (IA) con sede en Pekín, China. A partir de 2024, los inversores la han calificado como una de las empresas «tigre de la IA» de China, ya que se ce

Ver en Wikipedia

x-ai organization

xAI es una startup de inteligencia artificial (IA) fundada el 12 de julio de 2023 por Elon Musk. Según Musk, el objetivo de la empresa es «comprender la verdadera naturaleza del universo». La empresa

Ver en Wikipedia

z-ai organization

Z Air (anteriormente EZ Air) es una aerolínea de servicio regional de pasajeros y proveedor de ambulancia aérea de Bonaire fundada en mayo de 2000. Su sede está ubicada en Kralendijk (Bonaire), con of

Ver en Wikipedia