La IA alcanza el 76 % de precisión en consultas de salud, según un estudio

Fuentes: La IA alcanza el 76 % de precisión en consultas de salud, según un estudioT3clickbait
Imagen generada por IA con el prompt: Editorial illustration of a doctor at a desk with a laptop showing a health chatbot conversation, soft blue clinical lighting, medical books and stethoscope in background, calm neutral palette
Imagen generada con IA

Los asistentes virtuales de inteligencia artificial responden a preguntas cotidianas de salud de usuarios generales con una precisión del 76,2 %, según un estudio dirigido por investigadores de Penn State (Estados Unidos) que se presentará en la conferencia FAccT 2026 de Montreal, del 25 al 28 de junio. El trabajo advierte de que, pese a la tasa de acierto, la IA todavía duplica la tasa de error de los médicos humanos, lo que suscita dudas sobre su uso directo por pacientes.

En la investigación, organizada como una competencia bautizada 'Diagnose-a-thon', 34 participantes —profesores, personal administrativo y estudiantes de grado y posgrado— generaron 212 preguntas y respuestas sobre problemas de salud reales e imaginarios, desde la perspectiva del paciente y del médico. Pudieron elegir entre cuatro modelos de lenguaje: ChatGPT-4o, ChatGPT-3.5, Gemini-1.5 Pro y Llama3-8b. Nueve médicos certificados evaluaron la precisión y el posible daño de las respuestas en una escala de seis puntos.

Las especialidades de obstetricia y ginecología, y otorrinolaringología obtuvieron las mejores puntuaciones de validez y las menores de riesgo, mientras que medicina interna, neurología y dermatología mostraron el peor rendimiento. Las preguntas más específicas y las de entre 60 y 250 caracteres generaron respuestas más precisas. Los investigadores también reentrenaron los modelos base con libros de texto médicos, guías clínicas y artículos revisados por pares, pero un panel de siete profesionales y estudiantes prefirió las respuestas de los modelos base Gemini y Llama frente a los aumentados, sin preferencia clara en el caso de ChatGPT.

Los autores concluyen que la IA no sustituirá a los médicos, pero puede servir como herramienta complementaria. Con todo, una tasa de error superior al 20 % —aproximadamente el doble que la de los facultativos— puede resultar perjudicial para los pacientes si se utiliza sin supervisión profesional.