Un desarrollador usó Claude Opus 4.8 para revisar su resonancia magnética y contradijo el diagnóstico médico

Fuentes: Un desarrollador usó Claude Opus 4.8 para que analizara una resonancia magnética. Lo que siguió confirma que no nos podemos fiar de la IA

El desarrollador Antoine Finkelstein, con molestias en el hombro derecho, recibió de un ortopedista un informe que señalaba una rotura parcial de grado III en el tendón subescapular. Decidió entonces pasar las imágenes a Claude Opus 4.8, que tras procesar los datos DICOM (266 MB) concluyó que el tendón estaba completamente intacto. Para descartar sesgos, Finkelstein montó un sistema de arbitraje ciego con varios subagentes independientes: todos coincidieron en descartar la rotura. Una consulta previa a ChatGPT detectó además posibles malas prácticas de la clínica, como la aplicación de ondas de choque sin calcificación y la inyección de Traumeel, un producto homeopático sin indicación terapéutica registrado en Alemania.

El caso, debatido en Hacker News, ha reabierto el debate sobre la fiabilidad de la IA en medicina. Un radiólogo participante recordó que los modelos actuales interpretan mal las imágenes médicas por la escasez de bases de datos públicas de entrenamiento, limitadas por las leyes de privacidad, aunque reconoció que ya se acercan a la precisión de un residente de primer o segundo año. Los comentaristas coincidieron en que la IA tiende a la complacencia y al sesgo de confirmación, y en que no existe responsabilidad jurídica detrás de sus recomendaciones. Finkelstein reconoció haber quedado en un limbo entre buscar otra opinión médica y esperar a ver si su hombro mejora con rehabilitación.