La IA en la Sala de Emergencias: Más precisa que médicos humanos según estudio de Harvard

Fuente: TechCrunch · Anthony Ha · 3 de mayo de 2026

Resumen

Un nuevo estudio publicado en la revista Science examina el rendimiento de modelos de lenguaje complejos en diversos contextos médicos. En experimentos con casos reales de urgencias, los modelos de inteligencia artificial de OpenAI demostraron ser, en ciertos escenarios de triaje, más precisos en sus diagnósticos que los médicos humanos tratantes.

¿Qué cambia exactamente?

La investigación, liderada por la Facultad de Medicina de Harvard y el Centro Médico Beth Israel Deaconess, comparó los diagnósticos de dos médicos internistas con los generados por los modelos o1 y 4o de OpenAI en 76 pacientes reales. La evaluación fue realizada a ciegas por otros dos médicos independientes.

A diferencia de otros estudios, los investigadores no preprocesaron los datos: a los modelos de IA se les presentó exactamente la misma información basada en texto que estaba disponible en los registros médicos electrónicos en el momento de la consulta.

Rendimiento de los modelos

En el triaje inicial (donde hay menos información disponible y mayor urgencia), el modelo o1 de OpenAI logró el mejor desempeño general:

Diagnosticador	Precisión en Diagnóstico Exacto o Aproximado
Modelo de IA (o1)	67%
Médico Internista 1	55%
Médico Internista 2	50%

⚠️ Importante: el estudio no afirma que la IA esté lista para tomar decisiones cruciales de vida o muerte. Los hallazgos subrayan la necesidad urgente de realizar ensayos prospectivos en entornos reales de atención al paciente.

Limitaciones y críticas del sector

Aspecto	Detalle
Tipo de datos admitidos	Solo información basada en texto; limitaciones en entradas no textuales.
Marco legal	No existe un marco formal de rendición de cuentas para diagnósticos por IA.
Sesgo de comparación	Se comparó la IA con médicos internistas, no con especialistas en urgencias.

El punto de vista de los profesionales

La Dra. Kristen Panthagani, médica de urgencias, advirtió que el titular puede generar expectativas exageradas. Señaló que el objetivo principal en una emergencia no es adivinar el diagnóstico final, sino descartar afecciones que pongan en riesgo la vida del paciente. Además, los pacientes siguen prefiriendo que los humanos los guíen en las decisiones difíciles de tratamiento.

Punto de atención: la necesidad de validación

Los autores del estudio recalcan que estos resultados demuestran el enorme potencial de la IA como herramienta de apoyo, pero insisten en que aún se requiere validación clínica rigurosa antes de integrarla formalmente en la práctica médica diaria.