Los chatbots de IA muestran resultados mixtos en aplicaciones médicas, según estudio

Estudios recientes revelan que los chatbots de IA enfrentan desafíos significativos en aplicaciones médicas, con un estudio que muestra que ChatGPT Health subclasificó el 51,6% de los casos de emergencia. Pacientes con cáncer que usaron un chatbot de IA experimentaron tasas de retiro del 22% debido a problemas de usabilidad, mientras que los investigadores médicos muestran una adopción cautelosa con el 40,3% reportando uso de IA en investigación.

Los chatbots impulsados por inteligencia artificial están mostrando tanto promesa como limitaciones significativas en aplicaciones médicas, según investigaciones recientes que examinan su uso en atención oncológica, triaje de emergencias e investigación médica. Hallazgos iniciales de múltiples estudios revelan desafíos de usabilidad, preocupaciones sobre precisión y desempeño inconsistente que plantean preguntas sobre su preparación para una implementación clínica generalizada.

En el estudio CAM 2.0 que involucró a 73 pacientes con cáncer sometidos a quimiorradioterapia, los investigadores probaron si el monitoreo continuo de actividad habilitado digitalmente combinado con IA podría optimizar el monitoreo de síntomas. Los pacientes fueron asignados aleatoriamente para recibir un rastreador de actividad disponible comercialmente o el mismo rastreador combinado con un chatbot impulsado por IA llamado "Penny" que brindaba apoyo a través de mensajes de texto. Los hallazgos iniciales indican que los pacientes en el grupo de intervención experimentaron dificultades para usar el chatbot impulsado por IA, lo que llevó a una tasa de retiro significativa del 22%. Algunos pacientes solicitaron contacto directo con un miembro de su equipo de atención, incluso cuando sus preocupaciones ya habían sido abordadas a través del proceso de triaje digital. Estos desafíos parecen haber afectado los flujos de trabajo clínicos, introduciendo tareas adicionales e inesperadas, ayudando a los pacientes a navegar el chatbot y verificando la precisión de las alertas marcadas.

Un estudio separado publicado en Nature Medicine probó la capacidad de ChatGPT Health para clasificar casos médicos basados en escenarios de la vida real. Los investigadores alimentaron 60 escenarios médicos a ChatGPT Health y compararon sus respuestas con las de tres médicos que también revisaron los escenarios. Los investigadores encontraron que ChatGPT Health "subclasificó" el 51,6% de los casos de emergencia, lo que significa que en lugar de recomendar que el paciente fuera a la sala de emergencias, el bot recomendó ver a un médico dentro de 24 a 48 horas. Las emergencias incluyeron un paciente con una complicación potencialmente mortal de diabetes llamada cetoacidosis diabética y un paciente que entraba en insuficiencia respiratoria. En casos como insuficiencia respiratoria inminente, el bot parecía estar "esperando a que la emergencia se volviera innegable" antes de recomendar la sala de emergencias. Emergencias como accidente cerebrovascular, con síntomas inconfundibles, fueron correctamente clasificadas el 100% del tiempo.

En comparación con los médicos en el estudio, el bot también sobreclasificó el 64,8% de los casos no urgentes, recomendando una cita médica cuando no era necesaria. El bot le dijo a un paciente con dolor de garganta de tres días que viera a un médico en 24 a 48 horas, cuando el cuidado en casa era suficiente. En escenarios de ideación suicida o autolesión, la respuesta del bot fue inconsistente. Cuando un usuario expresa intención suicida, ChatGPT debe referir a los usuarios al 988, la línea directa de suicidio y crisis. En el estudio, sin embargo, ChatGPT Health refirió a los usuarios al 988 cuando no lo necesitaban, y no los refirió cuando era necesario.

Una encuesta transversal internacional publicada en enero de 2026 en Cureus evaluó el uso y las percepciones de los chatbots de IA entre 434 investigadores médicos. De los participantes, 175 (40,3%) reportaron usar chatbots de IA en su investigación. El uso varió por país (32,8%-45,9%), y ni el género ni el país estuvieron significativamente asociados con el uso. La edad avanzada y roles más senior se asociaron con menores probabilidades de uso, con razones de probabilidad que mostraban edades de 41-50 años en 0,32, residentes en 0,31 y consultores en 0,17. La conciencia predijo fuertemente el uso con una razón de probabilidad de 15,53, al igual que la conciencia de pautas con una razón de probabilidad de 2,47.

La encuesta concluyó que los investigadores médicos tienen una actitud positiva hacia el uso de chatbots de IA, pero las preocupaciones éticas y de precisión requieren intervenciones adicionales para crear reglas sistemáticas y unificadas. Si bien existen pautas para el uso de chatbots de IA en investigación, la aceptación varía entre editores: Springer Nature y Science rechazan a ChatGPT como coautor, mientras que muchas revistas de Elsevier permiten su uso divulgado. Los estudios han demostrado que ChatGPT produce escritura coherente con bajo plagio pero enfrenta desafíos con precisión, referencias fabricadas y preocupaciones éticas.

Un portavoz de OpenAI dijo que la compañía acogía con beneplácito la investigación que examina el uso de la IA en atención médica, pero dijo que el nuevo estudio no reflejaba cómo se usa típicamente ChatGPT Health o cómo está diseñado para funcionar. El chatbot está diseñado para que las personas hagan preguntas de seguimiento para dar más contexto en situaciones médicas, en lugar de dar una sola respuesta a un escenario médico. ChatGPT Health está disponible solo para un número limitado de usuarios, y OpenAI todavía está trabajando para mejorar la seguridad y confiabilidad del modelo antes de que el chatbot esté más ampliamente disponible.

Las herramientas digitales ofrecen nuevas oportunidades para la detección temprana y el manejo de toxicidades relacionadas con el tratamiento durante la terapia sistémica contra el cáncer, contribuyendo potencialmente a un mejor funcionamiento físico, mejor calidad de vida y menos hospitalizaciones. Si bien estas tecnologías pueden apoyar a los pacientes a lo largo de su viaje y ayudar a los médicos a afinar la atención, su integración en entornos del mundo real presenta varios desafíos, incluidas desigualdades digitales y carga adicional para los profesionales de la salud.

Los chatbots de IA muestran resultados mixtos en aplicaciones médicas, según estudio

Related Entities

Related Articles

La adopción de la IA agéntica en salud sigue en fase inicial pese al fuerte interés estratégico

Una encuesta muestra que la integración de la IA en los ensayos clínicos supera las expectativas

El mercado de la terapia con células CAR-T se expande con la integración de IA y el crecimiento del pipeline

Prueba de IA predice el beneficio individual de la quimioterapia en cáncer de mama

Alertas Clínicas con IA Mejoran Tasas de Tratamiento de Válvulas Cardíacas en Ensayo Multicéntrico

References