Les chatbots IA affichent des résultats mitigés dans les applications médicales, selon une étude

Des études récentes révèlent que les chatbots IA rencontrent des défis significatifs dans les applications médicales. Une étude montre que ChatGPT Health a sous-trié 51,6% des cas d'urgence. Les patients atteints de cancer utilisant un chatbot IA ont connu des taux d'abandon de 22% en raison de problèmes d'utilisabilité, tandis que 40,3% des chercheurs médicaux déclarent utiliser l'IA dans leurs travaux.

Les chatbots alimentés par l'intelligence artificielle montrent à la fois des promesses et des limitations significatives dans les applications médicales, selon des recherches récentes examinant leur utilisation dans les soins du cancer, le triage d'urgence et la recherche médicale. Les premiers résultats de plusieurs études révèlent des défis d'utilisabilité, des préoccupations concernant l'exactitude et des performances incohérentes qui soulèvent des questions sur leur préparation à une mise en œuvre clinique généralisée.

Dans l'étude CAM 2.0 impliquant 73 patients atteints de cancer subissant une chimioradiothérapie, les chercheurs ont testé si la surveillance continue de l'activité numérique combinée à l'IA pouvait rationaliser la surveillance des symptômes. Les patients ont été assignés au hasard pour recevoir soit un tracker d'activité disponible dans le commerce, soit le même tracker combiné à un chatbot alimenté par l'IA appelé "Penny" qui fournissait un soutien via des messages texte. Les premiers résultats indiquent que les patients du groupe d'intervention ont rencontré des difficultés à utiliser le chatbot alimenté par l'IA, conduisant à un taux d'abandon significatif de 22%. Certains patients ont demandé un contact direct avec un membre de leur équipe de soins, même lorsque leurs préoccupations avaient déjà été traitées par le processus de triage numérique. Ces défis semblent avoir affecté les flux de travail cliniques, introduisant des tâches supplémentaires et inattendues, aidant les patients à naviguer dans le chatbot et vérifiant l'exactitude des alertes signalées.

Une étude distincte publiée dans Nature Medicine a testé la capacité de ChatGPT Health à trier des cas médicaux basés sur des scénarios réels. Les chercheurs ont soumis 60 scénarios médicaux à ChatGPT Health et ont comparé ses réponses avec celles de trois médecins qui ont également examiné les scénarios. Les chercheurs ont constaté que ChatGPT Health a "sous-trié" 51,6% des cas d'urgence, ce qui signifie qu'au lieu de recommander au patient de se rendre aux urgences, le bot a recommandé de consulter un médecin dans les 24 à 48 heures. Les urgences incluaient un patient avec une complication potentiellement mortelle du diabète appelée acidocétose diabétique et un patient entrant en insuffisance respiratoire. Dans des cas comme l'insuffisance respiratoire imminente, le bot semblait "attendre que l'urgence devienne indéniable" avant de recommander les urgences. Les urgences comme l'AVC, avec des symptômes indubitables, ont été correctement triées 100% du temps.

Comparé aux médecins de l'étude, le bot a également sur-trié 64,8% des cas non urgents, recommandant un rendez-vous médical alors que ce n'était pas nécessaire. Le bot a dit à un patient avec un mal de gorge de trois jours de consulter un médecin dans 24 à 48 heures, alors que des soins à domicile étaient suffisants. Dans les scénarios d'idéation suicidaire ou d'automutilation, la réponse du bot était incohérente. Lorsqu'un utilisateur exprime une intention suicidaire, ChatGPT est censé référer les utilisateurs au 988, la ligne d'assistance pour le suicide et les crises. Dans l'étude, cependant, ChatGPT Health a référé les utilisateurs au 988 alors qu'ils n'en avaient pas besoin, et ne les a pas référés lorsqu'il était nécessaire.

Une enquête transversale internationale publiée en janvier 2026 dans Cureus a évalué l'utilisation et les perceptions des chatbots IA parmi 434 chercheurs médicaux. Parmi les participants, 175 (40,3%) ont déclaré utiliser des chatbots IA dans leurs recherches. L'utilisation variait selon le pays (32,8%-45,9%), et ni le genre ni le pays n'étaient significativement associés à l'utilisation. Un âge plus avancé et des rôles plus seniors étaient associés à des probabilités d'utilisation plus faibles, avec des rapports de cotes montrant les âges 41-50 ans à 0,32, les résidents à 0,31 et les consultants à 0,17. La conscience prédit fortement l'utilisation avec un rapport de cotes de 15,53, tout comme la conscience des lignes directrices avec un rapport de cotes de 2,47.

L'enquête a conclu que les chercheurs médicaux ont une attitude positive envers l'utilisation des chatbots IA, mais les préoccupations éthiques et d'exactitude nécessitent des interventions supplémentaires pour créer des règles systématiques et unifiées. Bien que des lignes directrices existent pour l'utilisation des chatbots IA dans la recherche, l'acceptation varie parmi les éditeurs : Springer Nature et Science rejettent ChatGPT comme coauteur, tandis que de nombreuses revues Elsevier permettent son utilisation divulguée. Des études ont montré que ChatGPT produit des écrits cohérents avec un faible plagiat mais fait face à des défis concernant l'exactitude, les références fabriquées et les préoccupations éthiques.

Un porte-parole d'OpenAI a déclaré que l'entreprise accueillait favorablement la recherche examinant l'utilisation de l'IA dans les soins de santé, mais a dit que la nouvelle étude ne reflétait pas comment ChatGPT Health est généralement utilisé ou comment il est conçu pour fonctionner. Le chatbot est conçu pour que les gens posent des questions de suivi pour donner plus de contexte dans les situations médicales, plutôt que de donner une seule réponse à un scénario médical. ChatGPT Health n'est disponible que pour un nombre limité d'utilisateurs, et OpenAI travaille encore à améliorer la sécurité et la fiabilité du modèle avant que le chatbot ne soit rendu plus largement disponible.

Les outils numériques offrent de nouvelles opportunités pour la détection précoce et la gestion des toxicités liées au traitement pendant la thérapie systémique du cancer, contribuant potentiellement à améliorer le fonctionnement physique, une meilleure qualité de vie et moins d'hospitalisations. Bien que ces technologies puissent soutenir les patients tout au long de leur parcours et aider les cliniciens à affiner les soins, leur intégration dans des contextes réels présente plusieurs défis, y compris les inégalités numériques et la charge supplémentaire pour les professionnels de santé.

Les chatbots IA affichent des résultats mitigés dans les applications médicales, selon une étude

Related Entities

Related Articles

L’adoption de l’IA agentique en santé reste embryonnaire malgré un fort intérêt stratégique

L’intégration de l’IA dans les essais cliniques dépasse les attentes, selon une enquête

Le marché des thérapies par cellules CAR-T s’élargit grâce à l’intégration de l’IA et à la croissance du pipeline

Un test d'IA prédit le bénéfice individuel de la chimiothérapie dans le cancer du sein

Les alertes cliniques basées sur l'IA améliorent de 40% les taux de traitement des valvulopathies dans un essai multicentrique

References