KI-Chatbots zeigen gemischte Ergebnisse in medizinischen Anwendungen, Studie findet

Aktuelle Studien zeigen, dass KI-Chatbots erhebliche Herausforderungen in medizinischen Anwendungen bewältigen müssen. Eine Studie ergab, dass ChatGPT Health 51,6 % der Notfälle untertriageierte. Krebspatienten, die einen KI-Chatbot nutzten, hatten eine Abbruchrate von 22 % aufgrund von Usability-Problemen, während medizinische Forscher eine vorsichtige Übernahme zeigen, wobei 40,3 % über KI-Nutzung in der Forschung berichten.

KI-gestützte Chatbots zeigen sowohl Potenzial als auch erhebliche Einschränkungen in medizinischen Anwendungen, wie aktuelle Forschungsergebnisse zu ihrer Nutzung in der Krebsversorgung, Notfalltriage und medizinischen Forschung zeigen. Frühe Ergebnisse mehrerer Studien offenbaren Usability-Herausforderungen, Genauigkeitsbedenken und inkonsistente Leistung, die Fragen zu ihrer Einsatzbereitschaft für eine breite klinische Implementierung aufwerfen.

In der CAM 2.0-Studie mit 73 Krebspatienten, die sich einer Chemoradiotherapie unterzogen, testeten Forscher, ob digital ermöglichtes kontinuierliches Aktivitätsmonitoring in Kombination mit KI die Symptomüberwachung optimieren könnte. Patienten wurden randomisiert entweder einem kommerziell erhältlichen Aktivitätstracker oder demselben Tracker in Kombination mit einem KI-gestützten Chatbot namens "Penny" zugewiesen, der Unterstützung per SMS bot. Frühe Ergebnisse zeigen, dass Patienten in der Interventionsgruppe Schwierigkeiten bei der Nutzung des KI-gestützten Chatbots hatten, was zu einer signifikanten Abbruchrate von 22 % führte. Einige Patienten forderten direkten Kontakt mit einem Mitglied ihres Behandlungsteams, selbst wenn ihre Bedenken bereits durch den digitalen Triage-Prozess behandelt worden waren. Diese Herausforderungen scheinen klinische Arbeitsabläufe beeinflusst zu haben, indem sie zusätzliche und unerwartete Aufgaben einführten, wie Patienten bei der Navigation des Chatbots zu helfen und die Genauigkeit gekennzeichneter Warnungen zu überprüfen.

Eine separate Studie, die in Nature Medicine veröffentlicht wurde, testete die Fähigkeit von ChatGPT Health, medizinische Fälle basierend auf realen Szenarien zu triagieren. Forscher fütterten ChatGPT Health mit 60 medizinischen Szenarien und verglichen seine Antworten mit denen von drei Ärzten, die ebenfalls die Szenarien überprüften. Die Forscher fanden heraus, dass ChatGPT Health 51,6 % der Notfälle "untertriageierte", was bedeutet, dass der Bot stattdessen, den Patienten in die Notaufnahme zu schicken, empfahl, innerhalb von 24 bis 48 Stunden einen Arzt aufzusuchen. Die Notfälle umfassten einen Patienten mit einer lebensbedrohlichen Diabetes-Komplikation namens diabetische Ketoazidose und einen Patienten mit beginnendem Atemversagen. In Fällen wie drohendem Atemversagen schien der Bot darauf zu "warten, dass der Notfall unbestreitbar wird", bevor er die Notaufnahme empfahl. Notfälle wie Schlaganfall mit unverkennbaren Symptomen wurden zu 100 % korrekt triagiert.

Im Vergleich zu den Ärzten in der Studie übertriageierte der Bot auch 64,8 % der nicht dringenden Fälle und empfahl einen Arzttermin, wenn er nicht notwendig war. Der Bot riet einem Patienten mit dreitägiger Halsschmerzen, innerhalb von 24 bis 48 Stunden einen Arzt aufzusuchen, obwohl häusliche Pflege ausreichend gewesen wäre. Bei Suizidgedanken oder Selbstverletzungsszenarien war die Reaktion des Bots inkonsistent. Wenn ein Nutzer Suizidabsichten äußert, soll ChatGPT Nutzer an 988, die Suizid- und Krisenhotline, verweisen. In der Studie verwies ChatGPT Health Nutzer jedoch stattdessen an 988, wenn sie es nicht benötigten, und verwies sie nicht an die Hotline, wenn es notwendig gewesen wäre.

Eine internationale Querschnittsstudie, die im Januar 2026 in Cureus veröffentlicht wurde, bewertete die Nutzung und Wahrnehmung von KI-Chatbots unter 434 medizinischen Forschern. Von den Teilnehmern berichteten 175 (40,3 %) über die Nutzung von KI-Chatbots in ihrer Forschung. Die Nutzung variierte je nach Land (32,8 %-45,9 %), und weder Geschlecht noch Land waren signifikant mit der Nutzung assoziiert. Höheres Alter und erfahrenere Positionen waren mit geringeren Nutzungswahrscheinlichkeiten assoziiert, mit Odds Ratios von 0,32 für das Alter 41-50 Jahre, 0,31 für Assistenzärzte und 0,17 für Oberärzte. Bewusstsein sagte die Nutzung stark voraus mit einem Odds Ratio von 15,53, ebenso wie Richtlinienbewusstsein mit einem Odds Ratio von 2,47.

Die Studie kam zu dem Schluss, dass medizinische Forscher eine positive Einstellung zur Nutzung von KI-Chatbots haben, aber ethische und Genauigkeitsbedenken weitere Interventionen erfordern, um systematische, einheitliche Regeln zu schaffen. Während Richtlinien für die Nutzung von KI-Chatbots in der Forschung existieren, variiert die Akzeptanz unter Verlagen: Springer Nature und Science lehnen ChatGPT als Co-Autor ab, während viele Elsevier-Zeitschriften seine offengelegte Nutzung erlauben. Studien haben gezeigt, dass ChatGPT kohärente Texte mit geringer Plagiatsrate produziert, aber Herausforderungen bei der Genauigkeit, gefälschten Referenzen und ethischen Bedenken gegenübersteht.

Ein Sprecher von OpenAI sagte, das Unternehmen begrüße Forschung zur Nutzung von KI im Gesundheitswesen, merkte aber an, dass die neue Studie nicht widerspiegele, wie ChatGPT Health typischerweise genutzt wird oder wie es funktionieren soll. Der Chatbot sei dafür konzipiert, dass Menschen in medizinischen Situationen Nachfragen stellen, um mehr Kontext zu geben, anstatt eine einzelne Antwort auf ein medizinisches Szenario zu geben. ChatGPT Health sei nur einer begrenzten Anzahl von Nutzern verfügbar, und OpenAI arbeite weiter daran, die Sicherheit und Zuverlässigkeit des Modells zu verbessern, bevor der Chatbot breiter verfügbar gemacht wird.

Digitale Werkzeuge bieten neue Möglichkeiten für die Früherkennung und Behandlung therapiebedingter Toxizitäten während systemischer Krebstherapien, was potenziell zu verbesserter körperlicher Funktion, besserer Lebensqualität und weniger Krankenhausaufenthalten beitragen kann. Während diese Technologien Patienten während ihrer gesamten Behandlung unterstützen und Klinikern helfen können, die Versorgung zu optimieren, stellt ihre Integration in reale Umgebungen mehrere Herausforderungen dar, einschließlich digitaler Ungleichheiten und zusätzlicher Belastung für medizinisches Fachpersonal.

KI-Chatbots zeigen gemischte Ergebnisse in medizinischen Anwendungen, Studie findet

Related Entities

Related Articles

Einsatz agentischer KI im Gesundheitswesen bleibt trotz starkem strategischem Interesse in den Anfängen

Umfrage: KI-Integration in klinischen Studien übertrifft Erwartungen

CAR-T-Zelltherapie-Markt wächst durch KI-Integration und Pipeline-Ausbau

KI-Test sagt individuellen Chemotherapie-Nutzen bei Brustkrebs voraus

KI-gestützte klinische Warnungen steigern Herzklappenbehandlungsraten in multizentrischer Studie

References