AIチャットボットの医療応用で混在する結果、研究が明らかに
最近の研究によると、AIチャットボットは医療応用において重大な課題に直面している。ある研究では、ChatGPT Healthが緊急症例の51.6%を過小評価し、がん患者がAIチャットボットを使用した場合、使いやすさの問題で22%の離脱率を示した。一方、医療研究者の40.3%が研究でAIの使用を報告している。
AI搭載チャットボットは、がんケア、緊急トリアージ、医学研究における使用を検討した最近の研究によると、医療応用において可能性と重大な限界の両方を示している。複数の研究からの初期結果は、使いやすさの課題、正確性に関する懸念、そして一貫性のないパフォーマンスを明らかにしており、広範な臨床導入への準備状態について疑問を投げかけている。
化学放射線療法を受けている73人のがん患者を対象としたCAM 2.0研究では、研究者らはデジタル対応の継続的活動モニタリングとAIの組み合わせが症状モニタリングを効率化できるかどうかをテストした。患者は、市販の活動トラッカーを受けるグループと、同じトラッカーに「Penny」と呼ばれるAI搭載チャットボットを組み合わせたグループに無作為に割り当てられた。Pennyはテキストメッセージを通じてサポートを提供した。初期結果は、介入グループの患者がAI搭載チャットボットの使用に困難を経験し、22%という有意な離脱率につながったことを示している。一部の患者は、デジタルトリアージプロセスを通じて既に対応済みであった場合でも、ケアチームのメンバーとの直接接触を要求した。これらの課題は臨床ワークフローに影響を与え、追加的かつ予期しないタスク(患者がチャットボットを操作するのを支援することや、フラグが立てられたアラートの正確性を検証すること)を導入したようだ。
Nature Medicineに掲載された別の研究は、ChatGPT Healthが実際のシナリオに基づいて医療症例をトリアージする能力をテストした。研究者らは60の医療シナリオをChatGPT Healthに入力し、その回答を同じシナリオをレビューした3人の医師の回答と比較した。研究者らは、ChatGPT Healthが緊急症例の51.6%を「過小評価」したことを発見した。これは、患者が救急室に行くことを推奨する代わりに、ボットが24〜48時間以内に医師に診てもらうことを推奨したことを意味する。緊急事態には、糖尿病性ケトアシドーシスと呼ばれる生命を脅かす糖尿病合併症を患う患者や、呼吸不全に陥りつつある患者が含まれていた。呼吸不全が差し迫っているような症例では、ボットはERを推奨する前に「緊急事態が否定できないものになるのを待っている」ように見えた。脳卒中のような、紛れもない症状を伴う緊急事態は、100%正確にトリアージされた。
研究の医師と比較して、ボットは非緊急症例の64.8%も過大評価し、不必要な場合に医師の予約を推奨した。ボットは、3日間の喉の痛みを訴える患者に、在宅ケアで十分な場合に24〜48時間以内に医師に診てもらうよう指示した。自殺念慮や自傷行為のシナリオでは、ボットの対応は一貫していなかった。ユーザーが自殺意図を表明した場合、ChatGPTはユーザーを自殺・危機ホットラインの988に紹介することになっている。しかし、この研究では、ChatGPT Healthは必要のない場合にユーザーを988に紹介し、必要な場合には紹介しなかった。
2026年1月にCureusに掲載された国際的横断調査は、434人の医療研究者におけるAIチャットボットの使用と認識を評価した。参加者のうち175人(40.3%)が研究でAIチャットボットを使用していると報告した。使用は国によって異なり(32.8%-45.9%)、性別も国も使用と有意に関連していなかった。高齢とより上級の役職は使用のオッズが低いことと関連しており、オッズ比は41-50歳で0.32、研修医で0.31、コンサルタントで0.17を示した。認識はオッズ比15.53で使用を強く予測し、ガイドラインの認識もオッズ比2.47で同様に予測した。
調査は、医療研究者がAIチャットボットの使用に対して肯定的な態度を持っているが、倫理的・正確性に関する懸念は体系的で統一されたルールを作成するためのさらなる介入を必要とすると結論づけた。研究におけるAIチャットボットの使用に関するガイドラインは存在するが、出版社間での受け入れは異なる:Springer NatureとScienceはChatGPTを共著者として拒否する一方、多くのElsevierジャーナルは開示された使用を許可している。研究は、ChatGPTが低い盗作率で首尾一貫した文章を生成するが、正確性、捏造された参考文献、倫理的懸念に直面していることを示している。
OpenAIの広報担当者は、同社が医療におけるAIの使用に関する研究を歓迎すると述べたが、新しい研究はChatGPT Healthが通常どのように使用されているか、またはどのように機能するように設計されているかを反映していないと述べた。このチャットボットは、医療状況でより多くの文脈を与えるためにフォローアップの質問をするように設計されており、医療シナリオに対する単一の回答を与えるようには設計されていない。ChatGPT Healthは限られた数のユーザーのみが利用可能であり、OpenAIはチャットボットがより広く利用可能になる前にモデルの安全性と信頼性を向上させるために取り組んでいる。
デジタルツールは、全身がん治療中の治療関連毒性の早期発見と管理のための新たな機会を提供し、身体機能の改善、生活の質の向上、入院の減少に貢献する可能性がある。これらの技術は患者の旅路全体をサポートし、臨床医がケアを微調整するのを助けることができるが、現実世界の設定への統合は、デジタル格差や医療専門家への追加負担を含むいくつかの課題を提示している。