希少疾患診断で医師を上回るAI「DeepRare」、上海の研究チームが開発
上海の研究チームが、希少疾患の診断で経験豊富な医師を上回る精度を示したAIシステム**DeepRare**を開発した。直接比較試験では初回診断一致率が64.4%に達し、全体の診断精度は約79%で、既存ツールを凌駕した。
上海の科学者らは、経験豊富な医師よりも高い精度で希少疾患を診断できる人工知能(AI)システムDeepRareを発表した。直接比較試験では、AIが初回で疾患を正しく特定した割合は64.4%で、医師の54.6%を上回った。
上海交通大学(Shanghai Jiao Tong University)人工知能学院と、上海交通大学医学院附属新華医院(Xinhua Hospital Affiliated to Shanghai Jiao Tong University School of Medicine)の合同チームが開発した同システムに関する論文は木曜日、学術誌Natureのウェブサイトに掲載された。システムの全体的な診断精度は約79%に達し、利用可能な他の診断プログラムを上回った。
希少疾患は、ある時点で2,000人に1人未満の割合で発症するが、世界全体では数億人に影響する。希少疾患は7,000種類以上あり、そのうち80%は遺伝性である。現在、世界で約3億人がこれらの疾患の影響を受けており、診断にはしばしば5年以上を要する。その間、多くの患者は繰り返しの紹介受診、誤診、不必要な医療介入を伴う診断の道のり(diagnostic journey)を強いられる。
DeepRareはDiagnosis of Rare Diseases with Evidence-traced Autonomous Reasoning Agentsの略である。同システムは、40種類以上の異なるエージェントとツールを含むエージェンティック・アーキテクチャに基づいて構築されており、症状、診療記録、医学文献データベース、遺伝子シーケンス情報などの情報をそれぞれ取り込めるようになっている。膨大な医学文献データベースとリアルタイムの臨床データを統合し、より高度な診断アプローチを可能にしている。
高速なパターンマッチングに依存する従来型AIとは異なり、DeepRareは人間の医師の「ゆっくり考える(slow thinking)」プロセスを模倣する。不足している情報を補うために能動的に質問を投げかけ、仮説、検証、自己省察のサイクルを通じて診断情報を綿密に精緻化できる。情報を処理した後、DeepRareは世界中の既知疾患のデータベースを参照し、エージェント同士が仮説生成、検証、精緻化のループで協働しながら、患者における可能性の高い診断を順位付けし、その順位の根拠を提示できる段階に至るまで作業を続ける。
システムが生成する各診断結論はすべて追跡可能で、明確かつ完全なエビデンスチェーンを伴うため、医師は診断結果だけでなく、なぜその診断に至ったのかも理解できる。このツールは診断の背後にある推論を追跡するため、医師はDeepRareがその提案を行った理由を容易に確認できる。
DeepRareの最初のテストは、診断がすでに判明している6,401件の臨床症例を対象に実施された。AIは既存の15種類の診断ツールを上回った。並行評価(side-by-side evaluation)では、より少数の難症例163件を用い、10年以上の臨床経験を持つ5人の医師が、DeepRareと同じ情報を与えられた。
遺伝情報を含まない臨床表現型(clinical phenotype)情報のみが提供された場合、DeepRareの最上位(top-ranked)の診断精度は57.18%で、従来の国際的ベストモデルに比べて23.79パーセントポイントの改善となった。遺伝子シーケンスを含むマルチモーダルデータの支援がある場合、複雑症例におけるDeepRareの総合的な最上位診断精度は70.6%を超え、広く使用されている国際的ツールExomiser(53.2%)を大きく上回った。
DeepRareが初回で正解に到達できなかった場合でも、医師らは、AIが正しい診断を上位の予測に92%の割合で含めていることを確認した。10人の希少疾患専門医がAIの段階的な推論を確認したところ、その論理に95.4%の割合で同意した。
DeepRareは現在、世界600以上の機関で臨床医がオンラインで利用している。DeepRareの研究者らは、さらに拡大を進め、世界中の臨床専門家や患者と協力して、数万件規模の症例でモデルを検証する計画を立てている。