AIシステムDeepRare、希少疾患診断で70%の精度を達成
マルチエージェントAIシステムDeepRareが、2,919の希少疾患を対象とした国際的評価で高い診断性能を示した。臨床情報のみで57.18%、ゲノムデータを加えると70.6%の精度を達成し、Exomiserなど既存ツールを上回った。
新たに開発された希少疾患の診断を目的とする人工知能システムが、既存の臨床ツールに匹敵し、場合によってはそれを上回り得ることが、Natureに掲載された研究で示された。このシステムはDeepRareと呼ばれ、ゲノムシーケンスデータを組み込んだ複雑症例において70.6%の精度を達成した。これは、国際的に広く用いられている遺伝子解析ツールExomiserの53.2%と比べて高かった。
希少疾患は世界で3億人以上に影響し、これまでに7,000を超える異なる疾患が同定されている。その約80%は遺伝学的要因に由来する。負担の総和は大きいにもかかわらず、希少疾患は臨床的異質性、個々の有病率の低さ、臨床医の経験不足のため、診断が極めて難しいことで知られる。患者は平均5年以上に及ぶ長い「診断の旅(diagnostic odyssey)」を経験することが多く、繰り返しの紹介、誤診、不必要な介入が伴い、これらが治療開始の遅れや不良転帰につながる。
本研究は、上海交通大学の人工知能学院と、同大学医学部附属のXinhua Hospitalによる合同チームによって実施された。DeepRareは、アジア、北米、欧州の文献、症例報告、臨床センター由来の9つのデータセット(14の診療科領域)で評価され、2,919疾患において卓越した性能を示した。
患者の臨床フェノタイプ情報のみ—医師が症状だけに基づき初期判断を行う状況に相当—を用いた試験では、DeepRareはRecall@1で57.18%を達成し、最初の診断が半数超の症例で正しかったことを意味する。この性能は、遺伝子検査への定常的アクセスがない病院におけるスクリーニング支援に役立つ可能性を示唆している。この結果は、次点の手法を23.79%上回った。マルチモーダル試験では、168症例においてDeepRareは69.1%に到達し、Exomiserの55.9%と比較して高かった。
主として症状を疾患カテゴリーに照合する従来型の医療AIシステムとは異なり、DeepRareは研究者が「エージェント的(agentic)」と表現するワークフローに従う。このシステムは大規模言語モデルにより駆動されるマルチエージェントシステムであり、40以上の専門ツールと最新の知識ソースを統合している。人間の医師のように仮説を立て、証拠に照らして検証し、結論を修正したうえで、可能性のある疾患を順位付けする。
DeepRareは、自由記述テキスト、構造化されたHuman Phenotype Ontology(HPO)用語、遺伝子検査結果など、異質な臨床入力を処理し、検証可能な医学的根拠に紐づく透明性の高い推論を伴って、順位付けされた診断仮説を生成する。専門家レビューでは推論チェーンに関して95.4%の一致が得られ、その妥当性と追跡可能性が確認された。
China Alliance for Rare Diseasesが2万人超の患者を対象に行った調査では、42%が以前に誤診を受けており、確定診断に至るまで平均4.26年待っていたことが示された。International Rare Diseases Research Consortiumによれば、希少疾患に関する知識の環境は急速に進展しており、毎年およそ260〜280の希少遺伝性疾患が発見されている。
同システムは2025年7月以降、オンライン診断プラットフォーム上ですでに展開されており、世界で600を超える医療機関が登録している。Xinhua Hospitalでは、DeepRareは現在院内での試験運用が進められており、診断症例において医師を支援する計画がある。研究チームは、世界的な希少疾患診断アライアンスを立ち上げ、今後数か月で20,000の実臨床(real-world)症例を用いてシステムをさらに検証する予定である。