AI系统DeepRare在罕见病诊断中达到70%准确率

发表于《Nature》的研究显示,多智能体AI系统DeepRare在罕见病诊断方面表现突出,在纳入基因组测序数据的复杂病例中准确率达到70.6%。在国际多地区、多专科数据集测试中,DeepRare整体优于现有临床工具,并具备可追溯的推理链。

一种用于诊断罕见病的新型人工智能系统在研究中显示,其表现可与现有临床工具相当,且在某些情况下更胜一筹。相关研究发表于《Nature》。该系统名为DeepRare,在纳入基因组测序数据的复杂病例中准确率达到70.6%,而国际上广泛使用的遗传学分析工具Exomiser在相同条件下为53.2%。

全球有超过3亿人受罕见病影响,迄今已识别出7,000多种不同的疾病,其中约80%为遗传因素所致。尽管总体疾病负担沉重,罕见病因临床异质性强、单病种患病率低以及临床医生熟悉程度有限而长期被认为难以诊断。患者往往会经历漫长的“诊断之旅”,平均持续超过5年,其间伴随反复转诊、误诊以及不必要的干预,从而导致治疗延误和不良结局。

本研究由上海交通大学人工智能学院与其医学院附属新华医院的联合团队开展。研究人员在来自亚洲、北美和欧洲的文献、病例报告及临床中心的九个数据集上对DeepRare进行了评估,覆盖14个医学专科,并在2,919种疾病上表现出卓越性能。

在仅使用患者临床表型信息的测试中——类似于医生仅依据症状作出初步判断——DeepRare的Recall@1达到57.18%,意味着在超过一半的病例中首个诊断即为正确。该表现提示,该工具可为缺乏常规遗传检测条件的医院提供筛查支持。这一结果较次优方法高出23.79%。在多模态测试中,DeepRare在168例中达到69.1%,而Exomiser为55.9%。

与传统主要将症状与疾病类别进行匹配的医疗AI系统不同,DeepRare采用研究人员所称的“agentic(代理式)”工作流程。该系统为由大语言模型驱动的多智能体系统,整合了40余种专业工具与最新知识来源。其工作方式类似人类医生:提出假设、以证据进行检验,并在对结论进行修正后对可能疾病进行排序。

DeepRare可处理异质性的临床输入,包括自由文本描述、结构化的人类表型本体(Human Phenotype Ontology)术语以及遗传检测结果,从而生成带排序的诊断假设,并提供与可核验医学证据相链接的透明推理过程。专家评审对其推理链的一致性认可度达到95.4%,证实其有效性与可追溯性。

中国罕见病联盟对超过20,000名患者开展的一项调查发现,42%的患者曾被误诊,患者在获得确诊前平均等待4.26年。罕见病知识版图正在快速演进;根据国际罕见病研究联盟(International Rare Diseases Research Consortium)的数据,每年约有260至280种罕见遗传病被发现。

自2025年7月起,该系统已部署于在线诊断平台,全球已有超过600家医疗机构注册。在新华医院,DeepRare目前正在进行内部测试,并计划在诊断病例中为医生提供支持。研究团队计划在未来数月内发起全球罕见病诊断联盟,并使用20,000例真实世界病例进一步验证该系统。

Related Entities

Related Articles

References

  1. AI Tool Sets New Standard in Diagnosing Rare Diseases - Lifespan Research Institute · lifespan.io
  2. China's DeepRare AI Aims to Speed Rare Disease Diagnosis - Sixth Tone · www.sixthtone.com
  3. 'Agentic' AI system delivers high accuracy in rare disease diagnosis - CGTN · news.cgtn.com
  4. An agentic system for rare disease diagnosis with traceable reasoning | Nature · www.nature.com
  5. AI succeeds in diagnosing rare diseases - Nature · www.nature.com