KI-System DeepRare erreicht 70 % Genauigkeit bei der Diagnose seltener Erkrankungen

DeepRare, ein Multi-Agenten-KI-System, erzielte in einer in *Nature* veröffentlichten Studie eine Genauigkeit von 70,6 % bei der Diagnose seltener Erkrankungen, wenn genomische Sequenzierungsdaten einbezogen wurden. In internationalen Tests mit 2.919 Erkrankungen übertraf es bestehende klinische Tools wie Exomiser und lieferte nachvollziehbare, überprüfbare Begründungsketten.

Ein neues System künstlicher Intelligenz zur Diagnose seltener Erkrankungen hat gezeigt, dass es bestehenden klinischen Werkzeugen ebenbürtig ist und sie in manchen Fällen sogar übertreffen kann, wie aus in Nature veröffentlichten Forschungsergebnissen hervorgeht. Das System namens DeepRare erreichte in komplexen Fällen eine Genauigkeit von 70,6 %, wenn genomische Sequenzierungsdaten einbezogen wurden – im Vergleich zu 53,2 % bei Exomiser, einem international weit verbreiteten Tool zur genetischen Analyse.

Seltene Erkrankungen betreffen weltweit mehr als 300 Millionen Menschen; bislang wurden über 7.000 unterschiedliche Störungen identifiziert, von denen etwa 80 % genetischen Ursprungs sind. Trotz ihrer kumulativen Belastung sind seltene Erkrankungen bekanntermaßen schwer zu diagnostizieren – aufgrund ihrer klinischen Heterogenität, der geringen individuellen Prävalenz und der begrenzten Vertrautheit vieler Ärztinnen und Ärzte. Patientinnen und Patienten durchlaufen häufig eine lange „diagnostische Odyssee“ von im Durchschnitt mehr als 5 Jahren, geprägt von wiederholten Überweisungen, Fehldiagnosen und unnötigen Interventionen. All dies trägt zu verzögerten Behandlungen und ungünstigen Outcomes bei.

Die Studie wurde von einem gemeinsamen Team der School of Artificial Intelligence der Shanghai Jiao Tong University und des Xinhua Hospital, das der School of Medicine der Universität angegliedert ist, durchgeführt. DeepRare wurde anhand von neun Datensätzen aus Fachliteratur, Fallberichten und klinischen Zentren in Asien, Nordamerika und Europa über 14 medizinische Fachgebiete hinweg evaluiert und zeigte eine außergewöhnliche Leistung bei 2.919 Erkrankungen.

In Tests, die ausschließlich die klinischen Phänotypinformationen der Patientinnen und Patienten nutzten – vergleichbar mit der initialen Einschätzung einer Ärztin oder eines Arztes allein auf Basis von Symptomen –, erzielte DeepRare einen Recall@1 von 57,18 %. Das bedeutet, dass die erste Diagnose in mehr als der Hälfte der Fälle korrekt war. Die Leistung deutet darauf hin, dass das Tool das Screening in Krankenhäusern unterstützen könnte, die keinen routinemäßigen Zugang zu genetischen Tests haben. Dieses Ergebnis übertraf die nächstbeste Methode um 23,79 %. In multimodalen Tests erreichte DeepRare 69,1 % gegenüber 55,9 % für Exomiser bei 168 Fällen.

Im Gegensatz zu traditionellen medizinischen KI-Systemen, die vor allem Symptome mit Krankheitskategorien abgleichen, folgt DeepRare einem von den Forschenden als „agentisch“ beschriebenen Workflow. Das System ist ein Multi-Agenten-System, das von großen Sprachmodellen angetrieben wird und mehr als 40 spezialisierte Tools sowie aktuelle Wissensquellen integriert. Wie ein menschlicher Arzt bildet es Hypothesen, prüft sie anhand von Evidenz und revidiert seine Schlussfolgerungen, bevor es mögliche Erkrankungen priorisiert.

DeepRare verarbeitet heterogene klinische Eingaben – darunter Freitextbeschreibungen, strukturierte Begriffe der Human Phenotype Ontology und Ergebnisse genetischer Tests –, um gerankte diagnostische Hypothesen mit transparenter Begründung zu erzeugen, die mit überprüfbarer medizinischer Evidenz verknüpft ist. Eine Expertinnen- und Expertenbegutachtung erreichte eine Übereinstimmung von 95,4 % hinsichtlich der Argumentationsketten des Systems und bestätigte damit deren Validität und Nachvollziehbarkeit.

Eine Umfrage der China Alliance for Rare Diseases mit mehr als 20.000 Patientinnen und Patienten ergab, dass 42 % zuvor fehldiagnostiziert worden waren und die Betroffenen im Durchschnitt 4,26 Jahre auf eine gesicherte Diagnose warten mussten. Die Wissenslandschaft zu seltenen Erkrankungen entwickelt sich rasch weiter; nach Angaben des International Rare Diseases Research Consortium werden pro Jahr etwa 260 bis 280 seltene genetische Erkrankungen neu entdeckt.

Das System ist seit Juli 2025 bereits auf einer Online-Diagnoseplattform im Einsatz; mehr als 600 medizinische Einrichtungen weltweit haben sich registriert. Am Xinhua Hospital befindet sich DeepRare derzeit in internen Tests, mit dem Ziel, Ärztinnen und Ärzte in diagnostischen Fällen zu unterstützen. Das Forschungsteam plant, in den kommenden Monaten eine globale Allianz zur Diagnose seltener Erkrankungen zu starten und das System anhand von 20.000 Real-World-Fällen weiter zu validieren.

Related Entities

Related Articles

References

  1. AI Tool Sets New Standard in Diagnosing Rare Diseases - Lifespan Research Institute · lifespan.io
  2. China's DeepRare AI Aims to Speed Rare Disease Diagnosis - Sixth Tone · www.sixthtone.com
  3. 'Agentic' AI system delivers high accuracy in rare disease diagnosis - CGTN · news.cgtn.com
  4. An agentic system for rare disease diagnosis with traceable reasoning | Nature · www.nature.com
  5. AI succeeds in diagnosing rare diseases - Nature · www.nature.com