El sistema de IA DeepRare supera a los médicos en el diagnóstico de enfermedades raras
Científicos de Shanghái han desarrollado DeepRare, un sistema de IA que diagnostica enfermedades raras con una precisión global cercana al 79% y que supera a médicos con experiencia en pruebas comparativas. La herramienta ya se utiliza por clínicos en más de 600 instituciones en todo el mundo.
Científicos en Shanghái han presentado DeepRare, un sistema de inteligencia artificial que diagnostica enfermedades raras con mayor precisión que médicos con experiencia. En pruebas cara a cara, la IA identificó correctamente la enfermedad en su primer intento en el 64,4% de los casos, mientras que los médicos lograron la misma precisión en el 54,6% de las ocasiones.
Un artículo sobre el sistema, desarrollado por un equipo conjunto de la School of Artificial Intelligence de Shanghai Jiao Tong University y el Xinhua Hospital Affiliated to Shanghai Jiao Tong University School of Medicine, se publicó el jueves en el sitio web de la revista Nature. El sistema alcanzó una precisión diagnóstica global de aproximadamente el 79%, superando a otros programas de diagnóstico disponibles.
Las enfermedades raras afectan a menos de 1 de cada 2.000 personas en un momento dado, pero impactan a cientos de millones en todo el mundo. Existen más de 7.000 enfermedades raras, y el 80% son genéticas. Actualmente, alrededor de 300 millones de personas a nivel mundial padecen estos trastornos, y el diagnóstico suele tardar cinco años o más. Durante ese tiempo, muchos pacientes atraviesan un periplo diagnóstico marcado por derivaciones repetidas, diagnósticos erróneos e intervenciones médicas innecesarias.
DeepRare significa Diagnosis of Rare Diseases with Evidence-traced Autonomous Reasoning Agents. El sistema se basa en una arquitectura agentiva que contiene más de 40 agentes y herramientas diferentes, cada uno de los cuales ayuda a incorporar información sobre síntomas, notas médicas, bases de datos de literatura médica e información de secuenciación genética. El sistema integra amplias bases de datos de literatura médica con datos clínicos en tiempo real, lo que permite un enfoque más sofisticado del diagnóstico.
A diferencia de la IA convencional, que se apoya en una rápida coincidencia de patrones, DeepRare imita el "pensamiento lento" de los médicos humanos. Puede formular preguntas de manera proactiva para completar información faltante y refinar meticulosamente la información diagnóstica mediante un ciclo de hipótesis, verificación y autorreflexión. Tras procesar la información, DeepRare consulta bases de datos de enfermedades conocidas de todo el mundo; sus agentes trabajan conjuntamente en bucles de generación de hipótesis, verificación y refinamiento hasta poder clasificar los diagnósticos posibles para el paciente y aportar justificación de sus clasificaciones.
Cada conclusión diagnóstica generada por el sistema es trazable y va acompañada de una cadena de evidencia clara y completa, lo que permite a los médicos entender no solo cuál es el diagnóstico, sino también por qué se llegó a él. La herramienta rastrea el razonamiento que sustenta su diagnóstico para que los médicos puedan ver fácilmente por qué DeepRare les hizo esa sugerencia.
La primera prueba de DeepRare se realizó en 6.401 casos clínicos en los que el diagnóstico ya era conocido. La IA superó a otras 15 herramientas diagnósticas existentes. La evaluación en paralelo utilizó un grupo más pequeño de 163 casos difíciles; participaron cinco médicos con experiencia, cada uno con más de una década de práctica, a quienes se les proporcionó la misma información que a DeepRare.
Cuando se le proporcionó únicamente información clínica de fenotipo sin datos genéticos, DeepRare logró una precisión diagnóstica de primer lugar del 57,18%, lo que supone una mejora de 23,79 puntos porcentuales respecto del mejor modelo internacional previo. Con el respaldo de datos multimodales que incluyen secuenciación genética, la precisión diagnóstica integral de primer lugar de DeepRare en casos complejos supera el 70,6%, superando de forma significativa a la herramienta internacional ampliamente utilizada Exomiser, que se sitúa en el 53,2%.
Incluso cuando DeepRare no acertó la respuesta en el primer intento, los médicos observaron que el sistema de IA incluía el diagnóstico correcto entre sus principales predicciones el 92% de las veces. Se pidió a 10 especialistas en enfermedades raras que revisaran el razonamiento paso a paso de la IA, y estuvieron de acuerdo con su lógica el 95,4% de las ocasiones.
DeepRare está siendo utilizado actualmente por clínicos en línea en más de 600 instituciones diferentes en todo el mundo. Los investigadores responsables de DeepRare esperan ampliar su uso aún más y planean trabajar con profesionales clínicos y pacientes de todo el mundo para validar su modelo en decenas de miles de casos.