Herramientas de IA contra el cáncer podrían depender de atajos visuales; la radiación estereotáctica mejora los resultados en metástasis cerebrales
Dos estudios recientes destacan avances y límites en oncología: por un lado, sistemas de IA en anatomía patológica pueden basarse en atajos estadísticos más que en señales biológicas reales, lo que reduce su fiabilidad clínica. Por otro, un ensayo fase 3 sugiere que la radiación estereotáctica mejora síntomas y calidad de vida en pacientes con múltiples metástasis cerebrales frente a la radiación de todo el cerebro con evitación del hipocampo.
Las herramientas de inteligencia artificial desarrolladas para predecir la biología del cáncer directamente a partir de imágenes microscópicas podrían estar apoyándose en atajos ocultos en lugar de señales biológicas genuinas, según una nueva investigación de la University of Warwick publicada en Nature Biomedical Engineering. Los hallazgos plantean inquietudes de que algunas herramientas de IA para anatomía patológica (pathology) sean actualmente demasiado poco fiables para la atención de pacientes en el mundo real.
Los investigadores analizaron más de 8.000 muestras de pacientes en cuatro grandes tipos de cáncer —mama, colorrectal, pulmón y endometrio— y compararon el rendimiento de enfoques líderes de aprendizaje automático. Aunque los modelos a menudo alcanzaron una alta exactitud en términos generales, el equipo encontró que esto con frecuencia se debía a “atajos” estadísticos.
En lugar de detectar mutaciones en el gen BRAF asociado al cáncer, un modelo podría aprender que las mutaciones de BRAF a menudo aparecen junto con otra característica clínica como la inestabilidad de microsatélites (MSI). El sistema entonces aprende a utilizar esta combinación de pistas para predecir el estado de BRAF, en vez de aprender la señal causal de BRAF en sí; esto significa que las predicciones oncológicas precisas solo funcionan cuando estos biomarcadores coexisten y se vuelven poco fiables cuando no lo hacen.
Cuando el rendimiento de los modelos de IA se evaluó dentro de subgrupos estratificados de pacientes, como solo cánceres de mama de alto grado o solo tumores MSI-positivos, la exactitud disminuyó sustancialmente, lo que reveló que los modelos dependían de señales de atajo que desaparecen una vez que se controlan los factores de confusión.
Para determinadas tareas de predicción, la ventaja de rendimiento del aprendizaje profundo frente a la información clínica derivada por humanos fue modesta. Los sistemas de IA alcanzaron puntuaciones de exactitud de apenas por encima del 80% al predecir biomarcadores, en comparación con alrededor del 75% usando únicamente el grado tumoral, una medida que los patólogos ya evalúan.
Los métodos de aprendizaje automático aún pueden resultar valiosos para la investigación, la selección de candidatos en el desarrollo de fármacos y para el triaje clínico, el cribado o el apoyo suplementario a la toma de decisiones. Sin embargo, los investigadores sostienen que las futuras herramientas de IA deben ir más allá del aprendizaje basado en correlaciones y adoptar enfoques que modelen de forma explícita las relaciones biológicas y la estructura causal. También piden estándares de evaluación más sólidos, incluidas pruebas por subgrupos y la comparación frente a líneas base clínicas simples, antes de plantear su despliegue en la práctica asistencial rutinaria.
En una investigación independiente sobre el tratamiento de metástasis cerebrales, un ensayo clínico aleatorizado de fase 3 realizado en 4 centros de Estados Unidos encontró que la radiación estereotáctica dirigida a tumores individuales mejoró la gravedad de los síntomas y la interferencia con el funcionamiento diario en comparación con la radiación de todo el cerebro con evitación del hipocampo.
De los 196 pacientes aleatorizados (edad media, 61 años; 129 [66%] mujeres; 176 [90%] de raza blanca; número mediano de metástasis cerebrales, 14 [RIC, 11-18]; 49 [25%] con resección neuroquirúrgica previa), 83 (42%) completaron la evaluación a los 6 meses. Los pacientes elegibles tenían de 5 a 20 metástasis cerebrales y no habían recibido radiación previa dirigida al cerebro. La inclusión tuvo lugar entre el 11 de abril de 2017 y el 17 de mayo de 2024 (seguimiento final, 18 de marzo de 2025).
Para el desenlace primario, entre el basal y las evaluaciones posteriores al basal hasta el seguimiento de 6 meses, la radiación estereotáctica cambió la puntuación compuesta ponderada del MD Anderson Symptom Inventory–Brain Tumor score de 2,69 a 2,37 (cambio medio, −0,32) y la radiación de todo el cerebro con evitación del hipocampo cambió la puntuación de 2,29 a 3,03 (cambio medio, 0,74) (diferencia media, −1,06 [IC del 95%, −1,54 a −0,58]; P < .001). La escala va de 0 a 10, con un rango de cambio de puntuación de −10 a 10, donde −10 representa el mejor resultado. Una diferencia clínicamente significativa se definió como 0,98.
Se produjeron eventos adversos relacionados de grado 3-5 en 12 pacientes (12%) del grupo de radiación estereotáctica y en 13 pacientes (13%) del grupo de radiación de todo el cerebro con evitación del hipocampo; la fatiga de grado 1-3 fue la más frecuente (27 [28%] frente a 43 [44%], respectivamente).
El ensayo se registró con el identificador de ClinicalTrials.gov: NCT03075072.