Des outils d’IA en oncologie pourraient s’appuyer sur des raccourcis visuels ; la radiothérapie stéréotaxique améliore les résultats des métastases cérébrales
Des chercheurs alertent sur le fait que certaines IA d’anatomopathologie pourraient exploiter des « raccourcis » statistiques plutôt que des signaux biologiques, limitant leur fiabilité en pratique clinique. Par ailleurs, un essai randomisé de phase 3 rapporte que la radiothérapie stéréotaxique améliore la qualité de vie de patients présentant de multiples métastases cérébrales par rapport à l’irradiation encéphalique totale avec évitement de l’hippocampe.
Les outils d’intelligence artificielle conçus pour prédire la biologie des cancers directement à partir d’images au microscope pourraient s’appuyer sur des raccourcis cachés plutôt que sur de véritables signaux biologiques, selon de nouveaux travaux de l’University of Warwick publiés dans Nature Biomedical Engineering. Ces résultats soulèvent des inquiétudes : certains outils d’IA en anatomopathologie seraient actuellement trop peu fiables pour une prise en charge réelle des patients.
Les chercheurs ont analysé plus de 8 000 échantillons de patients dans quatre grands types de cancer — sein, colorectal, poumon et endomètre — et comparé les performances des principales approches d’apprentissage automatique. Si les modèles affichaient souvent une forte précision « en titre », l’équipe a constaté que celle-ci provenait fréquemment de « raccourcis » statistiques.
Au lieu de détecter des mutations du gène BRAF associé au cancer, un modèle pourrait apprendre que les mutations de BRAF surviennent souvent en parallèle d’une autre caractéristique clinique, telle que l’instabilité des microsatellites (MSI). Le système apprend alors à utiliser cette combinaison d’indices pour prédire le statut BRAF, plutôt qu’à apprendre le signal causal de BRAF lui-même : les prédictions ne restent exactes que lorsque ces biomarqueurs coexistent, et deviennent peu fiables lorsqu’ils ne le font pas.
Lorsque les performances des modèles d’IA ont été évaluées au sein de sous-groupes de patients stratifiés — par exemple uniquement des cancers du sein de haut grade, ou uniquement des tumeurs MSI-positives — la précision a fortement chuté, révélant que les modèles dépendaient de signaux de raccourci qui disparaissent une fois les facteurs de confusion contrôlés.
Pour certaines tâches de prédiction, l’avantage de performance du deep learning par rapport à des informations cliniques dérivées de l’expertise humaine était modeste. Les systèmes d’IA ont atteint des scores de précision d’un peu plus de 80 % pour prédire des biomarqueurs, contre environ 75 % en utilisant le grade tumoral seul — une mesure déjà évaluée par les anatomopathologistes.
Les méthodes d’apprentissage automatique peuvent néanmoins s’avérer utiles pour la recherche, le criblage de candidats au développement de médicaments, ainsi que pour le triage clinique, le dépistage ou une aide décisionnelle complémentaire. Cependant, les chercheurs soutiennent que les futurs outils d’IA doivent dépasser l’apprentissage fondé sur des corrélations et adopter des approches modélisant explicitement les relations biologiques et la structure causale. Ils appellent aussi à des standards d’évaluation plus stricts, incluant des tests par sous-groupes et des comparaisons avec des références cliniques simples, avant d’envisager un déploiement en soins courants.
Dans des travaux distincts portant sur le traitement des métastases cérébrales, un essai clinique randomisé de phase 3 mené dans 4 centres situés aux États-Unis a montré qu’une radiothérapie stéréotaxique ciblant les tumeurs individuellement améliorait la sévérité des symptômes et l’interférence avec le fonctionnement quotidien, par rapport à une irradiation encéphalique totale avec évitement de l’hippocampe.
Parmi 196 patients randomisés (âge moyen, 61 ans ; 129 [66 %] femmes ; 176 [90 %] Blancs ; nombre médian de métastases cérébrales, 14 [IQR, 11-18] ; 49 [25 %] avec résection neurochirurgicale antérieure), 83 (42 %) ont complété l’évaluation à 6 mois. Les patients éligibles présentaient 5 à 20 métastases cérébrales et n’avaient pas reçu de radiothérapie intracrânienne antérieure. L’inclusion a eu lieu entre le 11 avril 2017 et le 17 mai 2024 (dernier suivi, 18 mars 2025).
Pour le critère principal, entre l’évaluation initiale et les évaluations post-initiales jusqu’au suivi à 6 mois, la radiothérapie stéréotaxique a modifié le score composite pondéré du MD Anderson Symptom Inventory–Brain Tumor score de 2,69 à 2,37 (variation moyenne, −0,32) et l’irradiation encéphalique totale avec évitement de l’hippocampe a modifié le score de 2,29 à 3,03 (variation moyenne, 0,74) (différence moyenne, −1,06 [IC à 95 %, −1,54 à −0,58] ; P < .001). L’échelle va de 0 à 10, avec une plage de variation de −10 à 10, où −10 représente le meilleur résultat. Une différence cliniquement significative était définie comme 0,98.
Des événements indésirables de grade 3-5 liés au traitement sont survenus chez 12 patients (12 %) dans le groupe radiothérapie stéréotaxique et 13 patients (13 %) dans le groupe irradiation encéphalique totale avec évitement de l’hippocampe ; la fatigue de grade 1-3 était la plus fréquente (27 [28 %] vs 43 [44 %], respectivement).
L’essai a été enregistré sous l’identifiant ClinicalTrials.gov : NCT03075072.