News Release

Un modèle d’IA prédit les risques de maladies plus d’une décennie en avance

Un nouveau modèle d’IA peut prédire votre santé plus d’une décennie en avance, anticipant les risques de plus de 1 000 maladies.

Peer-Reviewed Publication

European Molecular Biology Laboratory

image: 

AI model forecasts disease risk decades in advance

view more 

Credit: Karen Arnott/EMBL-EBI

Imaginez un futur où votre historique de santé pourrait vous aider à prédire les possibles problèmes de santé que vous pourrez rencontrer les vingt prochaines années. Des chercheurs ont développé un nouveau modèle d’IA générative qui utilise des données médicales à grande échelle pour estimer comment la santé de l’Homme peut évoluer dans le temps. Il peut prévoir le risque et le temps de survenue de plus de 1 000 maladies et prédire les résultats en matière de santé plus d'une décennie à l'avance.

Ce nouveau modèle a été fait sur-mesure utilisant les mêmes principes algorithmiques que ceux utilisés pour les Grands modèles de langage (abrégé LLMs de l’anglais Large Language Models). Ce dernier fut entraîné sur des données anonymisées de plus de 4000 000 patients volontaires provenant de la UK Biobank. Les chercheurs ont aussi réussi à tester avec succès le modèle sur plus d’1.9 millions de patients inscrits au Registre National Danois des Patients. Cette approche, l'une des plus complètes à ce jour, démontre la capacité d'un modèle d'IA à prédire la progression des maladies à grande échelle et sur le long terme. Elle a de plus été testée avec succès sur deux systèmes de santé différents.

“Notre modèle d’IA représente une preuve de concept, démontrant qu’il est possible pour une IA de mieux comprendre les tendances concernant notre santé et utiliser cette information pour réaliser des prédictions qui ont du sens” a partagé Ewan Birney, Directeur Général par intérim au Laboratoire Européen de Biologie Moléculaire (EMBL). “En modélisant l’évolution des maladies dans le temps, nous pouvons commencer à explorer l'émergence de certains risques et comment  mieux préparer des interventions préliminaires. C’est un grand pas vers une approche plus préventive et personnalisée des soins donnés aux patients. 

Ce projet, publié dans le journal Nature, est le fruit d’une collaboration entre L’EMBL, le Centre Allemand de recherche sur le Cancer (DKFZ) et l’Université de Copenhague. 

L’IA pour les prévisions en santé

Tout comme les grands modèles de langage peuvent apprendre la structure des phrases, ce modèle d’IA apprend la “grammaire” des données de santé afin de modéliser les antécédents médicaux sous forme de séquences d'événements se déroulant dans le temps. Ces événements incluent des diagnostics médicaux ou encore des facteurs liés au mode de vie comme le tabagisme. Le modèle apprend à prévoir le risque de maladie en se basant sur l'ordre dans lequel ces événements se produisent et du temps qui s'écoule entre eux.

“Des changements liés à la santé suivent souvent des tendances prévisibles” ajoute Tom Fitzgerald, Scientifique à l’Institut Européen de Bioinformatique de l’EMBL (EMBL-EBI). “Notre modèle d’IA apprend ces tendances et peut prévoir les résultats futurs en matière de santé. Il nous permet d'explorer ce qui pourrait arriver en fonction des antécédents médicaux d'une personne et d'autres facteurs clés. Il est important de noter qu'il ne s'agit pas d'une certitude, mais d'une estimation des risques potentiels. »

Le modèle est particulièrement efficace lorsque les schémas d’évolutions sont clairs et cohérents, comme pour certains types de cancer, les crises cardiaques, et les cas de septicémie, qui sont un type d'empoisonnement du sang. Cependant, le modèle l’est moins pour des maladies et événements de la vie qui représentent une plus grande variabilité, comme les troubles psychologiques et complications liées à la grossesse qui dépendent d'événements de vie plus imprévisibles. 

Usages futurs et limites

Tout comme les prévisions météo, ce nouveau modèle nous donne des probabilités et non des certitudes. Il ne prédit pas avec exactitude ce qui pourrait arriver à une individu, néanmoins, il offre des estimations de la probabilité que certaines situations se produisent au cours d'une période donnée. Par exemple, il pourrait prédire les chances de développer une maladie cardiaque dans l’année qui suit. Ces risques sont exprimés comme tendances dans le temps, similaires à une prévision de 70% de chance de pluie le jour suivant. En général, les prévisions à court terme sont plus précises que celles à long terme.

Prenons un autre exemple, le modèle prédit différents niveaux de risque de crise cardiaque. Si l'on prend la cohorte UK BioBank âgée de 60 à 65 ans, le risque de crise cardiaque varie de 4 sur 10 000 par an pour certains hommes à environ 1 sur 100 pour d'autres, en fonction de leurs diagnostics antérieurs et de leur mode de vie.Les femmes présentent un risque moyen plus faible, mais une répartition similaire du risque. De plus, les risques augmentent en moyenne avec l'âge. Une évaluation systématique des données de la UK Biobank non utilisées lors de la phase d’entraînement a montré que ces risques calculés correspondent bien au nombre de cas observés dans les différents groupes d'âge et de sexe.

Le modèle est calibré pour produire des estimations précises du risque au niveau de la population. Cependant, comme n’importe quel modèle d’IA, il a ses limites. Par exemple, puisque les données d’entraînement de la UK Biobank proviennent d'individus âgés entre 40 et 60 ans, les situations liées à l’enfance et l’adolescence sont sous-représentées. Le modèle possède aussi des biais d'échantillonnages dûs à des groupes d’individus sous-représentés. 

Même si le modèle n’est pas prêt pour les essais cliniques, il pourrait déjà aider les chercheurs à: 

  • mieux comprendre comment les maladies se développent et progressent dans le temps,

  • Explorer comment le mode de vie et les maladies précédentes peuvent avoir un effets sur les risques de maladie longue durée,

  • simuler les résultats cliniques à l'aide de données de patients artificiels, dans les situations où il est difficile d'obtenir ou d'accéder à des données réelles.

Dans le futur, des outils IA similaires entraînés sur des bases de données plus représentatives pourront assister les cliniciens dans l’identification précoce des patients à haut risque. Avec le vieillissement de la population et l'augmentation des taux de maladies chroniques, la capacité à prévoir les besoins futurs en matière de santé pourrait aider les systèmes de santé à mieux planifier et à allouer plus efficacement les ressources. Mais de nombreux tests, consultations et cadres réglementaires solides sont encore nécessaires avant que les modèles d'IA puissent être déployés dans un contexte clinique.

« C'est le début d'une nouvelle manière de comprendre la santé humaine et la progression des maladies », a déclaré Moritz Gerstung, chef de la division IA en oncologie au DKFZ et ancien chef de groupe à l'EMBL-EBI. « Les modèles génératifs tels que le nôtre pourraient un jour contribuer à personnaliser les soins et à anticiper les besoins en matière de santé à grande échelle. En s'appuyant sur des populations importantes, ces modèles offrent un aperçu précieux de l'évolution des maladies et pourraient à terme permettre des interventions plus précoces et mieux adaptées. »

Confidentialité des données et éthique

Ce modèle d’IA a été entraîné à partir de données de santé anonymisées, dans le respect des règles éthiques strictes. Les participants de la UK Biobank ont donné leur consentement éclairé, et les données danoises ont été consultées conformément à la réglementation nationale qui exige que les données restent au Danemark. Les chercheurs ont utilisé des systèmes virtuels sécurisés pour analyser les données sans les transférer à l’étranger. Ces mesures de protection permettent de garantir que les modèles d’IA sont développés et utilisés dans le respect de la vie privée et des normes éthiques. 

Financements

Ce projet a été financé par les États membres de l’EMBL, les fonds DKFZ et une subvention de la fondation Novo Nordisk.


Disclaimer: AAAS and EurekAlert! are not responsible for the accuracy of news releases posted to EurekAlert! by contributing institutions or for the use of any information through the EurekAlert system.