Les micro-organismes remplissent des fonctions clés dans les écosystèmes et leur diversité reflète létat de santé de leur environnement. Or, ils sont encore largement sous-exploités dans les programmes de biosurveillance actuels, car difficilement identifiables. Des chercheurs de lUniversité de Genève (UNIGE) ont récemment mis au point une approche combinant deux technologies de pointe pour pallier ce manque. Ils se servent doutils génomiques pour séquencer lADN des micro-organismes dans les prélèvements, puis exploitent cette masse considérable de données grâce à lintelligence artificielle. Ils construisent ainsi des modèles prédictifs capables deffectuer un diagnostic de santé des écosystèmes à large échelle et didentifier les espèces qui remplissent des fonctions importantes. Cette nouvelle approche, publiée dans la revue Trends in Microbiology, permettra daugmenter considérablement la capacité dobservation décosystèmes étendus et de diminuer le temps danalyse, pour des programmes de biosurveillance de routine beaucoup plus performants.
Surveiller létat de santé des écosystèmes revêt une importance cruciale dans un contexte de développement durable et de pression croissante exercée par lhumain sur lenvironnement. Différentes espèces de micro-organismes sensibles aux changements qui affectent leur milieu sont utilisées comme bio-indicateurs pour le suivi de la qualité de lenvironnement. Or, leur identification morphologique nécessite beaucoup de temps et dexpertise. «Il y a un an, nous avons pu établir un indice de la qualité de leau basé uniquement sur les séquences dADN dalgues unicellulaires présentes dans les prélèvements, sans quil soit nécessaire den identifier visuellement chaque espèce», explique Jan Pawlowski, professeur au Département de génétique et évolution de la Faculté des sciences de lUNIGE.
Utiliser des séquences dADN sans devoir les identifier
Cet outil génomique permet de décrire rapidement et très précisément des communautés biologiques peuplant un environnement. Cependant, une large proportion des données ne peut pas être utilisée pour effectuer des diagnostics de santé des milieux, parce que bon nombre de séquences dADN ne sont pas référencées dans les base de données existantes. Les espèces qui détiennent ces séquences demeurent donc inconnues, ainsi que leur rôle écologique. «Afin dexploiter la totalité des données de génomique environnementale, soit lensemble de la biodiversité des échantillons, nous avons eu recours à un algorithme dapprentissage automatique», note Tristan Cordier, membre du groupe genevois et premier auteur de létude.
Les biologistes ont utilisé des échantillons de différents statuts de qualité écologique connus, allant de bon à mauvais, dont ils ont séquencé lADN. La combinaison de ces informations leur a permis de constituer un système de référence avec les données de chaque échantillon. «Un modèle prédictif a ensuite été élaboré avec cet algorithme, à partir de données dapprentissage. Celles-ci comprennent les données des diagnostics de référence et celles du séquençage despèces inconnues», expose Jan Pawlowski. Ce modèle est affiné et validé au fur et à mesure en incluant de nouveaux échantillons de référence au jeu de données existant.
Découvrir de nouveaux bio-indicateurs
La combinaison de ces deux technologies de pointe permet dobtenir des valeurs écologiques pour les séquences dADN sans devoir les identifier. Des espèces de micro-organismes, déjà décrites ou non, remplissant des fonctions importantes peuvent être découvertes grâce à cette approche, ainsi que de nouveaux bio-indicateurs. «Notre recherche partage des points communs avec celle menée sur le microbiome humain. Les deux visent en effet à démêler des communautés microbiennes et à identifier des biomarqueurs pouvant servir de puissants outils de diagnostic pour détecter la pollution environnementale ou des maladies humaines», conclut Tristan Cordier.
###
Journal
Trends in Microbiology