En chimie organique, les scientifiques sont sans cesse à la recherche de nouvelles molécules quils créent et étudient grâce à la résonance magnétique. Les données récoltées sont ensuite retranscrites en fonction des normes propres à chaque laboratoire ou publication. Elles sont dès lors difficilement exportables électroniquement et donc peu utilisables par la communauté scientifique. Une équipe internationale, dirigée par des chimistes de lUniversité de Genève (UNIGE), a développé un nouveau langage électronique commun, permettant de traduire les données de chaque molécule dune seule et même manière et de les exporter facilement dun système informatique à lautre. Les données deviennent ainsi facilement accessibles par tous les chimistes et réutilisables directement, permettant un gain de temps notable pour les futures recherches. Cette étude, à lire dans la revue Magnetic Resonance in Chemistry (Wiley), ouvre la voie à la création dune base de données internationale en accès libre et à des outils spécifiques incluant lanalyse par intelligence artificielle.
Les organiciens créent de nouvelles molécules à base datomes de carbone, mais celles-ci sont si petites quil leur est impossible de voir ce quils synthétisent. Pour vérifier ces assemblages effectuées à laveugle, les chercheurs utilisent alors la résonance magnétique : chaque atome constituant la molécule émet un signal, et la fréquence de ce signal est traduite sous forme de spectre que les chimistes vont ensuite décoder. Pour déterminer la structure dune molécule, il faut donc être capable de lire les spectres de résonance magnétique.
La résonance magnétique se met au diapason
Les chimistes possèdent un vocabulaire spécifique pour décrire les spectres et détailler la résonance des atomes. Mais cette traduction des données brutes en langage écrit varie en fonction de chaque laboratoire, logiciel utilisé et publication. Il ny a donc ni base de données sur la composition des molécules, ni uniformité dans le traitement des spectres et des données qui leurs sont attribuées. «Cest pourquoi il est très difficile de réutiliser des données générées par dautres laboratoires sans risque derreur, explique Damien Jeannerat, chercheur au Département de chimie organique de la Faculté des sciences de lUNIGE. Nous avons donc eu lidée de créer un langage électronique unique qui permette de passer dun système à lautre sans perte dinformation et de constituer des bases de données internationales en libre accès.»
Le NMReDATA comme langue unique
Les chimistes de lUNIGE ont ainsi dirigé une initiative international impliquant les spécialistes du domaine et proposé une norme pour le traitement des données des molécules organiques. «Notre nouveau format, nommé NMReDATA, fonctionne selon un système détiquettes à attribuer à chaque donnée extraite du spectre dans un ordre défini et qui est facilement lisible par un ordinateur», précise Marion Pupier, ingénieure au Département de chimie organique de la Faculté des sciences de lUNIGE. Ainsi, le signal de chaque spectre sera traduit dans lordre par le déplacement chimique, le nombre datomes, le couplage, les corrélations interatomiques et finalement lattribution. «Jusquà présent, chacun transmettait ces mêmes informations de façon plus ou moins complète dans un ordre qui lui était propre, rendant impossible le transfert électronique dun ordinateur à lautre sans un contrôle et une réorganisation des informations par les chercheurs. Avec notre système, cette obligation disparaît grâce à luniformité du langage», senthousiasme Damien Jeannerat.
Créer une base de données internationale en libre accès
Lidée dun langage électronique commun est intimement liée à la volonté de créer une base de données en accès libre. «Celle-ci permettrait aux chimistes de trouver la composition exacte de molécules étudiées, sans refaire eux-mêmes un travail déjà effectué par le passé», note Marion Pupier. Linformation sera visible et disponible en tout lieu et toute heure, permettant un gain de temps et dargent considérable dans la recherche en chimie organique.
Reste à présent à diffuser ce nouveau format et à en faire la norme dans la publication darticles par les grandes revues internationales. «Nous espérons que dans une année environ, tous les logiciels seront parfaitement opérationnels et que NMReDATA sera utilisé par tous», conclut Damien Jeannerat.
###
Journal
Magnetic Resonance in Chemistry