Des outils big data pour faire progresser la médecine de précision
Des chercheurs de l’EPFL ont mis au point des outils big data pour identifier de nouvelles fonctions géniques. Leur travail révèle des millions de liens entre les gènes et leurs fonctions, ce qui peut faciliter le développement de la médecine de précision.
Les gènes sont les unités fonctionnelles de l’hérédité, et comprendre leur fonction constitue le principal objet de la recherche biomédicale, qui sert de base à la médecine de précision. Toutefois, la plupart des travaux de recherche portent uniquement sur une petite partie des gènes, négligeant la plus grande partie que forme la «matière noire du génome». Cela entrave notre compréhension – nécessaire pour progresser en médecine de précision – des mécanismes sous-jacents de traits et maladies complexes.
«La plupart des recherches sont axées sur les gènes et considérablement influencées par nos connaissances préalables. Par conséquent, de nombreux gènes potentiellement importants sont ignorés», explique Johan Auwerx, dont le laboratoire à l’EPFL a dirigé l’étude, en collaboration avec des collègues de l’Université de Lausanne et de l’Université du Tennessee, ainsi que les professeurs de l’EPFL Kristina Schoonjans et Stephan Morgenthaler.
Dans un article publié dans Genome Research, les scientifiques abordent la question de la «matière noire du génome» en développant de nouvelles approches fondées sur la génétique systémique. «Les gènes possédant des fonctions similaires tendent à avoir des profils d’expression similaires, explique Hao Li, auteur principal. Nous nous sommes fondés sur cette caractéristique pour prédire la fonction de gènes inconnus à partir de celles des gènes connus.»
Les chercheurs ont rassemblé des ensembles de données d’expression génique à grande échelle contenant plus de 300 000 échantillons de six espèces différentes. Ces données leur ont permis de mettre au point un ensemble d’outils baptisé «GeneBridge», capable d’identifier les potentielles fonctions géniques. L’équipe de chercheurs a ensuite utilisé cet instrument pour identifier des centaines de milliers de nouvelles fonctions géniques, dont beaucoup ont été vérifiées par le groupe de Johan Auwerx et d’autres groupes de chercheurs.
«Nous avons ajouté GeneBridge et ses sept milliards de points de données aux 300 millions qui existent déjà sur systems-genetics.org, déclare Johan Auwerx. Cette ressource améliorera incontestablement notre connaissance de la “matière noire du génome” et favorisera le développement de la médecine de précision.»
Autres contributeurs
- Institut suisse de bioinformatique
- Université de Lausanne
- Université du Tennessee
EPFL
Conseil européen de la recherche
Fonds national suisse de la recherche scientifique
National Research Foundation of Korea (GRL grant)
Initiative suisse en biologie des systèmes (projet AgingX)
National Institutes of Health
Hao Li, Daria Rukina, Fabrice P.A. David, Terytty Yang Li, Chang-Myung Oh, Arwen W. Gao, Elena Katsyuba, Maroun Bou Sleiman, Andrea Komljenovic, Qingyao Huang, Robert W. Williams, Marc Robinson-Rechavi, Kristina Schoonjans, Stephan Morgenthaler, Johan Auwerx. Identifying gene function and module connections by the integration of multispecies expression compendia. Genome Research 21 November 2019. DOI: 10.1101/gr.251983.119