Présentation de cageminer, un package R/Bioconductor pour hiérarchiser les gènes candidats en intégrant GWAS et les réseaux de coexpression de gènes

Bien que les études d’association à l’échelle du génome (GWAS) permettent l’identification de variants de polymorphisme nucléotidique unique (SNP) associés à des traits d’intérêt, bon nombre des variants identifiés se trouvent dans des régions non codantes et n’influencent vraisemblablement que la régulation de l’expression génique. Par conséquent, l’identification des gènes responsables sous-jacents à un phénotype donné à l’aide de variants seuls est très difficile. L’intégration de GWAS et de réseaux de coexpression de gènes peut aider à hiérarchiser les gènes candidats de haute confiance, car les profils d’expression des gènes associés aux traits peuvent être utilisés pour extraire de nouveaux candidats. Un nouvel article publié dans en silicone Plants présente un cadre statistique qui automatise l’intégration des réseaux de coexpression de gènes et des SNP dérivés de GWAS pour hiérarchiser les gènes candidats associés aux traits d’intérêt.

Le chercheur diplômé Fabricio Almeida-Silva et le professeur agrégé Dr. Thiago Venancio à l’Université d’État du nord de Rio de Janeiro présente mineur de cage (candidate gene miner), le package R/Bioconductor pour prioriser les gènes candidats grâce à l’intégration de GWAS et de réseaux de coexpression.

mineur de cage utilise une approche basée sur les gènes guides pour découvrir de nouveaux candidats qui sont coexprimés avec des gènes associés à des traits connus et qui sont significativement induits ou réprimés dans des conditions d’intérêt.

Bien qu’il existe une approche informatique existante, Camoco, qui peut intégrer des locus identifiés par GWAS avec des informations fonctionnelles dérivées de réseaux de coexpression de gènes, mineur de cage est capable de découvrir des gènes candidats dans une fenêtre glissante plus grande, ce qui lui permet de détecter davantage de gènes candidats.

Données d’entrée requises par mineur de cage sont des positions SNP, des gènes guides et un réseau de coexpression de gènes.

Les gènes sont considérés comme des candidats de haute confiance s’ils satisfont aux trois critères de filtrage mis en œuvre dans mineur de cage:

  1. proximité physique avec les SNP,
  2. coexpression avec des gènes associés à des traits connus, et
  3. des changements significatifs dans les niveaux d’expression dans les conditions d’intérêt.

Les candidats prioritaires peuvent également être notés et classés pour sélectionner des cibles pour la validation expérimentale.

Un organigramme montrant les trois étapes séquentielles de la hiérarchisation des gènes candidats cageminer.

Les auteurs ont appliqué mineur de cage à un ensemble de données réel de Capsicum annuel réponse à l’infection par Phytophthora pour identifier les candidats prioritaires qui codent pour les protéines liées aux processus connus liés à l’immunité des plantes. Une documentation facile à suivre de la session comprenant le code, les explications et les chiffres est incluse dans un fichier complémentaire à l’article.

Venancio conclut, « nous avons développé mineur de cage de prioriser les gènes candidats, conduisant à une réduction significative de la taille des listes de gènes candidats. Nous prévoyons que cet ensemble contribuera à l’avancement de la génomique des populations et à l’identification de gènes pour des applications biotechnologiques. »

LIRE L’ARTICLE:

Fabricio Almeida-Silva, Thiago M Venancio, cageminer : un package R/Bioconductor pour hiérarchiser les gènes candidats en intégrant GWAS et les réseaux de coexpression de gènes, in silico Plants, 2022 ; diac018, https://doi.org/10.1093/insilicoplants/diac018


Toutes les données et le code utilisés dans ce manuscrit sont disponibles gratuitement dans un référentiel GitHub (https://github.com/almeidasilvaf/cageminer_benchmark) pour assurer une reproductibilité totale

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *