Utiliser l’IA pour trouver des gènes pathogènes :

Un nouveau programme d’intelligence artificielle aide les scientifiques à parcourir rapidement des milliers d’ensembles de données et des millions d’articles pour se concentrer sur les gènes qui sous-tendent la maladie, condensant considérablement un processus de recherche qui prenait autrefois des mois.

À l’aide d’un logiciel informatique, les scientifiques peuvent scanner des génomes entiers, ou l’ensemble complet de l’ADN d’un organisme, de souris qui modélisent des maladies humaines. Le but: pour identifier les mutations génétiques qui causent ces maladies et ouvrir de nouvelles portes aux scientifiques afin de mieux exploiter la génétique pour développer des traitements contre les maladies, a déclaré Gary Peltz, MD, PhD, professeur d’anesthésiologie, de médecine périopératoire et de médecine de la douleur à Stanford Medicine.

Mais pour ce faire, les scientifiques doivent rechercher dans des ensembles massifs de données génomiques, ce qui donne plus de faux positifs que les chercheurs ne veulent l’admettre. C’est aussi beaucoup de temps. Peltz voulait rendre le processus de découverte génétique plus facile, plus rapide et plus précis.

À cette fin, Peltz et le boursier postdoctoral Zhuoqing Fang, PhD, ont créé un programme automatisé qui trie les données de séquence d’ADN et peut analyser plus de 10 000 ensembles de données – dans ce cas, des traits de maladies de la souris – d’un seul coup. Le programme trie 29 millions d’articles publiés et évalue les liens possibles entre les gènes et les traits de la maladie. Ensuite, il réduit ces informations pour identifier les gènes qui peuvent contribuer à une certaine maladie.

Dans un article récemment publié dans la revue : Bioinformatique :l’équipe a utilisé son pipeline automatisé pour identifier les gènes liés au diabète et à l’obésité, ainsi qu’à la formation de cataractes chez la souris.

J’ai parlé avec Peltz de ce qui a motivé son équipe à combiner l’IA et la découverte de gènes, comment fonctionne ce nouveau pipeline informatique et ce que cela peut signifier pour l’avenir de la médecine.

Qu’est-ce que votre laboratoire a fait pour améliorer le processus de découverte des gènes ?

Nous avons commencé à analyser de grands ensembles de données détaillant les phénotypes de la maladie, ou les traits physiques, de nombreux types de souris différents. Nous avons ensuite réalisé des études d’association à l’échelle du génome, qui identifient des corrélations entre les gènes et les phénotypes spécifiques de certaines maladies.

Mais cela nécessite d’analyser d’énormes quantités de données entrantes, ce qui crée beaucoup de travail. Vous vous retrouvez avec beaucoup de gènes qui peuvent être liés au hasard à la sensibilité ou à la résistance aux maladies. Cependant, cette corrélation ne signifie pas qu’un gène est réellement impliqué dans la cause ou la protection contre cette maladie. Donc, vous devez trier ces corrélations. Je passais trois mois à lire la littérature sur les différents gènes, essayant de comprendre lesquels étaient les plus susceptibles d’être impliqués dans une maladie donnée.

Comment votre nouveau pipeline automatisé rend-il ce processus encore plus gérable ?

Étant un peu paresseux, j’ai demandé: « Ne pourrions-nous pas demander à l’ordinateur de trier ces corrélations génétiques ? C’est la base de ce pipeline.

Zhuoqing Fang, le co-auteur de l’étude, avait beaucoup d’expérience avec l’IA et les programmes informatiques. Ce qu’il a fait n’était vraiment rien de moins que phénoménal. Son travail utilise l’IA pour évaluer la probabilité qu’un gène candidat soit impliqué dans le développement de la maladie.

Le programme d’IA identifie les gènes corrélés aux caractéristiques de la maladie, comme le diabète et la cataracte, chez la souris. Fang a téléchargé 29 millions d’articles et le programme d’IA les a tous lus et a déterminé si un gène candidat était mentionné dans un article sur une maladie particulière. Le programme recherche la cooccurrence du gène X et de la maladie Y dans un article.

Et, comme de nombreuses maladies humaines résultent d’interactions entre protéines, nous avons utilisé le programme d’IA pour analyser une base de données d’interactions protéine-protéine. De cette façon, nous obtenons une meilleure idée de savoir si une protéine produite par un gène candidat est liée à une maladie.

L’algorithme compile ensuite ces données, qui sont utilisées pour évaluer la force de la relation entre un gène candidat et un phénotype de la maladie.

Le pipeline vous a-t-il aidé à identifier les gènes associés à une maladie donnée ?

Dans un cas, nous avons vu certaines souris, mais pas toutes, qui avaient une version souris de la cataracte avaient une incidence très élevée de la maladie. Nous avons donc posé une question simple : « Quelle est la différence entre les souris qui développent des cataractes et celles qui n’en développent pas ? » Le programme d’IA a identifié un gène appelé Nid1, qui est actif dans les cellules situées directement dans une membrane située à l’intérieur de votre œil. Le programme l’a découvert en trouvant un article qui identifiait un type de mutation qui ressemblait à celle que nous avons vue chez les souris, mais qui provoquait des cataractes chez les bovins.

Il laisse vraiment la crème monter vers le haut et filtre beaucoup de déchets.

Qu’espérez-vous faire avec ce pipeline de calcul ?

J’espère que cela nous permettra de faire de nouvelles découvertes génétiques, qui pourront servir de base à de nouveaux tests de diagnostic et à de nouvelles thérapies qui amélioreront les soins aux patients. En ce moment, nous utilisons notre programme d’IA pour analyser les génomes de souris. Cependant, cet outil peut également être utilisé pour analyser d’autres types d’ensembles de données, tels que des données génétiques humaines ou des listes de protéines, qui pourraient révéler davantage comment les changements génétiques provoquent des maladies.

Comprendre l’architecture génétique sous-jacente à la susceptibilité aux maladies pourrait permettre aux médecins de diagnostiquer plus précisément les maladies chez leurs patients, et les informations génétiques d’une personne peuvent être utilisées pour identifier le meilleur traitement ou pour élaborer un plan de prévention des maladies. Cela pourrait également aider à orienter le développement de nouveaux médicaments. Si l’IA peut conduire votre voiture, pourquoi ne pouvons-nous pas utiliser l’IA pour faire des découvertes génétiques ?

Photo Siarhei:

Leave a Comment