Dans les profondeurs du patrimoine génétique

Lorsque des algorithmes analysent le patrimoine génétique complet d'une tumeur, cela permet d'optimiser le succès du traitement. L'analyse permet également de découvrir comment le cancer se développe.

Illustration de l'intelligence artificielle
(Illustration : Ray Oranges)

Dans quelques cliniques de premier plan au niveau mondial, spécialisées dans le traitement du cancer, c'est déjà la norme : des échantillons de tissus de chaque patient sont analysés génétiquement de manière très précise à partir des tumeurs. Des spécialistes extraient l'ADN de ces échantillons et en décryptent le patrimoine génétique complet de la tumeur cancéreuse. Combiné à des informations sur l'activité des différents gènes, cela permet de décrire plus précisément le type de cancer et de prédire à quels traitements et médicaments un patient est le plus susceptible de répondre.

Décrypter le génome complet d'un cancer implique toutefois de gérer plusieurs centaines de gigaoctets de données brutes, qu'il faut d'abord évaluer. Cela n'est possible que grâce à des algorithmes efficaces d'apprentissage automatique, comme le dit Niko Beerenwinkel. Il est professeur de biologie computationnelle au Département des systèmes biologiques et spécialisé dans l'analyse des données de biologie moléculaire.

Les appareils modernes de séquençage de l'ADN sont certes performants et rapides. Cependant, ces appareils fournissent des données brutes "bruitées" qui ne peuvent être interprétées qu'avec des analyses informatiques performantes. "Les algorithmes réduisent le bruit en comparant les données brutes d'une analyse génétique avec un grand nombre d'autres analyses génétiques et décident ainsi ce qui a de grandes chances d'être du bruit et ce qui ne l'est pas", explique Beerenwinkel.

Trouver une aiguille dans une botte de foin

L'analyse est toutefois loin d'être terminée. "Dans le patrimoine génétique d'une tumeur, des milliers de petites modifications se sont souvent accumulées, dont seules quelques-unes sont pertinentes", explique Beerenwinkel. "En outre, il y a des modifications qui, prises isolément, sont insignifiantes sur le plan médical, mais qui, combinées à d'autres, sont décisives". Les algorithmes informatiques aident ici aussi à extraire des informations pertinentes sur le plan médical à partir des grandes quantités de données.

A cela s'ajoute le fait que les tumeurs sont des amas de différents types de cellules qui se distinguent fortement par leur génétique et leur mode de fonctionnement. Outre les cellules cancéreuses proprement dites, on trouve par exemple dans les tumeurs des cellules de vaisseaux sanguins et du système immunitaire. Comme le patrimoine génétique des cellules cancéreuses évolue rapidement, une tumeur contient généralement plusieurs populations génétiquement différentes de ces cellules dégénérées, qui peuvent ne pas toutes réagir au même médicament.

Avec son groupe, Beerenwinkel développe des méthodes d'apprentissage automatique et des logiciels permettant d'identifier et de décrire la grande diversité génétique des tumeurs. "A l'avenir, il sera possible de prendre en compte toutes les populations de cellules dans le traitement du cancer et pas seulement la plus fréquente, comme c'est généralement le cas aujourd'hui", explique Beerenwinkel.

Pronostics et thérapies

Valentina Boeva, professeure d'informatique biomédicale au département d'informatique de l'ETH Zurich, utilise elle aussi des algorithmes d'apprentissage automatique. L'un des points forts de sa recherche concerne les modifications épigénétiques dans les cellules tumorales. Il s'agit de modifications temporaires et réversibles du patrimoine génétique, par opposition aux modifications génétiques permanentes.

"Suite aux modifications épigénétiques, d'autres gènes sont actifs dans les cellules tumorales que dans les cellules saines d'origine, et d'autres protéines sont fabriquées", explique Boeva. Elle utilise des bases de données rendues accessibles à la recherche et contenant des données de patients anonymes, qu'elle évalue à l'aide d'algorithmes informatiques.

Dans un travail de recherche non encore publié, elle a pu montrer pourquoi, dans certaines tumeurs, des modifications épigénétiques s'accompagnent d'une plus grande agressivité : Grâce à ces modifications, les tumeurs parviennent à échapper aux défenses immunitaires de l'organisme. Comme il est possible d'inverser ces modifications à l'aide de médicaments, cette découverte donne des indications sur de nouvelles possibilités de traitement.

Un autre exemple est la recherche de sections sur le brin de patrimoine génétique qui régulent l'activité des gènes. Les mutations dans ces sections sont également pertinentes dans le développement du cancer. Souvent, ces sections se trouvent à proximité du gène qu'elles régulent. Mais si elles se trouvent plus loin, elles sont difficiles à trouver. "Un autre défi consiste à déterminer quel gène est régulé par une telle section", explique Boeva. Elle a utilisé une méthode moderne d'apprentissage automatique, développée dans le domaine de la linguistique informatique, pour saisir la signification d'un texte. Boeva a ainsi analysé des données génomiques afin de déterminer la "signification" des différentes sections du génome. Et elle a effectivement trouvé de cette manière des séquences de génome régulatrices jusqu'alors inconnues.

Pour son travail, Boeva n'a pas toujours besoin des toutes dernières méthodes d'évaluation. "Parfois, j'arrive à mes fins avec des méthodes statistiques que les scientifiques ont déjà développées il y a plusieurs décennies", dit-elle. Le nombre de méthodes est important et souvent, elle ne sait pas d'emblée avec quelle méthode un problème a le plus de chances d'être résolu. Il faut donc en essayer plusieurs. "L'apprentissage automatique va toutefois continuer à se développer", explique la professeure de l'ETH. Et à l'avenir, il y aura probablement des algorithmes qui choisiront automatiquement la meilleure méthode d'apprentissage automatique.

En forme pour le marché du travail

L'apprentissage automatique suscite un grand intérêt chez les étudiants. Et l'industrie pharmaceutique a également reconnu l'apprentissage artificiel et l'intelligence artificielle comme des technologies clés. Outre le domaine des biomarqueurs moléculaires, dans lequel Beerenwinkel et Boeva sont actifs, ils sont également utilisés pour le développement de nouvelles molécules de substances actives. "Je constate un grand intérêt de la part de l'industrie, d'une part pour une collaboration avec nous dans des projets de recherche, d'autre part pour l'embauche de nos diplômés", déclare Beerenwinkel.

Lorsque la professeure Boeva de l'ETH trouve de nouveaux segments de génome pertinents pour le cancer, cela ne profite pas seulement aux patients dans les cliniques de pointe. En effet, des analyses génétiques limitées sont de plus en plus souvent effectuées sur des patients cancéreux dans des hôpitaux moins spécialisés. Au lieu de l'ensemble du génome, seules quelques dizaines de sections du génome sont alors analysées. Ce sont ces sections et ces mutations que Boeva, Beerenwinkel et de nombreux autres chercheurs du monde entier ont découvertes à l'aide de l'apprentissage automatique et dont ils ont décrypté la fonction.

Ce texte est paru dans le dernier numéro du magazine de l'ETH. Globe a été publié.

JavaScript a été désactivé sur votre navigateur