Quand les machines apprennent

Big data, intelligence artificielle, industrie 4.0 : les nouvelles possibilités offertes par les technologies de l'information vont changer le monde. Coup d'œil sur le monde des chercheurs qui apprennent aux machines à penser.

Thomas Hofmann, co-directeur du Centre pour les systèmes en formation de l'ETH et de la société Max Planck et Joachim Buhmann, directeur de l'Institut ETH pour l'apprentissage automatique.
Ils veulent apprendre aux machines à apprendre : Thomas Hofmann, codirecteur du Centre pour les systèmes en formation de l'ETH et de la société Max-Planck (à gauche) et Joachim Buhmann, directeur de l'Institut ETH pour l'apprentissage automatique. (Image : Daniel Winkler)

Une recherche Google portant sur Roger Federer, la star suisse du tennis, donne lieu à 28'900'000 entrées. La star mondiale du football Lionel Messi obtient tout de même 61'300'000 entrées. Il y en a un qui les bat facilement : la recherche d'AlphaGo, l'ordinateur qui a battu un champion du jeu de stratégie Go en mars de cette année, donne 313'000'000 de résultats. AlphaGo a fait la une des journaux ce printemps : La machine triomphe de l'homme - la victoire d'AlphaGo était le scénario d'horreur par excellence pour les uns, la percée de l'intelligence artificielle pour les autres.

Les champions

Joachim Buhmann, professeur d'informatique et directeur de l'Institut d'apprentissage automatique de l'ETH Zurich, juge la situation plus sobrement : "L'algorithme du joueur de go a bien sûr posé un jalon dans le domaine de l'apprentissage automatique. Mais c'est un jalon dans un domaine artificiel très délimité", déclare Buhmann. Depuis les débuts de l'informatique en tant que science, les jeux de stratégie ont été l'un des défis à l'aune desquels les progrès ont pu être mesurés relativement facilement. Les débuts ont été marqués par des jeux simples comme le moulin ou les dames. En 1997, l'ordinateur Deep Blue a battu le champion du monde d'échecs Garri Kasparov. Les programmeurs se sont ensuite intéressés au jeu de go, beaucoup plus complexe, comme prochaine étape possible.

En fait, ce n'est pas le fait qu'AlphaGo ait remporté la victoire qui est intéressant, mais la manière dont il l'a remportée : contrairement à l'ordinateur Deep Blue, ce n'est pas par la simple vitesse de calcul, mais bien plus par une énorme puissance de calcul, "combinée à une sorte d'apprentissage intelligent", explique Buhmann. Mais il nuance : "La résolution réussie de tels problèmes de jeu n'est pas une percée majeure, car la véritable intelligence se caractérise par la prise de décision dans un contexte de grande incertitude. Son collègue Thomas Hofmann, l'un des directeurs du nouveau centre de recherche, est du même avis. page externeCentre des systèmes en formation de l'ETH et de la société Max-Planck : "Nous voulons construire des machines qui font leurs preuves dans le monde réel. Les voitures autopilotées, par exemple, sont confrontées à des décisions bien plus complexes et lourdes de conséquences".

Formation dans un océan de données

Néanmoins, la manière dont les créateurs d'AlphaGo ont mené leur ordinateur à la maîtrise est également typique de nombreux autres domaines de l'apprentissage automatique. Au départ, les concepteurs d'AlphaGo ont alimenté la machine avec 150 000 parties de jeu disputées par de bons joueurs et ont utilisé un réseau neuronal artificiel pour identifier des modèles typiques dans ces parties de jeu. La machine a notamment appris à prédire quel coup un joueur humain utiliserait dans une position donnée. Les concepteurs ont ensuite optimisé le réseau neuronal en le mettant régulièrement en concurrence avec des versions antérieures de ses propres jeux. Ainsi, par de petits ajustements constants, le réseau a continué à améliorer ses chances de gagner. "Ce sont deux ingrédients qui rendent ce type d'apprentissage possible", explique Hofmann. "Il faut de très nombreuses données comme matériel d'apprentissage et une vitesse de calcul suffisante". Ces deux éléments sont aujourd'hui disponibles dans de nombreux domaines.

L'approche des développeurs en matière d'intelligence artificielle a donc changé de manière spectaculaire. Joachim Buhmann l'explique dans le domaine de la reconnaissance d'images : auparavant, les experts en images devaient indiquer en détail à l'ordinateur sur la base de quelles caractéristiques il devait catégoriser une représentation comme étant un visage, par exemple. "Cela signifiait d'une part que nous dépendions du savoir des experts et que nous devions d'autre part écrire des quantités de règles sous forme de codes", se souvient le chercheur. Aujourd'hui, il suffit d'écrire un métaprogramme qui définit uniquement les principes de base de l'apprentissage. L'ordinateur apprend alors de lui-même, à l'aide de nombreux exemples d'images, quelles sont les caractéristiques d'un visage. Grâce à Facebook, Instagram et autres, le matériel d'apprentissage ne manque pas : "Aujourd'hui, nous pouvons facilement utiliser plusieurs millions d'images, voire plus, comme matériel d'entraînement", explique Buhmann.

L'ordinateur comme médecin

Son domaine de spécialité est la reconnaissance d'images dans le domaine médical. C'est justement dans ce domaine que l'avantage de l'apprentissage automatique se révèle clairement : "Avant, nous essayions de demander le savoir d'expert des médecins et de le convertir ensuite en règles détaillées. Nous avons ainsi fait naufrage, car même les bons médecins ne peuvent souvent pas fournir d'explications claires à leurs actes". Aujourd'hui, les programmes informatiques recherchent de manière autonome des modèles statistiquement pertinents dans de grandes quantités de données d'images. Concrètement, Buhmann et ses collègues utilisent de tels procédés par exemple dans la recherche sur le cancer, mais aussi dans l'étude de maladies neurologiques comme la schizophrénie ou de maladies cérébrales dégénératives comme la démence ou la maladie de Parkinson.

Ils ont notamment développé un programme qui permet aux pathologistes d'évaluer plus précisément l'évolution probable d'une certaine forme de cancer du rein. Pour ce faire, des biopsies sont prélevées sur les patients et des coupes histologiques sont réalisées. Certaines colorations permettent de mettre en évidence des caractéristiques importantes. Les coupes sont numérisées et évaluées à l'aide de procédés d'analyse d'images mécaniques. Il s'agit par exemple de compter les cellules cancéreuses qui sont en train de se diviser et qui ont été rendues visibles par les colorations. Sur la base de ces comptages, l'ordinateur établit ensuite, en combinaison avec d'autres données, des pronostics pour certains groupes de patients. Dans un autre projet, des images de résonance magnétique du cerveau de patients schizophrènes ont été analysées par ordinateur. L'analyse des images a révélé trois groupes de patients présentant des schémas d'activité cérébrale nettement différents. "Nous avons appris que toutes les schizophrénies ne se ressemblent pas", explique Buhmann. "C'est maintenant aux pharmaciens et aux médecins de trouver le bon traitement pour chaque type de patient". Il est bien possible que les analyses automatisées d'images cérébrales aident aussi dans ce sens.

Langue et sens

Ce que la reconnaissance d'images est pour Buhmann, la parole l'est pour son collègue chercheur Thomas Hofmann. "La reconnaissance vocale, en tant que domaine de l'intelligence artificielle, est surtout demandée lorsqu'il s'agit de l'interaction entre l'homme et la machine", explique Hofmann. Il ne veut plus avoir à expliquer péniblement à la voiture autonome, via un clavier, la destination qu'elle souhaite atteindre, mais plutôt lui donner spontanément des instructions orales. Hofmann est convaincu qu'il ne faudra pas attendre longtemps avant d'en arriver là. "Nous pouvons aujourd'hui aborder le problème de la compréhension des textes par une machine d'une toute autre manière qu'auparavant".

Le big data fournit ici aussi le matériel à partir duquel les machines s'entraînent à comprendre des textes. Le web est un trésor linguistique incommensurable, un immense parcours d'entraînement à l'aide duquel les machines filtrent des régularités statistiques qui leur montrent des relations entre les mots. "Et ce, bien mieux que nous n'aurions jamais pu le faire avec des règles linguistiques ou phonétiques abstraites", explique Hofmann. De tels procédés trouvent également une application concrète lorsqu'il s'agit d'optimiser les programmes de traduction ou les moteurs de recherche. Hofmann développe avec son équipe un programme qui apprend à l'aide de toutes les entrées de Wikipedia (soit plus de 5 millions d'entrées en langue anglaise) à relier judicieusement les textes et les mots entre eux. Les liens et les renvois vers d'autres contributions, que chaque auteur de Wikipédia fait aujourd'hui encore à la main, seront à l'avenir placés par l'ordinateur - plus rapidement et de manière plus complète qu'un auteur ne pourrait le faire. "Cela commence par les significations élémentaires des mots. Mais ensuite, nos programmes doivent aussi comprendre la signification de phrases entières et finalement de discours entiers", explique Hofmann.

A égalité avec les machines

De la musique d'avenir ? En partie seulement. Les programmes de traduction ont déjà fait d'énormes progrès ces dernières années. Les moteurs de recherche s'améliorent constamment, des programmes informatiques rédigent des messages sportifs. Hofmann a lui-même participé à la création d'une entreprise aux Etats-Unis appelée Recommind. Ses programmes analysent et trient les textes en fonction de leur contenu juridique. "Nous automatisons l'étude des dossiers, pour laquelle les avocats passaient jusqu'à présent un temps infini", explique le chercheur. L'entreprise emploie aujourd'hui 300 collaborateurs dans le monde entier et est leader du marché dans son domaine.

Recommind n'est qu'un exemple de la manière dont les nouvelles technologies vont modifier même le travail de groupes professionnels hautement qualifiés. Hofmann est convaincu qu'il y a très peu de groupes professionnels qui ne seront pas touchés par les changements technologiques. "Jusqu'à présent, les machines se chargeaient des tâches répétitives et mécaniques. À l'avenir, elles prendront également des décisions intelligentes", explique le chercheur. Buhmann est lui aussi convaincu : "Les nouvelles technologies intelligentes viendront à l'avenir compléter, voire remplacer les activités de personnes très bien formées". Ainsi, les nouvelles possibilités d'analyse d'images vont certainement modifier massivement le travail des pathologistes. "Nous aurons à l'avenir nettement moins besoin de pathologistes - mais en contrepartie, les médecins pourraient consacrer plus de temps à l'accompagnement psychique des malades", fait remarquer le chercheur. Son collègue Hofmann ajoute : "D'un point de vue technologique, tout est possible. C'est une question de volonté d'organisation de la société, comment nous gérons les changements technologiques".

Sujets similaires

JavaScript a été désactivé sur votre navigateur.