Christophe Zimmer, responsable de l’unité Imagerie et modélisation à l’Institut Pasteur, revient sur les réseaux de neurones artificiels profonds, des algorithmes dotés d’une capacité d’apprentissage (deep learning), qui sont au cœur du regain d’intérêt pour l’intelligence artificielle.
L’intelligence artificielle jouera un rôle clef pour la médecine personnalisée.
Christophe ZimmerResponsable de l’unité Imagerie et modélisation à l’Institut Pasteur.
Que sont les réseaux neuronaux artificiels ?
Ce sont des algorithmes dans lesquels un grand nombre d’unités de calcul appelés « neurones » sont utilisés pour apprendre des relations complexes entre des données numériques qui peuvent être de nature très différentes, par exemple des images et des mots - ces données se résument toutes à des tableaux de nombres. Ces nombres sont fournis en entrée à une première couche de neurones, et à l’issue d’un calcul assez simple chacun d'entre eux fournit une nouvelle valeur numérique en sortie. Ces valeurs sont transmises aux neurones de la couche suivante, qui chacun transmettent le résultat de leur calcul à une autre couche de neurones, et ainsi de suite, jusqu'à la dernière couche, qui représente le résultat final (souvent appelé "prédiction"). Cette propagation de l’information entre neurones s’apparente au fonctionnement du cerveau, et la composition d’un grand nombre d’opérations simples permet d’aboutir à des transformations très complexes. Le calcul effectué par chaque neurone ne dépend pas seulement des données d’entrée, mais aussi d’un grand nombre de paramètres, encore appelés « poids ». Ces poids ne sont pas fixés, mais déterminés progressivement grâce à l’analyse de données d’entraînement, d’où la notion d’« apprentissage ».
Pouvez-vous nous donner un exemple d’apprentissage profond ?
Un exemple classique est la classification automatique de photos de chiens et de chats. Nous savons faire en un clin d’œil la différence entre une image de chien et une image de chat, car l’évolution nous a dotés d’un système de reconnaissance visuelle (un réseau de milliards de neurones biologiques) très performant. Mais il est pratiquement impossible de programmer manuellement un algorithme capable de distinguer ces deux animaux dans des images numériques à partir de zéro.
Dans l’apprentissage profond, on part d’un ensemble de photos de chiens et de chats déjà inspectées et étiquetées par des humains (par exemple avec des 0 pour les chiens et des 1 pour les chats). Ces images et étiquettes constituent les données d’entraînement. Le réseau de neurone prend chaque image en entrée et produit une valeur entre 0 et 1 en sortie, censée correspondre à la probabilité que l'image montre un chat ou un chien. Au début, les valeurs calculées par le réseau sont aléatoires, comme si l’algorithme était aveugle. Mais comme on connaît déjà la bonne réponse, on peut mesurer précisément les erreurs faites par l’algorithme. Grâce à un algorithme appelé "backpropagation" (propagation inverse), les poids des neurones sont progressivement ajustés de façon à diminuer ces erreurs. A la fin de ce processus, qui nécessite de très nombreuses répétitions du même calcul sur des images différentes, le réseau produit des valeurs proches de 0 pour les chiens et proches de 1 pour les chats.
Bien sûr, l’exercice n’aurait pas grand intérêt s’il se limitait aux données d’entraînement. Mais, si tout se passe bien, le réseau de neurones a acquis au cours de l’apprentissage la faculté de généraliser, c’est-à-dire qu’il est devenu capable de distinguer les chats des chiens dans des images complètement nouvelles, et ce de façon aussi fiable -et souvent plus fiable- qu’un être humain.
Pourquoi cet essor récent de l’apprentissage profond en science et, plus généralement, de l’intelligence artificielle ?
L’intelligence artificielle est un terme générique qui désigne un grand nombre d’approches en dehors de l’apprentissage profond, mais l’apprentissage profond, grâce à ses percées applicatives récentes, est devenu le moteur principal de l’essor de l’IA ces dernières années.
L’« apprentissage profond » est un nom récent pour des algorithmes utilisant des réseaux de neurones artificiels à nombreuses couches (réseaux profonds). Ces algorithmes existent depuis plusieurs décennies, mais à l’époque leur performance était faible ou restreinte à des données relativement simples. Principalement parce que les données d’entraînement et les puissances de calcul étaient limitées. Entretemps, grâce au progrès de la numérisation et de l’Internet, on dispose dans de nombreux domaines de quantités de données très importantes, y compris dans le secteur médical. Or la quantité et la variété des données d’entraînement sont déterminantes pour obtenir des prédictions de bonne qualité par les réseaux de neurones. Et nous avons désormais des puissances de calcul suffisantes, en particulier grâce aux cartes graphiques comme celles utilisées pour les jeux vidéo. Ces cartes graphiques peuvent faire des milliers d’opérations en parallèle et permettent d’entraîner des réseaux de neurones profonds dans des temps acceptables.
C’est donc la combinaison des données massives et de la puissance de calcul qui permet dorénavant aux réseaux de neurones d’atteindre des performances remarquables dans de nombreux domaines applicatifs. Ces succès ont conduit à un engouement général pour ces méthodes et au développement de nouvelles approches algorithmiques encore plus puissantes.
A quoi peut servir l’apprentissage profond ? Pourriez-vous nous donner un exemple d’application en santé ?
L’apprentissage profond peut servir à traiter des données numériques dans une très grande gamme d’applications. Par exemple, il sert déjà à transformer des sons en texte dans le logiciel de reconnaissance vocal de votre téléphone, et a permis une forte amélioration de la traduction automatique. L’apprentissage profond joue également un rôle important dans diverses applications de reconnaissances d’images, comme dans les voitures autonomes. En santé, les applications les plus immédiates sont sans doute en imagerie médicale. Par exemple, une équipe de l’université de Stanford a entraîné un réseau de neurones qui permet à partir de la photo d’un grain de beauté de prédire s’il s’agit d’un naevus malin ou bénin. Le tout avec un taux d’erreur comparable à celui d’un dermatologue certifié. Par ailleurs, un type d’algorithme appelé « réseau génératif contradictoire » (que nous avons également utilisé dans ANNA-PALM) permet de générer de nouvelles données ayant certaines propriétés, comme par exemple des images d’oiseaux réalistes, ou les formules chimiques de nouvelles molécules thérapeutiques.
C’est le début d’une révolution en santé !
Une application comme celle qui analyse des photos de la peau aura sans doute des répercussions importantes dans l’organisation des soins car il ne sera peut-être plus nécessaire de se rendre chez un dermatologue pour faire un premier diagnostic. Le temps précieux des médecins sera davantage consacré à des examens complémentaires et à la prise en charge des patients. Par ailleurs, le diagnostic sera facilité dans les déserts médicaux, avec un coût très bas, puisqu’il suffira de prendre des photos avec un téléphone pour avoir un premier avis médical. L'analyse automatique des images par apprentissage profond aura aussi des conséquences en radiologie, en ophtalmologie, ou pour l'interprétation des IRM.
Vous évoquiez les grandes quantités de données qui existent en science. On pense aux données de séquençage de l’ADN. Que peut-on en faire avec l’intelligence artificielle ?
On peut penser que l’intelligence artificielle jouera un rôle clef pour la médecine personnalisée en exploitant mieux l'information génomique. La médecine reste encore largement une science empirique, qui procède par essai et erreur, et tient insuffisamment compte du patrimoine génétique de l’individu: le médecin établit un diagnostic, prescrit un traitement, observe la réaction du patient, et si le traitement ne marche pas, en change. Or l’évolution des maladies et la réponse des patients aux traitements tiennent au moins en partie à leur génome et pourraient en principe souvent être prédites. Depuis dix ans le coût du séquençage de l’ADN a baissé très vite, bien plus rapidement que le coût des ordinateurs. D’ici une dizaine d’années ou moins, l’ADN de la majorité de la population humaine aura probablement été séquencé et on disposera donc d'une masse d'information génomique colossale. Comprendre l’information génomique et prédire comment elle conditionne l’évolution de maladies et la réponse aux traitements sont des tâches hors de portée d’un être humain, en raison de la complexité des systèmes biologiques et de la masse énorme de données à analyser. Mais des méthodes d'intelligence artificielle comme l’apprentissage profond pourraient apporter une réponse à ce défi et aider le médecin à décider de la meilleure prise en charge du patient.
L’intelligence artificielle accélère la microscopie à haute résolution