Ma thèse en 180 secondes

4 minute read

Published:

En 2022 j’ai eu la chance de participer au concours Ma thèse en 180 secondes, un concours de vulgarisation de thèses en 3 minutes. Retrouvez ici la vidéo de mon passage en finale régionale et mon script.

Vidéo

Script

1 œuf, 80 grammes de sucre, 160 grammes de farine, 80 grammes de beurre, des pépites de chocolat, de la levure chimique. C’est la recette des cookies telle qu’on la trouve sur Marmiton. Mais si je demande à chacun d’entre vous sa recette préférée, j’aurai probablement des réponses très différentes : des noix de pécan, de la vanille, ou des gros morceaux de chocolat… Alors, quelle est la meilleure recette de cookies ? Et surtout, à partir d’une recette basique, comment peut-on trouver sa meilleure version ?

En intelligence artificielle, améliorer une recette c’est ce que l’on appelle l’apprentissage. Le rôle d’une Intelligence Artificielle, c’est de choisir ce qu’il faut faire dans chaque situation, un peu comme les instructions d’une recette, et en informatique on la représente avec un réseau de neurones artificiel. Un réseau de neurones, c’est juste un programme qui est comme une grosse boite noire, avec beaucoup de paramètres qui déterminent son comportement. On en utilise dans les voitures autonomes, où le réseau de neurones est ce qui détermine si on tourne à droite, ou à gauche selon l’état de la route et les piétons.

Le but de l’apprentissage, c’est de trouver le réseau de neurones qui conduit le mieux la voiture, dans un simulateur pour éviter de rayer la peinture, un peu comme trouver la recette qui donne les meilleurs cookies. Et mon travail, ce n’est pas juste de trouver la meilleure voiture autonome, ni de manger des cookies toute la journée : ce qui m’intéresse, c’est d’améliorer ce processus d’apprentissage, et de comprendre comment on peut apprendre.

Revenons à nos cookies. Une bonne méthode pour améliorer une recette, c’est de faire une fournée en changeant une petit quelque chose dans chaque cookie : un peu plus de sucre, moins de beurre, ajouter de la vanille… et même, pourquoi pas soyons fous, du poireau?

On cuit ces cookies, on les goûte, on garde les meilleurs, et on regarde les points communs des recettes : si les meilleurs sont tous à la vanille, on va garder l’idée pour la prochaine fois, et si ceux aux poireaux étaient mauvais… bah on va oublier ça. Et la semaine suivante, on recommence, avec la nouvelle recette, avec de la vanille dans tous les cookies, mais en changeant à nouveau un petit quelque chose dans chacun. Chaque semaine, la recette va s’améliorer jusqu’à trouver la meilleure recette.

Cette approche, je l’applique aussi aux voitures autonomes, pour ces fameux réseaux de neurones qui décident si l’on tourne à droite ou à gauche. Je pars d’un réseau de base, je teste plusieurs petits changements dans ses paramètres, je regarde ce qui marche le mieux et je recommence, jusqu’à avoir une voiture qui conduit toute seule correctement. Et c’est cette méthode d’optimisation, cette méthode d’apprentissage que j’essaie d’améliorer dans ma thèse.

Par exemple, que se passe-t-il si ce n’est plus moi qui goûte tous les cookies, mais si chacun d’entre vous en goûte un ? Si vous vous aimez la vanille alors que vous préférez sans, comment avoir une idée juste de la recette qui plaira au plus de monde possible, sans avoir à préparer 400 cookies de chaque sorte et faire goûter chacun à tout le monde ?

De la même manière, une voiture autonome ne conduira pas pareil dans le centre-ville de Toulouse et dans la campagne, mais on ne va pas faire le tour du monde pour vérifier qu’elle sait conduire partout.

A la place, j’essaie de déterminer mathématiquement cette incertitude sur les cookies, cette possibilité que certains les aiment et d’autres non, pour faire goûter plusieurs fois ceux qui sont à la limite, et être sûr de ne garder que les meilleurs cookies à chaque itération.

Et c’est comme ça qu’on trouve la meilleure recette.