Etude des pas de gradient en apprentissage par renforcement profond

Par Olivier Sigaud, 13 janvier, 2024

L'apprentissage par renforcement profond applique les algorithmes de l'apprentissage par renforcement tabulaire à des réseaux de neurones. Pour cela, on applique aux réseaux de neurones des gradients dans l'espoir d'améliorer progressivement le comportement des agents.

Un gradient est un vecteur qui se caractérise par une direction et une norme (le pas du gradient). L'objectif du projet est d'examiner finement l'effet du pas de gradient sur l'amélioration du comportement des agents, avec des outils de visualisation qui seront développés par les étudiant.e.s.

Une fois ce travail réalisé, les étudiant.e.s pourront participer au développement d'autres outils de visualisation.

Pour les étudiant.e.s qui seront choisi.e.s, ce sera l’occasion de se familiariser avec les concepts et outils de l’apprentissage par renforcement, qui jouent un rôle significatif dans les progrès actuels de l’Intelligence Artificielle.

Ce projet faisant appel à de nombreuses notions nouvelles, une formation initiale à l’apprentissage par renforcement et à des aspects méthodologiques sera assurée durant les premières semaines.

Une forte motivation pour le machine learning, des bonnes bases en programmation python et une bonne maîtrise de github sont des prérequis.

Encadrant
Olivier Sigaud
Nombre d'étudiants
2
Attribué
Oui
Obsolète
Non
Etudiants affectés
Paul Tiberiu Iordache, Andy Torres
Tags