Mots clefs : apprentissage supervisé, apprentissage profond, robotique, transfert simulation-réalité, saisie d’objets
Nombre suggéré d’étudiants/étudiantes : groupe de 2 à 4
(Se référer au document descriptif pour les références et détails)
-) Enjeux
L’apprentissage de la saisie d’objet robotique est une tâche encore irrésolue à cause de nombreuses difficultés [1]. D’une part, il s’agit d’un problème d’exploration difficile : il est très délicat de produire des saisies réussies avec un robot tant que l’on ne dispose pas d’un contrôleur efficace, autrement dit, tant que le problème n’est pas résolu. D’autre part, les expériences sur robots réels sont coûteuses, lentes, et sujettes à de nombreux problèmes d’intégration et de maintenance. L’apprentissage en simulation est donc préférable, mais le décalage entre simulation et réalité aboutit à des problèmes de transférabilité des politiques générées en simulations : une trajectoire réussie en environnement virtuel ne fonctionne pas nécessairement sur robot réel.
Les algorithmes de recherche de nouveauté [2] permettent d’aborder le problème d’exploration difficile en générant des trajectoires de saisies avec une grande diversité [3][4]. Ces méthodes génèrent de très larges répertoires de trajectoires de saisies qui fonctionnent en simulation. En revanche, le problème de la sélection des trajectoires pertinentes reste irrésolu : une sélection aléatoire aboutit à de faibles taux de transférabilité sur robot réel : jusqu’à 50 % pour les objets les plus réguliers, 5 % pour les plus lourds ou de forme complexe [4]. La question de la sélection des trajectoires pertinentes est donc essentielle pour exploiter le potentiel des méthodes basées NS pour la saisie d’objet.
Dans ce projet, on propose d’aborder ce problème par l’utilisation de méthodes d’apprentissage supervisé. L’objectif est d’entraîner un modèle de régression sur lequel s’appuyer pour estimer la transférabilité d’une trajectoire. Le modèle doit générer une probabilité de transférer avec succès sur robot réel à partir d’un ensemble restreint de données décrivant une trajectoire.
-) Feuille de route
Les grandes étapes du projet sont les suivantes :
- Annotation des données (trajectoires de saisies)
- Entraînement d'un modèle prédictif de transférabilité
- Amélioration des performances du modèle
-) Encadrement
Stéphane Doncieux : stephane (point) doncieux [arobase] isir (point) upmc (point) fr
Johann Huber : stephane (point) doncieux [arobase] isir (point) upmc (point) fr