Entre leur production et leur utilisation, le maintien de l’activité biologique des bioproduits est un enjeu majeur pour de nombreux domaines : producteurs de ferments, industries pharmaceutiques, banques biologiques, … Actuellement, les procédés de stabilisation employés, la congélation ou la déshydratation, sont souvent empiriques et très perfectibles. L’une des approches pour mieux appréhender et maîtriser la stabilisation consiste à étudier les réponses de la cellule aux niveaux physiologique, biochimique et génétique durant le processus de stabilisation afin de mieux comprendre et évaluer le couple activité biologique/procédé. De plus, l’évaluation environnementale du processus permet de compléter les critères de performance. Cette approche de caractérisation fine multi-niveaux (population, cellulaire et moléculaire) et multi-domaines (physiologie, biochimie et génétique) s’appuie sur des outils de modélisation permettant de rendre compte de tous ces aspects et de tous ces points de vue. En particulier, le formalisme des ontologies permet de formaliser et de structurer le vocabulaire d’un ou plusieurs domaines de connaissances en définissant une organisation hiérarchique et structurée de concepts et de propriétés existant entre ces concepts, et en spécifiant des règles et des axiomes exprimant des contraintes de cohérence et des moyens d’inférence. Cependant, si la construction et l’utilisation d’ontologies commencent à être bien maîtrisées, la modélisation de procédés et de processus de transformation demande que l’on puisse raisonner en prenant en compte l’incertitude caractérisant les concepts représentés dans les ontologies.
L’objectif de ce stage est de combiner l’ontologie PO² (Process and Observation Ontology), qui propose une modélisation des processus de transformation, avec des modèles relationnels probabilistes, afin de raisonner malgré l’incertitude du domaine étudié. Les modèles relationnels probabilistes étendent les réseaux bayésiens au domaine relationnel. Ils permettent de raisonner dans un contexte d'incertitude sur des domaines complexes et structurés. L’apprentissage des modèles relationnels probabilistes est un problème complexe. Le but de ce stage est de proposer une nouvelle méthode d’apprentissage des modèles relationnels probabilistes en s’appuyant sur une ontologie bien définie. Pour ce faire, l’étudiant pourra s’appuyer sur des algorithmes connus pour l’apprentissage de réseaux bayésiens. La combinaison de l’ontologie avec les modèles relationnels probabilistes permettra, par exemple, de prédire le résultat de certaines opérations, trouver la meilleur séquence d’opérations respectant un certain nombre de contraintes, découvrir de nouvelles corrélations entre les données et notamment entre les échelles, …
Les étapes du travail à faire pendant ce stage sont les suivantes:
1. Etudier des méthodes d’apprentissage pour les modèles relationnels probabilistes à partir d’une structure donnée ;
2. Proposer une nouvelle méthode d’apprentissage pour les modèles relationnels probabilistes à partir d’une structure donnée dont la fiabilité/qualité pourra être remise en cause ;
3. A l’aide de méthodes d’apprentissages existantes, apprendre les paramètres du modèle relationnel probabiliste précédemment construit à partir des données disponibles sur la stabilisation des levures, et, ainsi pouvoir l’évaluer et éventuellement améliorer l’ontologie.
Bibliographie
1. Cristina E. Manfredotti, Cédric Baudrit, Juliette Dibie-Barthélemy, Pierre-Henri Wuillemin: Mapping Ontology with Probabilistic Relational Models. KEOD 2015: 171-178.
2. L. Ibanescu, J. Dibie, S. Dervaux, E. Guichard, J. Raad (2016). PO2 - A Process and Observation Ontology in Food Science. Application to Dairy Gels. Proceedings of 10th International Conference on Metadata and Semantics Research Conference, MTSR 2016, To appear, Göttingen, Germany, November 2016.
3. Nir Friedman, Lise Getoor, Daphne Koller, Avi Pfeffer: Learning Probabilistic Relational Models. IJCAI 1999: 1300-1309
Durée du stage 6 mois, stage rémunéré (environ 500euros)