La plateforme cloud BlueMix d’IBM mettra à disposition de nombreux services REST d’analyses algorithmiques, notamment ceux de Watson liés au traitement de la langue naturelle. En complément, des composants de moteurs de règles probabilistes développés précédemment autour du produit ODM et aGrUM(projet PPR et URBS) seront aussi disponibles.
Le diagnostic automatique probabiliste (ou troubleshooting) est une technique qui utilise des inférences dans des modèles graphiques pour évaluer la connaissance de l’état d’un système afin de proposer la prochaine meilleure question à poser (meilleure en fonction d’une quantification du coût de chaque question). Cette technique peut être utilisée aussi bien dans l’aide au diagnostic médical que dans les outils de recherche de causes à des pannes, des bugs, etc.
Le premier objectif du stage PROBA est d’intégrer les différents outils proposés par BlueMix/Watson/ODM, en particulier la possibilité de dialogue en langage naturel dans un framework de troubleshooting. En particulier, il s’agira de proposer une méthodologie de formalisation d’évidence (observation de vraisemblance) à partir des retours (réponse+taux de confiance dans la réponse) proposés par Watson.
Par ailleurs, une des limites bien connues de ces outils de diagnostic est l’hypothèse de parfaite connaissance du modèle du système diagnostiqué. Bien évidemment, il est difficile de considérer cette hypothèse comme vraisemblable : dans de nombreux cas, on ne connaît pas parfaitement le modèle; par contre, on a une idée de l’ensemble du possible pour ce modèle. Avoir à choisir parmi plusieurs modèles n’est pas nécessaire et il est possible d’envisager un méta-modèle (switching) consistant à considérer une distribution de probabilité sur l’ensemble des modèles possibles. Il s’agira donc dans un second temps de proposer une extension de l’outil de diagnostic prenant en compte un tel méta-modèle. Les modèles seront construits sur la base de Probabilistic Relational Models, étendant les réseaux bayésiens.
Dans un troisième temps, et selon l’avancement du stage, il pourra être envisagé de se poser la question de l’apprentissage ou de la mise à jour des paramètres en fonction d’historiques d’utilisation.
Ce stage de Master 2 ans le cadre d'une collaboration entre le LIP6 - UPMC (ref exacte) et le lab France d'IBM basé à Gentilly, dans l'équipe de développement du moteur du système de règle ODM, ce stage de Master 2 propose de réaliser une étude sur l'utilisation de techniques stochastiques et d'apprentissages dans le développement d'agents de prise de décisions et conversationnels dans le cadre du projet PROBA (PROBabilistic Agent)
Ce stage se déroulera à partir de début 2016 (février souhaité) pendant 6 mois sur le site IBM de Gentilly.
Il sera demandé aux candidats de niveau Master 2 :
* une connaissance approfondie des modèles graphiques probabilistes,
* une expérience significative de développement en Java,
* une grande autonomie
Bibliographie, ressources
Bluemix http://www.ibm.com/cloud-computing/bluemix/
IBM Operational Decision Management documentation:
http://www-03.ibm.com/software/products/en/odm/
Darwiche A. Modeling and Reasoning with Bayesian Networks. Cambridge University
Press, 2009.
D. Koller and N. Friedman. Probabilistic Graphical Models. MIT Press, 2009.
Heckerman, D., Breese, J., and Rommelse, K. Decision-Theoretic Troubleshooting: A Framework for Repair and Experiment, 1996
P. Weber, G. Medina-Oliva, C. Simon, and B. Iung, Overview on Bayesian networks applications for dependability, risk analysis and maintenance areas Engineering Applications of Artificial Intelligence, vol. 25, no. 4, pp. 671–682, 2012.
Y. Huang, D. Antory, and R. P. Jones, Bayesian belief network based fault diagnosis in automotive electronic systems in Proceedings of the 8th International Symposium on Advanced Vehicle Control, pp. 469–474, 2006.