Approches de type “bandits manchots” pour l’apprentissage et le contrôle de r éseaux bayésiens dynamiques