Ce module propose des modélisations avancées en statistiques. D’une part, des techniques modernes qui visent à gérer les gros volumes de données (grand nombre d’observation et grande dimension): sont abordées ainsi des techniques utilisées en machine learning, agrégation d’experts et auto encodeurs. D’autre part, les liens entre modèles stochastiques et déterministes sont étudiés avec détail, à travers un cours liant processus stochastiques et équations aux dérivées partielles. Les deux premiers cours sont empruntés au défi Big Data du cycle ICM.
A la fin de l’unité pédagogique, l’élève sera capable de : | Niveau de taxonomie | Priorité |
---|
Part de l'évaluation individuelle | Part de l'évaluation collective | ||||
---|---|---|---|---|---|
Examen sur table : | % | Livrable(s) de projet : | % | ||
Examen oral individuel : | % | Exposé collectif : | % | ||
Exposé individuel : | % | Exercice pratique collectif : | % | ||
Exercice pratique individuel : | % | Rapport collectif : | % | ||
Rapport individuel : | % | ||||
Autre(s) : % |
Type d’activité pédagogique : | Contenu, séquencement et organisation |
---|---|
Méthodes d’agrégation | Techniques d'agrégations classiques (agrégation d'experts): produit d'experts (PoE, GPoE), Bayesian Committee Machine (BCM, rBCM), BLUP, applications aux cas spatial et au Krigeage. |
Auto-encodeurs et réduction de dimension | Auto-encodeurs (AE), principe de la réduction de dimension, Apprentissage d'un AE par retro-propagation, lien avec ACP, généralisations. |
Processus Stochastiques et EDP | Lien probabilités et EDP, équation de la chaleur et mouvement Brownien, calcul stochastiqueet EDS. Applications à l'apprentissage statistique à partir d'EDP. |