Unité pédagogique

Modélisation Statistique avancée

Derniere édition le: 12/01/2024

Modifier

Responsable:

BAY Xavier

Description générale :

Ce module propose des modélisations avancées en statistiques. D’une part, des techniques modernes qui visent à gérer les gros volumes de données (grand nombre d’observation et grande dimension): sont abordées ainsi des techniques utilisées en machine learning, agrégation d’experts et auto encodeurs. D’autre part, les liens entre modèles stochastiques et déterministes sont étudiés avec détail, à travers un cours liant processus stochastiques et équations aux dérivées partielles. Les deux premiers cours sont empruntés au défi Big Data du cycle ICM.

Mots-clés:

Grand volume Analyse de données Machine learning Big Data

Nombre d’heures à l’emploi du temps:

36

Domaine(s) ou champs disciplinaires:

Mathématiques Informatique, Systèmes d'information

Langue d’enseignement:

Français Anglais

Objectifs d’apprentissage:

A la fin de l’unité pédagogique, l’élève sera capable de : Niveau de taxonomie Priorité

Modalités d’évaluation des apprentissages:

Part de l'évaluation individuelle Part de l'évaluation collective
Examen sur table : % Livrable(s) de projet : %
Examen oral individuel : % Exposé collectif : %
Exposé individuel : % Exercice pratique collectif : %
Exercice pratique individuel : % Rapport collectif : %
Rapport individuel : %
Autre(s) : %

Programme et contenus:

Type d’activité pédagogique : Contenu, séquencement et organisation
Méthodes d’agrégation

Techniques d'agrégations classiques (agrégation d'experts): produit d'experts (PoE, GPoE), Bayesian Committee Machine (BCM, rBCM), BLUP, applications aux cas spatial et au Krigeage.

Auto-encodeurs et réduction de dimension

Auto-encodeurs (AE), principe de la réduction de dimension, Apprentissage d'un AE par retro-propagation, lien avec ACP, généralisations.

Processus Stochastiques et EDP

Lien probabilités et EDP, équation de la chaleur et mouvement Brownien, calcul stochastiqueet EDS. Applications à l'apprentissage statistique à partir d'EDP.