Unité pédagogique

From statistics to data mining

Derniere édition le: 26/09/2024

Modifier

Responsable:

Description générale :

Course instructor: Fabrice Muhlenbach

This course counts for 5 credits (/30 total for a semester). It gives the necessary mathematical background to perform data analysis using statistics, linear algebra and convex optimization. Practical sessions make use of the R-free software environment for statistical computing and graphics.

The following topics are covered:

  • Basics in probabilities (chance experiments, random variables, moments, law of large number, …)
  • Statistics (discrete and continuous distributions, estimates, Maximum Likelihood Estimation,...)
  • Basics in linear algebra and in convex optimization
  • Linear/polynomial/logistic Regression (closed-form solution, batch and stochastic gradient descent)
  • Principal Component Analysis
  • Clustering

Study materials:

  • Pattern Recognition, S theodoridis, K. Koutroumbas, 4th edition
  • Introduction to Statistics and Data Analysis, R. Peck, C. Olsen, J. Devore, Brooks/Cole, 4th edition, 2010.
  • Convex Optimization, Stephen Boyd & Lieven Vandenberghe, Cambridge University Press, 2012.
  • On-line Machine Learning courses: https://www.coursera.org/ UJM Semester 2 Expected prior-knowledge - Basic mathematics and statistics

Mots-clés:

probability statistics linear algebra optimisation linear regression PCA clustering

Nombre d’heures à l’emploi du temps:

60

Domaine(s) ou champs disciplinaires:

Informatique, Systèmes d'information

Langue d’enseignement:

Anglais

Objectifs d’apprentissage:

A la fin de l’unité pédagogique, l’élève sera capable de : Niveau de taxonomie Priorité

Modalités d’évaluation des apprentissages:

Part de l'évaluation individuelle Part de l'évaluation collective
Examen sur table : 66 % Livrable(s) de projet : %
Examen oral individuel : % Exposé collectif : %
Exposé individuel : % Exercice pratique collectif : %
Exercice pratique individuel : 34 % Rapport collectif : %
Rapport individuel : %
Autre(s) : %

Programme et contenus:

Type d’activité pédagogique : Contenu, séquencement et organisation
Lectures

(25h)

Supervised work

(10h)

Lab sessions

(15h)