Positionnement dans le cursus
Semestre 5
Intersemestre
Semestre 6
 
 
 
Semestre 7
 
Intersemestre
Semestre 9
 
 
Intersemestre

Groupe pédagogique - M-SDON

M- SCIENCE DES DONNÉES

Modifier

Crédits ECTS

10.0

Responsable:

  • BATTON-HUBERT Mireille
  • KRÉMÉ Marina
  • Description générale :

    L'évolution des technologies et notamment les transitions du numérique s’accompagne de la création de ‘data’ aussi bien dans l’industrie du futur, la ville du futur que de la société du futur.

    L’origine de la data est de nature variée: que ce soit des données recueillies par des capteurs (dans des lignes de fabrication, des systèmes d’observation ex. météorologiques), de suivi de consommation énergétiques, de traces laissées sur Internet , issues des résultats de simulations ou d’autres simulateurs physiques, économiques, agronomiques, ou obtenues par des recensements ou des enquêtes,  cette data devient l’entrant  indispensable pour la décision, l’évaluation, le diagnostic, la prévision et le pronostic. Elle intègre sa longue mutation de la donnée brute à la donnée traitée voir à devenir de l’information.

    La Data Science (ou Data Analytics) -- littéralement “Science des données”, vise à exploiter ces données.

    Une branche de la Data Science est le Big Data, qui concerne le cas extrême de gros Volumes de données de format varié arrivant à grande Vitesse : c'est un cas délicat à traiter et qui peut être vu comme un défi de nature pluridisciplinaire. C'est l'objet du défi "Big Data".

    D'autre part, l'essor de l'Intelligence Artificielle a modifié les contours des modèles statistiques pour être généralisés et devenir les constituants fondamentaux d'une branche à part entière celle de l’Apprentissage statistique.  L'approche  sémantique et  logique de l’Intelligence Artificielle est traitée de façon complémentaire dans le Défi "IA" notamment.

    La majeure science des données apporte les fondamentaux de cette modélisation statistique mathématique avec notamment l’apprentissage statistique et les outils mathématiques nécessaires.

    Au plan de l'enseignement, la Data Science dans son ensemble s'appuie sur des méthodes statistiques et algorithmiques relevant de domaines bien identifiés : apprentissage statistique, machine learning, data mining. Ce sont ces méthodes que la majeure Data Science se propose de développer.

    La formation assurera aux élèves une vision synthétique des grandes classes de méthodes d'apprentissage prévision supervisée et non supervisée . Elle leur donnera également une pratique de l'analyse de données grâce à de nombreuses études de cas, proposées dans des contextes variés


    Cohérence entre les unités pédagogiques du groupe pédagogique:

    La majeure est constituée de 4 UPs.

    La première UP1.  donne les bases indispensables au traitement de différent type de données et, tout particulièrement explicite la notion de modèle probabiliste notamment utilisé dans l'apprentissage statistique.

    L’adéquation entre typologie de données et typologie de problèmes (réduction, prévision, classification ...) dans le domaine de l'apprentissage statistique est introduite dans les de 3 autres UP. L'apprentissage automatique -de sa formulation en terme  mathématique à son application - est introduite, également.

    La dernière UP4. introduit la notion d'expériences numériques notamment couteuses en temps calcul et complexité.

    Les données temporelles  et les expériences numériques coûteuses  font l’objet de cours spécifique dans le GP.

    UP 1. Fondements probabilistes
    Ce module apporte les bases théoriques du calcul des probabilités et de la statistique.

    UP 2. Apprentissage statistique
    Ce module propose les méthodes et outils mathématiques permettant d'appréhender la notion d'apprentissage avec modèle statistique pour la réduction , la régression  et la classification dite supervisée.

    UP 3. Machine learning
    Cette UP donne un aperçu des méthodes d'optimisation classiques et modernes, associées à l'apprentissage automatique et notamment aux réseaux de neurones

    UP 4. Métamodélisation et optimisation

    Ce module propose des outils mathématiques et numériques permettant d'apprendre des résultats d'expériences numériques ou réelles dans un modèle statistique.

    Parcours et cohérence avec les autres groupes pédagogiques:


    Activités pédagogiques dispensés actuellement dans ce GP, répondent aux Objectifs de Développement Durable (ODD),  définis par l'ONU en 2015 suivant. Liste non exhaustive









    On donne ci-dessous quelques exemples de parcours d'ingénieurs s'appuyant sur une autre majeure et un défi, et utilisant une compétence "Data Scientist".


    Commentaires

    (1) Ce profil correspond à l'exploitation de données massives, en particulier les données internet.

    (2) L'utilisation de méthodes statistiques est largement répandue dans le domaine de la santé, par exemple pour prévoir la réaction future d'un patient à un traitement en fonction des données de premiers prélèvements sanguins, pour détecter des variables influentes sur une réponse d'intérêt, etc.

    (3) On utilise par exemple des outils de Data Science pour prévoir la consommation/production d'électricité à partir de données météorologiques, ce qui utile pour ajuster des moyens de production, mais aussi pour des études de faisabilité/rentabilité de futurs parcs éoliens (ou panneaux solaires). Des questions de faisabilité de posent aussi pour l'utilisation de capteurs en habitat individuel. Enfin les simulations numériques sont utilisées largement dans le secteur nucléaire pour des études de risque.

    (4) Profil recherché dans l'industrie automobile et aéronautique. Par exemple l'exploitation mathématique de simulations numériques est utilisée pour alléger la masse des véhicules, une obsession chez les constructeurs, tout en garantissant un niveau de sécurité suffisant. Ces méthodes sont également employées pour produire des moteurs moins polluants, etc.

    (5) L'industrie microélectronique regorge également de données de production qui sont exploitées pour le contrôle de procédés et l'amélioration de la qualité.

    (6) On exploite par exemple les données de vitesse de conducteurs automobiles recueillies à partir de leur téléphone portable pour fluidifier le trafic routier.

    Autre majeure

    Défi sociétal

    Métier associé

    Informatique

    Big Data /Intelligence Artificielle

    Data scientist spécialité big data / IA (1)

    Ingénierie biomédicale

    Santé et médecine personnalisées

    Ingénieur R&D ingénierie et santé (2)

    Procédés pour l'énergie

    Transition énergétique

    Ingénieur étude énergies alternatives (3)

    Gestion et finance d'entreprise

    Transition énergétique

    Ingénieur projet énergies alternatives (3)

    Environnement industriel et territorial

    Transition énergétique

    Ingénieur d'études environnementales (3)

    Mécanique

    Eco-conception

    Ingénieur méthodes conception (4)

    Matériaux

    Eco-conception

    Ingénieur méthodes conception (4)

    Microélectronique

    Nanotechnologies

    Ingénieur méthodes (5)

    Informatique

    Transport et mobilité intelligents

    Ingénieur gestion des transports (6)

    Mots-clés:

    Analyse de données Apprentissage statistique Machine learning Expériences numériques Optimisation