Groupe pédagogique - M-SDON
L'évolution des technologies et notamment les transitions du numérique s’accompagne de la création de ‘data’ aussi bien dans l’industrie du futur, la ville du futur que de la société du futur.
L’origine de la data est de nature variée: que ce soit des données recueillies par des capteurs (dans des lignes de fabrication, des systèmes d’observation ex. météorologiques), de suivi de consommation énergétiques, de traces laissées sur Internet , issues des résultats de simulations ou d’autres simulateurs physiques, économiques, agronomiques, ou obtenues par des recensements ou des enquêtes, cette data devient l’entrant indispensable pour la décision, l’évaluation, le diagnostic, la prévision et le pronostic. Elle intègre sa longue mutation de la donnée brute à la donnée traitée voir à devenir de l’information.
La Data Science (ou Data Analytics) -- littéralement “Science des données”, vise à exploiter ces données.
Une branche de la Data Science est le Big Data, qui concerne le cas extrême de gros Volumes de données de format varié arrivant à grande Vitesse : c'est un cas délicat à traiter et qui peut être vu comme un défi de nature pluridisciplinaire. C'est l'objet du défi "Big Data".
D'autre part, l'essor de l'Intelligence Artificielle a modifié les contours des modèles statistiques pour être généralisés et devenir les constituants fondamentaux d'une branche à part entière celle de l’Apprentissage statistique. L'approche sémantique et logique de l’Intelligence Artificielle est traitée de façon complémentaire dans le Défi "IA" notamment.
La majeure science des données apporte les fondamentaux de cette modélisation statistique mathématique avec notamment l’apprentissage statistique et les outils mathématiques nécessaires.
Au plan de l'enseignement, la Data Science dans son ensemble s'appuie sur des méthodes statistiques et algorithmiques relevant de domaines bien identifiés : apprentissage statistique, machine learning, data mining. Ce sont ces méthodes que la majeure Data Science se propose de développer.
La formation assurera aux élèves une vision synthétique des grandes classes de méthodes d'apprentissage prévision supervisée et non supervisée . Elle leur donnera également une pratique de l'analyse de données grâce à de nombreuses études de cas, proposées dans des contextes variés
La majeure est constituée de 4 UPs.
La première UP1. donne les bases indispensables au traitement de différent type de données et, tout particulièrement explicite la notion de modèle probabiliste notamment utilisé dans l'apprentissage statistique.
L’adéquation entre typologie de données et typologie de problèmes (réduction, prévision, classification ...) dans le domaine de l'apprentissage statistique est introduite dans les de 3 autres UP. L'apprentissage automatique -de sa formulation en terme mathématique à son application - est introduite, également.
La dernière UP4. introduit la notion d'expériences numériques notamment couteuses en temps calcul et complexité.
Les données temporelles et les expériences numériques coûteuses font l’objet de cours spécifique dans le GP.
UP 1. Fondements probabilistes
Ce module apporte les bases théoriques du calcul des probabilités et de la statistique.
UP 2. Apprentissage statistique
Ce module propose les méthodes et outils mathématiques permettant d'appréhender la notion d'apprentissage avec modèle statistique pour la réduction , la régression et la classification dite supervisée.
UP 3. Machine learning
Cette UP donne un aperçu des méthodes d'optimisation classiques et modernes, associées à l'apprentissage automatique et notamment aux réseaux de neurones
UP 4. Métamodélisation et optimisation
Ce module propose des outils mathématiques et numériques permettant d'apprendre des résultats d'expériences numériques ou réelles dans un modèle statistique.
Activités pédagogiques dispensés actuellement dans ce GP, répondent aux Objectifs de Développement Durable (ODD), définis par l'ONU en 2015 suivant. Liste non exhaustive
On donne ci-dessous quelques exemples de parcours d'ingénieurs s'appuyant sur une autre majeure et un défi, et utilisant une compétence "Data Scientist".
Commentaires
(1) Ce profil correspond à l'exploitation de données massives, en particulier les données internet.
(2) L'utilisation de méthodes statistiques est largement répandue dans le domaine de la santé, par exemple pour prévoir la réaction future d'un patient à un traitement en fonction des données de premiers prélèvements sanguins, pour détecter des variables influentes sur une réponse d'intérêt, etc.
(3) On utilise par exemple des outils de Data Science pour prévoir la consommation/production d'électricité à partir de données météorologiques, ce qui utile pour ajuster des moyens de production, mais aussi pour des études de faisabilité/rentabilité de futurs parcs éoliens (ou panneaux solaires). Des questions de faisabilité de posent aussi pour l'utilisation de capteurs en habitat individuel. Enfin les simulations numériques sont utilisées largement dans le secteur nucléaire pour des études de risque.
(4) Profil recherché dans l'industrie automobile et aéronautique. Par exemple l'exploitation mathématique de simulations numériques est utilisée pour alléger la masse des véhicules, une obsession chez les constructeurs, tout en garantissant un niveau de sécurité suffisant. Ces méthodes sont également employées pour produire des moteurs moins polluants, etc.
(5) L'industrie microélectronique regorge également de données de production qui sont exploitées pour le contrôle de procédés et l'amélioration de la qualité.
(6) On exploite par exemple les données de vitesse de conducteurs automobiles recueillies à partir de leur téléphone portable pour fluidifier le trafic routier.
Autre majeure | Défi sociétal | Métier associé |
Informatique | Big Data /Intelligence Artificielle | Data scientist spécialité big data / IA (1) |
Ingénierie biomédicale | Santé et médecine personnalisées | Ingénieur R&D ingénierie et santé (2) |
Procédés pour l'énergie | Transition énergétique | Ingénieur étude énergies alternatives (3) |
Gestion et finance d'entreprise | Transition énergétique | Ingénieur projet énergies alternatives (3) |
Environnement industriel et territorial | Transition énergétique | Ingénieur d'études environnementales (3) |
Mécanique | Eco-conception | Ingénieur méthodes conception (4) |
Matériaux | Eco-conception | Ingénieur méthodes conception (4) |
Microélectronique | Nanotechnologies | Ingénieur méthodes (5) |
Informatique | Transport et mobilité intelligents | Ingénieur gestion des transports (6) |