Log in English French

Module Sheet

FISA

ERE

Énergie Risques et Environnement


Unité d'Enseignement :


Semestre : 10
Crédits ECTS : 4

Analyse de Données pour la Qualité


Code UE : ERE10IQ_ADQ

Elément Constitutif :


Coefficient : 1

Big data - Data mining - Analyse prédictive


Code EC :

Option Ingénierie de la Qualité




Volume horaire : 12:00

Type Nombre Durée
Cours 3 02:00
TD 3 02:00


Evaluations : 1

Type Coefficient
Examen Final 1


Enseignants : 1

Enseignant Type
Manescau Brady Responsable


Connaître l’application des méthodes de l’analyse de données multidimensionnelle à la fouille des données « Data mining » Pour ce faire, il s’agit de : Connaître : • Les enjeux de l’usage des données pour les entreprises • Les impacts environnementaux de l’intelligence artificielle et du numérique • Les différents types de bases de données et les ressources open data • L’intégration du Big Data dans la stratégie d’entreprise Maîtriser : • La méthodologie CRISP d’analyse de données et sa mise en œuvre • La validation de la qualité de données exploitées • Un outil (Knime) permettant d’explorer, analyser des données • Les modèles et méthodes quantitatives élémentaires pour segmenter des observations ou prédire un phénomène (algorithme K-means, régression linéaire ou logistique, arbres de décision) • La validation et l’interprétation des résultats.

Pré-requis :

UE Semestre Module
Introduction aux enseignements scientifiques 5 Probabilité - Statistique Remise à Niveau


Les chapitres faisant l’objet d’une expérimentation en TD sont marqués (‡) • Présentation générale de la science des données • Impacts environnementaux du numérique et de l’intelligence artificielle • Contexte historique : de la recherche académique aux entreprises • Cycle de vie d'un projet de valorisation de données (méthodologie CRISP) • Cadrage d’un projet : les indispensables • Récolte des données internes aux entreprises, et données externes (open-data) • Exploration des données (‡) : comprendre leur qualité et pertinence, sélectionner et filtrer les données, introduction aux outils comme Knime. • Modélisation (‡) : segmentation, détection d’anomalies • Prédiction (‡) : classification, régression, réduire biais et variance d’un modèle, sélection automatique des variables • Validation statistique des modèles (‡) : dilemme biais-variance/complexité, sur-apprentissage, validation croisée, étude des prédictions des modèles • Interprétation des modèles (‡) : modèles simples / modèles complexes • Restitution et mesure du retour sur investissement en entreprise : visualisation des résultats, expliquer le travail réalisé, mesurer l’impact pour l’entreprise




Contrôle sur table (Durée 1h)


Compétences :

Ref. Verbe Description Niveau
C9 analyser Structurer les démarches de progrès continu des processus, équipements ou technologies 3