Type | Nombre | Durée |
---|---|---|
Cours | 3 | 02:00 |
TD | 3 | 02:00 |
Type | Coefficient |
---|---|
Examen Final | 1 |
Enseignant | Type |
---|---|
Manescau Brady | Responsable |
Connaître l’application des méthodes de l’analyse de données multidimensionnelle à la fouille des données « Data mining » Pour ce faire, il s’agit de : Connaître : • Les enjeux de l’usage des données pour les entreprises • Les impacts environnementaux de l’intelligence artificielle et du numérique • Les différents types de bases de données et les ressources open data • L’intégration du Big Data dans la stratégie d’entreprise Maîtriser : • La méthodologie CRISP d’analyse de données et sa mise en œuvre • La validation de la qualité de données exploitées • Un outil (Knime) permettant d’explorer, analyser des données • Les modèles et méthodes quantitatives élémentaires pour segmenter des observations ou prédire un phénomène (algorithme K-means, régression linéaire ou logistique, arbres de décision) • La validation et l’interprétation des résultats.
UE | Semestre | Module |
---|---|---|
Introduction aux enseignements scientifiques | 5 | Probabilité - Statistique Remise à Niveau |
Les chapitres faisant l’objet d’une expérimentation en TD sont marqués (‡) • Présentation générale de la science des données • Impacts environnementaux du numérique et de l’intelligence artificielle • Contexte historique : de la recherche académique aux entreprises • Cycle de vie d'un projet de valorisation de données (méthodologie CRISP) • Cadrage d’un projet : les indispensables • Récolte des données internes aux entreprises, et données externes (open-data) • Exploration des données (‡) : comprendre leur qualité et pertinence, sélectionner et filtrer les données, introduction aux outils comme Knime. • Modélisation (‡) : segmentation, détection d’anomalies • Prédiction (‡) : classification, régression, réduire biais et variance d’un modèle, sélection automatique des variables • Validation statistique des modèles (‡) : dilemme biais-variance/complexité, sur-apprentissage, validation croisée, étude des prédictions des modèles • Interprétation des modèles (‡) : modèles simples / modèles complexes • Restitution et mesure du retour sur investissement en entreprise : visualisation des résultats, expliquer le travail réalisé, mesurer l’impact pour l’entreprise
Contrôle sur table (Durée 1h)
Ref. | Verbe | Description | Niveau |
---|---|---|---|
C9 | analyser | Structurer les démarches de progrès continu des processus, équipements ou technologies | 3 |