Title: Universit
1Université Mohammed Ben AbdellahÉcole Supérieure
d TechnologieFès
- Licence Professionnelle Management International
- Et NTIC
- Exposé sous thème
Data Warehouse et Data Mining
Présenté par
Encadré par OUAZZANI
TOUHAMI Raouya Mr. HACHMOUD
LAMRABET Betissam Année
universitaire 2007/2008
2Plan
Introduction
Partie 1 Data WAREHOUSE
- I- Quest ce que le DW ?
- II- Concept du DW
- III- Mise en œuvre dun DW
- IV- Les aspects techniques
- V- Exploitation des entrepôts de données
- I- Quest ce que le Data Mining?
- II- Quel sont les techniques principales du Data
Mining ? - III- Domaines d'application du DATA MINING
- IV- Le Data Mining dans l'architecture du Data
WAREHOUSE - V- Les différents modules du Data Mining
Partie 2 Data MINING
Conclusion
3Introduction
- On qualifie d'informatique décisionnelle (en
anglais Business intelligence , parfois appelé
tout simplement le décisionnel )
l'exploitation des données de l'entreprise dans
le but de faciliter la prise de décision par les
décideurs, c'est-à-dire la compréhension du
fonctionnement actuel et l'anticipation des
actions pour un pilotage éclairé de l'entreprise.
- Les outils décisionnels comme le Data Warehouse
et le Data Mining sont basés sur l'exploitation
d'un système d'information décisionnel alimenté
grâce à l'extraction de données diverses à partir
des données de production, d'informations
concernant l'entreprise ou son entourage et de
données économiques.
4Partie 1 Data WAREHOUSE
I- Quest ce que le DW ?
- 1- Définition Data Warehouse
- Ensemble de données historisées variant dans le
temps, organisé par sujets, consolidé dans une
base de données unique, géré dans un
environnement de stockage particulier, aidant à
la prise de décision dans lentreprise.
52 -Le schéma général d'un DATA WAREHOUSE
6- intégrer différentes bases de données
opérationnelles - donner l accès aux informations du passé
- fournir des outils d analyse sur ces données
- résumer les données
- réconcilier des données inconsistantes.
7- 4- La structure du DATA WAREHOUS
Les données agrégées
Les méta- données
DATA WAREHOUSE
Les données détaillées
8- Données détaillées
- - Données se représentant aux événement les plus
récent - - données issues des systèmes de production qui
se réalisent à ce niveau de classe. - Données agrégées
- - données issues danalyse et de synthétisation
au préalable des informations provenant des
applications décisionnelles - - Elles représentent les informations ciblant
directement les besoins des utilisateurs - - Elles sont sous une forme facilement accessible
par lutilisateur et sémantiquement cohérente
pour la bonne compréhension des utilisateurs. -
9- Méta données
- - elles permettent de connaître le contenu du DW
- - ainsi de faciliter la recherche de données
- - elles contiennent les informations sur
lensemble du DW - Données historisées
- - propres, validées et proprement agrégées.
- - en harmonie avec la stratégie de lentreprise.
- - elles ne sont ni écrasées, ni modifiées, ni
supprimées.
10- II- Concept du DATAWARHOUSE
-
Orientée sujet
Données intégrées
DATA WAREHOUSE
Données non volatiles
11- III- Mise en œuvre dun DATA WAREHOUSE
- Un DATA WAREHOUSE fait partie du domaine
stratégique de lentreprise, doù limplication
nécessaire de la direction. -
1- Bien connaître le métier des utilisateurs
2- Assurer une conduite de projet adapté
3- Critère de réussite
121- Bien connaître le métier des utilisateurs
- Les utilisateurs doivent sapproprier le projet
pour que celui-ci puisse répondre pleinement à
leurs attentes, et pour cela il faut - - les informer très tôt, leur présenter le
projet, la démarche et leur implication dans
celui-ci. - - Les informer de létat davancement.
- - Leur présenter une version de pré production
afin quils puissent se faire une idée de la
solution finale .
132- Assurer une conduite de projet adapté
- La spécification, puis la qualification des
besoins que lon chiffre pour donner naissance à
une réalisation faisant lobjet dune recette
finale. - Cette démarche est inapplicable dans le cas des
DWH, car les utilisateurs sont incapables
dexprimer lintégralité de leur besoin en une
seule fois, parce quils nimaginent pas les
possibilités offerte par ce type doutil. - Il faut donc construire son DWH par itérations
successives
143- Critère de réussite
- Pour que la mise en place et la pérennité dun
DWH se fasse, il faut - - une implication forte des utilisateurs
- - un soutien convaincu de la direction générale
- - un domaine dactivité et des objectifs clairs
- - un effectif compétent
- - un prototypage par itérations rapprochées
- - un chef de projet expérimenté.
15- IV- Les aspects techniques
1-Les bases de données OLAP (On-Line Analitical
Processing) - Cest un mode de stockage prévu
pour lanalyse statistique des données contenues
dans la base - Il est appliqué à un modèle
virtuel de représentation de donnée appelé cube
ou hypercube OLAP. OLTP (On-Line Transactional
Processing) - Cest un mode de stockage fait
pour les systèmes opérationnels - Ils
supportent très bien une utilisation
transactionnelle de la base de données - À ce
mode de stockage est associé des requêtes type
sont courtes et ne demandant pas beaucoup de
ressource du côté du serveur de la base de
données.
162- Modélisation
- Les tables de dimensions
- - Elles contiennent les données qui permettent
de définir un axe dune étude. - - Ce type de tables joue le rôle de référentiel
au DATA WAREHOUSE - Les tables de faits
- - Comme leur nom lindique, Ces tables
contiennent uniquement les données factuelles du
DATA WAREHOUSE. - Les tables d'agrégats
- - Ces tables sont spéciales, elles permettent de
simplifier le travail de restitution des
logiciels danalyse - - Elles contiennent des données à un niveau de
granularité plus grand que dans les tables de
faits
173.Les types de modéle
Modèle en flocon
Modèle en étoile
18- V- Exploitation des entrepôts de données
-
2) Outils de restitution et danalyse
19- Outils dalimentation ETL
- Les ETL (Extract, Transform, load) sont des
outils qui ont pour but de transformer les
données primaires en informations stockées dans
le DATA WAREHOUSE. - Pour cela il est nécessaire de réaliser les
fonctions suivantes - - Recherche et identification des données
- - Contrôle de qualité (épuration et validation)
- - Extraction
- - Transformation
- - Chargement.
20Figure Le système d'alimentation
21- 2- Outils de restitution et danalyse
Source Business Decision
22- Il sagit des outils qui se branchent sur le DATA
WAREHOUSE. - Il existe des logiciels de datamining qui
permettent de trouver des corrélations entre les
données, des tableurs et des requêteurs - Ces derniers créent la requête en fonction des
paramètres que vous leur donnez.
23- - les grands acteurs du décisionnel
24I Quest ce que le Data Mining?
Partie 2 le Data Mining
- 1- Définition Data Mining
- Le Data Mining, ou feuille de données, est
l'ensemble des méthodes et techniques destinées à
l'exploration et l'analyse de bases de données
informatiques, afin d'en tirer des connaissances
,des règles, des associations, des structures
particulières restituant l'essentiel de
l'information utile en réduisant la quantité de
données.
Entrepôt des données
Connaissances (décision)
DATA MINING
Compréhension Prédiction
Découverte de modèles
252- Le Data Mining est un processus
- Formaliser un problème que l'organisation cherche
à résoudre en terme de données - Accéder aux données qu'elles en soient
- Préparer les données en vue des traitements et
utilisations futurs - Modéliser les données en leur appliquant des
algorithmes d'analyse - Évaluer et valider les connaissances ainsi
extraites des analyses - Déployer les analyses dans l'entreprise pour une
utilisation effective
263- Les outil de Data Mining
Les outils de data mining Technique utilisée
Knowledgeseeker Arbres de décision
Forecast Pro Prévision
Intelligent Miner Prévision
Alice Arbres de décision
Saxon Réseaux neuronaux
SAS System Statistiques, arbres de décision, réseaux neuronaux
Mine Set Arbres de décision, découverte de règles
STATlab Statistiques
SPSS Réseaux neuronaux Arbres de décision
274- Les principales qualités d'un outil de Data
Mining
- doivent offrir des richesses analytiques d'un
niveau équivalent aux outils statistiques
traditionnels. - doivent offrir une ergonomie, une convivialité,
une facilité de mise en oeuvre et
d'interprétation les rendant accessibles à des
utilisateurs non statisticiens. - Les résultats fournis par l'outil doivent être
clairs et compréhensibles - il ne doivent pas contenir trop de termes
techniques statistiques - Ils ne doivent pas être dédiés à un domaine
particulier et doivent pouvoir résoudre
différents problèmes provenant de contextes
différents.
28II- Quel sont les techniques du Data Mining ?
Découverte des règles
Réseaux neuronaux
les techniques du Data Mining
Arbres de décision
Fractales
Signal Processing
29- Signal Processing
- Cette technique consiste à positionner les
données et les filtrer à travers une hypothèse
pour essayer de faire apparaître un lien entre
ces données. - Découverte de règles
- Cette technique consiste à demander au système
daller chercher dans les données une validation
dune règle connue ou de découvrir lui-même une
règle. - Arbres de décision
- Cette technique consiste à formaliser un arbre
qui va procéder à une analyse critère par
critère.
30- Fractales
- Cette technique consiste à Composer des
segmentations à partir de modèles mathématiques
basés sur des regroupements irréguliers de
données. - Réseaux neuronaux
- Cette technique consiste à lutilisation des
technologies dintelligence artificielle afin de
découvrir par lapprentissage du moteur des liens
non procéduraux.
31III Domaines d'application du DATA MINING
Secteur bancaire
Marketing stratégique
Domaines d'application du DATA MINING
La grande distribution
Gestion de la relation client
Assurance de biens et de personnes
Gestion du risque
Vente par Correspondance (VPC)
Secteur médical
32 IV- Le Data Mining dans l'architecture du Data
WareHouse
Bases de production
Data Marts
Meta données (Dictionnaire)
Utilisateurs SIAD
OLAP
Data Warehouse
OLAP
Utilisateurs EIS
Data Mining
Data Mining
Outils dalimentation
Utilisateurs requêteurs
Bases externes
33V- Les différents modules du Data Mining
- Le Data Mining utilise la technique de la
modélisation pour faire des découvertes ou des
prévisions. - loutil Data Mining est en mesure de proposer
une technique différente correspondant à des
algorithmes et une méthode dapproche des données
adéquates a fin de répondre à des problématiques
concernant
34 1- Segmentation
- La segmentation permet de fragmenter la base de
données en segments ayant des caractéristiques
similaires et des comportements homogènes. - 2- Classification
- Il se propose de caractériser des groupes de
populations homogènes en rapprochant des
paramètres possédés par chacun des membres. - Ainsi, la classification permet de développer
des profils de groupe à partir des critères des
enregistrements.
35 3-Prévision
- La prévision permet de mesurer linfluence d'un
paramètre présent dans une population sur
lensemble des autres paramètres de cette
population. - 4- Association
- Lassociation permet danalyser la présence
simultanée de valeur de paramètres sur un même
critère ou sur deux paramètres différents. - 5-Modèle Séquentiel
- Le modèle séquentiel induit des découvertes
liées à laxe temporel. Il permet de trouver des
modèles de comportement qui présupposent des
enchaînements systématiques qui suivront sur une
période de temps.
36Conclusion
- Lutilisation des DATAWAREHOUSE est aujourdhui
très demandé dans le monde de lentreprise,
demande qui répond au besoin toujours plus
présent des utilisateurs davoir les bonnes
informations au bon moment. Ainsi que le Data
Mining participant dès lors à une meilleur
compréhension de l'activité des entreprises , et
à une rationalisation avancée du stockage de
l'information. Autrement dit, le Data Mining ne
consiste pas en une succession d'études ad hoc
mais doit bien permettre à l'organisation de
capitaliser sur les connaissances acquises. C'est
sa raison d'être.
37Webographie
- www.wikipédia.org
- www.supinfo.com Introdution au DataWareHouse.htm
lauteur Nicolas GUILLOT - www.ultrafluide.com
- www.journaldunet.com
- www.lincoln.fr
38Merci pour votre attention