Universit - PowerPoint PPT Presentation

1 / 38
About This Presentation
Title:

Universit

Description:

Title: Diapositive 1 Author: MIDO Last modified by: COMPAQ Created Date: 5/29/2005 9:04:57 AM Document presentation format: Affichage l' cran Company – PowerPoint PPT presentation

Number of Views:74
Avg rating:3.0/5.0
Slides: 39
Provided by: MID83
Category:

less

Transcript and Presenter's Notes

Title: Universit


1
Université Mohammed Ben AbdellahÉcole Supérieure
d TechnologieFès
  • Licence Professionnelle Management International
  • Et NTIC
  • Exposé sous thème

Data Warehouse et Data Mining
Présenté par
Encadré par OUAZZANI
TOUHAMI Raouya Mr. HACHMOUD

LAMRABET Betissam Année
universitaire 2007/2008
2
Plan
Introduction
Partie 1  Data WAREHOUSE
  • I- Quest ce que le DW ?
  • II- Concept du DW
  • III- Mise en œuvre dun DW
  • IV- Les aspects techniques
  • V- Exploitation des entrepôts de données
  • I- Quest ce que le Data Mining?
  • II- Quel sont les techniques principales du Data
    Mining ?
  • III- Domaines d'application du DATA MINING
  • IV- Le Data Mining dans l'architecture du Data
    WAREHOUSE
  • V- Les différents modules du Data Mining

Partie 2  Data MINING
Conclusion
3
Introduction
  • On qualifie d'informatique décisionnelle (en
    anglais  Business intelligence , parfois appelé
    tout simplement  le décisionnel )
    l'exploitation des données de l'entreprise dans
    le but de faciliter la prise de décision par les
    décideurs, c'est-à-dire la compréhension du
    fonctionnement actuel et l'anticipation des
    actions pour un pilotage éclairé de l'entreprise.
  • Les outils décisionnels comme le Data Warehouse
    et le Data Mining sont basés sur l'exploitation
    d'un système d'information décisionnel alimenté
    grâce à l'extraction de données diverses à partir
    des données de production, d'informations
    concernant l'entreprise ou son entourage et de
    données économiques.

4
Partie 1  Data WAREHOUSE
I- Quest ce que le DW ?
  • 1- Définition Data Warehouse
  • Ensemble de données historisées variant dans le
    temps, organisé par sujets, consolidé dans une
    base de données unique, géré dans un
    environnement de stockage particulier, aidant à
    la prise de décision dans lentreprise.

5
2 -Le schéma général d'un DATA WAREHOUSE
6
  • 3- Objectifs
  • intégrer différentes bases de données
    opérationnelles
  • donner l accès aux informations du passé
  • fournir des outils d analyse sur ces données
  • résumer les données
  • réconcilier des données inconsistantes.

7
  • 4- La structure du DATA WAREHOUS

Les données agrégées
Les méta- données
DATA WAREHOUSE
Les données détaillées
  • Les données historisées

8
  • Données détaillées
  • - Données se représentant aux événement les plus
    récent
  • - données issues des systèmes de production qui
    se réalisent à ce niveau de classe.
  • Données agrégées
  • - données issues danalyse et de synthétisation
    au préalable des informations provenant des
    applications décisionnelles
  • - Elles représentent les informations ciblant
    directement les besoins des utilisateurs
  • - Elles sont sous une forme facilement accessible
    par lutilisateur et sémantiquement cohérente
    pour la bonne compréhension des utilisateurs.

9
  • Méta données
  • - elles permettent de connaître le contenu du DW
  • - ainsi de faciliter la recherche de données
  • - elles contiennent les informations sur
    lensemble du DW
  • Données historisées
  • - propres, validées et proprement agrégées.
  • - en harmonie avec la stratégie de lentreprise.
  • - elles ne sont ni écrasées, ni modifiées, ni
    supprimées.

10
  • II- Concept du DATAWARHOUSE

Orientée sujet
Données intégrées
DATA WAREHOUSE
Données non volatiles
11
  • III- Mise en œuvre dun DATA WAREHOUSE
  • Un DATA WAREHOUSE fait partie du domaine
    stratégique de lentreprise, doù limplication
    nécessaire de la direction.

1- Bien connaître le métier des utilisateurs
2- Assurer une conduite de projet adapté
3- Critère de réussite
12
1- Bien connaître le métier des utilisateurs
  • Les utilisateurs doivent sapproprier le projet
    pour que celui-ci puisse répondre pleinement à
    leurs attentes, et pour cela il faut
  • - les informer très tôt, leur présenter le
    projet, la démarche et leur implication dans
    celui-ci.
  • - Les informer de létat davancement.
  • - Leur présenter une version de pré production
    afin quils puissent se faire une idée de la
     solution finale .

13
2- Assurer une conduite de projet adapté
  • La spécification, puis la qualification des
    besoins que lon chiffre pour donner naissance à
    une réalisation faisant lobjet dune recette
    finale.
  • Cette démarche est inapplicable dans le cas des
    DWH, car les utilisateurs sont incapables
    dexprimer lintégralité de leur besoin en une
    seule fois, parce quils nimaginent pas les
    possibilités offerte par ce type doutil.
  • Il faut donc construire son DWH par itérations
    successives

14
3- Critère de réussite
  • Pour que la mise en place et la pérennité dun
    DWH se fasse, il faut
  • - une implication forte des utilisateurs
  • - un soutien convaincu de la direction générale
  • - un domaine dactivité et des objectifs clairs
  • - un effectif compétent
  • - un prototypage par itérations rapprochées
  • - un chef de projet expérimenté.

15
  • IV- Les aspects techniques

1-Les bases de données OLAP (On-Line Analitical
Processing) - Cest un mode de stockage prévu
pour lanalyse statistique des données contenues
dans la base - Il est appliqué à un modèle
virtuel de représentation de donnée appelé cube
ou hypercube OLAP. OLTP (On-Line Transactional
Processing) - Cest un mode de stockage fait
pour les systèmes opérationnels - Ils
supportent très bien une utilisation
transactionnelle de la base de données - À ce
mode de stockage est associé des requêtes type
sont courtes et ne demandant pas beaucoup de
ressource du côté du serveur de la base de
données.

16
2- Modélisation
  • Les tables de dimensions
  • - Elles contiennent les données qui permettent
    de définir un axe dune étude.
  • - Ce type de tables joue le rôle de référentiel
    au DATA WAREHOUSE
  • Les tables de faits
  • - Comme leur nom lindique, Ces tables
    contiennent uniquement les données factuelles du
    DATA WAREHOUSE.
  • Les tables d'agrégats
  • - Ces tables sont spéciales, elles permettent de
    simplifier le travail de restitution des
    logiciels danalyse
  • - Elles contiennent des données à un niveau de
    granularité plus grand que dans les tables de
    faits

17
3.Les types de modéle
Modèle en flocon
Modèle en étoile
18
  • V- Exploitation des entrepôts de données

2) Outils de restitution et danalyse
  • Outils dalimentation
  •  ETL 

19
  • Outils dalimentation  ETL 
  • Les ETL (Extract, Transform, load) sont des
    outils qui ont pour but de transformer les
    données primaires en informations stockées dans
    le DATA WAREHOUSE.
  • Pour cela il est nécessaire de réaliser les
    fonctions suivantes
  • - Recherche et identification des données
  • - Contrôle de qualité (épuration et validation)
  • - Extraction
  • - Transformation
  • - Chargement.

20
Figure Le système d'alimentation
21
  • 2- Outils de restitution et danalyse

Source Business Decision
22
  • Il sagit des outils qui se branchent sur le DATA
    WAREHOUSE.
  • Il existe des logiciels de datamining qui
    permettent de trouver des corrélations entre les
    données, des tableurs et des requêteurs
  • Ces derniers créent la requête en fonction des
    paramètres que vous leur donnez.

23
  • - les grands acteurs du décisionnel

24
I Quest ce que le Data Mining?
Partie 2  le Data Mining
  • 1- Définition Data Mining
  • Le Data Mining, ou feuille de données, est
    l'ensemble des méthodes et techniques destinées à
    l'exploration et l'analyse de bases de données
    informatiques, afin d'en tirer des connaissances
    ,des règles, des associations, des structures
    particulières restituant l'essentiel de
    l'information utile en réduisant la quantité de
    données.

Entrepôt des données
Connaissances (décision)
DATA MINING
Compréhension Prédiction
Découverte de modèles
25
2- Le Data Mining est un processus
  • Formaliser un problème que l'organisation cherche
    à résoudre en terme de données
  • Accéder aux données qu'elles en soient
  • Préparer les données en vue des traitements et
    utilisations futurs
  • Modéliser les données en leur appliquant des
    algorithmes d'analyse
  • Évaluer et valider les connaissances ainsi
    extraites des analyses
  • Déployer les analyses dans l'entreprise pour une
    utilisation effective

26
3- Les outil de Data Mining
Les outils de data mining Technique utilisée
Knowledgeseeker Arbres de décision
Forecast Pro Prévision
Intelligent Miner Prévision
Alice Arbres de décision
Saxon Réseaux neuronaux
SAS System Statistiques, arbres de décision, réseaux neuronaux
Mine Set Arbres de décision, découverte de règles
STATlab Statistiques
SPSS Réseaux neuronaux Arbres de décision
27
4- Les principales qualités d'un outil de Data
Mining
  • doivent offrir des richesses analytiques d'un
    niveau équivalent aux outils statistiques
    traditionnels.
  • doivent offrir une ergonomie, une convivialité,
    une facilité de mise en oeuvre et
    d'interprétation les rendant accessibles à des
    utilisateurs non statisticiens.
  • Les résultats fournis par l'outil doivent être
    clairs et compréhensibles
  • il ne doivent pas contenir trop de termes
    techniques statistiques
  • Ils ne doivent pas être dédiés à un domaine
    particulier et doivent pouvoir résoudre
    différents problèmes provenant de contextes
    différents.

28
II- Quel sont les techniques du Data Mining ?
Découverte des règles

Réseaux neuronaux
les techniques du Data Mining
Arbres de décision
Fractales
Signal Processing
29
  • Signal Processing
  • Cette technique consiste à positionner les
    données et les filtrer à travers une hypothèse
    pour essayer de faire apparaître un lien entre
    ces données.
  • Découverte de règles
  • Cette technique consiste à demander au système
    daller chercher dans les données une validation
    dune règle connue ou de découvrir lui-même une
    règle.
  • Arbres de décision
  • Cette technique consiste à formaliser un arbre
    qui va procéder à une analyse critère par
    critère.

30
  • Fractales
  • Cette technique consiste à Composer des
    segmentations à partir de modèles mathématiques
    basés sur des regroupements irréguliers de
    données.
  • Réseaux neuronaux
  • Cette technique consiste à lutilisation des
    technologies dintelligence artificielle afin de
    découvrir par lapprentissage du moteur des liens
    non procéduraux.

31
III Domaines d'application du DATA MINING
Secteur bancaire
Marketing stratégique
Domaines d'application du DATA MINING
La grande distribution
Gestion de la relation client
Assurance de biens et de personnes

Gestion du risque
Vente par Correspondance (VPC)
Secteur médical
32
IV- Le Data Mining dans l'architecture du Data
WareHouse
Bases de production
Data Marts
Meta données (Dictionnaire)
Utilisateurs SIAD
OLAP
Data Warehouse
OLAP
Utilisateurs EIS
Data Mining
Data Mining
Outils dalimentation
Utilisateurs requêteurs
Bases externes
33
V- Les différents modules du Data Mining
  • Le Data Mining utilise la technique de la
    modélisation pour faire des découvertes ou des
    prévisions.
  • loutil Data Mining est en mesure de proposer
    une technique différente correspondant à des
    algorithmes et une méthode dapproche des données
    adéquates a fin de répondre à des problématiques
    concernant

34
1- Segmentation
  • La segmentation permet de fragmenter la base de
    données en segments ayant des caractéristiques
    similaires et des comportements homogènes.
  • 2- Classification
  • Il se propose de caractériser des groupes de
    populations homogènes en rapprochant des
    paramètres possédés par chacun des membres.
  • Ainsi, la classification permet de développer
    des profils de groupe à partir des critères des
    enregistrements.

35
3-Prévision
  • La prévision permet de mesurer linfluence d'un
    paramètre présent dans une population sur
    lensemble des autres paramètres de cette
    population.
  • 4- Association
  • Lassociation permet danalyser la présence
    simultanée de valeur de paramètres sur un même
    critère ou sur deux paramètres différents.
  • 5-Modèle Séquentiel
  • Le modèle séquentiel induit des découvertes
    liées à laxe temporel. Il permet de trouver des
    modèles de comportement qui présupposent des
    enchaînements systématiques qui suivront sur une
    période de temps.

36
Conclusion
  • Lutilisation des DATAWAREHOUSE est aujourdhui
    très demandé dans le monde de lentreprise,
    demande qui répond au besoin toujours plus
    présent des utilisateurs davoir les bonnes
    informations au bon moment. Ainsi que le Data
    Mining participant dès lors à une meilleur
    compréhension de l'activité des entreprises , et
    à une rationalisation avancée du stockage de
    l'information. Autrement dit, le Data Mining ne
    consiste pas en une succession d'études ad hoc
    mais doit bien permettre à l'organisation de
    capitaliser sur les connaissances acquises. C'est
    sa raison d'être.

37
Webographie
  • www.wikipédia.org
  • www.supinfo.com Introdution au DataWareHouse.htm
    lauteur Nicolas GUILLOT
  • www.ultrafluide.com
  • www.journaldunet.com
  • www.lincoln.fr

38
Merci pour votre attention
Write a Comment
User Comments (0)
About PowerShow.com