LE DECISIONNEL : LE CERCLE VERTUEUX - PowerPoint PPT Presentation

1 / 19
About This Presentation
Title:

LE DECISIONNEL : LE CERCLE VERTUEUX

Description:

Affectation de mots cl s aux articles qui arrivent dans une r daction de journal ... L 'affectation de codes industriels et de nomenclatures de t ches sur la base d ' ... – PowerPoint PPT presentation

Number of Views:866
Avg rating:3.0/5.0
Slides: 20
Provided by: hdm
Category:

less

Transcript and Presenter's Notes

Title: LE DECISIONNEL : LE CERCLE VERTUEUX


1
LE DECISIONNEL LE CERCLE VERTUEUX
TRANSFORMER L INFORMATION EN CONNAISSANCES
Le DATA MINING
IDENTIFIER L OPPORTUNITE COMMERCIALE OU AUTRE
AGIR SUR LES INFORMATIONS
MESURER LES RESULTATS DES ACTIONS
2
LE DATA MINING LE PRINCIPE GENERAL
3
LE DATA MINING POUR QUOI FAIRE
4
LE DATA MINING UN PROCESSUS AUTOMATISE
  • Passage de la donnée à l information
  • Le Data Mining est un processus (le plus
    automatisé possible) qui part des données
    élémentaires pour arriver à la prise de décision
  • A chaque étape, on a une plus value
    informationnelle

5
LES TACHES DU DATA MINING
  • La classification
  • L estimation
  • La prédiction
  • Le groupement par similitudes
  • Analyse des clusters
  • La description

6
LES TACHES DU DATA MINING LA CLASSIFICATION
  • Définir à priori une partition dun ensemble
    clairement identifié
  • Affecter un nouvel objet à lune des classes de
    la partition.
  • Principe
  • Définir précisément les classes
  • Apprentissage avec une base dexemples
    préclassés.
  • Mise au point dun modèle pour classer les
    données nouvelles.

7
LES TACHES DU DATA MINING EXEMPLES DE
CLASSIFICATION
  • Affectation de mots clés aux articles qui
    arrivent dans une rédaction de journal
  • Classification de demandeurs de crédit dans des
    classes de risque bas, risque moyen, risque haut
  • L affectation de codes industriels et de
    nomenclatures de tâches sur la base d une
    description des tâches en texte libre

8
LES TACHES DU DATA MINING LESTIMATION
  • La classification se réfère à des événements
    discrets
  • Lestimation se réfère à des valeurs continues.
    Estimer une valeur continue qui décrit un objet
    revient à classer cet objet dans un ensemble
    partitionné en un nombre  infini  de classes.
  • Exemple
  • la durée de vie d un client
  • la probabilité de réponse à un mailing

9
LES TACHES DU DATA MINING LA PREDICTION
  • La prédiction est assimilable au classement ou à
    lestimation mais les objets sont classés en
    fonction d un comportement futur prédit
  • On ne peut vérifier la précision de la
    classification ou de lestimation quaprès coup
  • Exemple
  • Prédiction des clients qui vont disparaître dans
    les six mois.
  • Prédiction dun volume de vente dun produit dans
    les mois qui suivent.

10
LES TACHES DU DATA MINING LE GROUPEMENT PAR
SIMILITUDE
  • Il sagit de regrouper des objets qui vont
    naturellement ensemble pour définir des règles
    d association
  • Exemples
  • Dans un supermarché, déterminer les  choses 
    qui se retrouvent dans un même caddie
  • Dans une base de données de cinéphiles, trouver
    les associations entre les films

11
LES TACHES DU DATA MINING L ANALYSE DE
CLUSTERS
  • Lanalyse de clusters permet de découper à
    postériori un population hétérogène en classes
    homogènes
  • La signification des clusters formés par la
    méthode est à découvrir par ailleurs.
  • Exemples
  • En fonction de critères d achats d une voiture,
    faire une segmentation des acheteurs
  • En fonction des notes obtenues dans les
    différentes matières, faire une segmentation des
    étudiants

12
LES TACHES DU DATA MINING LA DESCRIPTION
  • Il sagit de décrire les données pour essayer de
    découvrir et de comprendre le processus qui est à
    lorigine de ces données
  • Il sagit souvent du démarrage dune étude où on
    a peu de connaissances sur le phénomène étudié.
  • Cette description permet denchaîner sur une ou
    plusieurs des tâches précédentes.

13
METHODES DU DATA MINING STATISTIQUES ET
ANALYSE DES DONNEES
  • INFERENCE STATISTIQUE
  • Estimations de paramètres
  • Théorie des tests
  • ANALYSE DES DONNEES
  • Analyse en composantes principales
  • Analyse des correspondances
  • Analyse discriminante
  • ...

14
METHODES DU DATA MINING PANIER DE LA MENAGERE
  • On liste toutes les transactions (ensemble
    d objets pris par un individu)
  • On dresse un tableau de co-occurrence des objets
  • On détermine des règles de la forme  si
    condition alors résultat  avec des taux de
    confiance et damélioration
  • p1 p(condition) p2 p(résultat) p3
    p(condition et résultat) Confiance p3 /
    p1 Amélioration p3 /(p1.p2)

15
METHODES DU DATA MINING RAISONNEMENT BASE SUR
LA MEMOIRE (RBM)
  • Le principe du RBM est de trouver des voisins
    dun nouvel enregistrement dans une base
    d enregistrements connus (la mémoire) à des fins
    de classement ou de prédiction
  • Deux opérations la fonction de distance entre
    deux enregistrements et la fonction de
    combinaison pour donner la réponse à partir des
    résultats obtenus sur les voisins.
  • La fonction de combinaison
  • faire  voter  les k voisins les plus proches
    avec le poids 1/k( k impairs)
  • affecter un poids à chaque voisin inversement
    proportionnel à la distance avec le nouvel
    enregistrement et faire voter ces voisins avec ce
    poids
  • Utiliser des techniques de régressions

16
METHODES DU DATA MINING DETECTION DE CLUSTERS
  • Cette méthode sert uniquement à trouver a
    posteriori des classes homogènes
  • La méthode des K-Moyennes
  • La méthode des nuées dynamiques de Mr E Diday
  • Classification par agglomération (acendante)

17
METHODES DU DATA MINING LES ARBRES DE DECISION
  • Un outil de prédiction et de classification basée
    sur des règles identifiées grâce à une base pré
    classée.
  • Construction d une arborescence qui à chaque
    niveau maximise lexpression
  • diversité(avant division) - (diversité(fils
    gauche) diversité(fils droit))
  • Chaque feuille de larbre est affectée à une
    classe avec un taux derreur.

18
METHODES DU DATA MINING LES RESEAUX DE NEURONES
  • Méthode pour prédire ou classer sans avoir besoin
    de comprendre le pourquoi de la prédiction ou du
    classement
  • Le réseau est construit par apprentissage sur une
    base pré prédite ou pré classée
  • Meilleure approche des problèmes non linéaires
  • Un neurone des entrées couplées avec des poids
    fonction de combinaison C fonction de
    transfert F. s F(Cp1,..pk(e1,.,ek))

19
Data Mining L appariement des techniques aux
tâches
Write a Comment
User Comments (0)
About PowerShow.com