Title: LE DECISIONNEL : LE CERCLE VERTUEUX
1LE DECISIONNEL LE CERCLE VERTUEUX
TRANSFORMER L INFORMATION EN CONNAISSANCES
Le DATA MINING
IDENTIFIER L OPPORTUNITE COMMERCIALE OU AUTRE
AGIR SUR LES INFORMATIONS
MESURER LES RESULTATS DES ACTIONS
2LE DATA MINING LE PRINCIPE GENERAL
3LE DATA MINING POUR QUOI FAIRE
4LE DATA MINING UN PROCESSUS AUTOMATISE
- Passage de la donnée à l information
- Le Data Mining est un processus (le plus
automatisé possible) qui part des données
élémentaires pour arriver à la prise de décision - A chaque étape, on a une plus value
informationnelle
5LES TACHES DU DATA MINING
- La classification
- L estimation
- La prédiction
- Le groupement par similitudes
- Analyse des clusters
- La description
6LES TACHES DU DATA MINING LA CLASSIFICATION
- Définir à priori une partition dun ensemble
clairement identifié - Affecter un nouvel objet à lune des classes de
la partition. - Principe
- Définir précisément les classes
- Apprentissage avec une base dexemples
préclassés. - Mise au point dun modèle pour classer les
données nouvelles.
7LES TACHES DU DATA MINING EXEMPLES DE
CLASSIFICATION
- Affectation de mots clés aux articles qui
arrivent dans une rédaction de journal - Classification de demandeurs de crédit dans des
classes de risque bas, risque moyen, risque haut - L affectation de codes industriels et de
nomenclatures de tâches sur la base d une
description des tâches en texte libre
8LES TACHES DU DATA MINING LESTIMATION
- La classification se réfère à des événements
discrets - Lestimation se réfère à des valeurs continues.
Estimer une valeur continue qui décrit un objet
revient à classer cet objet dans un ensemble
partitionné en un nombre infini de classes. - Exemple
- la durée de vie d un client
- la probabilité de réponse à un mailing
9LES TACHES DU DATA MINING LA PREDICTION
- La prédiction est assimilable au classement ou à
lestimation mais les objets sont classés en
fonction d un comportement futur prédit - On ne peut vérifier la précision de la
classification ou de lestimation quaprès coup - Exemple
- Prédiction des clients qui vont disparaître dans
les six mois. - Prédiction dun volume de vente dun produit dans
les mois qui suivent.
10LES TACHES DU DATA MINING LE GROUPEMENT PAR
SIMILITUDE
- Il sagit de regrouper des objets qui vont
naturellement ensemble pour définir des règles
d association - Exemples
- Dans un supermarché, déterminer les choses
qui se retrouvent dans un même caddie - Dans une base de données de cinéphiles, trouver
les associations entre les films
11LES TACHES DU DATA MINING L ANALYSE DE
CLUSTERS
- Lanalyse de clusters permet de découper à
postériori un population hétérogène en classes
homogènes - La signification des clusters formés par la
méthode est à découvrir par ailleurs. - Exemples
- En fonction de critères d achats d une voiture,
faire une segmentation des acheteurs - En fonction des notes obtenues dans les
différentes matières, faire une segmentation des
étudiants
12LES TACHES DU DATA MINING LA DESCRIPTION
- Il sagit de décrire les données pour essayer de
découvrir et de comprendre le processus qui est à
lorigine de ces données - Il sagit souvent du démarrage dune étude où on
a peu de connaissances sur le phénomène étudié. - Cette description permet denchaîner sur une ou
plusieurs des tâches précédentes.
13METHODES DU DATA MINING STATISTIQUES ET
ANALYSE DES DONNEES
- INFERENCE STATISTIQUE
- Estimations de paramètres
- Théorie des tests
- ANALYSE DES DONNEES
- Analyse en composantes principales
- Analyse des correspondances
- Analyse discriminante
- ...
14METHODES DU DATA MINING PANIER DE LA MENAGERE
- On liste toutes les transactions (ensemble
d objets pris par un individu) - On dresse un tableau de co-occurrence des objets
- On détermine des règles de la forme si
condition alors résultat avec des taux de
confiance et damélioration - p1 p(condition) p2 p(résultat) p3
p(condition et résultat) Confiance p3 /
p1 Amélioration p3 /(p1.p2)
15METHODES DU DATA MINING RAISONNEMENT BASE SUR
LA MEMOIRE (RBM)
- Le principe du RBM est de trouver des voisins
dun nouvel enregistrement dans une base
d enregistrements connus (la mémoire) à des fins
de classement ou de prédiction - Deux opérations la fonction de distance entre
deux enregistrements et la fonction de
combinaison pour donner la réponse à partir des
résultats obtenus sur les voisins. - La fonction de combinaison
- faire voter les k voisins les plus proches
avec le poids 1/k( k impairs) - affecter un poids à chaque voisin inversement
proportionnel à la distance avec le nouvel
enregistrement et faire voter ces voisins avec ce
poids - Utiliser des techniques de régressions
16METHODES DU DATA MINING DETECTION DE CLUSTERS
- Cette méthode sert uniquement à trouver a
posteriori des classes homogènes - La méthode des K-Moyennes
- La méthode des nuées dynamiques de Mr E Diday
- Classification par agglomération (acendante)
17METHODES DU DATA MINING LES ARBRES DE DECISION
- Un outil de prédiction et de classification basée
sur des règles identifiées grâce à une base pré
classée. - Construction d une arborescence qui à chaque
niveau maximise lexpression - diversité(avant division) - (diversité(fils
gauche) diversité(fils droit)) - Chaque feuille de larbre est affectée à une
classe avec un taux derreur.
18METHODES DU DATA MINING LES RESEAUX DE NEURONES
- Méthode pour prédire ou classer sans avoir besoin
de comprendre le pourquoi de la prédiction ou du
classement - Le réseau est construit par apprentissage sur une
base pré prédite ou pré classée - Meilleure approche des problèmes non linéaires
- Un neurone des entrées couplées avec des poids
fonction de combinaison C fonction de
transfert F. s F(Cp1,..pk(e1,.,ek))
19Data Mining L appariement des techniques aux
tâches