Analyse des donn - PowerPoint PPT Presentation

1 / 31
About This Presentation
Title:

Analyse des donn

Description:

R gression logistique et Analyse discriminante 7. Mesure et M thodes avanc es 8. R gression Master Marketing de Paris-Dauphine * 3. – PowerPoint PPT presentation

Number of Views:117
Avg rating:3.0/5.0
Slides: 32
Provided by: POSTADMIN
Category:

less

Transcript and Presenter's Notes

Title: Analyse des donn


1
Analyse des donnéesappliquée au marketing3.
Expérimentation
  • Pierre DESMET

2
Sommaire général
  • 1. Introduction
  • 2. Tests
  • 3. Expérimentation et Analyse de Variance
  • 4. Analyses factorielles et des similarités
  • 5. Typologies et Segmentation
  • 6. Régression logistique et Analyse discriminante
  • 7. Mesure et Méthodes avancées
  • 8. Régression

3
3. Expérimentation et Analyse de variance
  • Expérimentation
  • faire varier de manière contrôlée une variable
    pour mesurer son effet sur une autre
  • Mesurer une relation causale
  • Plan dexpérience
  • Analyse des résultats
  • Une variable à expliquer (métrique)
  • 1 facteur contrôlé nominal ANOVA
  • Plusieurs facteurs ANOVA
  • 1 facteur covariable ANCOVA
  • Plusieurs variables à expliquer (métriques)
  • MANOVA MANCOVA

4
Causalité et Expérimentation
  • On cherche à mettre en évidence une relation de
    cause à effet entre X et Y
  • Conditions à respecter pour établir la relation
    causale
  • Variation concomitante (dx, dy)
  • Séquence temporelle / Présence manipulée
  • Élimination des autres causes possibles
  • Indépendance (Orthogonalité) des variables
    dépendantes entre elles
  • Quasi-expérimentation si pas daffectation
    aléatoire des individus
  • Exemple mesure Avant-après sur un seul groupe
  • Variables
  • VI (indépendantes, X) VD (dépendante, Y)
  • VI manipulée (pack) ou
  • VI invoquée (groupage des individus sur les
    modalités)

5
Procédure
  • Définition de la question marketing
  • Quel est leffet de la mention sur le pack sur
    les ventes du produit ?
  • Construction de la base théorique
  • Les variables situationnelles
  • Evaluatives
  • Attention, perception, préférence, choix
  • Attitude (envers lannonce, la marque,..)
  • Valeur perçue, satisfaction, fidélité
  • Intermédiaires
  • risque perçu,
  • Les variables modératrices
  • Individuelles genre, revenu, csp,
  • Psychologiques stables aversion pour le
    risque,
  • Interactives relation à la marque, implication
    produit,

6
Le modèle
Relation de causalité
Relation avec médiatrice
Relation avec modératrice
Y
X
Y
Z
X
X
Y

Z
Naturalité perçue
Préférence Pour le pack
Préférence Pour le pack
Mention sur Le pack
Mention sur Le pack
Sensibilité aux colorants
Sensibilité aux colorants
  • Rédiger clairement les hypothèses pour pouvoir
    les rejeter
  • H1 La mention  sans colorant  accroît la
    préférence pour le pack
  • H1a M(sans) gt M(avec) - H1b M(sans)lt M(avec)
  • H2 Plus la sensibilité à la présence de
    colorants est forte, plus leffet de la mention
    sur la préférence est élevé.
  • H2a M(sans,s) - M(avec,s) gt M(sans,s-) -
    M(avec,s-)

7
Construire un modèle utile
  • De la gauche vers la droite
  • le chemin de linfluence de X sur Y
  • Puis de la droite vers la gauche
  • les autres variables importantes qui peuvent
    influencer Y et quil faut mesurer ou contrôler
  • Identifier
  • Les hypothèses  validées  (par les
    connaissances, lexpérience, le quali..)
  • Les hypothèses  à valider 
  • Exemple
  • Maggi souhaite lancer un sachet de soupe
    déshydratée en 5 assiettes au lieu de 4
  • Proposez un modèle

8
Plan Inter ou Intra-sujets
  • Démarche
  • Un échantillon représentatif accent sur les
    relations et leffet
  • Préférence pour le pack A versus B
  • Des groupes différents accent sur les
    modérateurs
  • Clients de la marque / versus concurrence
  • Comment éliminer les spécificités personnelles ?
  • Neutraliser affectation aléatoire à un groupe
  • Un groupe névalue quune option
  • les groupes  identiques 
  • Contrôler par des mesures répétées
  • Un seul groupe qui évalue les options
  • Mais effet de la méthodologie (ordre de la
    présentation,..)

9
Validité des résultats
  • Interne Force de la conclusion
  • Facteurs non pris en compte dans lanalyse
  • Le temps
  • La répétition
  • Lenvironnement
  • Les mesures
  • Linteraction des répondants avec la méthodologie
  • La modification de léchantillon (mortalité)
  • Laffectation des répondants
  • Externe Généralité de la conclusion
  • Représentativité des répondants
  • Représentativité-réalisme des stimulis
  • Contexte expérimental

10
Les causes possibles des variations
  • Il faut isoler ces effets

Traitement (E) Effet de la manipulation
Histoire (H) évolution de lenvironnement
Contamination (I) Modification des réponses en fonction de la connaissance de lobjet de lexpérimentation (effet de demande)
Maturation (M) évolution des sujets (t, tn)
Test (T) Changement des réponses, ou biais, provoqué par la mesure
Sélection (S) Variation dans la composition de léchantillon Auto-sélection échantillonnage non réponse
Instrumentation Changement dans linstrument de mesure (enquêteur,)
Régression statistique Présence de valeurs extrêmes sélection successive en fonction de réponses précédentes
Mortalité Réduction de léchantillon par le refus de participation collecte contraignante
11
Plans expérimentaux
  • Grandes classes
  • Quasi-expérimental Avant-Après
  • Expérimental
  • Double affectation aléatoire des individus aux
    cellules des traitements aux cellules
  • Observation Mesure
  • Traitement
  • Quelles comparaisons
  • Entre les groupes dindividus
  • Entre les réponses dun même groupe

A
Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle
Groupe 1 A X O1
Groupe 2 A O2
O
X
Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle
Groupe 1 A O1 X O2
Groupe 2 A O3 O4
Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes
Groupe 1 A O1 X O2
Groupe 2 A O3 O4
Groupe 3 A X O5
Groupe 4 A O6
12
Mesure des effets
X O1 ?
O1 X O2 O2-O1 E H I M (T) (S)
X O1
O2 O2-O1 E (T) (S)
O1 X O2 O2-O1 E H I M (T) (S)
O3 O4 O4-O3 H M (T) (S)
(O2-O1)-(O4-O3) E I
O1 X O2 D1 O2-O1 E H I M (T) (S)
O3 O4 D2 O4-O3 H M (T) (S)
X O5 D3 O5-(O2O4)/2 E H (T) (S)
O6 D4 O6-(O2O4)/2 H (S)
O6 D5 O6-O5 E (T) (S)
D4-D3 E
D3-D5 H
D1-D3-(D2-D4) I
D2-D4 M
D4D5-D3 (T) (S)
  • Source Lambin JJ La recherce Marketing, McGraw
    Hill

13
Plans statistiques
  • Mise en évidence de leffet de plusieurs facteurs
  • Effet du prix sur
  • Des magasins de tailles différentes
  • Situés dans des régions différentes
  • Plans
  • Complet toutes les possibilités
  • Permet de tester les effets dinteraction
  • Fractionné combinaison choisie des modalités
  • Moins de cellules donc gourmand en effectifs

14
Plans statistiques complets
  • Plan factoriel
  • 2 variables (X, Y), même nombre de modalités (2)
  • 3 modalités -gt 3² groupes 9 groupes
  • 3 var, 3 modalités -gt27 groupes
  • Plan factoriel en blocs aléatoires
  • Groupage des individus selon une variable à
    contrôler

Plan factoriel 2 variables Plan factoriel 2 variables Plan factoriel 2 variables
X y
Groupe 1 1 1
Groupe 2 1 2
Groupe 3 2 1
Groupe 4 2 2
15
Plans statistiques fractionnés
  • Carré latin
  • 3 variables (X, Y, Z), même nombre de modalités
    (3)
  • le groupe 3 reçoit 3, 1, 2
  • Autres tailles
  • Gréco-latin 4 variables
  • Hyper-gréco-latin 5 variables

3
Carré latin 3 variables Carré latin 3 variables Carré latin 3 variables Carré latin 3 variables
X1 X2 X3
Y1 Z1 Z3 Z2
Y2 Z3 Z2 Z1
Y3 Z2 Z1 Z3
16
Analyse de variance Postulats
  • Modèle linéaire deffets indépendants
  • Une moyenne générale (m)
  • Des effets spécifiques par facteur (ai) pour la
    modalité i du facteur I
  • Des effets dinteraction (aibi) )
  • Une variable aléatoire (e) qui dépend des
    facteurs (i,j) mais aussi de lobservation (k)
  • Mesures dans les cellules (combinaison de
    traitements)
  • Normalité
  • Égalité des variances, surtout si les effectifs
    sont différents
  • Homogénéité des covariances (échantillons
    appariés)
  • Terminologie
  • Variations totales, Factorielles, Résiduelles
  • Variations ou Somme de carrés (ex VF S ni
    (mx1 mx.)2 )

17
Analyse de variance
  • Hypothèse
  • Les effets sont linéaires X Moyenne effet
    du facteur erreur
  • Hypothèse
  • H1a ?1 ?2 ?3 pas de différence de moyenne
    entre niveaux
  • H1b au moins une moyenne est différente des
    autres
  • Les facteurs contrôlés sont différents ENTRE les
    groupes mais identiques à l'intérieur de chaque
    groupe (VF variations factorielles)
  • Les facteurs incontrôlés ont la même influence
    quel que soit le groupe (VR variations
    résiduelles)
  • Le théorème de la décomposition de la variance
    (intra et inter)
  • VTVFVR

18
Qualité globale Test F de Fisher
  • Test de la qualité globale du modèle
  • I nombre de niveaux du facteur, N nombre
    dobservations
  • (I-1 N-1) degrés de liberté
  • Interprétation
  • H0 aucune effet de X sur Y (moyenne identique)
  • Si F calc gt F critique rejet de H0

19
Rapport de corrélation - êta carré (h2)
  • Si le F diagnostique lexistence dune relation,
    eta carré détermine la force de cette relation
  • Mesure dassociation entre une variable
    quantitative et une variable non quantitative
    (nominale ou ordinale)
  • Ex pouvoir explicatif du genre sur le montant
    des dépenses
  • Eta2 Variations expliquées / Variations totales
  • Eta2 e 0, 1
  • Sinterprète comme
  • le des variations de la variable quantitative
  • expliquées par la variable nominale/ordinale

20
Exemple de lecture
  • Effet du prix sur les ventes des magasins (q)
  • 3 niveaux de prix
  • 4 types de magasin, 30 observations par magasin
  • Relation globalement
  • significative (F)
  • Mais Faible (Eta2 ou R2)
  • Effet du prix
  • Significatif (t)
  • Dans quel sens ? (demander solution)

21
Analyse de variance multivariée Les interactions
  • Les effets de variables peuvent se combiner pour
  • Samplifier ou Se neutraliser

Sans interactinn
Variable dépendante
Variable indépendante
Interactinn dis-ordinale Avec croisement
Interactinn dis-ordinale Sans croisement
Interactinn ordinale
22
2 facteurs avec interaction
  • Effet du magasin
  • Significatif
  • Effet de linteraction
  • Significative
  • Amélioration de la qualité globale
  • Attention !
  • Les effets dinteraction sont toujours à analyser
    dabord
  • Car ils changent linterprétation des effets
    directs

23
Problème des comparaisons multiples
  • Quand il y a plusieurs groupes, les tests en t (2
    groupes) ne sont pas adaptés
  • Car pour chaque test dhypothèse, on additionne
    les risques derreur alpha
  • pour k groupes k.(k-1)/2 comparaisons
  • Pour 3 groupes avec un risque alpha5, la
    probabilité quaucune comparaison ne soit
    significative est (0.950.950.95)0.857 soit un
    risque alpha réel de 14.3
  • Objectif des corrections
  • Comparer les moyennes des groupes en contrôlant
    pour linflation des risques a (type I) pour
    toutes les comparaisons
  • Garder un risque a de 5 pour toutes les
    comparaisons gt le risque a pour chaque
    comparaison sera dautant plus petit que le
    nombre de comparaisons est important

24
Bonferroni, Scheffé, Dunnett
  • Comparaison a priori ou a posteriori des groupes
  • Corrections pour des comparaisons multiples
  • Dunn-Bonferroni (la correction plus simple a
    priori)
  • a corrigé ? / nombre de tests. 5-gt 1 si 5
    comparaisons
  • Autres tests ( a posteriori)
  • Dunnett les groupes sont comparés à un groupe
    de contrôle
  • Contrastes non orthogonaux - Usage fréquent
  • Tukey HSD
  • Compare toutes les paires possibles
  • adapté sil y a de nombreux groupes à comparer
  • Scheffé très conservateur mais accepte des
    groupes inégaux.
  • Correction pour toutes les comparaisons possibles
    (paires ou composées) en augmentant la différence
    critique.
  • Une différence à elle seule doit être assez
    grande pour rendre le F global significatif.

25
Test des différences
  • Bonferroni (test en t) Scheffé (test en F)

26
Contrastes
  • un test a priori de différences de moyennes
    (hypothèse préalable)
  • Un Contraste est une somme pondérée des moyennes
    dont la valeur attendue sous H0 est nulle
  • C a1.m1 a2.m2 a3.m3
  • Comparaison sur une combinaison linéaire de
    plusieurs groupes
  • Test dune combinaison linéaire des (nb
    groupes-1) contrastes
  • Si a 1 0 1 alors on a C m1 - m3
  • Si a 1 1/2 1/2 alors on a C m1 - 0.5 m2
    -0.5 m3
  • Contrastes particuliers
  • Helmert (groupes ordonné)
  • -1 1 0 0 -1 -1 2 0 -1 -1 -1 3
  • Contraste polynomial
  • Prise en compte successive dun trend linéaire,
    quadratique, cubique

27
Contrastes orthogonaux
  • Des Contrastes orthogonaux sont indépendants les
    uns des autres
  • Pour que 2 contrastes soient orthogonaux, il faut
    que la
  • Somme des produits des coefficients de chaque
    variable soit NULLE
  • Somme des coefficients dun contraste soit NULLE
  • Exemple
  • C1 -1 0 1 et C2 -1 2 -1
  • C1 1 -1 0 0 et C2 0 0 1 -1
  • Générer des contraste orthogonaux
  • http//www.bolderstats.com/orthogCodes/
  • Tous les contrastes doivent être orthogonaux 2 à
    2
  • Chaque contraste
  • a sa somme des carrés
  • a 1 degré de liberté au numérateur et ddl erreur
    au dénominateur.

28
Choix des sommes des carrés de Type I à III
  • Type
  • I Hiérarchique
  • lordre détermine la prise en compte des
    variables.
  • F de leffet SC de leffet / SC des effets
    précédents
  • II Non expérimental
  • F de leffet SC de leffet / SC des effets de
    son niveau et des niveaux inférieurs
  • III Régression
  • F de leffet SC de leffet / SC de tous les
    autres effets
  • Préconisations
  • Type I si les variables ont un ordre dimportance
    ET les groupes de taille identique
  • Type II déconseillé
  • Type III à privilégier (même si effectifs
    inégaux) option par défaut
  • Approfondir http//www.lsp.ups-tlse.fr/Doc_pedag
    ogique/PDF/ab-deseq.pdf

29
Moyennes et Moyennes estimées
  • Moyenne (MEAN) correspond à la moyenne
    arithmétique
  • Cest la moyenne générale
  • Moyenne estimée (LSMEANS) correspond à la moyenne
    estimée par le modèle utilisé
  • Cest la moyenne des moyennes des niveaux dun
    facteur
  • Elle est ajustée en fonction de la moyenne des
    variables indépendantes
  • Elles sont différentes
  • Sil y a des valeurs manquantes ou des effectifs
    différents
  • Sil y a des variables explicatives (covariates)

30
ANCOVA et MANOVA
  • ANCOVA
  • Permet de tenir compte dun facteur/variable que
    l on peut mesurer mais non contrôler
  • Leffet de la variable non contrôlé est éliminé
    dabord avant de prendre en compte les facteurs
  • MANOVA
  • Prendre en compte plusieurs variables à expliquer
    (Y1, Y2, Y3)
  • Voir sil y a un effet global de la variable
    explicative
  • Puis chercher sur quelle variable plus
    particulièrement il y a un effet par des ANOVA

31
Modèles mixtes
  • Les modèles mixtes prennent en compte la
    différence des répondants lors danalyses de
    mesures répétées
  • Modèle de base Y a b.X e
  • Introduction dune constante par répondant (i)
  • Yit a b.Xit S b.di eit
  • Prise en compte des variations des coefficients
    selon des caractéristiques des répondants
    (modèles multi-niveaux ou hiérarchiques)
  • Yit ai bi.Xit S b.di eit
  • ai a c.Zi g0i
  • bi b d.Ki g1i
Write a Comment
User Comments (0)
About PowerShow.com