Title: Analyse des donn
1Analyse des donnéesappliquée au marketing3.
Expérimentation
2Sommaire général
- 1. Introduction
- 2. Tests
- 3. Expérimentation et Analyse de Variance
- 4. Analyses factorielles et des similarités
- 5. Typologies et Segmentation
- 6. Régression logistique et Analyse discriminante
- 7. Mesure et Méthodes avancées
- 8. Régression
33. Expérimentation et Analyse de variance
- Expérimentation
- faire varier de manière contrôlée une variable
pour mesurer son effet sur une autre - Mesurer une relation causale
- Plan dexpérience
- Analyse des résultats
- Une variable à expliquer (métrique)
- 1 facteur contrôlé nominal ANOVA
- Plusieurs facteurs ANOVA
- 1 facteur covariable ANCOVA
- Plusieurs variables à expliquer (métriques)
- MANOVA MANCOVA
4Causalité et Expérimentation
- On cherche à mettre en évidence une relation de
cause à effet entre X et Y - Conditions à respecter pour établir la relation
causale - Variation concomitante (dx, dy)
- Séquence temporelle / Présence manipulée
- Élimination des autres causes possibles
- Indépendance (Orthogonalité) des variables
dépendantes entre elles - Quasi-expérimentation si pas daffectation
aléatoire des individus - Exemple mesure Avant-après sur un seul groupe
- Variables
- VI (indépendantes, X) VD (dépendante, Y)
- VI manipulée (pack) ou
- VI invoquée (groupage des individus sur les
modalités)
5Procédure
- Définition de la question marketing
- Quel est leffet de la mention sur le pack sur
les ventes du produit ? - Construction de la base théorique
- Les variables situationnelles
- Evaluatives
- Attention, perception, préférence, choix
- Attitude (envers lannonce, la marque,..)
- Valeur perçue, satisfaction, fidélité
- Intermédiaires
- risque perçu,
- Les variables modératrices
- Individuelles genre, revenu, csp,
- Psychologiques stables aversion pour le
risque, - Interactives relation à la marque, implication
produit,
6Le modèle
Relation de causalité
Relation avec médiatrice
Relation avec modératrice
Y
X
Y
Z
X
X
Y
Z
Naturalité perçue
Préférence Pour le pack
Préférence Pour le pack
Mention sur Le pack
Mention sur Le pack
Sensibilité aux colorants
Sensibilité aux colorants
- Rédiger clairement les hypothèses pour pouvoir
les rejeter - H1 La mention sans colorant accroît la
préférence pour le pack - H1a M(sans) gt M(avec) - H1b M(sans)lt M(avec)
- H2 Plus la sensibilité à la présence de
colorants est forte, plus leffet de la mention
sur la préférence est élevé. - H2a M(sans,s) - M(avec,s) gt M(sans,s-) -
M(avec,s-)
7Construire un modèle utile
- De la gauche vers la droite
- le chemin de linfluence de X sur Y
- Puis de la droite vers la gauche
- les autres variables importantes qui peuvent
influencer Y et quil faut mesurer ou contrôler - Identifier
- Les hypothèses validées (par les
connaissances, lexpérience, le quali..) - Les hypothèses à valider
- Exemple
- Maggi souhaite lancer un sachet de soupe
déshydratée en 5 assiettes au lieu de 4 - Proposez un modèle
8Plan Inter ou Intra-sujets
- Démarche
- Un échantillon représentatif accent sur les
relations et leffet - Préférence pour le pack A versus B
- Des groupes différents accent sur les
modérateurs - Clients de la marque / versus concurrence
- Comment éliminer les spécificités personnelles ?
- Neutraliser affectation aléatoire à un groupe
- Un groupe névalue quune option
- les groupes identiques
- Contrôler par des mesures répétées
- Un seul groupe qui évalue les options
- Mais effet de la méthodologie (ordre de la
présentation,..)
9Validité des résultats
- Interne Force de la conclusion
- Facteurs non pris en compte dans lanalyse
- Le temps
- La répétition
- Lenvironnement
- Les mesures
- Linteraction des répondants avec la méthodologie
- La modification de léchantillon (mortalité)
- Laffectation des répondants
- Externe Généralité de la conclusion
- Représentativité des répondants
- Représentativité-réalisme des stimulis
- Contexte expérimental
10Les causes possibles des variations
- Il faut isoler ces effets
Traitement (E) Effet de la manipulation
Histoire (H) évolution de lenvironnement
Contamination (I) Modification des réponses en fonction de la connaissance de lobjet de lexpérimentation (effet de demande)
Maturation (M) évolution des sujets (t, tn)
Test (T) Changement des réponses, ou biais, provoqué par la mesure
Sélection (S) Variation dans la composition de léchantillon Auto-sélection échantillonnage non réponse
Instrumentation Changement dans linstrument de mesure (enquêteur,)
Régression statistique Présence de valeurs extrêmes sélection successive en fonction de réponses précédentes
Mortalité Réduction de léchantillon par le refus de participation collecte contraignante
11Plans expérimentaux
- Grandes classes
- Quasi-expérimental Avant-Après
- Expérimental
- Double affectation aléatoire des individus aux
cellules des traitements aux cellules - Observation Mesure
- Traitement
- Quelles comparaisons
- Entre les groupes dindividus
- Entre les réponses dun même groupe
A
Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle Après seulement Groupe de contrôle
Groupe 1 A X O1
Groupe 2 A O2
O
X
Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle Avant - Après Groupe de contrôle
Groupe 1 A O1 X O2
Groupe 2 A O3 O4
Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes Solomon 4 groupes
Groupe 1 A O1 X O2
Groupe 2 A O3 O4
Groupe 3 A X O5
Groupe 4 A O6
12Mesure des effets
X O1 ?
O1 X O2 O2-O1 E H I M (T) (S)
X O1
O2 O2-O1 E (T) (S)
O1 X O2 O2-O1 E H I M (T) (S)
O3 O4 O4-O3 H M (T) (S)
(O2-O1)-(O4-O3) E I
O1 X O2 D1 O2-O1 E H I M (T) (S)
O3 O4 D2 O4-O3 H M (T) (S)
X O5 D3 O5-(O2O4)/2 E H (T) (S)
O6 D4 O6-(O2O4)/2 H (S)
O6 D5 O6-O5 E (T) (S)
D4-D3 E
D3-D5 H
D1-D3-(D2-D4) I
D2-D4 M
D4D5-D3 (T) (S)
- Source Lambin JJ La recherce Marketing, McGraw
Hill
13Plans statistiques
- Mise en évidence de leffet de plusieurs facteurs
- Effet du prix sur
- Des magasins de tailles différentes
- Situés dans des régions différentes
- Plans
- Complet toutes les possibilités
- Permet de tester les effets dinteraction
- Fractionné combinaison choisie des modalités
- Moins de cellules donc gourmand en effectifs
14Plans statistiques complets
- Plan factoriel
- 2 variables (X, Y), même nombre de modalités (2)
- 3 modalités -gt 3² groupes 9 groupes
- 3 var, 3 modalités -gt27 groupes
- Plan factoriel en blocs aléatoires
- Groupage des individus selon une variable à
contrôler
Plan factoriel 2 variables Plan factoriel 2 variables Plan factoriel 2 variables
X y
Groupe 1 1 1
Groupe 2 1 2
Groupe 3 2 1
Groupe 4 2 2
15Plans statistiques fractionnés
- Carré latin
- 3 variables (X, Y, Z), même nombre de modalités
(3) - le groupe 3 reçoit 3, 1, 2
- Autres tailles
- Gréco-latin 4 variables
- Hyper-gréco-latin 5 variables
3
Carré latin 3 variables Carré latin 3 variables Carré latin 3 variables Carré latin 3 variables
X1 X2 X3
Y1 Z1 Z3 Z2
Y2 Z3 Z2 Z1
Y3 Z2 Z1 Z3
16Analyse de variance Postulats
- Modèle linéaire deffets indépendants
- Une moyenne générale (m)
- Des effets spécifiques par facteur (ai) pour la
modalité i du facteur I - Des effets dinteraction (aibi) )
- Une variable aléatoire (e) qui dépend des
facteurs (i,j) mais aussi de lobservation (k) - Mesures dans les cellules (combinaison de
traitements) - Normalité
- Égalité des variances, surtout si les effectifs
sont différents - Homogénéité des covariances (échantillons
appariés) - Terminologie
- Variations totales, Factorielles, Résiduelles
- Variations ou Somme de carrés (ex VF S ni
(mx1 mx.)2 )
17Analyse de variance
- Hypothèse
- Les effets sont linéaires X Moyenne effet
du facteur erreur - Hypothèse
- H1a ?1 ?2 ?3 pas de différence de moyenne
entre niveaux - H1b au moins une moyenne est différente des
autres - Les facteurs contrôlés sont différents ENTRE les
groupes mais identiques à l'intérieur de chaque
groupe (VF variations factorielles) - Les facteurs incontrôlés ont la même influence
quel que soit le groupe (VR variations
résiduelles) - Le théorème de la décomposition de la variance
(intra et inter) - VTVFVR
18Qualité globale Test F de Fisher
- Test de la qualité globale du modèle
- I nombre de niveaux du facteur, N nombre
dobservations - (I-1 N-1) degrés de liberté
-
- Interprétation
- H0 aucune effet de X sur Y (moyenne identique)
- Si F calc gt F critique rejet de H0
19Rapport de corrélation - êta carré (h2)
- Si le F diagnostique lexistence dune relation,
eta carré détermine la force de cette relation - Mesure dassociation entre une variable
quantitative et une variable non quantitative
(nominale ou ordinale) - Ex pouvoir explicatif du genre sur le montant
des dépenses - Eta2 Variations expliquées / Variations totales
- Eta2 e 0, 1
- Sinterprète comme
- le des variations de la variable quantitative
- expliquées par la variable nominale/ordinale
20Exemple de lecture
- Effet du prix sur les ventes des magasins (q)
- 3 niveaux de prix
- 4 types de magasin, 30 observations par magasin
- Relation globalement
- significative (F)
- Mais Faible (Eta2 ou R2)
- Effet du prix
- Significatif (t)
- Dans quel sens ? (demander solution)
21Analyse de variance multivariée Les interactions
- Les effets de variables peuvent se combiner pour
- Samplifier ou Se neutraliser
Sans interactinn
Variable dépendante
Variable indépendante
Interactinn dis-ordinale Avec croisement
Interactinn dis-ordinale Sans croisement
Interactinn ordinale
222 facteurs avec interaction
- Effet du magasin
- Significatif
- Effet de linteraction
- Significative
- Amélioration de la qualité globale
- Attention !
- Les effets dinteraction sont toujours à analyser
dabord - Car ils changent linterprétation des effets
directs
23Problème des comparaisons multiples
- Quand il y a plusieurs groupes, les tests en t (2
groupes) ne sont pas adaptés - Car pour chaque test dhypothèse, on additionne
les risques derreur alpha - pour k groupes k.(k-1)/2 comparaisons
- Pour 3 groupes avec un risque alpha5, la
probabilité quaucune comparaison ne soit
significative est (0.950.950.95)0.857 soit un
risque alpha réel de 14.3 - Objectif des corrections
- Comparer les moyennes des groupes en contrôlant
pour linflation des risques a (type I) pour
toutes les comparaisons - Garder un risque a de 5 pour toutes les
comparaisons gt le risque a pour chaque
comparaison sera dautant plus petit que le
nombre de comparaisons est important
24Bonferroni, Scheffé, Dunnett
- Comparaison a priori ou a posteriori des groupes
- Corrections pour des comparaisons multiples
- Dunn-Bonferroni (la correction plus simple a
priori) - a corrigé ? / nombre de tests. 5-gt 1 si 5
comparaisons - Autres tests ( a posteriori)
- Dunnett les groupes sont comparés à un groupe
de contrôle - Contrastes non orthogonaux - Usage fréquent
- Tukey HSD
- Compare toutes les paires possibles
- adapté sil y a de nombreux groupes à comparer
- Scheffé très conservateur mais accepte des
groupes inégaux. - Correction pour toutes les comparaisons possibles
(paires ou composées) en augmentant la différence
critique. - Une différence à elle seule doit être assez
grande pour rendre le F global significatif.
25Test des différences
- Bonferroni (test en t) Scheffé (test en F)
26Contrastes
- un test a priori de différences de moyennes
(hypothèse préalable) - Un Contraste est une somme pondérée des moyennes
dont la valeur attendue sous H0 est nulle - C a1.m1 a2.m2 a3.m3
- Comparaison sur une combinaison linéaire de
plusieurs groupes - Test dune combinaison linéaire des (nb
groupes-1) contrastes - Si a 1 0 1 alors on a C m1 - m3
- Si a 1 1/2 1/2 alors on a C m1 - 0.5 m2
-0.5 m3 - Contrastes particuliers
- Helmert (groupes ordonné)
- -1 1 0 0 -1 -1 2 0 -1 -1 -1 3
- Contraste polynomial
- Prise en compte successive dun trend linéaire,
quadratique, cubique
27Contrastes orthogonaux
- Des Contrastes orthogonaux sont indépendants les
uns des autres - Pour que 2 contrastes soient orthogonaux, il faut
que la - Somme des produits des coefficients de chaque
variable soit NULLE - Somme des coefficients dun contraste soit NULLE
- Exemple
- C1 -1 0 1 et C2 -1 2 -1
- C1 1 -1 0 0 et C2 0 0 1 -1
- Générer des contraste orthogonaux
- http//www.bolderstats.com/orthogCodes/
- Tous les contrastes doivent être orthogonaux 2 à
2 - Chaque contraste
- a sa somme des carrés
- a 1 degré de liberté au numérateur et ddl erreur
au dénominateur.
28Choix des sommes des carrés de Type I à III
- Type
- I Hiérarchique
- lordre détermine la prise en compte des
variables. - F de leffet SC de leffet / SC des effets
précédents - II Non expérimental
- F de leffet SC de leffet / SC des effets de
son niveau et des niveaux inférieurs - III Régression
- F de leffet SC de leffet / SC de tous les
autres effets - Préconisations
- Type I si les variables ont un ordre dimportance
ET les groupes de taille identique - Type II déconseillé
- Type III à privilégier (même si effectifs
inégaux) option par défaut - Approfondir http//www.lsp.ups-tlse.fr/Doc_pedag
ogique/PDF/ab-deseq.pdf
29Moyennes et Moyennes estimées
- Moyenne (MEAN) correspond à la moyenne
arithmétique - Cest la moyenne générale
- Moyenne estimée (LSMEANS) correspond à la moyenne
estimée par le modèle utilisé - Cest la moyenne des moyennes des niveaux dun
facteur - Elle est ajustée en fonction de la moyenne des
variables indépendantes - Elles sont différentes
- Sil y a des valeurs manquantes ou des effectifs
différents - Sil y a des variables explicatives (covariates)
30ANCOVA et MANOVA
- ANCOVA
- Permet de tenir compte dun facteur/variable que
l on peut mesurer mais non contrôler - Leffet de la variable non contrôlé est éliminé
dabord avant de prendre en compte les facteurs - MANOVA
- Prendre en compte plusieurs variables à expliquer
(Y1, Y2, Y3) - Voir sil y a un effet global de la variable
explicative - Puis chercher sur quelle variable plus
particulièrement il y a un effet par des ANOVA
31Modèles mixtes
- Les modèles mixtes prennent en compte la
différence des répondants lors danalyses de
mesures répétées - Modèle de base Y a b.X e
- Introduction dune constante par répondant (i)
- Yit a b.Xit S b.di eit
- Prise en compte des variations des coefficients
selon des caractéristiques des répondants
(modèles multi-niveaux ou hiérarchiques) - Yit ai bi.Xit S b.di eit
- ai a c.Zi g0i
- bi b d.Ki g1i