Title: Lanalyse discriminante
1Lanalyse discriminante
2Interpréter les combinaisons linéaires avec les
contrastes
MANOVA bep detp opti vital flow BY passion(1,3)
/Method unique /discrim(cor) /print
cellinfo(means) signif(efsize dimenr eigen)
homogeneity /contrast(passion)special(1 1 1 -1
0 1 0 -1 1) /partition(passion) /design
passion(1) passion(2).
N.B. Il peut y avoir autant de contrastes que de
degrés de liberté (k-1). Donc sil y a 3
groupes, deux contrastes sont possibles. Si vous
en voulez plus, vous devez rouler la MANOVA plus
quune fois. Les contrastes peuvent être
orthogonaux ou non faire la correction qui
simpose sils ne sont pas orthogonaux.
3MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
A n a l y s i s o f V a r i a n c
e -- design 1 EFFECT ..
PASSION(1) Multivariate Tests of Significance (S
1, M 1 1/2, N 196 ) Test Name Value
Exact F Hypoth. DF Error DF Sig. of F
Pillais .11470 10.20929 5.00
394.00 .000 Hotellings .12956
10.20929 5.00 394.00 .000 Wilks
.88530 10.20929 5.00 394.00
.000 Roys .11470 Note.. F
statistics are exact. - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Multivariate Effect Size TEST NAME Effect
Size (All) .115
Contraste 1 Non passionnés vs passionnés
harmonieux
4MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - Eigenvalues and
Canonical Correlations Root No. Eigenvalue
Pct. Cum. Pct. Canon Cor. 1
.130 100.000 100.000 .339 -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - A n a l y s i s
o f V a r i a n c e -- design 1
EFFECT .. PASSION(1) (Cont.) Correlations
between DEPENDENT and canonical variables
Canonical Variable Variable 1
bep -.719 detp .590
opti -.591 vital -.701
flow -.884
Attention, A) les contrastes 1 et 2 sont
inversés dans le output et B) les signes ne
sont pas nécessairement corrects!!!
Contraste 1 Non passionnés vs passionnés
harmonieux
5Puisque les signes de la corrélation canonique et
des corrélations entre la variable canonique et
les variables dépendantes ne sont pas
nécessairement corrects
- Examinez vos moyennes pour interpréter la
direction de la relation.
Passionnés harmonieux vivent plus de bien-être
et plus de flow, etc
6Pour rapporter la corrélation canonique et les
corrélations entre la variable canonique et les
variables dépendantes
- Faites votre dessin en insérant les chiffres
appropriés sans les signes. - Indiquer les signes représentant votre contraste
(ceux de la commande). - Indiquer les signes nécessaires pour que la
direction de leffet que vous avez observez entre
les moyennes de chaque variable dépendante y soit
reflètée.
Passionnés harmonieux (1) vs Non passionnés
(-1)
7Pour rapporter la corrélation canonique et des
corrélations entre la variable canonique et les
variables dépendantes
En regardant mes moyennes, jobtiens que les
passionnés harmonieux vivent plus de bien-être,
moins de détresse, plus doptimisme, plus de
vitalité et plus de flow Ainsi,
Bien-être
.72
Détresse
-.59
Passionnés harmonieux (1) vs Non passionnés
(-1)
.34
.59
Optimisme
.70
Vitalité
.88
Flow
8MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
A n a l y s i s o f V a r i a n c
e -- design 1 EFFECT ..
PASSION(2) Multivariate Tests of Significance (S
1, M 1 1/2, N 196 ) Test Name Value
Exact F Hypoth. DF Error DF Sig. of F
Pillais .12600 11.35987 5.00
394.00 .000 Hotellings .14416
11.35987 5.00 394.00 .000 Wilks
.87400 11.35987 5.00 394.00
.000 Roys .12600 Note.. F
statistics are exact. - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Multivariate Effect Size TEST NAME Effect
Size (All) .126 - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - -
Contraste 2 Passionnés obsessifs vs passionnés
harmonieux
9MANOVA bep detp opti vital flow BY
passion(1,3) /Method unique /discrim(cor)
/print cellinfo(means) signif(efsize dimenr
eigen) homogeneity /contrast(passion)special(1
1 1 -1 0 1 0 -1 1) /partition(passion)
/design passion(1) passion(2).
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - Eigenvalues and
Canonical Correlations Root No. Eigenvalue
Pct. Cum. Pct. Canon Cor. 1
.144 100.000 100.000 .355 -
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - A n a l y s i s
o f V a r i a n c e -- design 1
EFFECT .. PASSION(2) (Cont.) Correlations
between DEPENDENT and canonical variables
Canonical Variable Variable 1
bep .946 detp -.729
opti .649 vital .618
flow .451 - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - -
Attention, A) les contrastes 1 et 2 sont
inversés dans le output et B) les signes ne
sont pas nécessairement corrects!!!
Contraste 2 Passionnés obsessifs vs passionnés
harmonieux
10Type De question
Type De mesure des Variables Dépendantes
Nombre De Variables Dépendantes
Nombre De Niveaux ou de VI
Échantillons Dépendants ou indépendants
Satistiques
indépendants
?2
Deux
Une
dépendants
McNemar
Qualitatives
Analyse discriminante
Multiples
Multiples
indépendants
Test t (ind)
Deux
Différences
dépendants
Test t (dép)
Une
indépendants
ANOVA/ANCOVA
ANOVA/ANCOVA mesures répétées
Multiples
dépendants
Quantitatives
Ind dép
ANOVA/ ANCOVA (mixte)
MANOVA/ MANCOVA
Multiples
Multiples
Ind dép
Qualitatives
Deux
Une
Phi
Relations
Aucune
Analyse Factorielle
Multiples
Corrélation / Régression Simple
Une
Quantitatives
Une
Régression Multiple
Multiples
Corrélation Canonique
Aussi TF, p.29-31.
Multiples
Multiples
11Corrélation canonique (R)
Motricité fine
Coordination
Gars (0) vs Fille (1)
?
Logique
Capacité dabstraction
Reconnaissance des émotions
Expression émotionnelle
12La MANOVA
- La MANOVA crée des combinaisons linéaires (des
variables canoniques) permettant de maximiser la
séparation des groupes.
Critère Trouver la combinaison linéaire qui
maximise la séparation entre les groupes
13Lanalyse discriminante
- Lanalyse discriminante crée des combinaisons
linéaires (des variables canoniques) permettant
de maximiser la prédiction de lappartenance aux
différents groupes.
Critère Trouver la combinaison linéaire qui
maximise la prédiction de lappartenance aux
groupes
14Motricité fine
Coordination
Gars (0) vs Fille (1)
Logique
Capacité dabstraction
Reconnaissance des émotions
Expression émotionnelle
15Lanalyse discriminante
Variable canonique 1
16Lanalyse discriminante
Variable canonique 1
17Le lambda de Wilks (Wilks ?)
- Le lambda de Wilks (Wilks ?) nous dit sil y a
une combinaison linéaire de variables dépendantes
qui permet de séparer les groupes de façon
statistiquement significative.
18Interpréter les combinaisons linéaires (deux
groupes)
- Sil ny a que deux groupes
Corrélation canonique (R)
R2
.44
.19
Wilks Lambda
p
?2approximatif
.33
15.07
.01
Dimensions
Wilks Lambda
p
?2approximatif
1 Ã 1
.33
15.07
.01
19Interpréter les combinaisons linéaires (deux
groupes)
Corrélations entre les variables indépendantes et
les scores obtenus par combinaisons linéaires
Variables indépendantes
Combinaison 1
Motricité fine
-.86
Coordination
-.73
Logique
.15
Capacité dabstraction
.01
Reconnaissance des émotions
.53
Expression émotionnelle
.59
Convention Les corrélations de .33 et plus sont
interprétées.
20Les variables canoniques
- Le nombre de paires de variables canoniques créés
est le plus petit entre deux possibilités - le nombre de variables indépendantes ou
- k-1 (degrés de liberté du traitement, groupes-1)
- Sil y a deux groupes
- Une seule paire de variables canoniques (k-1 1)
- Sil y a plus que deux groupes
- Au moins deux paires de variables canoniques
- Avec 3 groupes, K-1 2
21Les variables canoniques
- Les variables canoniques obtenues sont reliées
aux contrastes qui permettent dobtenir la
meilleure séparation des groupes et donc la
meilleur prédiction. - Quels sont ces contrastes?
22Interpréter les combinaisons linéaires (plusieurs
groupes)
Corrélation canonique (R)
R2
.44
.19
.06
.24
23Interpréter les combinaisons linéaires (trois
groupes)
Corrélations entre les variables indépendantes et
les variables canoniques (Canonical variables)
Variables indépendantes
Combinaison 1
Combinaison 2
.55
.16
Objectifs à court terme
.35
.23
Plan de développement à long terme
.09
.68
Encourage la coopération
.15
.78
Valorise la conciliation travail/famille
.01
.51
Soucis de la santé des employés
Convention Les corrélations de .33 et plus sont
interprétées.
24Interpréter les combinaisons linéaires (trois
groupes)
Le score de la variable canonique au centroide
des groupes (Functions at Group Centroids)
Centroides des Groupes
Combinaison 1
Combinaison 2
.310
-.319
Organisations favorisant le bien-être
-.428
.009
Organisations favorisant la performance
.370
.125
Organisations favorisant la performance et le
bien-être
25Lanalyse discriminante
Variable canonique 1 Performance
Bien-être performance
Performance
Bien-être
26Le pourcentage de variance expliquée par
lappartenance au groupe
- Cramer et Nicewander (1979 cité dans Stevens,
1996, p. 443) recommande dutiliser la moyenne de
toutes les corrélations canoniques au carré. - (.19 .12) / 2 .16
Corrélation canonique (R)
R2
.44
.19
.12
.34
27Les postulats
- Lanalyse exige plus de participants
- Pour le wilks de façon approximative, le plus
petit groupe devrait être composé de 20 personnes
ou plus (pour environ 5 prédicteurs et moins). - Pour la classification environ 20 participants
pour chaque prédicteur. - Si les groupes sont très inégaux, la régression
logistique est préférable. - Il est recommandé de vérifier vos scores extrêmes
univariés et multivariés séparément pour chaque
groupe. - Sort cases by passion.
- Split file by passion.
Non nécessaire pour les besoins du cours.
28Les postulats
- Normalité et linéarité
- Indépendance des scores
- Absence de multicolinéarité
- Homogénéité de la variance et de la covariance.
29Lhomogénéité des matrices de variance-covariance
et le Wilks
- Si les groupes sont égaux ou relativement égaux
(32), le test est robuste - Si les groupes sont inégaux et que le test M de
Box (Fapproximatif) nest pas significatif à p lt
0.001, alors il y a homogénéité. - Si les groupes sont inégaux et que le test M de
Box (Fapproximatif) est significatif à p lt 0.001 - Si la variance ET la covariance les plus élevées
se retrouvent dans le plus grand groupe, le test
est conservateur - Si, au contraire, la variance ET la covariance
les plus grandes se retrouvent dans le plus petit
groupe, le Wilks est libéral. Égalisez vos
groupes ou ajustez votre alpha critique à p lt
.01(Tabachnick Fidell, 2001) - Si cest entre ces deux extrêmes, prenez pour
acquis que le postulat est respecté.
30(No Transcript)
31La classification
32La classification
- Le théorème de Bayes Les personnes sont classées
dans un groupe selon deux critères - La distance de la personne par rapport au
centroide de chaque groupe - La probabilité dappartenir au groupe
33La classification
Variable canonique 1
34La classification
Variable canonique 1
35(No Transcript)
36Les probabilités dappartenance au groupes
- Égales pour chaque groupe.
- Égales aux proportions observées dans chaque
groupe de léchantillon. - Proportions théoriques
- Sur une période de 12 mois, entre 4 et 5 de
la population fera une dépression majeure (Source
Rapport sur les maladies mentales au Canada,
octobre 2002). - Si vous avez un échantillon provenant de la
population en générale, il serait possible de
penser que vous devriez obtenir les mêmes
proportions de 4-5 pour les dépressifs et de
95-96 pour les non-dépressifs.
37La classification
Appartenance prédite
Gars
Filles
40
70
Appartenance réelle
Gars
22
22
Filles
Note 40.3 sont classifiés correctement (40
22) / 154 40.3
N 154
38La classification
Appartenance prédite
Gars
Filles
36
64
Appartenance réelle
Gars
N 110 (71)
50
50
Filles
N 44 (29)
39La classification
40Comment évaluer le de classification?
- Comparez le obtenu à celui qui serait obtenu Ã
cause du hasard seulement. - Sil y a deux groupes égaux ½ et ½, donc 50.
- Sil y a trois groupes égaux ?, ?, ?, donc 33.
41Évaluez le de classification en le comparant Ã
celui qui serait obtenu à cause du hasard
seulement
- Si les groupes sont inégaux, le calcul des
probabilités totales est un peu plus compliqué - Les probabilités spécifiées pour chaque groupe
sont en fait les probabilités de classement
correct pour chaque groupe (Par exemple, .10,
.30, .60) - Mais, étant donné que ce sont des probabilités,
vous ne pouvez pas simplement en faire une
moyenne arithmétique. - Vous devez utiliser la formule de la moyenne
harmonique à lacétate suivante.
42Évaluez le de classification en le comparant Ã
celui qui serait obtenu à cause du hasard
seulement
- Vous avez besoin de la taille des groupes
attendus (n1, n2, n3,) et la taille totale
(Ntot). - La taille des groupes attendus (n1, n2, n3,)
dépend des probabilités spécifiées.
43Évaluez le de classification en le comparant Ã
celui qui serait obtenu à cause du hasard
seulement
- Si on sattend à trois groupes égaux et quil y a
600 participants - n1.3333600200
- n2.3333600200
- n3.3333600200
- Ntot600
44La classification
45Évaluez le de classification en le comparant Ã
celui qui serait obtenu à cause du hasard
seulement
- Si on sattend à trois groupes inégaux et quil y
a 392 participants - n1.16339264
- n2.385392151
- n3.452392177
- Ntot392
46Lhomogénéité des matrices de variance-covariance
et la classification
- La méthode pour classifier les participants est
très sensible à lhétérogénéité de la variance et
de la covariance - Les participants ont plus de chance dêtre
classés dans le groupe ayant la plus grande
variance.
47(No Transcript)