Title: Une Introduction aux Modles dquations Structurales MES SEM Structural Equation Modeling
1Une Introduction aux Modèles dÉquations
Structurales (MES)(SEM Structural Equation
Modeling)
Albert Dionne membre du GEMSAS Université Laval
Hiver 2001
24 Logiciels GRATUITS MES
- AMOS
- http//www.smallwaters.com/amos
- EQS
- http//www.mvsoft.com/eqsftp.htm
- LISREL
- http//www.ssicentral.com
- MPLUS
- http//www.StatModel.com
3Modèles dÉquations Structurales (MES)
- INTRODUCTION
- DIAGRAMMES DE CHEMINEMENT
- PROGRAMMATION DANS SAS, LISREL, EQS
- MODÈLE GLOBAL
- IDENTIFICATION
- EFFETS DIRECT, INDIRECT(S), TOTAL
- QUALITÉ DE LAJUSTEMENT
- INDICES POUR MODIFIER LE MODÈLE
- MES EN 7 ÉTAPES
- EXEMPLES VARIÉS
4INTRODUCTION
- LAS Technique multivariée pour étudier des
relations causales entre variables - Variables observées seulement analyse des
cheminements - Variables Observées et Latentes (non observées)
MES - Applications biologie, économique, éducation,
- marketing, psychologie, sociologie, etc.
- Logiciels
- LISREL (LInear Structural RELations, Jöreskog
Sörbom,1972) - PROC CALIS in SAS
- EQS (EQuationS, Bentler, 1985)
- AMOS (Analysis of Moment Structures) in SPSS
- SEPATH (Structural Equations, PATH analysis) in
STATISTICA - PLS (partial least squares) , etc.
5DIAGRAMMES DE CHEMINEMENT
X Ventes
Y Profits
Erreur
6DIAGRAMMES DE CHEMINEMENT
X1 dheures
b1
b2
X2 de clients
Y Revenu
b3
X3 dappels
Erreur
7DIAGRAMMES DE CHEMINEMENT
- 3- Analyse des cheminements
-
-
Erreur
Niveau SE du fils au temps 1
Niveau SE du père
Niveau SE du fils au temps 2
État PSYCHO du fils au temps 1
Erreur
Erreur
8Analyse des cheminements
- Étude des effets direct, indirects et total
- Limite les variables sont mesurées sans erreur
- Dans chaque équation, il y a une erreur de
spécification - Les erreurs de spécification sont non corrélées
dune équation à lautre
9DIAGRAMMES DE CHEMINEMENT
- 4- Analyse factorielle confirmatoire
-
X1 dheures
d1 Erreur
l1
xAmbition
l2
X2 de clients
d2 Erreur
l3
X3 dappels
d3 Erreur
10Analyse factorielle confirmatoire(AFC)
- La théorie impose a priori un modèle dAF
- Il y a un nombre déterminé de facteurs
- Certains facteurs peuvent être corrélés entre eux
- À chaque facteur est attribué un nom
- Les indicateurs de chaque facteur sont connus
- On estime les saturations (loadings)
lij
xj
Xi
di
11Un exemple AFC via EQS
12EQS un exemple dAFC fichier MULE99MOD
1 /TITLE
2 CFA
ANALYSIS WITH 2 FACTORS (adapted from MUELLER p.
99) 3 /SPECIFICATIONS
4
CASES 3094 VARIABLES 6 MATRIX
CORRELATION 5 /LABELS
6 V1 AcAbility V2 SelfConf V3
DegreAsp V4 Selctvty 7 V5
Degree V6 OcPrestg
8 F1 AcMotiv F2
ColgPres
9 /EQUATIONS
10 V1 F1E1
11 V2
F1E2
12 V3 F1E3
13 V4 F2E4
14 V5 F2E5
15 V6
F2E6
16 /VARIANCES
17 F1 TO F2
18 E1 TO E6
19 /
COVARIANCES
20 F2,F1
13EQS un exemple dAFC
21 /MATRIX
22 1
23 .487 1
24 .236
.206 1
25 .382 .216 .214 1
26 .242 .179 .253 .254 1
27 .163 .090 .125 .155 .481
1 28 /STANDARD DEVIATIONS
29 .744 .782 1.014 1.99 .962 1.591
30 /LMTEST
31 Set PEE
32 /WTEST
33 /PRINT
34
Digit 2
35 /END
14EQS un exemple dAFC
GOODNESS OF FIT SUMMARY INDEPENDENCE MODEL
CHI-SQUARE 2832.727 ON 15 DEGREES OF
FREEDOM INDEPENDENCE AIC 2802.72721
INDEPENDENCE CAIC 2697.16891 MODEL
AIC 427.14190 MODEL CAIC
370.84414 CHI-SQUARE 443.142 BASED ON
8 DEGREES OF FREEDOM PROBABILITY VALUE FOR
THE CHI-SQUARE STATISTIC IS LESS THAN 0.001 THE
NORMAL THEORY RLS CHI-SQUARE FOR THIS ML SOLUTION
IS 433.136. BENTLER-BONETT NORMED
FIT INDEX 0.844 BENTLER-BONETT NONNORMED
FIT INDEX 0.710 COMPARATIVE FIT INDEX
(CFI) 0.846
ITERATIVE SUMMARY
PARAMETER ITERATION ABS CHANGE
FUNCTION 1 0.357097
0.57598 2 0.162575
0.25114 3
0.071338 0.14738 4
0.041108 0.14395
5 0.009730
0.14338 6 0.008100
0.14329 7 0.002992
0.14328 8
0.001486 0.14327 9
0.000665 0.14327
15EQS un exemple dAFC
MEASUREMENT EQUATIONS WITH STANDARD ERRORS
AND TEST STATISTICS ACABILITV1
1.00 F1 1.00 E1
SELFCONFV2
.85F1 1.00 E2
.05
18.02
DEGREASPV3
.61F1 1.00 E3
.04
14.10
SELCTVTYV4 1.00 F2
1.00 E4
DEGREE V5 1.02F2
1.00 E5
.07
14.51
OCPRESTGV6 1.28F2 1.00 E6
.08
15.38
16INDICES de MODIFICATION
- Peut-on éliminer des paramètres du modèle ?
- WALD TEST (FOR DROPPING PARAMETERS)
-
- MULTIVARIATE WALD TEST BY SIMULTANEOUS PROCESS
CUMULATIVE MULTIVARIATE STATISTICS
UNIVARIATE INCREMENT
--------------------------------------------------
--------- -----------------------------
-------
STEP PARAMETER CHI-SQUARE D.F. PROB.
CHI-SQUARE PROB.
----
----------------- ---------- ----
--------- ----------------
-----------
-
- NONE OF THE FREE PARAMETERS IS DROPPED IN THIS
PROCESS.
17INDICES de MODIFICATION
- Devrait-on ajouter des paramètres au modèle ?
- LAGRANGE MULTIPLIER TEST (FOR ADDING PARAMETERS)
- ORDERED UNIVARIATE TEST STATISTICS
NO
PARAMETER CHI-SQUARE PROBABILITY
PARAMETER CHANGE 1 E6,E5
306.228 0.000
1.470
2 E4,E1
203.719 0.000
0.315 3 E2,E1 83.180
0.000 0.321 4
E5,E3 58.523
0.000 0.112 5 E5,E4
48.642 0.000
-0.349 .............................etc...
..................... - MULTIVARIATE LAGRANGE MULTIPLIER TEST
CUMULATIVE MULTIVARIATE STATISTICS
UNIVARIATE INCREMENT STEP
PARAMETER CHI-SQUARE D.F. PROB.
CHI-SQUARE PROB. 1 E6,E5
306.228 1 0.000 306.228
0.000 2 E2,E1 389.408
2 0.000 83.180
0.000 3 E4,E1 413.299 3
0.000 23.891 0.000
.............................etc.................
....... -
18DIAGRAMMES DE CHEMINEMENT
Erreur
- 5- Modèle dÉquations Structurales
-
Erreur
Heures
Ventes
Ambition
Performance
Erreur
Clients
Nouveaux Clients
Erreur
Appels
Erreur
Erreur
19Notation EQS
E4
E1
V1
V4
F1
F2
E2
V2
V5
E3
V3
D2
E5
20Notation LISREL
e1
d1
X1
x
y
l11
l11
Y1
x
?11
?1
?1
l21
d2
X2
y
l21
x
l31
Y2
d3
X3
?
e2
21MODÈLE GLOBAL selon la notation LISREL
22MODÈLE GLOBAL
- Il consiste en une série déquations linéaires en
termes de variables observées, de variables
latentes et de paramètres structuraux les
reliant. - Les paramètres structuraux sont des constantes
inconnues qui indiquent la force des relations
causales entre - 1- variables latentes, comme dans ? ? ?
? 2- variables latente et observée,
comme dans Y l ? e -
23MODÈLE GLOBAL selon la notation LISREL
-
- Il est composé de 3 sous-modèles
- 1- Le modèle structural entre variables latentes
? et ? ? B ? ?? ? - 2- Les 2 modèles de mesure entre variables
observées et variables latentes X Lx?
? Y Ly? ? -
24MAS notation LISREL (p. 132)
25 Le modèle structural? B ? ?? ?
-
- Les 3 équations linéaires
- ?1 ?11?1 ?12?2 ?1 ?2 ?21 ?1
?21?1 ?22 ?2 ?2 ?3 ?31 ?1 ?32 ?2
?31?1 ?32 ?2 ?3
26Les 2 modèles de mesure X Lx? ? Y Ly? ?
- Les 10 équations linéaires
- Y1 ?11?1 ?1 X1 ?11?1 ?1
- Y2 ?21?1 ?2 X2 ?21?1 ?2
- Y3 ?31?1 ?3 X3 ?31?1 ?3
- Y4 ?42?2 ?4 X4 ?42?2 ?4
- Y5 ?53?3 ?5
- Y6 ?63?3 ?6
- La saturation ?63 représente la quantité de
changement dans la variables observée Y6 pour
une augmentation d une unité dans la variable
latente ?3
27Modèles dÉquations Structurales (MES)
- Les 8 matrices (p. 135-137) B, G, F ,
Y , Lx , qd , LY , qe déterminent
complètement le MES décrit par la figure 3.1 (p.
132) - Si Lx I, LY I, qd 0, qe 0 , le MES se
réduit au sous-modèle de lanalyse des
cheminements Y B Y ?X ? - Si B 0, G 0, Y 0, LY 0 , qe 0 , le
MES se réduit au sous-modèle de lAFC X
Lx? ?
28Postulats dans les MES (p. 137)
- Les variables latentes x et ? ont une moyenne
nulle - La théorie impose a priori un MES linéaire , avec
un nombre déterminé de facteurs nommés,
et dont les indicateurs sont connus - À chaque variable endogène ? est associée une
erreur de spécification ? - Les erreurs de spécification ? ont une moyenne
nulle, sont non corrélées avec la variable
latente exog. x, mais peuvent être corrélées
entre elles y - La matrice (I-B) est inversible
29Postulats dans les MES (p. 139)
- Les variables observées X et Y sont centrées
elles ont donc des moyennes nulles - À lindicateur X est associée une erreur de
mesure d . Ces erreurs de mesure d ont une
moyenne nulle, sont non corrélées avec les
variables latentes x et ? , mais peuvent être
corrélées entre elles qd - À lindicateur Y est associée une erreur de
mesure e. Ces erreurs de mesure e ont une
moyenne nulle, sont non corrélées avec les
variables latentes x et ? , et avec d, mais
peuvent être corrélées entre elles qe - On pourrait considérer des variables X et Y non
centrées, et/ou une matrice de var-cov qde
30Modèles dÉquations Structurales(MES)
- Notions à (re)considérer
- Identification Estimation
- Effets direct, indirects et total entre facteurs
latents - Qualité de lajustement
- Indices de modification
- Les Méthodes destimation (MV, MCG) supposent la
multinormalité des observations. Ces estimateurs
sont convergents (consistent), pourvu que la
taille de léchantillon soit grande