Title: POL1803: Analyse des techniques quantitatives
1POL1803 Analyse destechniques quantitatives
2Lanalyse bivariée
- Variables dintervalles / ratio
3Satisfaction et réélection
- Année Satisfaction Vote
- 1973 56 55
- 1976 28 34
- 1981 60 49
- 1985 39 39
- 1989 47 50
- 1994 40 44
- 1998 52 43
- 2003 40 33
- 2007 39 33
- 2008 54 42
- 2012 31 31
- 2014 38 25
- 2014b 43 ?
4Satisfaction et réélection
- Réélection
- 1973 56
- 1981 60
- 1989 47
- 1998 52
- 2007 39
- 2008 39
- Défaite
- 1976 28
- 1985 39
- 1994 40
- 2003 40
- 2012 31
- 2014 38
5Diagramme de dispersion
- Définition
- Outil pour représenter graphiquement la relation
entre deux variables dintervalles / ratio. - Permet de caractériser la direction, la force et
la forme de la relation.
6Diagramme de dispersion
7Direction de la relation
8Force de la relation
9Force de la relation
10Force de la relation
11Forme de la relation
12Diagramme de dispersion
13Coefficient de corrélation
- Définition
- Outil pour synthétiser en une seule valeur la
relation entre deux variables dintervalles /
ratio. - Permet de caractériser la direction et la force
de la relation, mais pas la forme de la relation.
14Coefficient de corrélation
- Formule
- r S Zx Zy
- N
- où Zx x mx et Zy y my
- sx sy
15r S Zx Zy où Zx x mx et Zy y
my N sx sy
X Y Zx Zy Zx Zy Zx Zy
56 55 (56-44)/10 (55-40)/9 1,2 1,7 2,0
28 34 (28-44)/10 (34-40)/9 -1,6 -0,7 1,1
60 49 (60-44)/10 (49-40)/9 1,6 1 1,6
39 39 (39-44)/10 (39-40)/9 -0,5 -0,1 0,1
47 50 (47-44)/10 (50-40)/9 0,3 1,1 0,3
40 44 (40-44)/10 (44-40)/9 -0,4 0,4 -0,2
52 43 (52-44)/10 (43-40)/9 0,8 0,3 0,2
40 33 (40-44)/10 (33-40)/9 -0,4 -0,8 0,3
39 33 (39-44)/10 (33-40)/9 -0,5 -0,8 0,4
52 42 (52-44)/10 (42-40)/9 0,8 0,2 0,2
31 31 (31-44)/10 (31-40)/9 -1,3 -1 1,3
38 25 (38-44)/10 (25-40)/9 -0,6 -1,7 1,0
m 44 40 total 8,3
s 10 9 / 12 0,7
16Coefficient de corrélation
17Interprétation du coefficient de corrélation
- Léchelle sétend de 1 à 1.
- 0 signifie une association nulle.
- Signe négatif signifie une ass. négative.
- -1 signifie une ass. négative parfaite.
- Signe positif signifie une ass. positive.
- 1 signifie une ass. positive parfaite.
18Interprétation du coefficient de corrélation
- 0 - 0,25 Faible
- 0,25 - 0,50 Moyenne
- 0,50 - 0,75 Forte
- 0,75 - 1 Très forte
19Coefficient de corrélation
- Problèmes
- Le coefficient de corrélation saisit seulement la
linéarité dune relation entre deux variables.
20Coefficient de corrélation
21Coefficient de corrélation
- Problèmes
- Le coefficient de corrélation saisit seulement la
linéarité dune relation entre deux variables. - Le coefficient de corrélation est sensible aux
cas extrêmes.
22Coefficient de corrélation
23Coefficient de corrélation
24Test F
- Définition
- Mesure de la signification statistique du
coefficient de corrélation. - Révèle si une association statistique existe
probablement entre ces deux variables dans
lensemble de la population.
25Test F
- Formule r2 (n - 2)
- 1 r2
- où
- r Coefficient de corrélation
- N Nombre dobservations
26Test F
- Formule r2 (n - 2)
- 1 r2
- Exemple
- 0,82 (12 - 2) 0,64 10 6,4
- 1 - 0,82 1 - 0,64 0,36
- F 17,8
27Test F
- Critère
- Normalement, pour que le coefficient de
corrélation soit statistiquement significatif, le
F doit dépasser une valeur dans la table F. - Raccourci
- la valeur du F doit dépasser 3,84
28Test F
- Si le F est supérieur à 3,84
- on peut rejeter lhypothèse nulle (pas
dassociation dans la population) - on peut conclure quune relation existe
probablement dans la population (95) - Si le F est inférieur à 3,84
- on ne peut pas rejeter lhypothèse nulle (pas
dassociation dans la population) - on ne peut pas conclure quune relation existe
probablement dans la population
29Signification statistique du coefficient de
corrélation
30Signification statistique
- Si la signification est inférieure à 0,05
- on peut rejeter lhypothèse nulle (pas
dassociation dans la population) - on peut conclure quune relation existe
probablement dans la population (95) - Si la signification est supérieure à 0,05
- on ne peut pas rejeter lhypothèse nulle (pas
dassociation dans la population) - on ne peut pas conclure quune relation existe
probablement dans la population
31Équation de régression
- Définition
- Outil pour résumer, avec plus de détails, la
relation entre deux variables dintervalles /
ratio. - Permet de prédire (estimer) des valeurs inconnues
de la variable dépendante.
32Équation de régression
33Équation de régression
- Formule
- Y a bX
- où Y Valeur de la variable dépendante
- a Intersection ou constante
- b Pente ou coefficient de régression
- X Valeur de la variable indépendante
34Équation de régression
- Y a bX
- Constante
- Point sur laxe des Y où passe la droite de
régression. - Valeur de la variable dépendante lorsque la
variable indépendante a la valeur de 0.
35Équation de régression
36Équation de régression
37Équation de régression
- Y a bX
- Coefficient de régression
- Le signe du coefficient reflète la direction de
la relation. - La valeur du coefficient indique leffet sur la
variable dépendante dun mouvement dune unité
sur la variable indépendante.
38Statistique t pour lecoefficient de régression
- Définition
- Mesure de la signification statistique du
coefficient de régression (pente). -
- Critère
- Pour que le coefficient de régression soit
statistiquement significatif à 95, la valeur
absolue du t doit dépasser 1,96.
39Statistique t pour lecoefficient de régression
40Coefficient de détermination
- Définition
- Mesure de la proportion de variation chez la
variable dépendante qui est expliquée par
léquation de régression. -
- Formule r2
- où r Coefficient de corrélation
41Coefficient de détermination
42Interprétation du coefficient de détermination
- 0 - 0,25 Faible
- 0,25 - 0,50 Moyenne
- 0,50 - 0,75 Forte
- 0,75 - 1 Très forte
43Révision
r2 1 r2 1 r
1 r -1 b b
-
44Révision
r2 0,64 r2 0,04 r
0,8 r 0,2 b
b
45Révision
r2 0 r 0
b 0
46Réélection du PLQ?
- Année Satisfaction Vote
- 1973 56 55
- 1976 28 34
- 1981 60 49
- 1985 39 39
- 1989 47 50
- 1994 40 44
- 1998 52 43
- 2003 40 33
- 2007 39 33
- 2008 54 42
- 2012 31 31
- 2014 38 25
- 2014b 43 ?
47Estimation à partir deléquation de régression
48Estimation à partir deléquation de régression
- Y 10,36 0,68X
- Y 10,36 0,68 43
- Y 10,36 29,24
- Y 39,6
49Estimation à partir deléquation de régression
- X 30 Y 30,1
- X 35 Y 34,2
- X 40 Y 37,6
- X 45 Y 41,0
- X 50 Y 44,4
- X 60 Y 51,2
50Intervalle de confiancedune estimation
- Éventail de valeurs autour de lestimation
ponctuelle - (À 95)
- Estimation ? 1,96 Erreur standard de
lestimation - Lerreur standard de lestimation est
léquivalent de lécart-type de léquation de
régression. - Lerreur standard de lestimation est calculée
par SPSS.
51Intervalle de confiancedune estimation
52Intervalle de confiancedune estimation
- X 43 Y 39,6
- Estimation ? 1,96 Erreur standard de
lestimation - 39,6 ? 1,96 6,07 39,6 ? 11,9
- 27,7 51,5 27,7 lt Y lt 51,5
53Remarque finale
- Il ne faut pas confondre les termes association
statistique et relation causale. Le fait de
trouver que deux variables varient ensemble
nimplique pas automatiquement que lune est la
cause de lautre.