Title: Licence 1re anne Sociologie
1- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Introduction
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
2Statistiques et bon sens
- Depuis que les mariages ne sont plus
arrangés , les individus choisissent de plus
en plus leur conjoint en dehors de leur classe
sociale. - Plus on avance dans ses études, plus on lit.
Ainsi, un étudiant lit en moyenne plus qu'un
lycéen, qui lui-même lit plus qu'un collégien.
3Problèmes statistiques
- Enregistrement statistique des objets socialement
préconstruits début juillet 2009, un rapport
dénonce que les instituteurs ont 11 jours de
congé-maladie par an contre 9 pour les salariés
du privé. - Fiabilité des données administratives
statistiques sur le suicide - Interprétation de liaison statistique âge ou
génération
4Mise en perspective
Méthodes en sociologie
Méthodes qualitatives entretien, observation,
etc.
Méthodes quantitatives
Faire une enquête questionnaire, échantillon,
logiciel de statistiques, etc.
Analyser des données statistiques
Analyses multivariées
Analyse des variables quantitatives
Analyse des variables qualitatives
5- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n1 Concepts de base
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
6Définitions de base
- Population ensemble étudié
- Individu élément de la population
- Echantillon sous-ensemble de la population
- Caractère propriété étudiée
- Classe sous-ensemble de la population
correspondant à une même valeur ou à des valeurs
voisines prises par le caractère
7Exercices - Reconnaître les concepts
- Parmi l'ensemble des élèves d'un collège, on
analyse les notes en mathématiques de deux
classes de 6ème, de 5ème, de 4ème et de 3ème
chacun. Parmi ces élèves, on analyse en
particulier ceux dont les notes sont supérieures
à 15. - On analyse l'utilisation des transports en commun
des 320 000 bordelais. Pour cela, on envoie un
courrier à 10 000 personnes réparties dans tous
les quartiers de Bordeaux. Parmi eux, on
s'intéresse à ceux qui utilisent les transports
en commun de manière quotidienne.
8Variables
- Variable application qui associe à chaque
individu une valeur unique parmi un ensemble de
valeurs possibles - Variable qualitative (ou catégorielle) variable
dont les modalités sont non numériques - Variable quantitative (ou numérique) variable
dont les modalités sont numériques (des nombres
réels)
9Types de variable
- Variable qualitative
- Ordinale s'il existe un ordre sur ses modalités
(ex niveau de satisfaction, niveau
hiérarchique) - Nominale dans le cas contraire (sexe, religion)
- Variable quantitative
- Continue si les modalités sont des nombres d'un
intervalle (poids, température) - Discrète si les modalités sont des valeurs
isolées (nombre de pièces d'un logement, nombre
d'enfants d'une famille)
10Exercices - Reconnaître les variables
- Nombre de sorties au cinéma
- Taille du logement
- Orientation sexuelle
- Niveau d'études
- proposez-en d'autres !
11- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n2 Effectifs, fréquences
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
12Définitions
- Effectif nombre d'individus présentant une
modalité d'une variable. - Fréquence proportion d'individus présentant une
modalité d'une variable. Effectif de la case /
Effectif total - Effectif cumulé croissant (ou décroissant)
nombre d'individus présentant une valeur de la
variable inférieure (supérieure) ou égale à une
valeur observée. - Fréquence cumulée croissante (ou décroissante)
proportion d'individus présentant une valeur de
la variable inférieure (supérieure) ou égale à
une valeur observée. - Lien entre et décimal 5555/1000,55
- Remarque pour les variables qualitatives
nominales, les fréquences cumulées n'ont pas
beaucoup de sens.
13Exemple
Diplôme le plus élevé parmi la population non
scolarisée de plus de 15 ans en
France
Source INSEE, recensement 2006, population
non scolarisée de plus de 15 ans.
9188/45522 0,202
9188/45522 0,202 (91885582)/45522 0,324
1 1-(9188/45522) 1-0,202 0,798
0,123 0,066 0,238 0,150 0,107 0,114 1
0,390 0,628 0,778 0,886 1
1-((91885582) /45522)0,676 0,610 0,372 0,222
0,114
14Exercice
Nombre d'individus scolarisés selon l'âge en
2006 Sou
rce INSEE, recensement 2006, population
scolarisée
2380/15266 0,156 15,6
0,156 0,1560,454 0,610 0,6100,154
0,764 0,7640,192 0,956 0,9560,020
0,976 0,9760,025 1,001 ERREUR A EVITER
2380/15266 0,156 15,6 (23806929)/ 152660,6
10
1 1-(2380/15266) 1-0,156 0,844
0,454 0,154 0,192 0,020 0,025 1
1-(23806929)/15266 1-0,610
0,390 0,236 0,044 0,025
0,764 0,956 0,975 1
15- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n3 Tableaux de données chronologiques
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
16Définitions
- Ecart absolu c'est l'évolution de la variable
exprimée dans la mesure utilisée (nombre
d'individus, revenus en euros, etc.). Calcul
Valeur d'arrivée Valeur de départ - Ecart relatif c'est l'évolution de la variable
exprimée en pourcentage. Calcul (Valeur
d'arrivée Valeur de départ)/Valeur de départ - Coefficient multiplicateur c'est l'évolution de
la variable exprimée en multiple. Calcul Valeur
d'arrivée / Valeur de départ - Coefficient multiplicateur 1 Ecart relatif
ltltlt gtgtgt Ecart relatif Coefficient
multiplicateur -1 - Taux de variation moyen c'est l'évolution
moyenne de la variable en pourcentage.
17Ecarts absolus et relatifs
Nombre d'étudiants (en milliers) selon l'année et
le type d'institution S
ource Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173
Ecarts entre le nombre d'étudiants à l'unversité
entre 1960 et 1970 Absolu 637-214,7
422,3 Relatif (637-214,7)/214,7
196,7 Attention les écarts peuvent aussi être
négatifs.
18Exemple - Ecart relatif et coefficient
multiplicateur
Nombre d'étudiants (en milliers) selon l'âge et
le type d'institution Sourc
e Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173
Entre le nombre d'étudiants en BTS et IUT entre
1970 et 1990 Ecart relatif (273,6-51)/51
436,5 gtgtgt Le nombre d'étudiants en BTS / IUT a
augmenté de 436,5. Coefficient multiplicateur
273,6/51 5,365 gtgtgt Le nombre d'étudiants en BTS
/ IUT a été multiplié par 5,365. L'écart relatif
et le coefficient multiplicateur sont très
proches. En fait coefficient multiplicateur
1 écart relatif
19Exemple - Taux de variation moyen
Nombre d'étudiants (en milliers) selon l'âge et
le type d'institution Sou
rce Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173
D'abord, comptez le nombre d'années (ou semaines,
etc.). De 1960 à 1990, il y a 30 années
(1990-196030). Ensuite, calculez le coefficient
multiplicateur. Entre 1960 et 1990, le nombre
d'étudiants a été multiplié par 5,26. Le
coefficient multiplicateur moyen est alors
30v(5,26) 1,057, soit une multiplication
moyenne par an de la population par 1,057. Taux
de variation moyen Coefficient multiplicateur
moyen - 1 1,057-1 0,057 5,7, soit une
augmentation de la population en moyenne de 5,7
par an.
20Exercice 1
12010,21,2
150x(120)180 Ou 150x1,2180
0,85-1-0,15-15 Ou (3000-3529,4) /3529,4 -15
3000/0,853529,4
(1750-500)/500 250 Ou 3,5-12,5250
1750/5003,5
1,1-10,110
750x1,1825 Ou 750x(110)825
Dès que vous avez 3 termes dans la ligne, il y a
toujours 2 manières de calculer le dernier terme.
21Exercice 2 Taux de variation
- La population française est passé de 60 millions
d'habitants en 1999 à 64 millions d'habitants en
2008. Quelle a été l'évolution moyenne par an de
la population française entre 1999 et 2008 ? - Sur vos calculatrices, vous devez taper le nombre
d'unités temporelles (racine Xième), puis le
signe xv, et enfin le coefficient multiplicateur
entre parenthèse
22Exercices gtgtgt que savoir faire ?
- Vous devez pouvoir calculer toutes les relations
entre écart absolu, écart relatif, valeur de
départ, valeur d'arrivée, - On peut vous demander de calculer une évolution
moyenne par période de temps (par an par exemple)
gtgtgt cela renvoie au taux de variation moyen.
23- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n4 Notions d'attraction, de répulsion
entre deux variables qualitatives - Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
24Définitions
- Tableau de contingence tableau croisant deux
caractères d'une population (en ligne et en
colonne) - Effectif (et fréquence) partiel nombre (et
proportion) d'individus présentant à la fois une
modalité de la variable en ligne et une modalité
de la variable en colonne. Effectif de la case /
effectif total de la population - Fréquence conditionnelle proportion d'individus
présentant une modalité de la variable en colonne
(ou ligne), pour une ligne (ou colonne) définie.
Ex si on ne sélectionne que les filles, quelle
est la proportion de filles qui discutent de
politique avec leur famille ? Calcul effectif
de la case / effectif total de la ligne ou de la
colonne - Tableaux des pourcentages en ligne et en colonne
ce sont les deux tableaux des fréquences
conditionnelles. Le premier se calcule en ligne,
le second en colonne. - Effectif (et fréquence) marginal nombre (et
proportion) total d'individus présentant une
modalité de la variable en colonne (ou ligne),
quelle que soit la variable en ligne (ou
colonne). Dans les marges du tableau. En fait,
une fréquence marginale est aussi à la fois une
fréquence partielle et une fréquence
conditionnelle. - Attraction / répulsion l'attraction signifie
que deux modalités s'attirent, que leur
croisement apparaît plus souvent que d'autres
croisements du tableau. C'est l'inverse pour la
répulsion. Il y a attraction si une fréquence
conditionnelle est plus élevée que la fréquence
marginale. Il y a répulsion dans le cas inverse.
Ce calcul permet de repérer rapidement les
déséquilibres dans le tableau.
25Exemple - Eff. et fréq. partiels
Question Discutez-vous souvent de politique
avec votre famille ?
Modalités de la variable en colonne
En gras les effectifs et fréquences
partiels 24 221/908
Modalités de la variable en ligne
Effectifs (ou fréquence) marginaux de la variable
en ligne
Effectif total de la population
Effectifs (ou fréquence) marginaux de la variable
en colonne
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
26Exemple - Fréq. conditionnelles
- Fréquence conditionnelle si on ne sélectionne
que les filles, quelle est la proportion de
filles qui discutent de politique avec leur
famille ? - Pour calculer le tableau des en ligne, il faut
faire les calculs en ligne (39 221/567). Pour
le tableau des en colonne, il faut faire les
calculs en colonne (69221/320). - Les fréquences conditionelles sont dans deux
tableaux - Tableau des pourcentages en ligne
Tableau des pourcentages en colonne
Question Discutez-vous souvent de politique
avec votre famille ?
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
27Exemple - Attraction et répulsion
- Fréquence conditionnelle gt Fréquence marginale
gtgtgt Attraction () - Fréquence conditionnelle lt Fréquence marginale
gtgtgt Répulsion (-) - Il y a une attraction entre être une femme et
discuter souvent de politique avec sa
famille . On retrouve les mêmes attractions si
l'on part du tableau des pourcentages en ligne,
ou de celui en colonne. - Tableau des pourcentages en ligne
Attraction et répulsion pour les en ligne
Variable Discutez-vous souvent de politique
avec votre famille ?
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
28Exercice
- Calculer les fréquences partielles (pas
nécessaire pour repérer les attractions et
répulsions) - Calculer les fréquences conditionnelles
(c'est-à-dire les tableaux des pourcentages en
ligne et en colonne) - Repérer les attractions et répulsions dans ce
tableau - Tableau Nombre de diplômés selon le domaine
d'études et selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur
29Exercice fréquences partielles
- Tableau des fréquences partielles
- Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
30Exercice fréquences conditionnelles (1)
- Tableau des pourcentages en ligne
- Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
31Exercice fréquences conditionnelles (2)
- Tableau des pourcentages en colonne
- Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
32Exercice attraction et répulsion
- Tableau des attractions et des répulsions
- Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France - On peut donc dire qu'il y a une attraction entre
le fait d'être une femme et le fait d'être
diplômé dans la santé ou le social.
33Exercices gtgtgt que savoir faire ?
- On peut vous demander de calculer la proportion
d'une population particulière dans la population
totale (fréquence partielle), ou dans la
population totale de la ligne (tableau des
pourcentages en ligne) ou de la colonne (tableau
des pourcentages en colonne) - Pour calculer le tableau des pourcentages en
ligne, il faut faire les calculs en ligne. Pour
le tableau des pourcentages en colonne, il faut
faire les calculs en colonne. - Pour trouver des attractions et répulsions, vous
n'avez besoin de faire qu'un seul des deux
tableaux de pourcentages (en ligne ou en
colonne), car ils donnent les mêmes attractions
et répulsions. Vous n'avez pas besoin de calculer
les fréquences partielles.
34- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Point d'étape qu'avons-nous fait et
qu'allons-nous faire ? - Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
35Qu'avons-nous fait jusqu'à présent ?
- Des tableaux de répartition...
- Calculer des proportions de population
fréquences et fréquences cumulées - Calculer des variations dans le temps variation
moyenne ou variation sur toute la période
36Exemple 1
Diplôme le plus élevé parmi la population non
scolarisée de plus de 15 ans en
France
Source INSEE, recensement 2006, population
non scolarisée de plus de 15 ans.
37Exemple 2
Nombre d'étudiants (en milliers) selon l'année et
le type d'institution
Source Ministère de l'Education Nationale,
2007, Repères et Références Statistiques, p. 173
38Que faisons-nous désormais ?
- Des tableaux de contingence (croisement de
modalités en ligne et en colonne) - Repérer des attractions et des répulsions gtgtgt
y-a-t-il un lien entre deux modalités ? - Calculer le Khi deux gtgtgt y-a-t-il une corrélation
statistiquement significative entre les deux
variables ? - Calculer le V de Cramer et le Phi gtgtgt Quelle est
l'intensité de cette corrélation forte,
moyennement forte, faible, très faible ? - Calculer les PEM gtgtgt De quelles cases du tableau
(ou croisements de modalités) provient
l'intensité de cette corrélation ?
39Exemple
Réponse à la question Dans quelle mesure
êtes-vous daccord avec l'affirmation suivante ?
Les gens de mon pays ont la possibilité de
choisir leur propre vie. (échelle de 1 à
7) Sources Stellinger A.,
Wintrebert R., 2008, Les jeunesses face a
leur avenir. Une enquete
internationale, Fondation pour l'inn
ovation politique, p. 11. 1000 jeunes de chaque
pays. ?21112,29 ce qui signifie
(nous verrons pourquoi plus tard)
qu'il y a une corrélation significative à
plus de 95 entre la nationalité et le
fait qu'un individu pense que les
gens de son pays ont la possibilité
de choisir leur propre vie. V 0,37
donc l'intensité de la corrélation est
faible, c'est-à-dire que le lien
entre la nationalité et le fait qu'un individu
pense que les gens de son pays ont la
possibilité de choisir leur propre vie est
faible. Le PEM est très élevé pour les Etats-Unis
( 38,58 et 67,12), le Danemark ( 37,01 et
64,38) et le Japon ( 49,61 et 86,30). Ce sont
donc ces cases qui contribuent le plus à
l'intensité de ce lien Interprétation
sociologique la nationalité a une influence
très faible sur le niveau d'optimisme des jeunes.
Les cas déviants sont notamment le Danemark et
les Etats-Unis (très optimistes) et le Japon où
la jeunesse est quant à elle très pessimistes.
40- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n 5 Notion d'indépendance entre deux
variables qualitatives - Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
41Définitions
- Indépendance dans le cas où il n'y a ni
attraction ni répulsion, c'est-à-dire si les
fréquences conditionnelles sont égales à la
fréquence marginale. - Effectif théorique nombre d'individus dans la
situation d'indépendance. Calcul (effectifs
marginaux (somme) de la ligne x effectifs
marginaux (somme) de la colonne) / effectif
total de la population
42Effectifs théoriques (si indépendance)
- 35 des enquêtés répondent oui donc, s'il y
avait indépendance, 35 des filles devraient
répondre oui . - 62 des répondants sont des filles donc, s'il y
avait indépendance, 62 de ceux qui répondent
oui devraient être des filles.
Si les garçons et les filles discutaient autant
de politique avec leur famille, voici le tableau
théorique de données que nous aurions.
Calcul des eff. théoriques (effectifs marginaux
de la ligne x effectifs marginaux de la colonne)
/ effectif total
43Exemple - Effectifs théoriques
Calcul des eff. théoriques (effectifs marginaux
de la ligne x effectifs marginaux de la colonne)
/ effectif total On utilise donc les effectifs
marginaux réels pour calculer les effectifs
théoriques à l'intérieur du tableau.
44Exemple - Ecart à l'indépendance
- A ce stade, on pose l'hypothèse H0 qu'il y a
indépendance entre les variables. L'autre
hypothèse (H1) serait qu'il existe une
corrélation entre les variables. H0 est souvent
ce que l'on cherche à réfuter. - Ecart à l'indépendance
- Tableau des effectifs réels - Tableau des
effectifs théoriques
45Exercice
- Calculer les effectifs théoriques
- Calculer les écarts à l'indépendance
- Tableau Nombre de diplômés selon le domaine
d'études et selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
Effectif théorique pour les femmes et la santé
1632x284/2994 154,8 Ecart à l'indépendance
224 154,8 69,2
46Exercice effectifs théoriques
- Tableau Nombre de diplômés selon le domaine
d'études et selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
47Exercice écarts à l'indépendance
- Nombre diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
48- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n6 et 7 Test du ?2
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
49Définitions du Khi deux
- Le calcul du ?2 (écrit aussi Khi deux et prononcé
qui deux ) permet d'établir des corrélations
(pas des causalités) entre deux variables
nominales. - Le ?2 permet de valider que l'indépendance a une
signification statistique réelle et n'est pas due
au simple hasard. L'objectif est d'inférer
l'existence de caractéristiques constantes au
niveau de la population de référence.
50Règles d'utilisation
- Le Khi se calcule uniquement
- Pour deux variables nominales.
- Si plus de 20 des cases des effectifs théoriques
sont inférieures à 5. - Le Khi deux n'a pas d'utilité si
- On travaille sur un échantillon de grande taille
(car on sait que c'est significatif) - L'écart entre fréquences observées et théoriques
est faible (car on sait déjà que ce ne sera pas
significatif)
51Etapes du calcul du Khi deux
- Calcul Khi deux S(Eff. réels Eff.
théor.)²/Eff. théor. - Pour chacune des cases du tableau (sauf les
marges) les Khi deux partiels ou Khi deux par
case - Calculer les effectifs théoriques.
- Les retrancher aux effectifs réels (Eff. réels
Eff. théor.). - Mettre au carré chacun de ces nombres. (Eff.
réels Eff. théor.)² - Les diviser par les effectifs théoriques. (Eff.
réels Eff. théor.)²/Eff. théor. - Faire la somme de tous ces nombres.
- Remarque si le degré de liberté 1, alors le
calcul du Khi deux est légèrement différent, mais
la différence est très faible et nous en
resterons à ce calcul identique pour cette année.
52Exemple
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Mon avenir est prometteur. (échelle
de 1 (pas d'accord du tout) à 7) ?2
59,4371,304655,21 231,94 Sources Données
légèrement modifiées dans l'intérêt de
l'exercice. Stellinger A., Wintrebert R., 2008,
Les jeunesses face a leur avenir. Une enquete
internationale, Fondation pour l'innovation
politique, p. 8. 1000 jeunes Français et 1000
jeunes Danois de 16 à 29 ans.
53Exercice (1)
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7) Sources Stellinger
A., Wintrebert R., 2008, Les jeunesses face a
leur avenir. Une enquete internationale,
Fondation pour l'innovation politique, p. 11.
1000 jeunes de chaque pays.
Eff. théorique 2920x1000/8000 365 Khi deux
partiel (430-365)²/36511,58
54Exercice (2)
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7) ?21112,29 Sources
Stellinger A., Wintrebert R., 2008, Les jeunesses
face a leur avenir. Une enquete
internationale, Fondation pour
l'innovation politique, p. 11. 1000 jeunes de
chaque pays.
55- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n8 et 9 Les étapes de l'interprétation
du Khi deux - Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
56Etapes de l'interprétation du Khi deux
- Significativité du ?2 lire le nombre
correspondant dans le tableau du ?2 de Pearson,
et en déduire s'il existe un lien statistiquement
significatif. - Si significatif, intensité du lien calculer le
V de Cramer (V) ou le Phi (F). - Calcul du PEM pour préciser l'intensité de la
relation
57- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n8 Significativité et intensité du lien
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
58Définitions (1)
- Degré de liberté (ddl) il est égal à
(Nc-1)x(Nl-1) avec Nc le nombre de modalités de
la variable en colonne et Nl le nombre de
modalités de la variable en ligne. Sert dans le
calcul puis l'interprétation du Khi deux. - Tableau de Pearson tableau de valeurs (que vous
n'avez pas à apprendre !! Il vous sera donné en
annexe à l'examen) qui permet d'analyser la
significativité de l'indépendance des deux
variables. Il met en relation la valeur du Khi
deux avec le degré de liberté (plus il y a de
cases dans un tableau, plus le Khi deux est
automatiquement élevé) et le coefficient a qui
est le seuil de risque (plus il est faible, plus
la probabilité que la relation soit significative
est élevé on prend habituellement a0,05, qui
correspond à une probabilité de 95). - Si Khi deux global gt Khi deux théorique alors la
relation est statistiquement significative à XX - On distingue les Khi deux partiels ou par cas
(ceux dans chacune des cases) et le Khi deux
global (la somme de tous les Khi deux partiels ou
par case).
59Définitions (2)
- V de Cramer (V) indicateur statistique mesurant
l'intensité du lien entre deux variables
qualitatives pour les tableaux avec ddlgt1. Calcul
v(?2/(Nx(k-1))) où ?2 est le Khi deux, N la
taille de l'échantillon et k le nombre de
modalités de la variable qui en a le moins. - Phi (F) indicateur statistique mesurant
l'intensité du lien entre deux variables
qualitatives pour les tableaux avec ddl1. Calcul
v(?2/N) où ?2 est le Khi deux, N la taille de
l'échantillon. Le Phi n'est qu'un cas particulier
du V de Cramer (si k2). - Ces deux indicateurs sont des coefficients de
corrélations. Ils sont compris entre 0 et 1. Plus
la valeur se rapproche de 0, plus le lien
statistique entre les deux variables est nul.
Plus la valeur se rapproche de 1, plus le lien
statistique entre les deux variables est élevés. - Il faut donc retenir l'interprétation suivante
60Exemple (1)
Tableau des Khi deux partiels Réponse à la
question Dans quelle mesure êtes-vous daccord
avec l'affirmation suivante ? Mon avenir est
prometteur. (échelle de 1 à 7) ?2
59,4371,304655,21 231,94 Sources Données
légèrement modifiées dans l'intérêt de
l'exercice. Stellinger A., Wintrebert R., 2008,
Les jeunesses face a leur avenir. Une enquete
internationale, Fondation pour l'innovation
politique, p. 8. 1000 jeunes Français et 1000
jeunes Danois de 16 à 29 ans.
61Exemple (2) significativité et intensité du lien
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Mon avenir est prometteur (échelle de
1 à 7 deux modalités entre 1 et 5 puis 6 et
7) ?2231,94 Degré de liberté 2 colonnes et
2 lignes donc ddl (2-1) x (2-1) 1
Significativité Il y a une corrélation
statistiquement significative à plus de 95 (car
231,94gt3,84) (et même à plus de 99,9 car
231,94gt10,83) entre sa nationalité et le fait de
penser que mon avenir est prometteur ou
non. Intensité F v(?2/N) v(231,94/2200)
0,32. Donc l'intensité du lien entre ces deux
variables est faible.
62Exercice (1)
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7) ?21112,29 Sources
Stellinger A., Wintrebert R., 2008, Les jeunesses
face a leur avenir. Une enquete
internationale, Fondation pour
l'innovation politique, p. 11. 1000 jeunes de
chaque pays.
63Exercice (2) significativité et intensité du
lien
Tableau Réponse à la question Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7 (échelle de 1 à 7 deux modalités
entre 1 et 5 puis 6 et 7) ?21112,29 Degré de
liberté 2 colonnes et 8 lignes donc ddl (2-1)
x (8-1) 7 a0,05 Il y a une corrélation
significative à plus de 95 (car 1112,29gt14,07)
(et même à plus de 99,9 car 1112,29gt24,32) entre
sa nationalité et le faire de penser que les gens
de mon pays ont la possibilité de choisir leur
propre vie. V v(?2/(Nx(k-1)))
v(1112,29/(8000x(2-1))) 0,37. Donc l'intensité
du lien entre ces deux variables est faible.
64Exercices gtgtgt que savoir faire ?
- On peut vous demander de dire si deux variables
sont corrélées de façon statistiquement
significative - Repérer ou calculer le Khi deux
- Calculer le ddl (degré de liberté)
- Repérer le seuil de risque
- Comparer le Khi deux au chiffre dans le tableau
de Pearson - En déduire la significativité
- On peut vous demander l'intensité de la relation
- Vous avez déjà calculé le ddl avant
- Si ddl 1 gtgtgt Calcul de Phi
- Si ddl gt 1 gtgtgt Calcul de V de Cramer
- En déduire l'intensité à partir du tableau de
correspondance des valeurs de Phi et de V de
Cramer.
65Corrigé Séance 6 Ex. 1 (1)
Question 1 1) 103/114 92,0 gtgtgt 92,0 des
lycéens interrogés à Marseille supportent
l'équipe de Marseille 2) 103/151 68,2 gtgtgtgt
68,2 des supporters de Marseille interrogés
habitent à Marseille.
66Corrigé Séance 6 Ex. 1 (2)
Question 2 Tableaux des Khi deux
partiel Khi deux 311,31 et ddl
(3-1)x(3-1) 4 D'après la lecture dans le
tableau de Pearson, les variables Habitant de
la ville et Supporter de l'équipe de la
ville sont corrélées de manière statistiquement
significative à 95 (car 311,31gt9,488) et même à
99,9 (car 311,31gt18,467).
67Corrigé Séance 6 Ex. 1 (3)
Question 3 On utilise le V de Cramer car
ddlgt1. k 3 N 331 ?2 311,31 V
v(311,31/(331x(3-1))) v(311,31/662) 0,69 Le
lien statistique entre les deux variables est
d'une force moyenne. Question 4 Il existe un
lien entre le fait d'habiter une ville et le fait
de supporter l'équipe de cette ville. Cette
relation est assez forte dans l'ensemble. On peut
supposer qu'au-delà de l'attachement d'un lycéen
à l'équipe de sa ville, il existe aussi une
pression à la conformité chez les lycéens, qui se
doivent de supporter l'équipe préférée du goupe
de pairs.
68Corrigé Séance 6 Ex. 2 (1)
Question 1 Tableaux des Khi deux
partiels Khi deux 947,1 et ddl
(2-1)x(2-1) 1 Il existe une relation
statistiquement significative entre la situation
électorale de départ des candidats et leur
performance électorale à 95 (car 947,1gt3,841) et
même à 99,9 (car 947,1gt10,827).
69Corrigé Séance 6 Ex. 2 (2)
Question 2 ?2 701,7 et ddl (2-1)x(2-1)
1 Il existe une relation statistiquement
significative entre la situation électorale de
départ des candidats et leur profil à 95 (car
701,7gt3,841) et même à 99,9 (car
701,7gt10,827). Question 3 Les deux tableaux
montrent des relations statistiquement
significatives. Le premier tableau montre que les
candidats sortants sont beaucoup plus souvent
élus que les candidats non sortants. Or le
tableau 2 montre qu'il existe un lien entre le
fait d'être un professionnel ou un notable et le
fait d'être un sortant à une élection. Il y
aurait presque ainsi deux expériences distinctes
de la politique celle des professionnels et
notables, beaucoup plus souvent élus et sortants
et celle des autonomes et militants, souvent
battus, et moins souvent sortants. En quelque
sorte, l'élection fait probablement passer les
militants et les autonomes à un nouveau statut
pour l'élection suivante, celle de notable et de
professionnel de la politique, avec une certaine
institutionnalisation de leur candidature
(soutiens d'un parti, d'associations, etc.). Les
deux tableaux posent aussi la question du rôle du
financement dans le monde politique faut-il
être bien financé pour avoir une chance d'être
élu ?
70- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Cours n9 Calcul du PEM
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
71Définition PEM
- Cas déviant en statistiques, c'est un cas qui
s'éloigne beaucoup de la moyenne. - PEM (Pourcentage de l'écart maximum) c'est un
indice simple de liaison entre deux variables
d'un tableau de contingence. Plus le pourcentage
est élevé, plus la liaison est forte. En clair,
il permet de calculer l'intensité de la relation
d'un tableau, mais il est plus précis que le Phi
ou le V de Cramer, et permet ainsi de conclure
précisément sur l'intensité de la variable. - Calcul des PEM
- Somme des écarts positifs de la situation réelle/
somme des écarts positifs de la situation
maximale - Etapes du calcul
- Calculer le tableau des attractions (peut-être
déjà fait dans l'exercice précédent) - Calculer le tableau des écarts à l'indépendance
(effectifs réels effectifs théoriques) - Calculer le tableau des effectifs de dépendance
maximum - Calculer le tableau des écarts à l'indépendance
maximale (effectifs de dépendance max effectifs
théoriques) - Faire la somme des écarts positifs de la
situation réelle. Et les diviser par la somme des
écarts positifs de la situation maximale. - Interprétation du PEM
- en dessous de 5 les PEM correspondent à des
attractions et répulsions en général
négligeables, - que 10 constitue un seuil au-dessus, les PEM
sont en général intéressants, entre 5 et 10,
les liaisons peuvent lêtre ou non, - que des liaisons supérieures à 50 sont
exceptionnelles et manifestent souvent quon a
affaire à deux indicateurs dun même phénomène.
72Exemple PEM (1)
- D'abord le tableau des attractions et des
répulsions - Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
73Exemple PEM (2)
- Puis le tableau des effectifs théoriques
- Tableau Nombre de diplômés selon le domaine
d'études et selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
74Exemple PEM (3)
- Puis le tableau des écarts à l'indépendance
- Nombre diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France - La somme des écarts positifs à l'indépendance est
533,7.
75Exemple PEM (4)
- Puis le tableau des effectifs de dépendance
maximum suivez les étapes pour le calculer - Il faut partir d'une des cases dans un coin du
tableau (disons en haut à droite) et entrer le
nombre maximum d'individus possibles (qui
correspond au minimum du total en ligne et total
en colonne). - Tableau Nombre de diplômés selon le domaine
d'études et selon le sexe
76Exemple PEM (5)
- Puis le tableau des écarts à l'indépendance
maximale - Nombre diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France - La somme des écarts positifs à l'indépendance
maximale est 1367,5. - Donc PEM 533,7/1367,5 39,03 gtgtgt Le lien
entre les deux variables est donc relativement
fort.
77- Licence 1ère année Sociologie
- TD de Méthodes quantitatives
- Conseils pour l'examen
- Nicolas Charles
- nicolas.charles_at_u-bordeaux2.fr
78Que faire pendant l'examen ?
- Comprendre l'énoncé repérer la population,
l'échantillon, le caractère étudié, mais aussi la
nature de la variable. Ne pas lire trop
rapidement... - Comprendre le type de calculs à faire repérer
dans les questions et le tableau s'il s'agit de
données chronologiques, de notion d'indépendance,
de test du Khi deux, etc. - Utiliser correctement sa calculatrice vérifier
deux fois d'avoir bien taper les bons chiffres
sur sa calculatrice, ne pas se tromper dans les
arrondis, ne pas oublier les parenthèses. - Avoir un regard critique sur son travail se
relire, repérer les résultats incongrus (erreur
d'échelle, etc.), limiter les pattes de
mouche , bien réfléchir à l'analyse sociologique
que vous portez. - Ne pas abandonner l'exercice si vous n'y arrivez
pas lire les questions suivantes (ça vous
donnera des idées) et revenir à l'exercice en fin
de devoir.
79Comment répondre ?
- Ecrire lisiblement et dans un français correct.
- Lire l'énoncé proportion ou fréquence gtgtgt ou
décimal ? - Mettre le bon nombre de chiffres après la
virgule. - Faîtes ce que l'on vous demande un tableau
nécessite de faire un tableau... - Détailler vos calculs. Pour les tableaux,
détailler une première case, puis mettre
uniquement le résultat dans les autres cases.
80A quoi savoir répondre ?
- Reconnaître les 4 types de variable.
- Calculer une proportion / fréquence, et une
fréquence cumulée (dé)croissante. - Calculer un écart absolu, un écart relatif et un
coefficient multiplicateur. - Calculer une variation dans le temps, y compris
un taux de variation moyen. - Calculer un tableau des attractions / répulsions,
un Khi deux, un V de Cramer, un Phi, un
pourcentage de l'écart maximal (PEM). - Faire un tableau des effectifs théoriques, un
tableau des écarts à l'indépendance. - Montrer qu'il existe ou pas une relation
statistiquement significative entre deux
variables qualitatives (Khi deux), et si oui, en
calculer l'intensité du lien (V de Cramer et
Phi), calculer le PEM. - Interpréter sociologiquement vos résultats.
81Comment présenter les tableaux ?
- Mettre les détails dans les premières cases des
tableaux. - Ecrire des légendes pour vos calculs si vous
écrivez plusieurs résultats dans un même tableau
(eff. Théorique, écarts à l'indépendance, Khi
deux partiels, etc.)
82Exemple de présentation pour l'examen (1)
- Tableau des pourcentages en ligne
- Nombre de diplômés selon le domaine d'études et
selon le sexe - Sources Enquête Formation et Qualification
Professionnelle 2003, 26-35 ans, diplômés du
supérieur, France
83Exemple de présentation pour l'examen (2)
Tableau du Khi deux Réponse à la question
Dans quelle mesure êtes-vous daccord avec
l'affirmation suivante ? Les gens de mon pays
ont la possibilité de choisir leur propre vie.
(échelle de 1 à 7) ?2151,3164,4515,41
49,9311,58271,8530,216,6586,9795,538,8628,
76,65156,2617,36 1112,29