Title: Chapitre 6
1Chapitre 6
- Différentier les diverses méthodes
d'échantillonnage.
- Estimer une moyenne ou un pourcentage d'une
population à partir de la moyenne ou du
pourcentage d'un échantillon
2Sondage ?
- La grandeur de la population.
- Le temps.
- L'impossibilité de cerner la population.
- Le fait qu'un recensement peut s'avérer
destructif.
3Historique
- En 1896, le journal de Chigago The Record)
premier sondage scientifique - G.H. Gallup (1901-1984) fit sa thèse de doctorat
sur les théories de l'échantillonnage. - Au Québec CROP, SORÉCOM et IQOP
4Méthodes d'échantillonnage probabiliste
- Échantillonnage aléatoire simple
Chaque unité de la population a une probabilité
mesurable d'être choisie
5Méthodes d'échantillonnage probabiliste
- Échantillonnage systématique
On prélève de façon systématique chaque ke unité
de la liste de la population. k pas du sondage
6Méthodes d'échantillonnage probabiliste
- Échantillonnage stratifié
On subdivise la population en sous-groupes
homogènes, ou strates, à partir d'un ou plusieurs
critères sexe, langue, province, ville,
etc. Chaque strate est représentée dans
l'échantillon proportionnellement à son
importance dans la population.
7Méthodes d'échantillonnage probabiliste
- Échantillonnage par grappes
Lorsque la population se subdivise physiquement,
géographiquement en groupes homogènes, classes
d'étudiants, blocs appartements, quartier
résidentielle, etc.
8Méthodes d'échantillonnage non probabiliste
- Échantillonnage à l'aveuglette ou accidentel.
- Échantillonnage de volontaires
- Échantillonnage par quota
Il consiste à choisir les unités de l'échantillon
de façon arbitraire.
Il consiste à choisir les individus de
l'échantillon en faisant appel à des volontaires.
Similaire à l'échantillonnage stratifié mais sans
le choix aléatoire des individus.
9Rappel sur les notations
n taille (nombre d'unités statistiques)
µ moyenne de la variable étudiée
? moyenne de la variable étudiée
?2 variance de la variable étudiée
s2 variance corrigée de la variable étudiée
s écart type corrigé de la variable étudiée
? l'écart type de la variable étudiée
10Schéma population-échantillon
Population
Échantillon
X variable étudiée
µ ? N
? s n
11Les lois du hasard pour une moyenne d'échantillon
Population de 907 chefs de ménage
Échantillon de 60 chefs de ménage
X Âge
µ 44,5 ans ? 12,9 ans N 907
? ? ans s inconnu n 60
12Série de moyennes d'âge de 145 échantillons de 60
individus
13Répartition des 145 échantillons selon la moyenne
d'âge des 60 chefs de ménage
Quelles sont les chances que ? se situe à au plus
1,5 ans de µ ?
P(44,5 1,5 ? ? ? 44,5 1,5) P(43 ans ? ? ?
46 ans)
22,8 24,1 20
66,9
Un étudiant
avait donc près de
2 chances sur 3 de piger un
échantillon dont la moyenne d'âge ? se situe à au
plus 1,5 an de la moyenne d'âge µ de la
population.
14 Courbe normale
Répartition des 145 échantillons selon la moyenne
d'âge des 60 chefs de ménage
Nb d'échantillons
44,5
Moyenne d'âge ?
Les deux schémas se ressemblent comme deux
jumeaux presque identiques.
15Un schéma qui résume
Population µ et ?
Échantillon1 ?1 s1
Échantillon2 ?2 s2
Échantillon3 ?3 s3
Échantillon k ?k sk
16Théorème central limite Conditions d'application
- La population suit une loi normale
ou
- La taille de l'échantillon n est supérieure ou
égale à 30.
17Théorème central limiteÉnoncé
- Si, d'une population de taille N, de moyenne µ et
d'écart type ?, on prélève au hasard un
échantillon de taille n, la distribution des
valeurs possibles pour ? suit une loi normale et
a alors les caractéristiques suivantes - Sa moyenne µ? est égale à la moyenne µ de la
population µ? µ - Son écart type est
18Distribution des valeurs possibles pour une
moyenne d'échantillon ?
n taille (nombre d'unités statistiques)
Taille en générale grande.
µ moyenne de la variable étudiée
? moyenne de la variable étudiée
? l'écart type de la variable étudiée
s écart type corrigé de la variable étudiée
19Retour à l'exemple de l'âge des chefs de familles
La taille de nos échantillons sont de 60 gt 30 la
seconde condition est satisfaite. La
distribution des moyennes d'échantillons obéira
sagement à une loi normale.
Nous avions les paramètres suivants pour la
population
Pour la distribution des moyennes d'échantillons ?
La moyenne µ 44,5 ans
µ?
µ 44,5 ans
L'écart type ? 12,9 ans
??
1,6
La taille de la population N 907 lt 20 n 20 x
60
20Peut-on prédire la plus petite et la plus grande
valeur que la hasard peut donner pour ? ?
Pour une distribution normale, tout le monde sait
que 99,7 des individus se trouvent à moins de 3
écarts types de la moyenne.
La plus petite moyenne d'échantillon sera alors
?min ?
44,5 ans 3 x 1,6 ans
39,7 ans
La plus grande moyenne d'échantillon sera alors
?max ?
44,5 ans 3 x 1,6 ans
49,3 ans
21Autres beaux exemples
22Estimation de la moyenne de la population
recherche d'un intervalle de confiance.
Conditions
La distribution des moyennes d'échantillons obéit
sagement à une loi normale.
La moyenne de la population est inconnue.
L'écart type de la population connu.
La moyenne d'un échantillon connue.
Un pourcentage d'échantillons dont leurs moyennes
se trouvent près de la moyenne de la population
est fixé disons 95
23Valeurs possibles pour ?
95
E
µ
?
Zone pour 95 des valeurs possibles de ?
24Cas où ? est à droite de µ
47,5 95/2
E
? - E
µ
µ E
?
Zone pour 95 des valeurs possibles de ?
P(µ lt ? lt µ E) 47,5
P(? - E lt µ )
25Cas où ? est à gauche de µ
47,5 95/2
E
? E
µ
?
µ - E
Zone pour 95 des valeurs possibles de ?
P(µ - E lt ? lt µ) 47,5
P(µ lt ? E)
26Combinons les deux résultats
P(? - E lt µ ) 47,5
P(µ lt ? E)
P(? - E lt µ lt ? E) 95
Interprétation Nous avons 95 des chances que la
moyenne de la population µ soit située entre ? -
E et ? E.
Il ne nous reste qu'à trouver la valeur de E puis
nous seront heureux et heureuses.
27Taille de l'échantillon pour estimer une moyenne
µ
?
Exemple
28Estimation d'un pourcentage d'une population
- Distribution des valeurs possibles pour un
pourcentage d'échantillon
29Théorème central limite pour un pourcentage
- Conditions d'application
- n ? 30
- np ? 500
- n(100 p) ? 500
30Théorème central limite pour un pourcentage
énoncé
- Si, d'une population ayant un pourcentage de p
unités statistiques possédant une même
caractéristique, alors la distribution des
valeurs possibles pour (pourcentage d'unités
d'un échantillon de taille n ayant cette
caractéristique) suit les règles suivantes
31Théorème central limite pour un pourcentage
énoncé
- La moyenne des est égale à p
- L'écart type des est égal à
Exemple
32Estimation d'un pourcentage par intervalle de
confiance Démarche
Déterminer l'écart type de la distribution
des valeurs possibles pour
Calculer la marge d'erreur associée au niveau de
confiance considéré
Construire et interpréter l'intervalle de
confiance
33Estimation d'un pourcentage par intervalle de
confiance Remarque
Comme nous voulons un estimation de p, ce qui
signifie qu'il est inconnu. Dans ce cas nous
calculerons l'écart type comme suit
Exemple
34Choix de la taille de l'échantillon
Représentation graphique de l'expression p(100
p)
On voit que si p 50, on obtient la plus grande
valeur pour l'expression. Alors l'expression
sera maximale lorsque p 50. Pour toute autre
valeur de p, la marge d'erreur sera plus petite.
Exemple