Title: chantillonnage STT2000
1Échantillonnage (STT-2000)
- Section 2
- Méthodes déchantillonnage.
Version 22 août 2003
2Population, base de sondage, échantillon
- On dispose dune population de taille finie N.
- Notation U 1,2,,k,,N.
- Lindice k identificateur de lunité k.
- Variable dintérêt y
- Salaire yk 40 500 salaire de lunité k.
- Étude sur le chômage
- yk 1 si chômeur, yk 0 sinon.
3Paramètres de la population
- Total
- Moyenne
- Variance
- Dautres quantités sont possibles médiane de la
population, quantile, etc.
4Convention pour le symbole
- Soit A un sous ensemble dunités,
- On écrira pour le total de y de A
- On écrit et
5Échantillon
- Un échantillon s est un sous-ensemble de U.
- Il existe un nombre fini déchantillons, mais le
nombre possible peut être très grand. - Nombre total déchantillons?
6- Dans un sondage, on tire un échantillon s et on
observe les unités - Si la variable dintérêt est y, on observe alors
- Échantillon probabiliste Cest un échantillon
réalisé par un mécanisme aléatoire quon appelle
un plan déchantillonnage. - Plan déchantillonnage règles strictes, qui une
fois mises en applications, nous donnent
léchantillon. - On requiert que la probabilité dêtre inclus dans
léchantillon s est gt 0, et ce
7Échantillon représentatif
- Un échantillon a pour but de représenter la
population, donc être représentatif. - En quelque sorte, léchantillon est un modèle
pour la population. - Il nest pas possible de déterminer si un
échantillon est représentatif ou non. - Un bon plan déchantillonnage peut cependant
contribuer à éliminer des échantillons non
représentatifs.
8Échantillonnage probabiliste
- Tirage aléatoire simple avec remise
- Tirage aléatoire simple sans remise (chaque
échantillon de taille n (n est fournie) possède
les mêmes chances de survenir) - Tirage de Bernouilli
- Tirage stratifié simple
- Tirage systématique
- Tirage en grappes
- Tirage à plusieurs degrés
9Exemples de sondages probabilistes
- Dans une étude de marketing, on désire sonder les
ménages de la ville de Montréal. - On suppose que lon dispose dune liste de 1 à M
des unités géographiques sur une carte (remarque
on parle de sondages aréolaires). - On tire un échantillon au hasard dunités
géographiques. - Dans chaque unité géographique, sélectionner et
observer tous ou une partie des ménages.
10Île de Montréal(frontières des strates)source
François Brisebois, Statistique Canada
11- Partie de la strate 46236
- (frontières des grappes)
12Exemple (suite)
- Sondages de grappes et sondages à deux degrés
- Sondages de grappes Si on observe tous les
ménages dans les unités géographiques
sélectionnées. - Sondages à deux degrés Si on observe un
sous-ensemble des ménages dans les unités
géographiques sélectionnées. On parle
déchantillonnage (premier degré les grappes)
suivit de sous-échantillonnage (second degré les
ménages).
13Base de sondage
- Liste de N unités de la population.
- Dans léchantillonnage probabiliste, chaque unité
a une chance positive dêtre dans léchantillon. - Idéalement on possède une base de sondage ou
encore on en construit une. - Sinon, on peut construire des grappes avec laide
dune carte géographique et observer tous les
ménages dans les grappes choisies
échantillonnage de grappes permet de contourner
les problèmes lorsquil ny a pas de base de
sondage.
14Exemple dune base de sondage population MU284
(SSW, Appendice B, p. 652
15Base de sondage (suite)
- Dans lexemple précédent, la variable P85 est
inconnue et veut faire un sondage pour estimer le
total de la population. - Les autres variables sont des variables
auxiliaires qui sont utiles au niveau de la - Conception dun sondage Construction
destimateurs - Variables auxiliaires quantitatives P75, RMT85,
CS82, - Variables auxiliaires qualitatives REG, CL
16Stade destimation et analyse
- Taille de léchantillon
- Moyenne échantillonnale
- Variance échantillonnale
17Utilisation de la moyenne échantillonnale
- Les propriétés statistiques de cette quantité
dépendent du plan déchantillonnage. - Pour le tirage aléatoire simple, on sait que
- Propriété dabsence de biais, de la moyenne
échantillonnale, sous le tirage aléatoire simple.
18Biais
- Pour tirage aléatoire simple, la moyenne de
sur tous les s égale la moyenne de la
population, - Biais dun estimateur
- Biais positif en moyenne, les estimateurs
excèdent la véritable valeur du paramètre. - Biais négatif en moyenne, les estimateurs sont
inférieurs à la véritable valeur du paramètre.