Title: Statistique, Chapitre 1 Echantillonnage et notions de statistique descriptive
1Statistique, Chapitre 1Echantillonnage et
notions de statistique descriptive
- 1.1 Population, Echantillon, Statistique
- 1.2 Notions de Statistique Descriptive
21.1 Population, Echantillon, Statistique
- Exemple 1.1
- Une usine reçoit un lot de N pièces. Avant de
l'accepter, elle veut en vérifier la qualité.
Pour ce faire, elle prélève n3 pièces du lot et
par un procédé de vérification destructif, elle
en trouve une défectueuse (x1). Que doit faire
l'usine? Accepter ou Refuser? - Accepter néanmoins le lot c'est courir le risque
que le lot contienne d'autres pièces défectueuses
et qu'à terme, sa propre production soit rejetée. - Refuser le lot c'est courir le risque de manquer
de pièces alors que les pièces restantes sont
bonnes. Comme le procédé de vérification est
destructif, on ne peut les vérifier toutes. - Besoin Règles de décision logiques qui limitent
simultanément les deux risques.
?
3Définition 1.1 Population
- On appelle population, l'ensemble de toutes les
observations que l'on peut faire relativement à
une v.a. (ou à un ve.a.). - ISO 3534-1 Population Totalité des individus
pris en considération. Note - Dans le cadre
d'une variable aléatoire, la loi de probabilité
est considérée comme définissant la population de
cette variable.
4Définition 1.2 Echantillon
- On appelle échantillon de taille n, tout ensemble
de n observations faites sur une population. - ISO 3534-1 Echantillon Une ou plusieurs unités
d'échantillonnage prélevées dans une population
destinées à fournir des informations sur cette
population.
n
5Définition 1.2 Echantillon aléatoire simple
- On appelle échantillon aléatoire simple de taille
n, tout ensemble de n v.a. indépendantes
X1,X2,... ,Xn ayant même loi de probabilité que
la v.a. de la population à laquelle on
s'intéresse (v.a. i.i.d.). La même définition est
valable pour des ve.a. - ISO 3534-1 Echantillon simple au hasard
Echantillon de n unités d'échantillonnage prélevé
dans une population de façon que toutes les
combinaisons possibles de n unités
d'échantillonnage aient la même probabilité
d'être prélevées.
n
6Définition 1.3 Réalisation dun échantillon
- On appelle réalisation x1,x2,... ,x d'un
échantillon X1,X2,... Xn les valeurs réellement
observées dans l'expérience
n
7Définition 1.5. Statistique
- On appelle statistique T toute v.a. qui est une
fonction des observations de l'échantillon
X1,X2,... Xn. - ISO 3534-1 Fonction de variables aléatoires
d'échantillons. Note - Une statistique, en tant
que fonction de variables aléatoires est
également une variable aléatoire, et comme telle
elle admet différentes valeurs selon les
échantillons. La valeur de la statistique obtenue
en utilisant les résultats d'essai dans cette
fonction peut être utilisé dans le cadre d'un
test statistique ou comme estimation d'un
paramètre d'une population tel que la moyenne ou
l'écart-type.
n
8Définition 1.6. Distribution d Echantillonnage
- On appelle distribution d'échantillonnage la loi
de probabilité d'une statistique. - Exemple FXN(m,s2)
- Echantillon Xi iid N(m,s) i1,..,n
- Statistique T(X1,,Xn)(X1Xn)/n
- Distribution d échantillonnage
- FTN(m, s2/n)
- Utilité on si n est grand on peut prédire qu une
réalisation t sera près de m. Donc on peut
utiliser t pour estimer m.
n
91.2 Statistique Descriptive
- Graphiques pour découvrir
- Chronologie
- Morphologie, Répartition
- Position, DispersionRègle, Exception
10Chronologie
Mêmes histogrammes
Évolutions différentes
11Exemple Qualité dembryons en FIVETE
- Rater une évolution chronologique peut avoir des
conséquences tragiques.
12Position, morphologie Points, histogramme,
répartition, boîte et moustaches
13Lhistogramme
- Règles de construction
- superficiefréquence
- observations sur la division de deux intervalles
appartiennent à lintervalle supérieure - données entièresBon si utiliser comme bornes
des .5 - nombre dintervalles
14La fonction de répartition (empirique)
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
495
505
510
500
15Diagramme en boîtes et moustaches, version
simplifiée
75
50
25
max
min
p75
p25
médiane (p50)
495
505
510
500
16Diagramme en boîtes version commerciale
5000
max. non aberrant
4000
p75
poids à la naissance
3000
médiane
iqr
p25
2000
min. non aberrant
1000
1.5 iqr
observation suspecte
0
Moustaches jusquau quartile /- 1.5IQR ou le
max/min selon lequel est atteint le premier
17Les Cinq Règles de la Présentation de Données
- Simplicité
-
- Fidélité
- Sobriété
- Honnêteté
- et la Poupée Russe
18Encore quelques suggestions
- Quand vous analysez des données, surtout avant
nimporte quelle analyse statistique, faites des
graphiques et tables - graphiques temporels sil y a un ordre
chronologique - ajoutez de la valeur à vos graphiques
- si vous montrez un diagramme en x-y et vous avez
encore une variable qualitative importante,
ajoutez la avec des symboles - faites des comparaisons avec des graphiques
catégorisés (mêmes échelles, rapprochés) - minimisez lencre consacré aux embellissements
(cadres, grilles, canvas des bâtons) utilisez
lencre pour montrer vos données - lisez et interprétez des graphiques et tables
avec soin, notez ce que vous voyez, ce qui est
attendu, ce qui est inattendu - séparez les tendances générales des exceptions