Title: Plan du cours
1Plan du cours
- Introduction
- Statistique descriptive
- Echantillonnage
- Calcul des probabilités et variables aléatoires
- Inférence statistique
- Estimation
- Tests dhypothèses
- Régression linéaire
2Inférence
- Un premier cas Moyenne dans une population
- Variable distribution dans la population.
- Exemple
- Budget annuel transport dun étudiant ULCO.
- Budget annuel moyen ?
- Echantillon prélevé dans la population
(échantillon aléatoire). - Moyenne de léchantillon.
- Erreur déchantillonnage ?
- Distribution déchantillonnage.
3Distribution déchantillonnage
- Exemple
- Expérience aléatoire lancer dun dé.
- Population (infinie) résultats de lancers du
dé. - Variable aléatoire X points obtenus.
- Distribution de probabilité de X
4Distribution de la population
- Normalement inconnue !
- Moyenne population
- Variance population
- Ecart-type population
5Problème
- Supposons ? inconnue.
- Comment estimer la valeur de ? à partir dun
échantillon ? - Exemple échantillon de 2 lancers de dé.
- n 2
- Calculer la moyenne échantillon
- Ecart entre et m ?
6Distribution déchantillonnage
- En fonction de tous les échantillons
possibles(échantillon aléatoire simple n
fixé). - 36 échantillons possibles (même probabilité pour
chacun)
7Distribution déchantillonnage
- Pour la moyenne échantillon
8Distribution déchantillonnage
- Paramètres de la distribution déchantillonnage
pourn 2
9Distribution déchantillonnage
1
2
- Théorème central limite Plus n est grand, plus
la distribution déchantillonnage se rapproche de
celle dune v.a. normale !
3
4
10Distribution déchantillonnage et inférence
- Estimation dun paramètre.
- Test dune hypothèse.
11Distribution déchantillonnage pour une proportion
- Population proportion p dindividus ayant une
certaine caractéristique. - Problème p est inconnue !
- Echantillon de n individus
- X présentent la caractéristique parmi les n.
- Estimation de p
- Distribution déchantillonnage de X
12Inférence statistique
Individu
Population Paramètres
Distribution
Distribution déchantillonnage
Statistique
Distribution déchantillonnage
13Plan du cours
- Introduction
- Statistique descriptive
- Echantillonnage
- Calcul des probabilités et variables aléatoires
- Inférence statistique
- Estimation
- Tests dhypothèses
- Régression linéaire
14Estimation
- Quelle est la valeur dun paramètre population ?
- Utilisation dune statistique provenant dun
échantillon. - Estimation ponctuelle
- Calcul dune valeur unique (estimateur).
- Estimation intervalle
- Calcul dun intervalle, prenant en compte
lerreur déchantillonnage (intervalle de
confiance).
15Propriétés des estimateurs
- Non biais
- Si lespérance de lestimateur est égale au
paramètre population. - Convergence
- Si lerreur déchantillonnage tend vers 0 lorsque
la taille de léchantillon augmente. - Efficacité
- Si lestimateur est de variance minimum
(distribution déchantillonnage).
16Estimation dune moyenne
- On étudie une variable définie sur une population
X - Distribution de X m et s
- On suppose m inconnue (et s connu).
- Echantillon aléatoire simple de n observations.
- Estimateur moyenne échantillon
17Distribution échantillonnée de la moyenne
échantillon
- Normale si la distribution de X est normale.
- Approximativement normale si n est suffisamment
grand (n 30). - Variable normale réduite
18Quantiles de la normale réduite
19Quantiles de la normale réduite
20Intervalle de confiance pour m
21Intervalle de confiance pour m
- Intervalle de confiance au niveau de confiance
1?a - Largeur de lintervalle
- Diminue lorsque n grandit,
- Augmente avec s,
- Diminue lorsque a grandit.
22Exemple lancer dun dé.
- On lance 100 fois un dé (n100).
- On connait s1,71
- On observe
- Intervalle de confiance pour m au niveau de
confiance 95 (a0,05)
23Si s est inconnu !
- Si n est grand (n 30), on remplace s par s
(approximation). - Si n est petit et si la distribution de X est
normale, on a Et lintervalle de confiance
pour m est
24Exemple
- On sintéresse au poids de paniers de pommes.
- Un échantillon de 12 paniers donne une moyenne de
738 g et un écart-type de 124 g. - Trouver un intervalle de confiance, aux niveaux
95 et 99, pour le poids moyen des paniers de
pommes.
25Exemple
- Données
- Supposition poids distribué normalement.
- Intervalle de confiance
26Estimation dune proportion
- On sintéresse à une caractéristique présente sur
une proportion p des individus de la population
étudiée. - La proportion p est inconnue.
- Echantillon aléatoire simple de n observations.
- Soit X le nombre dobservations présentant la
caractéristique, et
27Distributions échantillonnées
- Distribution exacte de X
- Distribution approchée normale pour un grand
échantillon
28Intervalle de confiance
- Pour p, au niveau de confiance 1?a ou
29Exemple
- Dans une enquête menée auprès de 1000 ménages, on
constate que 340 dentre eux trient correctement
leurs déchets. Construire un intervalle de
confiance pour la proportion population de
ménages qui trient correctement leurs déchets.
30Plan du cours
- Introduction
- Statistique descriptive
- Echantillonnage
- Calcul des probabilités et variables aléatoires
- Inférence statistique
- Estimation
- Tests dhypothèses
- Régression linéaire
31Test dhypothèse
- Objectif essayer de valider une hypothèse
relative à un paramètre population, à partir dun
échantillon. - Exemple paniers de pommes
- Peut-on dire que le poids moyen des paniers de
pommes est inférieur à 750g (poids annoncé) ? - On pèse 12 paniers pris au hasard et on observe
un poids moyen de 738g et un écart-type de 124g.
32Principe de test
- On teste une hypothèse H0 (hypothèse nulle)
contre une hypothèse alternative H1. - H0 est choisie de façon à connaître la
distribution échantillonnée de la statistique
utilisée sous H0 (si H0 est vraie). - On définit une règle de décision
- RH0 On rejette H0 si lon dispose déléments
suffisamment convaincants pour le faire. - On ne rejette pas H0 dans le cas contraire.
33Exemple
- Hypothèses
- Statistique
- Distribution sous H0
- On observe
- Règle de décision ?
34Règle de décision
- Rejeter H0 si la valeur observée est peu
vraisemblable sous H0 et plus vraisemblable si H1
est vraie. - Deux types derreurs peuvent être commises
- Type 1 Rejeter H0 alors quelle est vraie.
- Type 2 Ne pas rejeter H0 alors quelle est
fausse.
35Règle de décision
- Risques derreurs
- Type 1
- Type 2
- Diminuer a ? augmenter b !
- On fixe a (car distribution connue sous H0).
Souvent 5 ou 1. - On établit la règle de décision en fonction de la
distribution sous H0 et de a.
36Exemple
- Rejeter H0 (a 5) si
- Test unilatéral à gauche.
- Conclusion
- On ne peut pas rejeter H0.
- On ne peut donc pas montrer que m lt 750g.
- On ne peut pas en conclure que m 750g !
37Exemple
- En 2007, 48 étudiants de M1, parmi lesquels 36
Lille3 et 12 ULCO , ont obtenu les notes
suivantes en statistique.