Title: Comparaison de plusieurs moyennes observes
1Comparaison de plusieurs moyennes observées
- Situation du problème
- On dispose dune variable qualitative nominale Ã
deux classes ou plus qui permet de définir p
groupes. On désigne cette variable comme le
facteur étudié. - On mesure une variable quantitative qui permet de
calculer dans chaque groupe les différents
paramètres de la distribution moyenne,
estimateur de lécart type... - On désire savoir si les moyennes observées dans
chacun des groupes peuvent être considérées comme
des estimateurs de la même moyenne aux
fluctuations du hasard près. Il sagit bien, dans
un premier temps, de comparer globalement les
différentes moyennes entre elles et non pas
deffectuer des comparaisons deux à deux. - Par exemple, disposant de plusieurs traitements
(A, B, C) de l'hypertension artérielle, on désire
savoir s'ils entraînent la même baisse moyenne de
tension systolique. Pour répondre au problème
posé, on a administré de manière aléatoire un des
traitements à 3 échantillons d'individus
différents.
2Comparaison de plusieurs moyennes observées
- Hypothèses
- Hypothèse nulle
- Les moyennes observées dans les différents
groupes xa, xb,xc,.. sont des estimateurs des
moyennes ma, mb, mc,... - H0 ma mb mc
- Hypothèse alternative
- Lune au moins des moyennes ma, mb, mc,..
diffère des autres. - Condition homocédasticité, Normalité
- Note si on est amené à rejeter H0, on accepte
H1. On sait alors qu'une au moins des moyennes
diffère des autres mais on ne sait pas laquelle.
Pour répondre à cette question, il faudra
compléter le test global par des comparaisons
répondant au problème qui se pose.
3Comparaison de plusieurs moyennes observées
Soit p le nombre de traitements (ici p3). Pour
chaque traitement, on a un effectif (nj), un
total des valeurs (Tj) et un total des carrés
(Uj).
Les paramètres statistiques
- Effectif, Moyenne, Écart type estimé par
groupe...
p
Ã¥
N
N
- Effectif total
j
j
1
- Total général (de l'ensemble des valeurs)
- Total général des carrés
4Comparaison de plusieurs moyennes observées
- Rappel de calcul
- Pour chaque groupe on peut calculer les
paramètres statistiques moyenne, estimateur de
l écart type, SCE,.. Ceci à partir de
leffectif, de la somme des valeurs et de la
somme des carrés des valeurs - Sous H0, on peut calculer les paramètres
statistiques de lensemble des groupes réunis
5Comparaison de plusieurs moyennes observées
H0 Vraie
La variance totale est égale à la variance de
chacune des populations
H1 Vraie
TAS 160 140
La variance totale est plus grande que la
variance de chacune des populations
Gpe A B C Tous gpes
6Comparaison de plusieurs moyennes observées
- Le tableau de lanalyse de la variance
Origine SCE
DDL Variance Entre groupes
p-1 Intra groupe
N-p Résiduelle Totale
N-1
Num
p-1
Dén
N-p
Num
DDL p-1
F
Dén
DDL N-p
7Comparaison de plusieurs moyennes observées
- Décision
- Si F dépasse le F lu dans la table au risque
alpha choisi (5 pour 5 ), on rejette
l'hypothèse nulle toutes les moyennes ne sont
pas égales. Une au moins des moyennes diffère des
autres. - Si on rejette H0, on peut compléter l'analyse par
différentes stratégies dont la comparaison des
moyennes 2 à 2 grâce à un test t de student dit
"t protégé" dans lequel on utilise comme variance
commune la variance résiduelle calculée dans
l'analyse de la variance. - Sinon, on accepte H0 mais attention au risque
Beta. - Cas de 2 moyennes
- Le F est le carré du t de student
8Comparaison de plusieurs moyennes observées
Le F 23,42 est supérieur au F DDL 2-9 5 (4,26
lu dans la table). On rejette H0. Une au moins
des moyennes diffère des 2 autres mais on ne sait
pas laquelle.
9Comparaison de plusieurs moyennes observées
- Suite
- Comme on a rejeté H0, on peut poursuivre
lanalyse en comparant les moyennes par un t dit
protégé qui utilise comme variance commune la
variance résiduelle et qui a comme DDL le DDL de
la résiduelle
11,2-14,75
t A-B
1.28 1.28 5 4
Les t sont comparés à talpha avec DDL 9. Pour
alpha 5 on lit dans la table 2,26. Ici toutes
les comparaisons 2 Ã 2 sont significatives.