Title: Diapositive 1
1Lanalyse de variance à deux critère de
classification
Objectif comparer linfluence de chaque facteur
sur la moyenne de plusieurs (k) groupes
indépendants dobservations
- La méthode détaillée ci-dessous sapplique
uniquement quand les deux critères (variables
qualitatives)sont indépendants, et sil y a une
seule unité dexpérimentation pour chaque groupe.
- La première variable qualitative a r catégories
et - la deuxième a s catégories
- r x s observations
Cette analyse correspond grosso modo à une double
ANOVA à un critère de classification
2(No Transcript)
3Cette méthode nous permet uniquement de tester
leffet de chaque critère uniquement, mais PAS
linteraction
H0 Les moyennes de la variable x ne sont pas
affectées par le critère A. µ1 µ2
µr H0 Les moyennes de la variable x ne sont
pas affectées par le critère B. µ1 µ2
µs
Puisquon a deux séries dhypothèses, on a deux
statistiques F
4(No Transcript)
5Exemple Robert !!! Robert sintéresse à
leffet des strates dun lac et du type de
nutriments présents dans 4 différentes zones du
lac sur la quantité de bactéries présentes dans
leau. Robert veut être certain davoir de la
bonne eau à son chalet.
6Étape 1 Question biologique
- Est-ce que le nombre de bactéries par mL deau
varie selon la strate à laquelle léchantillon a
été pris ? - Est-ce que le nombre de bactéries par mL deau
varie selon le traitement ?
Étape 2 Hypothèses
H0 La profondeur naffecte pas le nombre de
bactéries par mL (hypothèse A)
H1 La profondeur affecte le nombre de bactéries
par mL (hypothèse A)
H0 La présence de nutriments naffecte pas le
nombre de bactéries par mL (hypothèse B)
H1 La présence de nutriments affecte le nombre
de bactéries par mL (hypothèse B)
7Étape 3 Choix du test
Le test statistique utilisé est une ANOVA à deux
critères de classification où
Étape 4 Conditions dapplication
- Normalité des données dans tous les groupes et
ce, pour chaque combinaison des critères - Indépendance des observations
- Équivariance de ces groupes
Étape 5 Distribution de la variable auxiliaire
Sous H0, la variable FA se distribue selon la loi
de Fisher à ?1 (r-1) 2 et ?2 (r-1)(s-1)
8 degrés de liberté et la variable FB se
distribue selon la loi de Fisher à ?1 (s-1) 4
et ?2 (r-1)(s-1) 8 d.d.l.
8Étape 6 Règles de décision
Pour un seuil a 0.05 On rejette H0 (il y a un
effet des strates) si FA gt 4,46. On rejette H0
(il y a un effet des traitements) si FB gt 3,84
Étape 7 Calcul du test
9(No Transcript)
10Étape 8 Décision statistique
Puisque FA 9,71 gt 4,46, on rejette H0 Les
strates ont un effet des sur le nombre de
bactéries. Puisque FB 1,91 lt 3,84, on ne
rejette pas H0 pas deffet des traitements sur
le nombre de bactéries.
11Étape 9 Interprétation biologique
Les bactéries sont sensibles à la concentration
doxygène, qui varie passablement entre les
différentes strates dun lac, mais pas aux types
de nutriments qui ont été utilisés lors de
lexpérience.
12ANOVA factorielle à deux critères de
classification
n égaux orthogonal experimental design
Ce type dANOVA permet de tester, en plus de
leffet isolé de chacun des facteurs, leffet de
linteraction des deux. Pour cela il faut
disposer de plusieurs mesures pour chaque
combinaison de niveaux, cest-à-dire dans chaque
cellule.
Les résultats permettent de tester trois séries
dhypothèses
13H0 Les moyennes de la variable x ne sont pas
affectées par le critère A. µ1 µ2
µr H0 Les moyennes de la variable x ne sont
pas affectées par le critère B. µ1 µ2
µs
H0 Les critères A et B ninteragissent pas sur
les moyennes.
14- SC Somme des carrés des écarts
- Dispersion totale SCT
- Dispersion intragroupe (due aux erreurs)
SCE - Dispersion due aux facteur A ou B SCEA ou
SCEB - Dispersion des cellules SCcells
Mesure de la dispersion (variation) totale SCT
d.d.l. N-1
15Mesure de la dispersion (variation) du facteur A
d.d.l. a-1
Mesure de la dispersion (variation) du facteur B
d.d.l. b-1
16Mesure de la dispersion (variation) des cellules
SCcells
d.d.l. ab-1
Mesure de la dispersion (variation) de
linteraction AxB SCAB
SCAB SCcells (SCA SCB)
d.d.l. (a-1)(b-1)
17Mesure de la dispersion (variation) intragroupe
(dûe aux erreurs) SCE
SCE SCT SCcells
d.d.l. ab(n-1)
18Calculs
Interaction
19(No Transcript)
20Exemple Le régime miracle !
On désire quantifier lefficacité de trois types
de régimes, de quatre intensités dactivité
physique ainsi que linteraction de ces deux
critères sur la perte de poids.
21Étape 1 Question biologique
Quel est leffet du régime, de lexercice
physique ainsi que de leur interaction sur la
perte de poids ?
Étape 2 Déclaration des hypothèses
22Étape 3 Choix du test
Le test statistique utilisé est une ANOVA
factorielle à deux critères de classification où
Étape 4 Conditions dapplication
- Normalité des données dans tous les groupes et
ce, pour chaque combinaison des critères - Équivariance de ces groupes
- Indépendance des observations
Étape 5 Distribution de la variable auxiliaire
Sous H0, la variable FA se distribue selon la loi
de Fisher à ?1 (r-1) 2 et ?2 rs(k-1) 60
d.d.l. la variable FB se distribue selon la loi
de Fisher à ?1 (s-1) 3 et ?2 rs(k-1) 60
d.d.l. la variable FAB se distribue selon la loi
de Fisher à ?1 (r-1)(s-1) 6 et ?2 rs(k-1)
60 d.d.l.
23Étape 6 Règles de décision
Pour un seuil a 0,05 On rejette H0 (donc il y
a un effet des régimes) si FA gt 3,15. On rejette
H0 (donc il y a un effet des exercices) si FB gt
2,76 On rejette H0 (donc il y a une interaction)
si FAB gt 2,25.
Étape 7 Calcul du test
24(No Transcript)
25(No Transcript)
26Étape 8 Décision statistique
Puisque FA 3,435 gt 3,15, on rejette H0 il y a
un effet des régimes. Puisque FB 26,743 gt 2,76,
on rejette H0 il y a un effet des
exercices. Puisque FAB 3,954 gt 2,25, on rejette
H0 il y a une interaction.
Étape 9 Interprétation biologique
Le régime et lexercice physique permettent de
perdre du poids car ils permettent de contrôler
le taux de gras. De plus, leffet du régime sur
la perte de poids variera en fonction de
lactivité physique et vice-versa.
27Modèle I les 2 facteurs ont des effets
fixes Modèle II les niveaux des facteurs sont
aléatoires Modèle III modèle mixte entre I et II
28ANOVA factorielle à deux critères de
classification
n inégaux et non proportionnels
Sil manque une mesure ou qqes, on peut lestimer
selon la formule
Somme de toutes les données dans le niveau i du
facteur A
Somme de toutes les autres données
Ou plus simple on remplace par les cellules
manquantes par la valeur moyenne des données,
puis on fait lanova MAIS avec le ddl total et le
ddl des cellules calculés sur le vrai nombre de
mesures
29Sil en manque plus Voir les modèles GLM
(General Linear Model) ou on recommence tout