Title: Pr
1ANALYSE DE VARIANCE
M2 Sciences des Procédés - Sciences des Aliments
2ANALYSE DE VARIANCE
Exemple
Des forestiers ont réalisé des plantations
darbres en 3 endroits. Plusieurs années plus
tard ils souhaitent savoir si la hauteur des
arbres est identique dans les trois forêts. Dans
chaque forêt on tire un échantillon darbre et
on mesure la hauteur de chaque arbre.
Lanalyse de variance (ANOVA) consiste à chercher
si la variabilité des observations peut être en
partie expliquée par les différences entre
variantes dun facteur (ici fôret)
Forêt 1 Forêt 2 Forêt 3
23.424.424.624.9 25.026.2 18.921.121.122.122.523.524.5 22.522.923.724.024.0
3OBJECTIF DE lANOVA Analyser des données qui
dépendent de plusieurs types deffets agissant
simultanément, afin de quantifier ces effets
expliquer une variable quantitative par une ou
des variables qualitatives (facteurs)
? En amont de lANOVA plan expérimental (nombre
dexpériences pour chaque niveau ou modalité,
facteurs)
4Analyse de la variance à 1 facteur
5Exemple
Etude sur lappréciation sensorielle de la
texture de 3 viandes. Seul le caractère fibreux
est considéré, noté sur une échelle de 15 points.
15 dégustateurs différents ont noté chacun une
viande
6Modèle de lanalyse de la variance à 1 facteur
Exemple de la viande texture fibreuse dune
viande caractère fibreux de la viande i caractère
fibreux potentiel due à lensemble des autres
causes qui déterminent la note fibreuse
où
est la variable à expliquer est leffet du
ième niveau du facteur ..... est leffet moyen
général . est la variable aléatoire
résiduelle
7Décomposition de lélément
8Décomposition de la variabilité
9On souhaite tester les hypothèses H0 " Il ny
a pas deffet produit " càd les moyennes pour les
différents produits (niveaux du facteur) sont
égales contre H1 " Il y a un effet produit
" càd deux moyennes au moins sont différentes
? Il sagit donc de comparer la variabilité
inter-niveaux à la variabilité intra-niveaux du
facteur
10Source de variation SCE ddl
Inter-niveaux SCE Inter I-1
Intra-niveaux SCE Intra n-I
Totale SCE Totale n-1
I nombre de niveaux
11Pour tester H0 contre H1, on évalue la quantité
Si lhypothèse H0 est vraie, la valeur F est
faible, sinon, en séloignant de cette hypothèse,
le rapport F augmente
? à partir de quelle valeur observée de F
rejette-t-on H0 ?
? Si les résidus du modèle de lanalyse de la
variance suivent une loi normale, et si H0 est
vraie, on sait que F est lobservation dune
variable qui suit la loi de Fisher ayant (I-1)
ddl au numérateur et (n-I) ddl au dénominateur
notée F(I-1, n-I)
H0 est rejetée si Fobs gt F (I-1, n-I) pour un
niveau de significativité donné a, cest-à-dire
si p-value lt a (cf. table de Fisher)
12Exemple de la viande
Tableau danalyse de la variance
Source de variation SCE ddl CM F p-value
Type de viande 90 2 45 10,8 p lt 0,01
Résiduelle (intra-produit) 50 12 4,17 10,8 p lt 0,01
Totale 140 14
? H0 rejetée il existe un effet type de viande
significatif concernant le caractère fibreux
13Analyse de la variance à 2 facteurs
14Dispositif complet sans répétition
Supposons maintenant que 5 juges aient évalué une
série de 3 échantillons
notes pour le caractère fibreux
viande viande viande
juge A B C
1 2 3 4 5 3 5 6 3 3 10 8 5 7 5 13 11 7 11 8
15III.2 Dispositif complet sans répétition
Modèle de lanalyse de la variance à 2 facteurs
sans interaction
Exemple de la viande texture fibreuse dune
viande caractère fibreux de la viande i effet lié
au juge j caractère fibreux potentiel due à
lensemble des autres causes qui déterminent la
note fibreuse
où
est la variable à expliquer est leffet du
ième niveau du facteur A ..... est leffet du
jème niveau du facteur B .... est leffet moyen
général . est la variable aléatoire
résiduelle
16III.2 Dispositif complet sans répétition
Equation de la décomposition de la variance
SCET SCEA SCEB SCER
soit
Source de variation SCE ddl
Effet principal de A SCEA I-1
Effet principal de B SCEB J-1
Résiduelle SCER (I-1)(J-1)
Totale SCET n-1
17On teste chaque facteur
Tableau danalyse de la variance
Source de variation SCE ddl CM F
Type de viande 90,0 2 45,0 13,2
Effet juge 22,7 4 5,7 1,7
Résiduelle 27,3 8 3,4
Totale 140 14
? 1er test Fobs 13,2 gtgt Fa,2,8 4,5 avec a
5 ? H0 rejetée avec un risque de 5 il
existe un effet produit significatif concernant
le caractère fibreux
? 2ème test Fobs 1,7 lt Fa,4,8 3,8 avec a
5 ? H0 non rejetée il nexiste pas deffet
juge significatif
18Dispositif complet avec répétitions
Comparaison de 3 types de sondes pédologiques
pour 2 natures de sol
Type de sol Type de sol
1 2
Type de sonde 1 43 45 46 53 40 40 40 43
Type de sonde 2 41 42 43 44 35 37 40 40
Type de sonde 3 42 44 46 48 37 39 40 40
19III.3 Dispositif complet avec répétitions
Modèle de lanalyse de la variance à 2 facteurs
avec interaction
où
est la variable à expliquer est leffet du ième
niveau du facteur A est leffet du jème niveau du
facteur B est linteraction des niveaux i et j
des 2 facteurs est leffet moyen général est la
variable aléatoire résiduelle
20Avec répétition
Effet moyen
PAS DINTERACTION
A2
A1
B3
B1
B2
DINTERACTION
Effet moyen
A2
A1
B3
B1
B2
21Equation de la décomposition de la variance
SCET SCEA SCEB SCEAB SCER
soit
? 3 tests dhypothèse
22Type de sol Type de sol
1 2
Type de sonde 1 43 45 46 53 40 40 40 43
Type de sonde 2 41 42 43 44 35 37 40 40
Type de sonde 3 42 44 46 48 37 39 40 40
23 ? Effet sol gtgt effet sonde
? Effets sol et sonde significatifs pour a 5
24Tests de comparaisons multiples
Si rejet de lhypothèse testée effet du facteur
Le rejet signifie il existe au moins 1 niveau
différent des autres Le ou lesquels? Il existe
des méthodes complémentaires
- - test LSD (Least Significance Difference) de
Fischer (ppds) - test de Scheffe
- test de Dunnett
- test de Duncan
-
25Tests de comparaisons multiples
Pour chaque comparaison de 2 moyennes, on
calcule une valeur seuil r (range), fonction du
carré moyen résiduel de lANOVA Si ,
alors la différence est déclarée significative,
au niveau de signification a
ddl de la source de variation résiduelle