Title: ANOVA : introduction
1ANOVA introduction
2Définition
- L ANOVA est lanalyse des variances. La
comparaison des variances nous dira si les
moyennes sont significativement différentes
3Problème
- On cherche a détecter dun phénomène particulier
- Flûtiste exceptionnelle ou moyenne
- Groupe de TD super bon
- Caillou dans la mer
4Flûtiste
Cécile seule
Silence
Cécile avec les autres
Les autres sans Cécile
5Quiz je mélange
6Quiz je mélange
Ultra facile Silence
Trop facile Cécile seule
Ben
Heu
7Pourquoi ?
Ici, la variance est de 0,5
La variance ici est nulle
Cest une grosse différence. Elle EST
significative
Ici, la variance ici est 17,43
Ici, la variance est de 17,93
Entre 17,43 et 17,93 la différence NEST PAS
significative
8Intuitivement
- Vinter (Variance Inter) est la variance que lon
cherche à détecter. - Vintra (Variance Intra) est le  bruit , la
variabilité du au hasard (variabilité biologique)
9Intuitivement
On détecte la flûte ou son absence
Vintra 0 Vinter 0,5
On détecte lorchestre mais la flûte seule est
impossible à entendre
Vintra 17,43 Vinter 0,5
10Formulation du problème
- On dispose de plusieurs groupes de donnée (ici,
des bandes sonores). On cherche à détecter
quelque chose (ici, la flûte) - Pour le savoir, on calcule Vintra et Vinter
- Vintra mesure la variabilité biologique (ici, le
bruit) - Vinter mesure ce que lon cherche vraiment (ici,
la flûte) - Si Vinter est grand devant Vintra, on a détecté
quelque chose. - Si Vinter est petit devant Vintra, la variabilité
biologique est trop forte, elle empêche toute
détection.
11La flûte
Vintra 0 Vinter 0,5
On détecte la présence dune flûte dans le groupe
2
Vintra 17,43 Vinter 0,5
On ne détecte pas la présence de la flûte dans le
groupe 2
12Décomposition en facteurs
13Autre approche Mini QCM
La note de lélève 2 groupe 1 (Yvon) est 19.
Pourquoi ?
14Étude de la note dYvon
- La moyenne générale est de 12.
- Yvon a 7 par rapport à la moyenne générale
- La moyenne de groupe 1 est de 15
- Yvon a 4 par rapport à la moyenne du groupe 1
- Le groupe 1 a 3 par rapport à la moyenne
générale
15Étude de la note dYvon
- On peut donc  expliquer la note dYvon comme
- 19 12 3 4
Particularité dYvon (sa variabilité biologique
Yvon est plutôt bon)
Note dYvon
Moyenne générale (contrôle facile)
Effet du groupe 1 (super prof)
16Étude de la note de Justin
- Justin, élève 4 groupe 1 à 14
- On peut donc  expliquer la note de Justin
- 14 12 3 - 1
Note de Justin
Particularité de Justin
Moyenne générale (contrôle facile)
Effet du groupe 1 (super prof)
17Étude de la note de Gaston
- Gaston, élève 7 groupe 3 à 13
- On peut donc  expliquer la note de Gaston
- 13 12 - 3 4
Note de Gaston
Particularité de Gaston
Moyenne générale (contrôle facile)
Effet du groupe 3 (prof pas terrible)
18Formalisation
- On peut donc  expliquer la note dYvon comme
- 19 12 3 4
Variabilité personnelle, à lintérieur du groupe
Note
Moyenne générale
Variabilité entre les groupes
19Que cherche-t-on ?
- La variabilité personnelle dépend de nombreux
facteurs - On ne peut pas lexpliquer.
- Cest la variabilité entre groupes qui nous
intéresse ici - Si les groupes ont des moyennes significativement
différentes, on pourra ensuite examiner des
causes éventuelles différences entre les profs,
meilleur matériel, meilleur emploi du temps
20Formellement
21H0
- Hypothèse H0 il ny a pas de différence entre
les groupes. Ils ont même moyenne et même
variance - On ne sintéresse pas au groupe mais aux
populations quils représentent on travaille
avec ?
22Calcul de Vintra
- Notations
- k est le nombre de groupe (ici, k3)
- n est le nombre délève dans chaque groupe (n9)
- N est le nombre total délève (N27)
- ?i2 est la variance du groupe i (?121,5)
- Xi est la moyenne du groupe i (X115)
- X est la moyenne générale (X12)
23Calcul de Vintra
- La variance dun groupe représente son
hétérogénéité ou sa variabilité biologique
interne. - Vintra est la variabilité biologique interne de
tous les groupe (le  bruit global). Pour
lévaluer, on prend simplement la moyenne des
variances des groupes
24Les clones sont parmi nous
- Si on travaillait sur des  clones (aucune
différence entre les individus dun groupe), il
ny aurait aucune variance à lintérieur des
groupes
25Calcul de Vinter
- La moyenne dun groupe est une mesure du niveau
moyen du groupe. - Vinter est la variabilité entre les groupes. Pour
lévaluer, on prend simplement la variance des
moyennes multipliés par leffectif
26Calcul pratique (réveil !!!)
27Des clones partout
Les profs et les élèves sont des clones Pas de
variabilité du tout
Les profs sont des clones Variabilité Ã
lintérieur des groupes, mais pas entre les
groupes
Les élèves sont des clones Variabilité entre
les groupes, mais pas à lintérieur
Situation réelle Variabilité à lintérieur des
groupes et également entre les groupes
28Retour au problème
- Y a-t-il des différences entre les groupes ?
29Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 0
La réponse est trivialement non !
30Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 0
La réponse est trivialement non car Vinter0
indique légalité entre les moyennes des groupes
Les profs et les élèves sont des clones Pas de
variabilité du tout
Les profs sont des clones Variabilité Ã
lintérieur des groupes, mais pas entre les
groupes
31Retour au problème
- Y a-t-il des différences entre les groupes ?
32Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 16 Vintra 0
La réponse est oui car on détecte une différence
entre les moyennes sans que des variations
internes (bruit) gênent cette détection
33Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 16 Vintra 0
La réponse est oui car on détecte une différence
entre les moyennes sans que des variations
internes (bruit) gênent cette détection
Les élèves sont des clones Variabilité entre
les groupes, mais pas à lintérieur
Pas de bruit Détection possible
34Retour au problème
- Y a-t-il des différences entre les groupes ?
35Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 16 Vintra 22,4
La réponse est moins nette. Peut-être quune
différence existe mais le bruit nous empêche de
la détecter. On ne rejette pas H0
36Retour au problème
- Y a-t-il des différences entre les groupes ?
Vinter 16 Vintra 22,4
La réponse est moins nette. Peut-être quune
différence existe mais le bruit nous empêche de
la détecter. On ne rejette pas H0
Situation réelle Variabilité à lintérieur des
groupes et également entre les groupes
Trop de bruit Détection impossible
37Comment conclure ?
- Si Vinter16 et Vintra0 on rejette H0
- Si Vinter0 et Vintra22,4 on rejette H0
- Entre les deux, si Vinter18 et Vintra7 ?
- On utilise le test pour comparer les variances
- le F de Fisher
38F de Fisher
39F de Fisher comme dhab
- On calcule le F observé
- On calcule la probabilité de F
- Autre méthode lecture du F théorique sur une
table - Si FObs gt FTh, la différence est significative,
on rejette H0 - Si FObs lt FTh, la différence nest pas
significative, on ne rejette pas H0
40Calcul du F observé
- Puis la probabilité dobtenir un tel F si
SEULEMENT la variabilité biologique est en jeu
est - Loi.F(Fobs,DDL dessous,DDL dessus)
41Calcul des DDL
- V inter est une variance
- Son DDL est de le nombre de groupe moins 1
- DDL interk-1
- Vintra est la moyenne des variances
- Son DDL est la somme des DDL de chacun des
groupes - Chaque groupe a un DDL de n-1
- DDL intra n-1 n-1 n-1 N-k
42Exemple
- DDL inter k-1 3-1 2
- DDL intra N-k 27 3 24
43Lecture du F théorique
- Cette fois-ci, on lit le F sur la table 5 (parce
ce que on doit tester Vinter/Vintra, mais pas
Vintra/Vinter - FTh3,40
- FObs étant plus grand que FTh, on peut rejeter H0
- il existe une différence significative entre les
moyennes
44Risque 5
- On veut savoir si Vinter/Vintra est grand
- On teste donc au risque 5
- Pour la comparaison des variances, on voulait
savoir si V1/V2 était grand OU si V2/V1 était
grand. - On devait donc tester V1/V2 au risque 2,5 et
V2/V1 au risque 2,5 - Grâce a une astuce, on avait quun seul des deux
tests à faire, mais ca ne changeait rien au seuil
45Groupes de taille variable
46Vintra Groupes de taille variable
- Rappel pour les groupes de même taille
- Vintra moyenne des variances
- Pour des groupes de taille variable
- Vintra moyenne des variances PONDEREE par les
DDL - Si les k groupes ont la même taille n, les
formules coïncident
47Vinter Groupes de taille variable
- Rappel pour les groupes de même taille
- Vinter n x variances des moyennes
- Pour des groupes de taille variable
- Vinter variances des moyennes PONDEREE par les
tailles - Si les groupes ont la même taille n, les formules
coïncident
48Exemple mini QCM
49Conclusion
- Lhypothèse  toutes les moyennes sont les
mêmes est rejetée. - toutes les moyennes ne sont pas les mêmes
- MAIS on ne sait pas ou sont les différences
50Conclusion
- Les moyennes sont 10,2 15,2 et 17,6
- On sait quil existe au moins une différence
significative. - Entre 10,2 et 15,2 ?
- Entre 10,6 et 17,6 ?
- Entre 15,2 et 17,6 ?
51Pour le savoir T de Student
- Rappel pour comparer deux moyennes
- Ici, au lieu de calculer la variance commune, on
va utiliser Vintra
52Pour le savoir T de Student
- DDL des 2 groupes (11-1) (7-1) 16
- T th 2,120
- La différence entre 10,2 et 15,2 Nest PAS
significative