Title: L
1LAFC, mais quest-ce?
2Présentation générale
- méthodes dites multidimensionnelles
- représentations géométriques
- Trois méthodes classiques
- ACP Analyse en composantes principales.
- Individus et variables numériques
- ACM Analyse des correspondances multiples
- Individus et codages de valeurs qualitatives.
- AFC Analyse factorielle des correspondances.
- tableaux de fréquence
- Un exemple
3Exemple
4Exemple
5Exemple
- Age (4 classes)
- Activité (8 classes)
6Exemple
7Exemple
8Exemple
9Exemple
10Exemple
11Exemple
12Exemple
- Taille
- Poids
- Age
- Taux cholestérol
- Consommation dalcool
- CSP
- Sexe
- ???
13Exemple
- ???
- Espace multi-dimensionnel
- Multi-paramétrique
- Comment qualifier, quantifier, et surtout
visualiser ces phénomènes ? - Comment différencier les interactions
essentielles des rencontres fortuites ?
14Exemple
- projections de ces hyper-nuages sur des plans.
- Ombres portées
- Déformer le moins possible
- Conserver linertie
- Choisir le bon angle
- Axes factoriels
15Exemple
- Baguette
- Allongement
- Aplatissement
- 75 de la variance
- 1 plan 2 axes
16Précisions
- Variance, dispersion, inertie ???
- Individus et modalités superposés
- Une représentation est une description, pas une
preuve !!!
17Méthode et hop!
18Méthode et hop!
- Avec 2 variables
- CSP
- Lieux de vacances
I\J hôtel locat propri parent amis tente villag divers total
Agricult 160 28 0 321 36 141 45 65 796
Salariés 35 34 1 178 8 0 4 0 260
Patrons 700 354 229 959 185 292 119 140 2978
Cad sup 961 471 633 1580 305 360 162 148 4620
Cadre moy 572 537 279 1689 206 748 155 112 4298
Employés 441 404 166 1079 178 434 178 92 2972
Ouvriers 783 1114 387 4052 497 1464 525 387 9209
Personnels 65 43 21 294 79 57 18 6 580
Autres actif 77 60 189 839 53 124 28 53 1423
Non actifs 741 332 327 1789 311 236 102 102 3940
Total 4535 3377 2232 12780 1858 3856 1336 1105 31079
19Et hop!
20Moins vite
- Couleur des yeux
- Couleur des cheveux
21Encore plus fort
- Effectifs théoriques en cas dindépendance,
établis à partir des totaux en ligne et en
colonne
22Toujours mieux
- Ecarts à lindépendance différence entre
leffectif constaté et leffectif théorique.
bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24
Total 108 144 84 132 468
23Attractions
- Les écarts positifs significatifs
bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24
Total 108 144 84 132 468
24Répulsions
- Les écarts négatifs significatifs
bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5 10,8 -10,8 16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2 12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2 12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9 14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir 19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux 5,5 -5,5 7,4 -7,4 24 4,3 19,7 6,8 -6,8 24
Total 108 144 84 132 468
25And the winner is
26Encore plus fort
27Est-ce bien clair ?
- Châtains noisette
- Blonds bleus
- Verts roux
- Mais
- Axe 1 des cheveux blonds aux cheveux roux ou des
yeux bleus aux yeux verts? - Axe 2 du blanc au châtain, ou des yeux marrons
aux yeux noisette?
28Un peu daide les contributions absolues
- La contribution absolue résume le poids dune
modalité par rapport à lensemble des modalités
décrites par un facteur. - On les lit en colonne et par facteur. Total 100
- Elle permet de repérer les modalités qui ont le
plus créé le facteur. - F1 Y verts, C roux, C noirs
- F2 Y noisette, Y marrons, C blancs, C châtain
sombre
29Un peu plus daide les contributions relatives.
- La contribution relative décrit le poids dune
modalité relativement à lensemble des facteurs. - Elle se lit horizontalement, par modalité.
- Elle permet de voir sur quel facteur une modalité
est le mieux représentée. - Les blonds aux yeux bleus ?
30Contributions les blonds aux yeux bleus
- Sur le facteur 3, ils ont les plus fortes
contributions absolues! - Ils ont donc permis la formation de ce facteur.
- Ils sont néanmoins mieux représentés sur le
facteur 1 !
31Encore plus fort 3 variables.
32Lecture du graphe
- Facteur 1
- Femmes aux yeux noisettes, aux cheveux châtains
ou sombres, - Hommes aux yeux marrons, chauves ou cheveux
blancs. - Facteur 2
- Les irlandais vs les scandinaves.
33Représentation graphique des contributions
absolues
- Les rectangles se lisent dans la dimension du
facteur. - Contributions horizontales, seulement facteur 1
- Contributions verticales, facteur 2
- Carré (blanc), un peu des deux, mais pas
beaucoup. - Et les yeux verts?
- Et les chauves?
34Interpréter prudence
- difficile à interpréter quand le nombre de
questions et de modalités est très élevé - tendance à mettre en valeur les écarts sur les
modalités aux effectifs faibles. - Linterprétation dun mapping (représentation
graphique des modalités sur 2 axes) est assez
délicate. - Le fait que deux modalités soient proches ne
signifie pas nécessairement quelles sont en
attraction. Il est rare en effet que tous les
liens entre modalités puissent être représentés
en deux dimensions.
35Interpréter prudence
- lanalyse factorielle peut se réduire à une
technique permettant de représenter de manière
suggestive le maximum dinformations sur les
attractions entre modalités - Elle devient une technique exploratoire qui
permet un premier débroussaillage des données et
qui peut suggérer des pistes fructueuses. - Il faut toujours revenir aux tris croisés ou aux
profils de modalités pour vérifier les
suggestions de lapproche graphique. - Le fait que lAFC révèle peu dattractions entre
variables peut être un résultat intéressant en
tant que tel.
36Décrire / prédire
- Echantillon ? Probabilités
- 1 réponse 1 estimateur
- (valeur dune moyenne, dune variance, dune
proportion, dun pourcentage) - un intervalle de confiance
- une probabilité
37Décrire / prédire
- Description la moyenne est m.
- Prédiction jai une probabilité p de ne pas me
tromper en affirmant que la moyenne est comprise
entre (m-i) et (mi).
38Décrire / prédire
- Hypothèses sur les distributions des paramètres
de la population totale, des paramètres des
échantillons - Ambiguïtés des théories en probabilité.
- Les probabilités, ce nest pas intuitif.
- Benzecri prouver lexistence de Dieu.