L - PowerPoint PPT Presentation

1 / 38
About This Presentation
Title:

L

Description:

Title: L AFC, mais qu est-ce? Author: Charles-Antoine Arnaud Last modified by: Charles-Antoine Arnaud Created Date: 5/24/2006 7:34:11 AM Document presentation format – PowerPoint PPT presentation

Number of Views:98
Avg rating:3.0/5.0
Slides: 39
Provided by: Charle729
Category:

less

Transcript and Presenter's Notes

Title: L


1
LAFC, mais quest-ce?
  • Quelques rappels

2
Présentation générale
  • méthodes dites multidimensionnelles
  • représentations géométriques
  • Trois méthodes classiques
  • ACP Analyse en composantes principales.
  • Individus et variables numériques
  • ACM Analyse des correspondances multiples
  • Individus et codages de valeurs qualitatives.
  • AFC Analyse factorielle des correspondances.
  • tableaux de fréquence
  • Un exemple

3
Exemple
  • Taille

4
Exemple
  • Taille

5
Exemple
  • Age (4 classes)
  • Activité (8 classes)

6
Exemple
  • Age
  • Activité

7
Exemple
  • Age
  • Activité

8
Exemple
  • Age
  • Activité

9
Exemple
  • Age
  • Activité

10
Exemple
  • Taille
  • Poids
  • Age

11
Exemple
  • Taille
  • Poids
  • Age

12
Exemple
  • Taille
  • Poids
  • Age
  • Taux cholestérol
  • Consommation dalcool
  • CSP
  • Sexe
  • ???

13
Exemple
  • ???
  • Espace multi-dimensionnel
  • Multi-paramétrique
  • Comment qualifier, quantifier, et surtout
    visualiser ces phénomènes ?
  • Comment différencier les interactions
    essentielles des rencontres fortuites ?

14
Exemple
  • projections de ces hyper-nuages sur des plans.
  • Ombres portées
  • Déformer le moins possible
  • Conserver linertie
  • Choisir le bon angle
  • Axes factoriels

15
Exemple
  • Baguette
  • Allongement
  • Aplatissement
  • 75 de la variance
  • 1 plan 2 axes

16
Précisions
  • Variance, dispersion, inertie ???
  • Individus et modalités superposés
  • Une représentation est une description, pas une
    preuve !!!

17
Méthode et hop!
  • Avec deux variables

18
Méthode et hop!
  • Avec 2 variables
  • CSP
  • Lieux de vacances

I\J hôtel locat propri parent amis tente villag divers total
Agricult 160 28 0 321 36 141 45 65 796
Salariés 35 34 1 178 8 0 4 0 260
Patrons 700 354 229 959 185 292 119 140 2978
Cad sup 961 471 633 1580 305 360 162 148 4620
Cadre moy 572 537 279 1689 206 748 155 112 4298
Employés 441 404 166 1079 178 434 178 92 2972
Ouvriers 783 1114 387 4052 497 1464 525 387 9209
Personnels 65 43 21 294 79 57 18 6 580
Autres actif 77 60 189 839 53 124 28 53 1423
Non actifs 741 332 327 1789 311 236 102 102 3940
Total 4535 3377 2232 12780 1858 3856 1336 1105 31079
19
Et hop!
20
Moins vite
  • Couleur des yeux
  • Couleur des cheveux

21
Encore plus fort
  • Effectifs théoriques en cas dindépendance,
    établis à partir des totaux en ligne et en
    colonne

22
Toujours mieux
  • Ecarts à lindépendance différence entre
    leffectif constaté et leffectif théorique.

  bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
  Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5   10,8 -10,8   16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2   12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2   12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9   14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir   19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux   5,5 -5,5   7,4 -7,4 24 4,3 19,7   6,8 -6,8 24
Total 108     144     84     132     468
23
Attractions
  • Les écarts positifs  significatifs 

  bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
  Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5   10,8 -10,8   16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2   12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2   12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9   14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir   19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux   5,5 -5,5   7,4 -7,4 24 4,3 19,7   6,8 -6,8 24
Total 108     144     84     132     468
24
Répulsions
  • Les écarts négatifs  significatifs 

  bleus bleus bleus marrons marrons marrons verts verts verts noisette noisette noisette Total
  Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff. Th Ec Eff.
blanc 24 13,8 10,2 36 18,5 17,5   10,8 -10,8   16,9 -16,9 60
blond 36 16,6 19,4 12 22,2 -10,2   12,9 -12,9 24 20,3 3,7 72
châtain 12 16,6 -4,6 12 22,2 -10,2   12,9 -12,9 48 20,3 27,7 72
sombre 12 11,1 0,9   14,8 -14,8 12 8,6 3,4 24 13,5 10,5 48
noir   19,4 -19,4 36 25,8 10,2 36 15,1 20,9 12 23,7 -11,7 84
chauve 24 24,9 -0,9 48 33,2 14,8 12 19,4 -7,4 24 30,5 -6,5 108
roux   5,5 -5,5   7,4 -7,4 24 4,3 19,7   6,8 -6,8 24
Total 108     144     84     132     468
25
And the winner is
26
Encore plus fort
27
Est-ce bien clair ?
  • Châtains noisette
  • Blonds bleus
  • Verts roux
  • Mais
  • Axe 1 des cheveux blonds aux cheveux roux ou des
    yeux bleus aux yeux verts?
  • Axe 2 du blanc au châtain, ou des yeux marrons
    aux yeux noisette?

28
Un peu daide les contributions absolues
  • La contribution absolue résume le poids dune
    modalité par rapport à lensemble des modalités
    décrites par un facteur.
  • On les lit en colonne et par facteur. Total 100
  • Elle permet de repérer les modalités qui ont le
    plus créé le facteur.
  • F1 Y verts, C roux, C noirs
  • F2 Y noisette, Y marrons, C blancs, C châtain
    sombre

29
Un peu plus daide les contributions relatives.
  • La contribution relative décrit le poids dune
    modalité relativement à lensemble des facteurs.
  • Elle se lit horizontalement, par modalité.
  • Elle permet de voir sur quel facteur une modalité
    est le mieux représentée.
  • Les blonds aux yeux bleus ?

30
Contributions les blonds aux yeux bleus
  • Sur le facteur 3, ils ont les plus fortes
    contributions absolues!
  • Ils ont donc permis la formation de ce facteur.
  • Ils sont néanmoins mieux représentés sur le
    facteur 1 !

31
Encore plus fort 3 variables.
32
Lecture du graphe
  • Facteur 1
  • Femmes aux yeux noisettes, aux cheveux châtains
    ou sombres,
  • Hommes aux yeux marrons, chauves ou cheveux
    blancs.
  • Facteur 2
  • Les irlandais vs les scandinaves.

33
Représentation graphique des contributions
absolues
  • Les rectangles se lisent dans la dimension du
    facteur.
  • Contributions horizontales, seulement facteur 1
  • Contributions verticales, facteur 2
  • Carré (blanc), un peu des deux, mais pas
    beaucoup.
  • Et les yeux verts?
  • Et les chauves?

34
Interpréter prudence
  • difficile à interpréter quand le nombre de
    questions et de modalités est très élevé
  • tendance à mettre en valeur les écarts sur les
    modalités aux effectifs faibles.
  • Linterprétation dun mapping (représentation
    graphique des modalités sur 2 axes) est assez
    délicate.
  • Le fait que deux modalités soient proches ne
    signifie pas nécessairement quelles sont en
    attraction. Il est rare en effet que tous les
    liens entre modalités puissent être représentés
    en deux dimensions.

35
Interpréter prudence
  • lanalyse factorielle peut se réduire à une
    technique permettant de représenter de manière
    suggestive le maximum dinformations sur les
    attractions entre modalités
  • Elle devient une technique exploratoire qui
    permet un premier débroussaillage des données et
    qui peut suggérer des pistes fructueuses.
  • Il faut toujours revenir aux tris croisés ou aux
    profils de modalités pour vérifier les
    suggestions de lapproche graphique.
  • Le fait que lAFC révèle peu dattractions entre
    variables peut être un résultat intéressant en
    tant que tel.

36
Décrire / prédire
  • Echantillon ? Probabilités
  • 1 réponse 1 estimateur
  • (valeur dune moyenne, dune variance, dune
    proportion, dun pourcentage)
  • un intervalle de confiance
  • une probabilité

37
Décrire / prédire
  • Description  la moyenne est m. 
  • Prédiction  jai une probabilité p de ne pas me
    tromper en affirmant que la moyenne est comprise
    entre (m-i) et (mi). 

38
Décrire / prédire
  • Hypothèses sur les distributions des paramètres
    de la population totale, des paramètres des
    échantillons
  • Ambiguïtés des théories en probabilité.
  • Les probabilités, ce nest pas intuitif.
  • Benzecri prouver lexistence de Dieu.
Write a Comment
User Comments (0)
About PowerShow.com