Title: Le chicarr
1Le chi-carré
2Introduction
- Certains types de données ne se prêtent pas aux
analyses habituelles (test t, ANOVA, ) - Ex. Si on dit quil y a 30 de fumeurs, on ne
peut pas dire quun fumeur moyen fume à 30. - Les test habituelles se prêtent souvent mal aux
données NOMINALES car elles ne sont pas
continues, elles représentent un EFFECTIF.
3Différence entre les tests paramétriques et les
tests non paramétriques
- Un test paramétrique est un test qui a des
postulats sur la population (on connaît la
moyenne et son écart-type). - Un test non paramétrique est un test qui na pas
de postulats sur la population peut seffectuer
sur nimporte quel type de populations.
4Distribution du chi-carré
Histogramme (n 1000 )
Histogramme (n 1000 )
z2
c2
5Distribution du chi-carré
Histogramme (n 10000, dl1)
Histogramme (n 10000, dl5)
Histogramme (n 10000, dl25)
6Distribution du khi-carré
Histogramme (n 10000, dl1000)
mdl, s22dl
7Tableaux de contingences à 1 variable
8Utilisation du chi-carré
- Un test dajustement  goodness-of-fit Est-ce
que les données observées sajustent bien aux
données théoriques ? - On veut savoir si une nouvelle gomme à mâcher (D)
est préférée aux autres marques concurrentes (A,
B, C) - 32 participants
- Il semble que la nouvelle gomme à mâcher soit la
préférée, mais comment en être certain ?
9Utilisation du chi-carré
- Si les participants navaient pas une préférence
particulière, chacune des marques aurait autant
de chance dêtre choisie.
- Si lhypothèse nulle est vraie (les fréquences
observées seront les mêmes que les fréquences
attendues) le numérateur sera petit et le
chi-carré sera près de zéro.
10Calculs
- Attention pour effectuer le test du chi-carré il
faut au moins 5 fréquences attendues par cellule.
11Chi-carré critique
12Décision
- Comme le chi-carré observé (c2obs 9.25) est
plus grand que le chi-carré critique (c20.05 (3)
7.815), on rejette lhypothèse nulle et on
accepte lhypothèse alternative. Les participants
préfèrent la nouvelle gomme à mâcher aux trois
autres marques concurrentes.
13Tableaux de contingences à 2 variables
14Exemple
- Le but est de savoir si 2 variables sont
indépendantes lune de lautre. Par exemple, on
cherche à savoir si le sexe de létudiant et le
choix du programme universitaire sont liés.
Observée
15Exemple
- Le but est de savoir si 2 variables sont
indépendantes lune de lautre. Par exemple, on
cherche à savoir si le sexe de létudiant et le
choix du programme universitaire sont liés.
Observée
16Exemple
- Pour calculer les fréquences attendues on procède
comme suit
Attendue
17Exemple
- Pour calculer les fréquences attendues on procède
comme suit
Attendue
18Exemple
19Chi-carré critique
20Décision
- Comme le chi-carré observé (c2obs 465.06) est
plus grand que le chi-carré critique (c20.01 (3)
11.345), on rejette lhypothèse nulle et on
accepte lhypothèse alternative. Le choix du
programme détude est lié au sexe de létudiant.
Les femmes ont tendance à choisir la littérature
et la médecine alors que les hommes ont tendance
à choisir la physique et le génie.
21Concaténation de variables
22Exemple
- Le but est de savoir si le fait dinscrire le
message  Please dont litter sur les reçus de
caisse, diminue la quantité de déchets trouvé
dans les supermarchés.
Observée et (attendue)
23Exemple
- Comme le chi-carré observé (c2obs 25.79) est
plus grand que le chi-carré critique (c20.01 (2)
5.99), on rejette lhypothèse nulle et on accepte
lhypothèse alternative. Lendroit où le reçue
est retrouvé dépend du type de message. Autrement
dit, lorsquil est indiqué sur le reçu  please
dont litter ces dernier ont un plus haut
pourcentage de se retrouver à la poubelle ou Ã
lextérieur du magasin.
24Exemple
- Cependant, il est clair que la vraie question est
de savoir si les gens disposent correctement ou
non leur reçu. Autrement ont peut regrouper les
catégorie  Poubelle et  Enlevé ensemble
Observée et (attendue)
25Exemple
- Comme le chi-carré observé (c2obs 16.12) est
plus grand que le chi-carré critique (c20.01 (1)
3.841), on rejette lhypothèse nulle et on
accepte lhypothèse alternative. Lendroit où le
reçue est retrouvé dépend du type de message.
Autrement dit, lorsquil est indiqué sur le reçu
 please dont litter ces dernier ont un faible
pourcentage de se retrouver nimporte où (sauf
dans les poubelles) à lintérieur du magasin.
26Mesure dassociation et le rapport de cote
27Le phi (fc) de Cramér
- Quel est le degré de relation entre les variables
? (semblable au coefficient de corrélation)
Exemple précédent
28Le coefficient de détermination
- Quel est pourcentage de variance expliqué ?
(semblable au coefficient de détermination)
Exemple précédent
29Le rapport de cotes
- Une statistique intéressante spécialement pour
les tableaux de contingences 2x2 est de savoir le
degré dinfluence dune variable sur une autre. - Le rapport de cotes à lavantage de ne pas être
affecté par la taille de léchantillon et de
linégalité des totaux des lignes et colonnes.
Ou
Ou
30Exemple
- On veut connaître le rapport de cote par rapport
au ramassage des ordures pour la condition
message et la condition contrôle.
31Exemple
- Autrement dit, une personne est 1.48 fois plus
porté de ne pas ramasser ses déchets sil ny a
pas de message indiqué sur le reçu.
- Autrement dit, une personne est 0.67 fois plus
porté de ne pas ramasser ses déchets sil y a un
message indiqué sur le reçu.
32Exemple 2
- On veut connaître le rapport de cote davoir une
crise cardiaque si on ne prend pas dAspirin.
33Exemple
- Autrement dit, une personne dans le groupe
placebo a 1.83 fois plus de chance davoir une
crise cardiaque quune personne dans le groupe
Aspirin.
- Autrement dit, une personne qui prend une
 Aspirin par jour a la moitié moins de chance
davoir une crise cardiaque que les personnes qui
nen prennent pas.
34Fin!