Title: DONNEES CENTREES et NORMALITE
1DONNEES CENTREESet NORMALITE
UE 45.2 CHIII
- Pierre MORETTO,
- Université Paul Sabatier, Toulouse III.
2Données centrées et normalité
- Indices centraux
- Dispersion
- Loi Normale (Equiprobabilité)
- Variables centrées réduites
- Normalité dune distribution
- Détermination graphique
- Détermination / indices
- Test du ?²
3Indices centraux et de dispersion
- Mode, Médiane, Moyenne
- Quartile, variance et écart-type
4Indices centraux et de dispersion
- Mode valeur la plus représentée
- Médiane valeur correspondant à un effectif
cumulé de 50 - Moyenne
Effectif ( verre ? plein )
Centre de classe ( Position du verre sur le
plateau )
5Indices centraux et de dispersion
Equilibre du plateau
Mode
Médiane
Moyenne
6Indices centraux et de dispersion
Mode
Médiane
Moyenne
7Indices centraux et de dispersion
- Intervalle interquartile
- Ecart-type
8Indices centraux et de dispersion
50 de la population sur IQ 68.25 de la
population sur ? 1 ?
9Loi Normale
10Equiprobabilité
- Modèle mathématique
- Equiprobabilité Pr(A)Pr(B)
- Un exemple Somme sur jets de 2 dés
- Considérer la probabilité que la somme des 2 dés
fasse 0, 1, 2, jusquà 14 - Cad un de chance .. Une fréquence probable
- Tracer le diagramme en fréquence de ces lancers
de dés. - Rappel Pr(A et B) Pr(A) x Pr(A/B)
11Equiprobabilité
- Sur somme de 2 dés Pr(A et B) Pr(A) x Pr(A/B)
- Pr(0)0
- Pr(1)0
- Pr(2)Pr(1et1)Pr(1) x Pr(1/1)2/6 x 1/62/36
- Pr(3)Pr(1et2)2/36
- Pr(4)Pr(1et3)Pr(2et2)2/362/364/36
- Pr(5)Pr(1et4)Pr(2et3) 2/362/364/36
- Pr(6)Pr(1et5)Pr(2et4)Pr(3et3)1/6
- Pr(7)Pr(1et6)Pr(2et5)Pr(3et4)1/6
12Equiprobabilité
- Sur somme de 2 dés Pr(A et B) Pr(A) x Pr(A/B)
- Pr(8) Pr(2et6)Pr(3et5)Pr(4et4)1/6
- Pr(9) Pr(3et6)Pr(4et5)4/36
- Pr(10)Pr(4et6 )Pr(5et5)4/36
- Pr(11)Pr(5et6)2/36
- Pr(12)Pr(6et6)2/36
- Pr(13)0
- Pr(14)0
13Graphiquement
Probabilités
Sommes possibles
Courbe en cloche Loi de Gauss
14Loi Normale (Laplace-Gauss)
- - Mode, Médiane et Moyenne sont confondus
- - Symétrie / indices centraux
- 1 ? 68.25 de la population
- 2 ? 95.50 de la population
15Loi de Gauss
- Cette courbe en cloche illustre très fréquemment
les comportements humains (neurosciences,
physiologie, biomécanique, sociologie etc.)
Parlebas Cyffers, (1992)
16Variables centrées réduites
17Variables Centrées Réduites
- Lécart centré réduit est défini pour pouvoir
utiliser la Loi Normale - Situer un individu / groupe et selon différentes
variables - Pouvoir donner le nombre dindividus dans un
intervalle de performance
18Table de la loi normale
19Table de la loi normale
- Variables normales centrées réduites
20Table de la Loi normale centrée réduite
- Lecture
- Valeur d? en additionnant colonne de gauche
(dixième) et ligne du haut (centième)
Ex Soit z 0.5 une valeur de ? A lintersection
de 0.5 (première colonne) et 0 (1ère ligne) La
valeur est 0.1915 . Soit 19.15 de la
population entre 0 et z.
21Utilisation de lécart centré réduit
- Situation dun sujet / groupe selon différentes
variables - Dénombrement dans un intervalle donné
22Situation dun sujet / groupe selon différentes
variables
?
Performance centrée réduites du sujet
S1 Détente verticale Squat Saut en longueur
Profile des performances de lathlète
23Dénombrement dans un intervalle donné
Table des valeurs normales centrées réduites
- La taille dun groupe denfants suit une
distribution normale. - Indiquez la probabilité pour que
24Correction
25Dénombrement dans un intervalle donné
Table des valeurs normales centrées réduites
- La taille dun groupe denfants suit une
distribution normale. - Indiquez la probabilité pour que
26Correction
27Normalité dune distribution
28Normalité dune distribution
- Il sagit de comparer la distribution
expérimentale à la loi normale. - Si la distribution expérimentale est normale, les
tests statistiques dits paramétriques peuvent
être appliqués - sinon transformation des données (log, racine
etc) - Sinon tests non paramétriques.
29Normalité dune distribution
Cette distribution peut-elle être assimilée à
celle de Gauss ?
30Normalité dune distribution
- Normalité dune distribution
- Détermination graphique
- Détermination / indices
- Test du ?²
31Normalité de la distribution
- Détermination graphique
- Test de la droite de Henry
- Principe
- Vérifier que le graphique des fréquences cumulées
est linéaire après changement déchelle. - La transformation est appelée Anamorphose
32Détermination graphique Anamorphose
- Diagramme fréquences cumulées
Echelle danamorphose
33Détermination graphique Anamorphose
- Si la distribution est normale à 2? correspond
95.5 de la population. - Intervalle entre 2.28 et 95.5 correspond à 4?.
- Pente(Q95-Q2.28)/ 4?
- PThéo(95.5-2.28)/40.23
34Normalité dune distribution
- Normalité dune distribution
- Détermination graphique
- Détermination / indices
- Test du ?²
35Normalité dune distribution /Indices
- Une distribution est normale si
- Les indices centraux sont confondus
- ModeMédianeMoyenne
- 68.25 de la population à 1 ?
- 95.5 de la population à 2 ?
- Si ces faits sont retrouvés à partir des données
expérimentales alors, la distribution peut être
considérée comme Normale
36Normalité dune distribution
- Normalité dune distribution
- Détermination graphique
- Détermination / indices
- Test du ?²
37Test du ?²
- Le test du ?² permet de comparer 2 distributions.
- Si il est appliqué à la comparaison de la
distribution de la donnée expérimentale et dune
distribution normale (au sens Gaussien), il
permet de vérifier très précisément la normalité
de la distribution expérimentale.
38Test du ?²
- Comparer 2 fréquences
- Expérimentale (rouge)
- Normale (Bleu)
- Quantifier la somme des différences/classes
- Règle de décision / valeur théorique
39Test du ?²
- Calculer lécart centré réduit pour chaque centre
de classe Xi - Trouver la probabilité associée dans la table de
la Loi Normale Centrée Réduite
40Test du ?²
- Calculer lécart centré réduit pour chaque centre
de classe Xi - Trouver la probabilité associée dans la table de
la Loi Normale Centrée Réduite
41Test du ?²
- Pour chaque classe, ? une fth et une fobs(ni/N)
- Calculer la différence de ces fréquences pour
chaque classe
42Test du ?²
Carré des différences Rapportée à
Fth Somme Surface entre les 2 courbes
43Test du ?²
- Une table des valeurs de ?²
- La valeur est lue pour un Degrès De Liberté
(ddlN-1) - A un risque choisi (10, 5, 1)
44Test du ?²
Si ?²Calculégt ?²Théorique au risque choisi les
distributions diffèrent significativement. Sinon
elles sont statistiquement semblables.
45Test du ?²
- Le ?² calculé sur un échantillon de 19 sujets est
de 32.5. - La distribution est-elle normale au risque 5 ?
- La distribution est-elle normale au risque 1 ?
46Test du ?²
- Le ?²théorique à P0.05 pour un ddl18 est de
28.87
- 32.5 gt 28.87 donc ?²calculé gt?²théorique
- Les distributions observée (expérimentale) et
théorique (Loi Normale) sont semblables à Plt0.05 - La distribution est normale au risque Plt5
47Test du ?²
- Le ?²théorique à P0.01 pour un ddl18 est de
34.80
- 32.5 lt 34.8 donc ?²calculé lt?²théorique
- Les distributions observée (expérimentale) et
théorique (Loi Normale) sont différentes à Plt0.01 - La distribution nest pas normale au risque Plt1
- Risque inférieur entraîne une décision plus sévère
48Comparaison déchantillons paramétriques
UE 45.2 CHIV
- Pierre MORETTO,
- Université Paul Sabatier, Toulouse III.
49Comparaison déchantillons
- Règles de décisions et orientations
- Les distributions des échantillons A et B
sont-elles normales (Gaussiennes) ? - Si OUI, tests paramétriques
- Si NON,
- Transformation (racine, log ..) et retour à
- Tests Non paramétriques (Ch V)
50Comparaison déchantillons paramétriques
- Méthodologie générale Distributions
normales
51Comparaison déchantillons paramétriques
- Comparaison des variances des échantillons de
distributions normales A (?²A) et B (?²B)
52Comparaison des variances
53Comparaison des variances
- Le test est appelé Test F de Fisher-Snedecor
- Il est basé sur le rapport (F) des variances des
échantillons A et B - Donc
- si les variances sont semblables le rapport F est
proche de 1 - si les variances diffèrent le rapport F séloigne
de 1 - Dans les 2 cas lobjectivité impose de savoir
de combien et à quel risque ?
54Histogramme
55Le diagramme cumulatif
56Détermination Graphiques
- Ces graphiques permettent de déterminer
- Des indices centraux
- Mode et médiane
- Des indices de dispersion
- Quartiles
- Intervalle interquartile
57Détermination du mode Histogramme
- - Repérer le plus grand effectif
- - Le mode est la performance (61.5 cm) la plus
représentée (33) - (cad pour laquelle la fréquence est la plus
importante)
58Détermination de la médiane Fréq cumulées
- - Repérer 50 sur leffectif cumulé (ordonnées)
- - Projeter sur laxe des performances
- - La médiane est la performance (57.5 cm) qui
coupe leffectif en deux parties égales (cad 50
font plus mais 50 font moins de 57.5 cm de
détente verticale)
59Lintervalle et lhétérogénéité
Dans les 2 cas 50 de la population sont
distribués sur IQ
IQ1
IQ2
60Les indices de dispersion
- Lécart-type
- À partir de lensemble des valeurs (Nlt30)
- A partir de données regroupées (Ngt30)
A certaines conditions (de normalité), 68.5 de
la population sont distribués sur une étendue de
?1?
61Distribution et hétérogénéité
68.5 de la population distribués sur ? 1
lécart-type autour de la moyenne
? 1 ?
- 1 ?