DONNEES CENTREES et NORMALITE - PowerPoint PPT Presentation

1 / 61
About This Presentation
Title:

DONNEES CENTREES et NORMALITE

Description:

DONNEES CENTREES ET NORMALITE UE 45.2 CHIII Pierre MORETTO, Universit Paul Sabatier, Toulouse III. – PowerPoint PPT presentation

Number of Views:47
Avg rating:3.0/5.0
Slides: 62
Provided by: Pier2202
Category:

less

Transcript and Presenter's Notes

Title: DONNEES CENTREES et NORMALITE


1
DONNEES CENTREESet NORMALITE
UE 45.2 CHIII
  • Pierre MORETTO,
  • Université Paul Sabatier, Toulouse III.

2
Données centrées et normalité
  • Indices centraux
  • Dispersion
  • Loi Normale (Equiprobabilité)
  • Variables centrées réduites
  • Normalité dune distribution
  • Détermination graphique
  • Détermination / indices
  • Test du ?²
  • Les étapes

3
Indices centraux et de dispersion
  • Mode, Médiane, Moyenne
  • Quartile, variance et écart-type

4
Indices centraux et de dispersion
  • Centraux
  • Mode valeur la plus représentée
  • Médiane valeur correspondant à un effectif
    cumulé de 50
  • Moyenne

Effectif ( verre ? plein )
Centre de classe ( Position du verre sur le
plateau )
5
Indices centraux et de dispersion
Equilibre du plateau
Mode
Médiane
Moyenne
6
Indices centraux et de dispersion
Mode
Médiane
Moyenne
7
Indices centraux et de dispersion
  • Dispersion
  • Intervalle interquartile
  • Ecart-type

8
Indices centraux et de dispersion
50 de la population sur IQ 68.25 de la
population sur ? 1 ?
9
Loi Normale
  • Equiprobabilité

10
Equiprobabilité
  • Modèle mathématique
  • Equiprobabilité Pr(A)Pr(B)
  • Un exemple Somme sur jets de 2 dés
  • Considérer la probabilité que la somme des 2 dés
    fasse 0, 1, 2, jusquà 14
  • Cad un de chance .. Une fréquence probable
  • Tracer le diagramme en fréquence de ces lancers
    de dés.
  • Rappel Pr(A et B) Pr(A) x Pr(A/B)

11
Equiprobabilité
  • Sur somme de 2 dés Pr(A et B) Pr(A) x Pr(A/B)
  • Pr(0)0
  • Pr(1)0
  • Pr(2)Pr(1et1)Pr(1) x Pr(1/1)2/6 x 1/62/36
  • Pr(3)Pr(1et2)2/36
  • Pr(4)Pr(1et3)Pr(2et2)2/362/364/36
  • Pr(5)Pr(1et4)Pr(2et3) 2/362/364/36
  • Pr(6)Pr(1et5)Pr(2et4)Pr(3et3)1/6
  • Pr(7)Pr(1et6)Pr(2et5)Pr(3et4)1/6

12
Equiprobabilité
  • Sur somme de 2 dés Pr(A et B) Pr(A) x Pr(A/B)
  • Pr(8) Pr(2et6)Pr(3et5)Pr(4et4)1/6
  • Pr(9) Pr(3et6)Pr(4et5)4/36
  • Pr(10)Pr(4et6 )Pr(5et5)4/36
  • Pr(11)Pr(5et6)2/36
  • Pr(12)Pr(6et6)2/36
  • Pr(13)0
  • Pr(14)0

13
Graphiquement
Probabilités
Sommes possibles
 Courbe en cloche  Loi de Gauss
14
Loi Normale (Laplace-Gauss)
  • - Mode, Médiane et Moyenne sont confondus
  • - Symétrie / indices centraux
  • 1 ? 68.25 de la population
  • 2 ? 95.50 de la population

15
Loi de Gauss
  • Cette courbe en cloche illustre très fréquemment
    les comportements humains (neurosciences,
    physiologie, biomécanique, sociologie etc.)

Parlebas Cyffers, (1992)
16
Variables centrées réduites
17
Variables Centrées Réduites
  • VCR
  • Intérêts
  • Lécart centré réduit est défini pour pouvoir
    utiliser la Loi Normale
  • Situer un individu / groupe et selon différentes
    variables
  • Pouvoir donner le nombre dindividus dans un
    intervalle de performance

18
Table de la loi normale
  • Loi Normale
  • VCR

19
Table de la loi normale
  • Variables normales centrées réduites

20
Table de la Loi normale centrée réduite
  • Lecture
  • Valeur d? en additionnant colonne de gauche
    (dixième) et ligne du haut (centième)

Ex Soit z 0.5 une valeur de ? A lintersection
de 0.5 (première colonne) et 0 (1ère ligne) La
valeur est 0.1915 . Soit 19.15 de la
population entre 0 et z.
21
Utilisation de lécart centré réduit
  • Situation dun sujet / groupe selon différentes
    variables
  • Dénombrement dans un intervalle donné

22
Situation dun sujet / groupe selon différentes
variables
?
Performance centrée réduites du sujet
S1 Détente verticale Squat Saut en longueur
Profile des performances de lathlète
23
Dénombrement dans un intervalle donné
Table des valeurs normales centrées réduites
  • La taille dun groupe denfants suit une
    distribution normale.
  • Indiquez la probabilité pour que

24
Correction
25
Dénombrement dans un intervalle donné
Table des valeurs normales centrées réduites
  • La taille dun groupe denfants suit une
    distribution normale.
  • Indiquez la probabilité pour que

26
Correction
27
Normalité dune distribution
28
Normalité dune distribution
  • Il sagit de comparer la distribution
    expérimentale à la loi normale.
  • Si la distribution expérimentale est normale, les
    tests statistiques dits paramétriques peuvent
    être appliqués
  • sinon transformation des données (log, racine
    etc)
  • Sinon tests non paramétriques.

29
Normalité dune distribution
Cette distribution peut-elle être assimilée à
celle de Gauss ?
30
Normalité dune distribution
  • Normalité dune distribution
  • Détermination graphique
  • Détermination / indices
  • Test du ?²

31
Normalité de la distribution
  • Détermination graphique
  • Test de la droite de Henry
  • Principe
  • Vérifier que le graphique des fréquences cumulées
    est linéaire après changement déchelle.
  • La transformation est appelée  Anamorphose 

32
Détermination graphique Anamorphose
  • Diagramme fréquences cumulées
  • Droite de Henry

Echelle danamorphose
33
Détermination graphique Anamorphose
  • Droite de Henry
  • Calcul de la pente
  • Si la distribution est normale à 2? correspond
    95.5 de la population.
  • Intervalle entre 2.28 et 95.5 correspond à 4?.
  • Pente(Q95-Q2.28)/ 4?
  • PThéo(95.5-2.28)/40.23

34
Normalité dune distribution
  • Normalité dune distribution
  • Détermination graphique
  • Détermination / indices
  • Test du ?²

35
Normalité dune distribution /Indices
  • Une distribution est normale si
  • Les indices centraux sont confondus
  • ModeMédianeMoyenne
  • 68.25 de la population à 1 ?
  • 95.5 de la population à 2 ?
  • Si ces faits sont retrouvés à partir des données
    expérimentales alors, la distribution peut être
    considérée comme  Normale 

36
Normalité dune distribution
  • Normalité dune distribution
  • Détermination graphique
  • Détermination / indices
  • Test du ?²

37
Test du ?²
  • Le test du ?² permet de comparer 2 distributions.
  • Si il est appliqué à la comparaison de la
    distribution de la donnée expérimentale et dune
    distribution normale (au sens Gaussien), il
    permet de vérifier très précisément la normalité
    de la distribution expérimentale.

38
Test du ?²
  • Principe
  • Comparer 2 fréquences
  • Expérimentale (rouge)
  • Normale (Bleu)
  • Quantifier la somme des différences/classes
  • Règle de décision / valeur théorique

39
Test du ?²
  • Quantifier la différence
  • Calculer lécart centré réduit pour chaque centre
    de classe Xi
  • Trouver la probabilité associée dans la table de
    la Loi Normale Centrée Réduite

40
Test du ?²
  • Quantifier la différence
  • Calculer lécart centré réduit pour chaque centre
    de classe Xi
  • Trouver la probabilité associée dans la table de
    la Loi Normale Centrée Réduite

41
Test du ?²
  • Quantifier la différence
  • Pour chaque classe, ? une fth et une fobs(ni/N)
  • Calculer la différence de ces fréquences pour
    chaque classe

42
Test du ?²
  • Calcul de lindice

Carré des différences Rapportée à
Fth Somme  Surface entre les 2 courbes 
43
Test du ?²
  • Règle de décision
  • Une table des valeurs de ?²
  • La valeur est lue pour un Degrès De Liberté
    (ddlN-1)
  • A un risque choisi (10, 5, 1)

44
Test du ?²
  • Règle de décision

Si ?²Calculégt ?²Théorique au risque choisi les
distributions diffèrent significativement. Sinon
elles sont statistiquement semblables.
45
Test du ?²
  • Exemple
  • Table du ?²
  • Le ?² calculé sur un échantillon de 19 sujets est
    de 32.5.
  • La distribution est-elle normale au risque 5 ?
  • La distribution est-elle normale au risque 1 ?

46
Test du ?²
  • Correction
  • Table du ?²
  • Le ?²théorique à P0.05 pour un ddl18 est de
    28.87
  • 32.5 gt 28.87 donc ?²calculé gt?²théorique
  • Les distributions observée (expérimentale) et
    théorique (Loi Normale) sont semblables à Plt0.05
  • La distribution est normale au risque Plt5

47
Test du ?²
  • Correction
  • Table du ?²
  • Le ?²théorique à P0.01 pour un ddl18 est de
    34.80
  • 32.5 lt 34.8 donc ?²calculé lt?²théorique
  • Les distributions observée (expérimentale) et
    théorique (Loi Normale) sont différentes à Plt0.01
  • La distribution nest pas normale au risque Plt1
  • Risque inférieur entraîne une décision plus sévère

48
Comparaison déchantillons paramétriques
UE 45.2 CHIV
  • Pierre MORETTO,
  • Université Paul Sabatier, Toulouse III.

49
Comparaison déchantillons
  • Règles de décisions et orientations
  • Les distributions des échantillons A et B
    sont-elles normales (Gaussiennes) ?
  • Si OUI, tests paramétriques
  • Si NON,
  • Transformation (racine, log ..) et retour à
  • Tests Non paramétriques (Ch V)

50
Comparaison déchantillons paramétriques
  • Méthodologie générale Distributions
    normales

51
Comparaison déchantillons paramétriques
  • Comparaison des variances des échantillons de
    distributions normales A (?²A) et B (?²B)

52
Comparaison des variances
  • Echantillon A
  • Echantillon B

53
Comparaison des variances
  • Le test est appelé  Test F de Fisher-Snedecor 
  • Il est basé sur le rapport (F) des variances des
    échantillons A et B
  • Donc
  • si les variances sont semblables le rapport F est
    proche de 1
  • si les variances diffèrent le rapport F séloigne
    de 1
  • Dans les 2 cas lobjectivité impose de savoir
    de combien et à quel risque ?

54
Histogramme
55
Le diagramme cumulatif
56
Détermination Graphiques
  • Ces graphiques permettent de déterminer
  • Des indices centraux
  • Mode et médiane
  • Des indices de dispersion
  • Quartiles
  • Intervalle interquartile

57
Détermination du mode Histogramme
  • - Repérer le plus grand effectif
  • - Le mode est la performance (61.5 cm) la plus
    représentée (33)
  • (cad pour laquelle la fréquence est la plus
    importante)

58
Détermination de la médiane Fréq cumulées
  • - Repérer 50 sur leffectif cumulé (ordonnées)
  • - Projeter sur laxe des performances
  • - La médiane est la performance (57.5 cm) qui
    coupe leffectif en deux parties égales (cad 50
    font plus mais 50 font moins de 57.5 cm de
    détente verticale)

59
Lintervalle et lhétérogénéité
Dans les 2 cas 50 de la population sont
distribués sur IQ
IQ1
IQ2
60
Les indices de dispersion
  • Lécart-type
  • À partir de lensemble des valeurs (Nlt30)
  • A partir de données regroupées (Ngt30)

A certaines conditions (de normalité), 68.5 de
la population sont distribués sur une étendue de
?1?
61
Distribution et hétérogénéité
68.5 de la population distribués sur ? 1
lécart-type autour de la moyenne
? 1 ?
- 1 ?
Write a Comment
User Comments (0)
About PowerShow.com