Title: V
1Vérification des données
2Entrée des données
Fichier Excel
- Données brutes
- Nom Note score R age sexe
- Houle, N. A 30 21 f
- Darcy, T. B 27 25 m
- Petit, M. C 31 23 m
- Legrand, P. A 28 24 f
- .
- .
- .
- .
- .
- Baron, C. B 29 24 m
3Data window
4Premières vérifications
- Vérification du fichier de données
- Données manquantes
- Exclusion des variables ou des cas générant un
pourcentage important de données manquantes - Remplacement des valeurs manquantes
- Moyenne de groupe
- Régression
- Valeurs extrêmes
- Univariées
- Multivariées
5Influence des valeurs extrêmes Examine ltnom de
variablegt
6Valeurs extrêmes univariées (SPSS - Explore)
7Valeurs extrêmes multivariées
8Normalité de distribution
Number of valid observations (listwise)454.00 V
ariable ltnom de variablegt Mean
9.649 Std Dev
7.642 Kurtosis 11.157
S.E. Kurt .229 Skewness 2.755
S.E. Skew .115 Minimum
1.00 Maximum
58.00
Distribution normale gt Coefficient de
dissymétrie (skewness) 0 et Coefficient
daplatissement (kurtosis) 0
9Vérification de normalité SPSS Explore
10(No Transcript)
11Homocédasticité
- Homogénéité de la variance La variance dune
variable dépendante est la même pour les
différents niveaux de la variable indépendante - Homocédasticité La variance des scores pour une
variable est la même pour toutes les valeurs
dune autre variable - Manque de Homocédasticité
- Non normalité dune des variables
- Ex âge et salaire (salaire est biaisé
positivement) - Plus derreur de mesure pour certains niveaux
dune des variables - Ex des personnes dune certain âge sont plus
préoccupées avec leur santé et donnent donc des
informations plus fiables à ce sujet
12Solutions
- Taille de léchantillon
- Normalité Une Anova avec plus de 20 dferreur est
assez robuste dans le cas de violation de
normalité - Homogénéité des variances Taille des groupes
égale -gt peu problématique - Taille inégale (Fmax rapport entre la variance
la plus large et la variance la plus petite) - rapport entre la cellule la plus importante et la
cellule la plus petite env. 4 pour 1 Fmax 10 - rapport entre la cellule la plus importante et la
cellule la plus petite plus important Fmax lt 3 - Transformations
13Transformations
14Transformation logarithmique
15(No Transcript)
16Interprétation des résultats
17Le test statistique
- Quelles sont les informations fournies par un
test statistique? - Un test statistique répond à la question
- Est-ce que la différence entre le groupe
expérimental et le groupe contrôle est telle que
lon puisse conclure quelle nest pas due au
hasard? - La réponse dépend
- de la taille deffet
- du nombre de sujets
- du test statistique utilisé
- du niveau alpha fixé
18MAGIC
- Magnitude ? la taille de leffet
- ? est-ce que linfluence de la VI sur la VD est
importante? - Articulation ? le degré de détail énoncé
- ? facilité de tirer des conclusions utiles (ex
les moyennes des cinq groupes A,B,C,D,E ne sont
pas les mêmes - vs
- les moyennes des groupes C,D,E sont
significativement différentes des moyennes de A
et B bien que ceux-ci ne différent pas entre eux
- ou
- on observe une augmentation linéaire des
moyennes de A à E - Generality ??validité externe
- ? permet la généralisation des résultats
- Interestingness ? limportance théorique
- est-ce que létude fournit des nouvelles
connaissances? - Credibility ? validité interne
- ? la qualité de lopérationnalisation des
variables, contrôle des artefacts potentiels
19Significatif ou non
- Exemples
- Le résultat est significatif au niveau de .07
- Le résultat est marginalement significatif
- Bien que le résultat ne soit pas significatif au
niveau conventionnel de .05, il suggère que ... - Tukey (1991)
- .05 lt p lt .15 the difference leans in the ...
direction - .15 lt p lt .25 there is a hint regarding the
direction
20Style
- Style conservateur
- nutilise jamais des tests unidirectionnels
- nutilise quune seule analyse pré-déterminée
- nexclue jamais de valeurs extrêmes
- évite de se concentrer sur un seul résultat en
particulier, surtout sil est favorable - ne dévie jamais dun seuil de signification
pré-établi
21Présentation des résultats
22Analyse de la variance
Degrées de liberté (effet, erreur)
Valeur p
Eta2 taille deffet
Valeur F
23Les tableaux et les figures
24Les erreurs les plus communes
- Répéter les mêmes informations dans une figure,
un tableau, ou bien dans le texte - Présenter des tableaux ou des figures qui sont
incompréhensibles sans l aide du texte - Présenter des données dans des tableaux ou des
figures sans discuter de leur signification dans
le texte
25Les tableaux
- Quand ?
- Pour des petites séries de données peu complexes
- Comment ?
- Mettre les informations dans les colonnes et les
lignes dans un ordre logique (p.ex dans lordre
de limportance des items) - Choisissez un nombre de chiffres raisonnable
(p.ex 3578 plutôt que 3578,887, 1,34 plutôt que
1,3434562) - Arrangez les items tel que les comparaisons
importantes soient faciles à faire
26APA
- Emplacement
- Après les notes de bas de page, à la fin du
document - Dans le texte on signale
- ----------------------
- Insert Table 1 here
- ----------------------
- Numérotation
- Chiffres arabes sans suffixes (donc 5 et 6 à la
place de 5a et 5b) - Titre
- Doit décrire de manière précise les variables
indépendantes et dépendantes tel que le lecteur
sait ce qui est présenté sans avoir recours au
texte (ex Mean log-transformed post-auricular
reflex magnitude as a function of emotional
facial expression and expresser sex )
27Figures
- Pour des fins de vérification et dinterprétation
des données - Pour des fins de communication des résultats
28Née en 1323 à Allemagne (À louest de Riez),
FranceMort le 11 juillet 1382 à Lisieux, France
29Stem-and-leaf Plot (Tracés en arborescence)
Exemple Un enseignant a demandé à 10 élèves
d'indiquer combien de livres ils avaient lu au
cours des 12 derniers mois. Voici leurs réponses
12, 23, 19, 6, 10, 7, 15, 25, 21, 12
Tige Feuille 0 6 7 1 0 2 5 9 2 1 2
3 5
- Cette forme de présentation des données permet
facilement de détecter des distributions
problématiques
30Box Plot
- Ce type de figure est construit à partir de la
médiane, des deux quartiles et des valeurs
extrêmes - Les valeurs extrêmes se retrouvent à plus de 1.5
espaces interquartiles en bas ou en haut des
quartiles - Les valeurs extrêmement extrêmes se retrouvent à
plus de 3 espaces interquartiles en bas ou en
haut des quartiles
31Box Plot exemple
32Comparaison des séries des données
33Communication des résultats
- Présentation claire avec des symboles distincts
- Supprimez des informations non essentielles
- Éviter trop de points sur l échelle
- Ne mettez pas dinformations supplémentaires (ex
légende) dans la région des données - Quand des symboles ou des lignes chevauchent,
utiliser des moyennes qui aident à la
discrimination visuelle - Faire plusieurs essais afin de voir quel type de
graphique communique le mieux les données
34suite
- Deux graphiques clairs sont mieux quun graphique
surchargé par des données ou des symboles - Il est acceptable de se servir dun graphique
complexe sil permet de visualiser un résultat
complexe - Quand plusieurs graphiques devraient être
comparés il faut quils aient la même échelle - Il est possible dindiquer létendue de mesure
(ex 0-200) sur le titre de laxe et de la
commencer avec une autre valeur afin daméliorer
la résolution - Voir aussi http//www.statcan.ca/francais/edu/pow
er/ch9/first9_f.htm
35Exemple I
- Problème peu de données avec un patron simple -gt
mieux sous forme de tableaux
36Exemple II
- Problème demande le jugement des longueurs
relatives, ce qui est plutôt difficile
37Capacités cognitives impliquées dans la lecture
de figures
- Position sur une échelle commune
- Position sur des échelles identiques mais non
alignées - Longueur
- Angle/pente
- Surface
- Volume
- Gradation des couleurs
38Exemple III
39APA
- Impression
- Très bonne qualité sur une feuille 8 x 11.5
- Emplacement Après les tableaux (pages non
numérotées) - Dans le texte on signale
- -----------------------
- Insert Figure 1 here
- -----------------------
- La légende est sur la page de la figure et ne
fait pas partie du titre - Numérotation
- Chiffres arabes
- Titres
- Sur une feuille à part (la dernière page
numérotée du document)
40Références
- Abelson, R.P. (1995). Statistics as principled
argument. Hillsdale, NJ Lawrence Erlbaum. - Sternberg, R.J. (2005). The psychologists
companion (4th ed.). New York, NY Cambride
University Press . - Cohen, J. (1994). The earth is round (p lt .05).
American Psychologist, 49, 997-1003. - Cohen, J. (1990). Things that I have learned (so
far). American psychologist, 45, 1304-1312. - Cowles, M. Davis, C. (1982). On the origins of
the .05 level of statistical significance.
American Psychologist, 37, 553-558.