Diapositive 1 - PowerPoint PPT Presentation

1 / 40
About This Presentation
Title:

Diapositive 1

Description:

Permet de confirmer ou d'infirmer une hypoth se avec une marge d'erreur la plus ... Adulte III. 47. Adulte II. 35. Adulte 1. 12. Juv niles. Fr quence absolue. ge ... – PowerPoint PPT presentation

Number of Views:43
Avg rating:3.0/5.0
Slides: 41
Provided by: thib2
Category:

less

Transcript and Presenter's Notes

Title: Diapositive 1


1
Biostatistiques
Thierry THIBAUT
2
But des statistiques Permet de confirmer ou
dinfirmer une hypothèse avec une marge derreur
la plus petite possible et/ou prédire un
événements à laide doutils
Statistiques descriptives
Statistiques inférentielles
3
La démarche scientifique
4
Statistiques descriptives Identification des
données
5
Population-cible ensemble des éléments visés,
en principe, par l'échantillonnage. - quelle est
la population-cible? Il s'agit là de la
population sur laquelle on aimerait bien que les
conclusions de l'étude portent.
Population statistique ensemble des éléments
effectivement représentés par l'échantillonnage.
Les éléments qui la composent se caractérisent
par au moins une caractéristique commune et
exclusive qui permettent de les distinguer sans
ambiguïté. - quelle est la population
statistique?Il faut mentionner la ou les
caractéristiques qui permettent de la distinguer
de toute autre population statistique.
6
Échantillon (sample) fragment d'un ensemble
prélevé pour juger de cet ensemble. Fraction de
la population statistique sur laquelle des
mesures sont faites pour connaître les propriétés
de cette population. - quel est l'échantillon?
Quel est son effectif?
Échantillonnage aléatoire simple Prélèvement
au hasard, et de façon indépendante, dun certain
nombre n déléments de la population statistique
de N éléments. Chaque élément de la population
doit avoir la même probabilité dêtre sélectionné.
Échantillon représentatif Échantillon qui
reflète fidèlement la complexité et la
composition de la population. Léchantillonnage
aléatoire ainsi que linventaire
exhaustif (recensement), sont deux façons
dobtenir un échantillon représentatif dune
population. Aussi mélange suivi du prélèvement
de n individus.
7
  • Élément membre d'une population statistique
    (spécimen, prélèvement d'eau, individu...)
  • quel est l'élément?Il faut le définir de manière
    à pouvoir le reconnaître sans ambiguïté.

8
Variable Toute caractéristique mesurable ou
observable sur un élément d'échantillonnage (var.
propre) ou sur son environnement (var. associée)
Descripteur, caractère, attribut, observation,
trait, profil (en géophysique), item (dans les
questionnaires de psychologie), stimulus (en
étude du comportement).
Variable aléatoire Variable dont la valeur
(ou létat) est le résultat dun processus
aléatoire. Pour un élément donné, la valeur
précise prise par une variable aléatoire nest
pas connue avant quune observation nait été
faite.
Variable contrôlée Variable dont la valeur
est déterminée par le chercheur et connue de
façon précise. En expérimentation contrôlée, il
sagit des variables dont la valeur est
déterminée par lexpérimentateur qui connaît
ainsi leur valeur précise, à lerreur de
manipulation près. Lors dexpériences mesurant un
phénomène naturel, les régions échantillonnées,
par exemple, constituent clairement une variable
contrôlée. De même, les stations et les moments
déchantillonnage spécifiés dans le plan
déchantillonnage sont déterminés à lavance par
le chercheur et leur position est connue de façon
précise il sagit donc, au sens strict, de
variables contrôlées.
9
(No Transcript)
10
Statistiques descriptives Représentation des
données
Lobjectif est de transmettre un message clair au
lecteur Le graphique le plus simple est toujours
le plus clair
Le choix de la méthode de représentation se fait
selon - le type de série statistique (simple ou
double) - le type de variable (qualitative,
quantitative discrète ou continue)
11
(No Transcript)
12
Variable qualitative (ou variable
semi-quantitative comportant un petit nombre de
classes) chaque catégorie dobservations forme
une classe. On dénombre les éléments de chaque
classe.
Tableau de fréquences du nombre de souris
sylvestres en fonction de leur âge récoltées par
Landry (2000) dans des populations insulaires du
Lac Duparquet (Abitibi, Québec).
13
Variable quantitative (ou variable
semi-quantitative comportant un grand nombre de
classes) on regroupe les observations en
classes.
Établir des classes
14
Définir les bornes, les intervalles et les
indices des classe
Borne inférieure dune classe la plus petite
valeur admise dans la classe (ex. 15 g). Borne
supérieure dune classe la plus grande valeur
admise dans la classe (ex. 15,9999... g)
Intervalle de classe (ex. de 15 à 16 g
intervalle 1 g). Lintervalle se calcule
approximativement comme suit Indice de
classe valeur centrale de la classe (ex. 15,5
g).
gtFaire coïncider les bornes et les indices de
classes avec des nombres comportant peu de
décimales, délimiter des classes dégale étendue,
les classes ne se chevauchent pas.
Dénombrer les éléments appartenant à chaque
classe (la fréquence absolue ou leffectif de la
classe)
15
Exemple Longueur totale du crâne (mm) pour un
sous-échantillon de 60 souris sylvestres adultes
(I, II et III), tiré dun échantillon de 122
souris de Landry (2000).
16
Combien de classes? Effectif de léchantillon
(n) 60 Selon la règle de Sturge nb de
classe 1 (3,3 log1060) 6,87 7 classes
Selon la règle de Yule nb de classes 2.5
4v60 2.5 2.78 6.95 7 classes
Quelle sera l'étendue des classes? Étendue de
variation de la variable max - min 25,74 -
22,28 3,46 Ainsi 3,46/7 0,49 0,5 mm
17
Bornes, intervalles et indices des classe
? Attention nous voulons des valeurs simples
avec très peu de décimales! Valeur minimum des
données 22,28 Nous avons 7 classes de 0,5 mm
chacune. Une série simple donnerait les indices
de classe suivants 22,5 23,0 23,5 24,0
24,5 25,0 et 25,5 Les bornes inférieure et
supérieure de la première classe sont 22,25 et
22,75. Les bornes inférieure et supérieure de la
dernière classe sont 25,25 et 25,75. Nos
classes incluent donc lensemble des 60 données,
ce qui est nécessaire. ATTENTION! Les classes ne
se chevauchent jamais la borne supérieure est
généralement exclue de lintervalle de classe.
Ex la classe 1 inclut toutes les valeurs 22,25
x lt 22,75
18
Les différentes fréquences Fréquence absolue
fi effectif de la classe i 0, 8 Fréquence
relative fi rel. fi /n 0, 1 Pourcentage
i 100 fi /n 0, 100 Fréquence cumulée
dune classe fi cum. 0, 8 Fréquence
relative cumulée fi rel. cum. fi cum./n 0,
1 Pourcentage cumulé i cum. 100 fi cum./n
0, 100
19
Tableau de fréquences de la longueur totale du
crâne de 60 souris sylvestres récoltées par
Landry (2000) dans des populations insulaires du
Lac Duparquet (Abitibi, Québec).
20
Histogramme représentant la distribution de
fréquences relatives de la longueur totale du
crâne de 60 souris récoltées par Landry (2000)
dans des populations insulaires du Lac Duparquet
(Abitibi, Québec).
21
Polygone de fréquences représentant la
distribution de fréquences relatives de la
longueur totale du crâne de 60 souris récoltées
par Landry (2000) dans des populations insulaires
du Lac Duparquet (Abitibi, Québec).
22
(No Transcript)
23
2 variables qualitatives
Tableau de contingence montrant la relation entre
la confession et l'obédience politique de 518
citoyens américains en 1976.
24
2 variables quantitatives
Tableau de corrélation de la largeur (mm) et de
la longueur totale (mm) du crâne chez 60 souris
sylvestres dans des populations insulaires du lac
Duparquet (Abitibi, Québec Landry, 2000).
25
Diagramme de dispersion de la largeur (mm) et de
la longueur totale (mm) du crâne chez 60 souris
sylvestres dans des populations insulaires du lac
Duparquet (Abitibi, Québec Landry, 2000).
26
Dautres définitions
Population biologique ensemble des individus
d'une même espèce habitant un lieu donné à un
moment donné. Notion qui relève davantage de la
biologie que de la statistique. quelle est la
population biologique? Il faut spécifier le temps
et le lieu.
Communauté ensemble des individus de diverses
espèces retrouvés dans un espace et un temps
donnés. Notion qui relève davantage de la
biologie que de la statistique. - quelle est la
communauté? Il faut spécifier le temps et le
lieu.
27
Plan d'échantillonnage Un plan
déchantillonnage a pour but de définir les
conditions de prise des données en fonction du
but de l'étude, tout en s'assurant de la
représentativité de léchantillon Un
échantillon représentatif reflète fidèlement la
composition et la complexité de la population
statistique. Il comporte toujours un élément de
hasard (aléatoire).
Échantillonnage aléatoire simple Prélèvement
au hasard dun nombre n déléments. Chaque
élément a une probabilité égale dêtre prélevé.
Cas particulier le recensement
(échantillonnage exhaustif).
Échantillonnage stratifié Subdivision dune
population hétérogène en sous-populations
homogènes (selon un critère bien défini).
Échantillonnage aléatoire simple dans chacune de
ces sous-populations
Échantillonnage systématique Prélèvement
régulier dans le temps ou dans lespace des
éléments. Assure une répartition uniforme des
éléments. Le pas d'échantillonnage pe est
défini selon le rapport entre le nombre
d'éléments disponibles dans la population
(effectif total) N et le nombre d'éléments à
sélectionner dans l'échantillon n. pe est
l'entier inférieur le plus proche de N/n.
L'emplacement (ou le temps) du premier élément
choisi est sélectionné aléatoirement, les valeurs
possibles allant de 1 à N. On peut définir des
échantillonnages systématiques à pas multiples
(combinaison de plusieurs pas).
28
Statistiques descriptives Paramètres dune
distribution
Paramètres de position (valeurs centrales autour
desquelles se groupent les valeurs observées)
désigne la moyenne arithmétique de n éléments (n
effectif) tirés dun échantillon. Mêmes unités
que x.
29
Médiane (median) Mex La médiane est la valeur
de la variable qui se situe au centre de la série
statistique, classée en ordre croissant. La
médiane sépare la série en deux groupes dégale
importance. Sil y a un nombre impair
dobservations, Me est une observation de
la série. Exemple pour la série 1, 32, 128,
129, 1000235, Me 128. Sil y a un nombre
pair dobservations, la médiane est située entre
les deux observations centrales de la série. Par
convention, on utilise la moyenne de ces deux
valeurs. Exemple pour la série 1, 32, 128, 129,
532, 1000235, Me 128,5.
30
  • Mode Mo
  • Le mode est lindice de la classe comportant le
    plus de valeurs. Dans une distribution continue
    cest la "bosse" de la distribution.
  • Il peut y avoir plusieurs modes dans une
    distribution.
  • Pour être plus précis on peut calculer le Mode
    corrigé

31
Mode corrigé
32
(No Transcript)
33
Intérêt de chaque paramètre de position
34
Forme dune distribution en fonction de ses
paramètres de position
35
Paramètres de dispersion (ils renseignent sur
létalement des valeurs observées)
Étendue de variation (range) Calcul valeur
maximum valeur minimum
36
(No Transcript)
37
(No Transcript)
38
(No Transcript)
39
(No Transcript)
40
(No Transcript)
Write a Comment
User Comments (0)
About PowerShow.com