Title: Chapitre 8: La gestion des donn
1Chapitre 8 La gestion des données
- Consulte les pages 366 et 367 pour les concepts
et vocabulaire clés
2Chapitre 8 Prépare-toi
- Avant de commencer le chapitre 8, il faut réviser
ces concepts - Représenter des données
- Les diagrammes à boîte et à moustaches
- Les mesures de tendance centrale
- Interpoler et Extrapoler des valeurs
38.1 Les diagrammes de dispersion
- Statistique Canada collectionne et organise des
données pour aider les Canadiens à mieux
comprendre leur pays sa population, ses
ressources, son économie, sa société et sa
culture.
4Les diagrammes de dispersion
- Un diagramme de dispersion est un diagramme qui
permet de représenter graphiquement des couples
de données numériques. - Il sert à voir des relations entre deux
variables.
5La droite la mieux ajustée
- La droite la mieux ajustée est la droite qui
passe par les points représentés dans un
diagramme de dispersion ou qui passe le plus près
possible de ces points.
6Une valeur aberrante
- Une valeur aberrante est une donnée qui ne suit
pas la régularité qui se dégage des autres
données. - Cette donnée semble très à lécart de la plupart
des données.
7Interpoler des valeurs
- Interpoler des valeurs veut dire lestimer des
valeurs qui se trouvent entre des données connues.
8Extrapoler des valeurs
- Extrapoler des valeurs veut dire lestimer des
valeurs qui se trouvent à lextérieur des données
connues.
9Les variables indépendantes
- Dans une relation, la variable indépendante est
la variable qui détermine la valeur de la
variable dépendante. - Par exemple, avec la vitesse, distance/temps, le
temps est la variable indépendante parce que la
distance le dépend. - Dhabitude, la variable indépendante est x
10Les variables dépendantes
- Dans une relation, la variable dépendante est la
variable dont la valeur est déterminée par la
variable indépendante - Par exemple, avec la vitesse, distance/temps, la
distance est la variable dépendante parce que la
distance dépend sur le temps pour sa valeur. - Dhabitude, la variable dépendante est y
11Les types des données
- des données continus
- des données discrètes
12Des données continues
- Si une variable peut représenter nimporte quel
nombre réel, les données sont des données
continus. - Quand les données sont rattachées ensemble pour
former une droite, cela représente des données
continues. - Un exemple des données continus est la
température.
13Des données discrètes
- Si la variable ne peut pas être nimporte quel
nombre réel (i.e. un nombre décimal), les données
sont des données discrètes. - Quand les données ne sont pas rattachées
ensemble, cela représente des données discrètes.
- Un exemple des données discrètes sont comme le
nombre des pages dans un livre.
14Une corrélation 1
- Pour mieux comprendre et mieux organiser les
données, Statistique Canada trace des diagrammes
de dispersion pour déterminer une corrélation
entre deux variables.
15Une corrélation 2
- Une corrélation est la mesure de la dispersion
des points autour dune droite dans un diagramme
de dispersion (le degré de relation entre deux
variables)
16Les adjectifs dune corrélation
- La corrélation entre 2 variables peuvent être
- Forte
- Faible
- Positive
- Négative
- Nest pas apparente
17Une corrélation forte
- Si la plupart des points sont groupés autour
dune droite, la corrélation est forte.
18Une corrélation faible
- Si les points sont dispersés, mais montrent une
tendance générale, la corrélation est faible.
19La corrélation positive
- Une corrélation positive veut dire que la
relation entre les variables est positive. - Par exemple, quand la variable indépendante
augmente, la variable dépendante augmente alors
la pente est positive (elle monte de gauche à
droite)
20La corrélation négative
- Une corrélation négative veut dire que la
relation entre les variables est négative. - Par exemple, quand la variable indépendante
augmente, la variable dépendante diminue alors la
pente est négative (elle descend de gauche à
droite)
21Une corrélation nest pas apparente
- Si les points sont dispersés et ils ne montrent
pas de tendance générale, il ny a pas de
corrélation ou la corrélation nest pas
apparente.
22Une relation
- Une relation est une régularité entre deux
ensembles de nombres. - Une relation a relationship
23Les types des relations
- Avec la gestion des données, il y a 2 types de
relations
- Une relation linéaire (elle forme une ligne
droite) - Une relation non linéaire (elle ne forme pas de
ligne droite)
248.2 Analyser des données et faire des prévisions
- Pour analyser les données, il est utile à
représenter les données à laide dun diagramme
de dispersion. - Puis, trace, à vue, la droite la mieux ajustée.
25La qualité de lajustement de la droite
- Une grille de corrélation est un guide pour
indiquer de la qualité de lajustement de ta
droite.
26Une grille de corrélation
Corrélation La qualité de lajustement
1 Lajustement parfait sur une droite de pente positive.
Forte et positive La plupart des points sont groupés autour dune droite de pente positive.
Faible et positive Les points sont dispersés, mais montrent une tendance générale positive.
0 Aucune relation apparente.
Faible et négative Les points sont dispersés, mais montrent une tendance générale négative.
Forte et négative La plupart des points sont groupés autour dune droite de pente négative.
-1 Lajustement parfait sur une droite de pente négative.
278.3 Représenter des données
- Voici 6 types de représenter des données (9ième
année)
- Un diagramme de dispersion
- Un histogramme
- Un diagramme circulaire
- Un diagramme à tiges et à feuilles
- Un diagramme à boîte et à moustaches
- Un diagrammes à bandes
28Un diagramme à bandes
- Un diagramme à bandes est un diagramme qui
représente des données à laide de bandes
horizontales ou verticales. - Il sert à comparer des catégories.
29Un diagramme circulaire
- Un diagramme circulaire est un diagramme qui
représente un ensemble de données par un cercle
divisé en secteurs. - Il sert à comparer des catégories entre elles et
à comparer chaque catégorie à lensemble complet.
30Un diagramme à tiges et à feuilles
- Un diagramme à tiges et à feuilles est une façon
dorganiser des données numériques qui représente
une partie de chaque nombre par une tige et
lautre partie par une feuille.
31Un histogramme
- Un histogramme est un diagramme à bandes
juxtaposés qui représente des données groupées
par intervalles.
32Un diagramme à boîte et à moustaches
- Un diagramme à boîte et à moustaches est un
diagramme qui indique la médiane et létendue
dun ensemble de données numériques.
33Le fonction des diagrammes à boîte et à moustaches
- Un diagramme à boîte et à moustaches illustre la
dispersion des données autour de la médiane dun
ensemble de données.
34Le vocabulaire des diagrammes à boîtes et à
moustaches
- La boîte contient ou représente au moins 50 des
données. - La plus petite valeur et la plus grande se
nomment la valeur minimum et la valeur maximum
respectivement. - Le quartile inférieur est la médiane de la moitié
inférieure des données. - Le quartile supérieur est la médiane de la moitié
supérieure des données.
35Comment choisir la représentation la plus
appropriée
- Le diagramme le plus approprié dépend du type de
données que tu veux communiquer.
36Les indices pour choisir la représentation
correcte 1
- Les diagrammes à ligne brisée et les diagrammes
de dispersion servent à analyser des tendances. - Les histogrammes, les diagrammes à boîte et à
moustaches et les diagrammes à tiges et à
feuilles servent à analyser létendue des
données.
37Les indices pour choisir la représentation
correcte 2
- Les diagrammes à bandes et les diagrammes
circulaire servent à comparer des catégories. -
38Les mesures de tendance centrale
- Le mesure de tendance centrale est la valeur qui
représente le centre dun ensemble de données.
39Les types de mesure de tendance centrale
- Il y a trois types de mesure de tendance
centrale
- La moyenne
- La médiane
- Le mode
40La moyenne
- La moyenne est la somme des valeurs dun ensemble
divisé par le nombre de valeurs dans lensemble. - Lavantage de la moyenne elle donne des
renseignements sur la somme des valeurs. - Le désavantage de la moyenne les valeur
aberrantes ont une incidence sur elle.
41Le médiane
- La médiane est la valeur du milieu quand les
données dun ensemble sont placées par ordre
croissant. - Lavantage de la médiane les valeurs aberrantes
ont peu dincidence sur elle. - Le désavantage de la médiane elle ne fournit
aucun renseignements sur la somme des valeurs.
42Le mode
- Le mode est la valeur la plus courante dans un
ensemble de données. - Lavantage du mode il est facile à trouver dans
des tableaux de fréquence, des diagrammes, des
diagrammes à bandes ou des histogrammes. - Le désavantage du mode il peut changer
énormément quand il y a ajout de nouvelles
données.