Title: QQ PLOTs
1Q-Q PLOTs
- Le but comparer un echantillon contre une loi
gaussienne - La demarche ordonner les chiffres
- et les representer avec les quantiles
correspondants dune normale - 3. Juger selon ladherance a une droite
-
2Normal Q-Q Plots
x rnorm(50)
3La dependance au taille
- Quest ce qui change si la taille augmente? si
elle diminue? - Est ce que les ordonnees changent?
- Yaurait-il une difference avec le comportement
au voisinage des queues?
4Normal Q-Q Plots
x rnorm(500)
5Normal Q-Q Plots
x rnorm(20)
6La dependance des parametres
- Quest ce qui change si au lieu dune normale, on
a une gaussienne avec nimporte quels parametres? - Est ce que les ordonnees changent?
- Yaurait-il une difference du comportement au
voisinage des queues?
7Normal Q-Q Plots
x rnorm(50, mean 2, sd 5)
8La dependance des distributions
- Quest ce qui va changer si au
lieu dune gaussienne, x est tiree dune autre
distribution? - Est ce que les ordonnees changent?
- Yaurait-il une difference du comportement aupres
des queues?
9Normal Q-Q Plots
x rexp(50)
10Normal Q-Q Plots
x runif(50)
11HISTOGRAMMES
- On choisit une partition en intervals I1 , I2 ,
I3,. . . Ir. Pour chaque 1 lti lt r,soit li., la
longueur de Ii.. et soit ni. le nombre de
valeurs dans linterval Ii., - Un histogramme est un graphe de la fonction qui
tient la valeur ni. /(n li. ) sur linterval Ii.,
12- Laire du rectangle qui correspond a linterval
Ii. represente la proportion de la population
pour laquelle la valeur de la variable est
contenue dans Ii.. Par consequent la mediane
(approximativement) separe laire en deux parties
egales une a gauche, et lautre a droite. - Parfois au lieu de ni. /(n li. ) , on prend
- ni. , pour la hauteur, mais il faut que
- tous les intervals aient la meme longeur
-
13Si lon choisit des intervals trop grands
14Si lon choisit des intervals trop petits
15Un choix plus convenable
16Lhistogramme pour un echantillon de taille 20
17Lhistogramme pour un echantillon de taille 50
18Lhistogramme pour un echantillon de taille 200
19Donnees de deux populations
- gt x
- 7 0.08171115 0.10601356 0.79280466
0.52774733 1.69317144 0.11856463 - 13 -0.54353860 0.35741181 -0.89335351
-0.03084331 -0.64487428 -0.36773527 - 19 -0.23345395 1.70563181 2.01659163
-0.14210055 -1.95439199 -0.32760025 - 25 -0.16114718 -0.97000106 0.07187731
0.62430820 -1.29840395 -1.68433680 - 31 -0.81768035 0.14292992 0.96436876
-1.38984087 -1.36567405 0.11524371 - 37 -0.53213480 -1.76849503 -0.09240808
0.31520857 -0.64435989 0.80076713 - 43 1.67755590 -0.48798335 0.22282511
-1.49882752 -1.06367186 -1.06356622 - 49 -0.60743165 -1.90095766
- gt y
- 1 0.707013184 1.370876878 1.373310905
0.247558044 0.241502829 1.093566831 - 7 0.813814926 1.419361725 0.713543864
0.722903138 1.158358762 0.066719836 - 13 0.067282301 0.059373324 0.002354538
0.287174687 0.377883390 0.558037453 - 19 0.170402233 3.430996276 0.086687802
0.750423551 1.432624604 0.320162468 - 25 0.170800376 0.081677950 0.373636039
0.162821424 0.261768093 1.722106652 - 31 2.520656917 0.976561980 0.482897462
1.392295586 0.082554253 1.824811980 - 37 1.137674670 0.224560895 0.862338052
0.556944143 0.661779465 0.769889967 - 43 0.092327478 0.479564989 1.934747750
1.224369478 0.601487291 0.709970541 - 1 2.02207855 0.59229991 -0.40001771
-0.45152693 0.39894383 -1.89434825
20Exemple ou les axes horizontaux se distinguent
21Exemple ou les axes verticaux se distinguent
22Finalment
23Les positions relatives de la mediane et la
moyenne
medianne moyenne
moyenne medianne
moyenne medianne
24Quantiles
- Le piemequantile est la valeur tel que la
proportion p de donnes se trouve au-dessous.
30
5.53 30th percentile
25Mesures de la variation IQR
- Le quartile inferieur (Q1), la mediane et le
quartile superieur (Q3) sont des percentiles qui
repartissent les donnees en quatre parties
egales. - La distance interquartile (IQR) dune variable
est la distance entre Q1 et Q3 - IQR Q3 Q1
- L IQR est une facon de mesurer la variation si
la medianne est prise pour le centre .
26Boxplot
valeurs aberrantes (soupconnees)
Q3
whiskers
medianne
Q1
27(No Transcript)