Title: S
1Séries chronologiques et prévision
2Séries chronologiques et prévisions
- Introduction
- Objectif maniement simple de quelques
techniques statistiques (Statistiques
descriptives, indices, séries chronologique,
moindres carrés ordinaires). - De quelle façon
- Sans démonstration et beaucoup dintuition
3Séries chronologiques et prévisions
- Plan prévisionnel (15 heures)
- Chapitre 1 Statistiques descriptives
- Chapitre 2 Taux de croissance et indices
- Chapitre 3 Les moindres carrés ordinaires (mco)
- Chapitre 4 Les séries chronologiques
- - Composantes,
- Dessaisonalisation,
- Estimation du trend par moyennes mobiles et par
les mco - Estimation des coefficients saisonniers
- Prévisions par lissage exponentiel
4Chapitre 1 Statistiques descriptives
- On distingue deux types de statistiques résumées
- Les statistiques qui résument la tendance
centrale dune série ( mode, moyenne et
médiane) et les statistiques qui résument la
dispersion dune série - Sans référence à aucune statistique de tendance
centrale (intervalle interquartile ou
interdécile), - Qui fait référence à la tendance centrale
(variance, écart-type et coefficient de
variation).
5Statistiques descriptives
- Il existe aussi des statistiques qui résument la
forme dune distribution, mais celles-ci ne
sont plus trop utilisées aujourdhui dans la
mesure où il est plus facile dobserver
directement le graphique dune distribution pour
en apprécier la forme.
6Statistiques descriptives
- 1. Les statistiques de tendance centrale
- A Le mode
- Le mode d'une série est la valeur la plus
fréquente d'une série. Exemple Soit la série
8,4,4,3,4,3,8,7,5 - La valeur la plus fréquente de cette série est 4.
Le mode est donc égal à 4. L'effectif associé à
ce mode est 3.
7Statistiques descriptives
- Quelques remarques à propos du mode
- Une série peut avoir plusieurs modes
- S 4, 0, 1, 1, 7, 7, 7, 3, 3, 4, 7, 3, 4, 5, 7,
1, 3, 3, 4, 5, -
- Cette série a 2 modes, elle est bimodale. Ses
deux modes sont 7 et 3. L'effectif associé à
chacun de ces modes est 5. - Il existe également des séries multimodales.
- b) Le mode nexiste pas forcément C'est le cas
lorsque toutes les valeurs ont le même effectif. - Exemple S 4, 0, 1, 2, 5, 6
8Statistiques descriptives
- c) Le mode nest pas la valeur la plus élevée. Il
ne faut pas confondre le mode, qui est la valeur
la plus fréquente, avec la valeur la plus élevée
de la série. - d) Les caractères quantitatifs et qualitatifs
peuvent avoir un mode - Le mode existe aussi bien dans le cas dune série
de valeurs que dans le cas dune série de
modalités - la série A,C,C,D,A,A,C,E,E,B,C a la modalité C
pour mode car cest la modalité C qui revient le
plus souvent.
9Chapitre 1
- B La moyenne arithmétique
- Soit un échantillon de n valeurs observées x1,
x7, .,xi,.,xn dun caractère quantitatif X, on
définit sa moyenne observée comme la moyenne
arithmétique des n valeurs - Exemple avec S 4, 0, 1, 1, 2, 2, 2, 3, 3, 4, 2,
3, 4, 5, 2, 1, 3, 3, 4, 5
10Statistiques descriptives
- Une des propriétés de la moyenne arithmétique est
que la somme des écarts à la moyenne est nulle
11Statistiques descriptives
- Si les données observées xi sont regroupées en k
classes deffectifs ni (variable continue
regroupée ou variable discrète), il faut les
pondérer par les effectifs correspondants - Avec
12Statistiques descriptives
- Exemple précédent regroupé
13Statistiques descriptives
- Remarque La moyenne obtenue après regroupement
des données en classe peut différer légèrement en
raison dune perte dinformation. - Exemple supposons que les données précédentes
soient regroupées en classe de la façon suivante
14Statistiques descriptives
- Pour calculer la moyenne, nous devons déterminer
les centres de classe et appliquer la formule
où les xi sont les centres de
classe (nommés Ci) - La différence ici est de 0.5 et cette différence
dépend de la définition des classes amplitude
et nombres de classes.
15Statistiques descriptives
- Décomposition de moyenne
- Soit une population totale de n individus,
composée de k groupes. Les groupes sont désignés
par des lettres. La population totale est égale à
la somme des populations des groupes - Notons la moyenne de la variable X du groupe m
-
16Statistiques descriptives
- La moyenne globale se calcule ainsi
- Ou encore
17Statistiques descriptives
- La formule sécrit en définitive
- Exemple
18Statistiques descriptives
- Les effets de structure les moyennes de chaque
classe possèdent des pondérations très
différentes -
19Statistiques descriptives
- Deux autres moyennes
- Moyenne géométrique
- Avec les notations précédentes
- est la moyenne géométrique de la série
statistique.
20Statistiques descriptives
- Exemple
- Lessence a augmenté de 10 lan dernier et de
30 cette année. Quelle est le taux
daugmentation annuelle ? - Ce nest pas 20 ! La moyenne arithmétique ne
convient pas. Si t est ce taux, on a bien sûr - et donc t 0,19619,6.
- La bonne moyenne est ici la moyenne
géométrique.
21Statistiques descriptives
- Moyenne harmonique
- Toujours avec les notations précédentes
- est la moyenne harmonique de la série
statistique.
22Statistiques descriptives
- Exemple
- Si je fais un trajet aller-retour avec une
vitesse v1 à laller et une vitesse v2 au retour,
quelle est ma vitesse moyenne sur lensemble du
trajet ? - La réponse nest pas
- Mais qui est la moyenne harmonique de v1 et
v2.
23Statistiques descriptives
- C La médiane
- Définition
- Si F désigne la fonction des fréquences cumulées,
la médiane dune série statistique sera la plus
petite valeur x telle que F(x) 0,5. Autrement
dit La médiane est la valeur du caractère pour
laquelle la fréquence cumulée est égale à 0,5 ou
50 . - Interprétation Elle correspond donc au centre de
la série statistique classée par ordre croissant,
ou à la valeur pour laquelle 50 des valeurs
observées sont supérieures et 50 sont
inférieures.
24Statistiques descriptives
- Avantages
- Contrairement à la moyenne, la médiane nest pas
sensible aux valeurs extrêmes. - dans une entreprise où les 10 salariés gagnent
chacun 1500 par mois et le patron 7000 par
mois, le salaire médian mensuel est de 1500. - La médiane a une signification concrète.
25Statistiques descriptives
- Détermination pratique caractère discret
- Si leffectif total n est impair, i.e. n 2k
1, la médiane sera le k1ème terme de la série.
La médiane est la valeur du milieu. EX 17, 15,
18. n 3, k(n-1)/2(3-1)/21 k1ème terme est
donc le deuxième gt M15. - Si n est pair, i.e. n 2k, la médiane sera le
kème terme de la série. EX 17, 15, 16, 18
gtM15. - Mais, si n est pair, une médiane est aussi une
valeur quelconque entre le kème et k1ème terme
de la série (M entre 15 et 16). Dans ce cas il
peut être commode de prendre le milieu (15,5).
26Statistiques descriptives
- On peut déterminer la médiane graphiquement
27Statistiques descriptives
- Détermination de la médiane caractère continu
- On commence par déterminer la classe médiane,
i.e. la première classe où la fréquence cumulée
dépasse 0,5. - Ensuite, on calcule la médiane par interpolation
linéaire.
28Statistiques descriptives
- Interpolation linéaire (Théorème de Thales)
- ABC est un triangle. M se trouve sur le segment
AB et N sur le segment AC. D'après le
théorème de Thalès, si les droites (BC) et (MN)
sont parallèles, alors on a l'égalité -
29Statistiques descriptives
- Le théorème de Thalès permet de calculer des
longueurs. Pour calculer une longueur dans la
configuration représentée ci-dessus, il suffit de
connaître trois des longueurs figurant dans deux
des rapports.
C
N
30Statistiques descriptives
Classes Effectif Fréquences cumulées croissantes
Moins de 25 ans 18 0,06
25X lt30 54 0,24
30X lt 35 72 0,48
35X lt40 84 0,76
40X lt 45 36 0,88
45X lt 50 22 0,95
50 ans et plus 14 1
Dans le cas de valeurs groupées, on pose
l'hypothèse selon laquelle les valeurs sont
uniformément réparties à l'intérieur de chaque
classe.
35,36
31Statistiques descriptives
32Statistiques descriptives
33- Résumé des caractéristiques des indicateurs
34Statistiques descriptives
- 2. Les indicateurs de dispersion
- Deux séries statistiques peuvent avoir les mêmes
paramètres de tendance centrale mais pas la même
dispersion . - Exemple
- Notes de Ruby 7 , 8 , 11 , 12 , 13 , 13 et 13
(moyenne 11) - Notes de Iris 4 , 7 , 9 , 12 , 13 , 13 et 19
(moyenne 11) - Il est donc nécessaire dadjoindre à un paramètre
de tendance centrale(moment 1), un ou des
paramètres de dispersion (moment 2).Ces
paramètres ont pour objectif dans le cas d'un
caractère quantitatif de caractériser la
variabilité des données dans léchantillon. - Les indicateurs de dispersion fondamentaux sont
la variance observée et lécart-type observé.
35Statistiques descriptives
- Quelques indicateurs de dispersion
- Étendue.
- Lécart interquartile
- Écart absolu.
- La variance et lécart type.
- Coefficient de variation
36Statistiques descriptives
- 1. Létendue
- Létendue dune série statistique est la
différence entre la plus grande valeur de la
série et la plus petite. - Remarque
- - Très simple à calculer et à interpréter.
- - Par nature très sensible aux valeurs extrêmes.
37Statistiques descriptives
- 2. Lécart interquartile Q3-Q1
- Si F désigne la fonction des fréquences cumulées,
le premier (resp. troisième) quartile dune série
statistique sera la plus petite valeur x telle
que F(x) 0,25 (resp. 0,75) . On le note Q1
(resp. Q3). - Q1 et Q3 se calculent comme la médiane. Q1 est la
valeur qui coupe la distribution en deux 25
en dessous et 75 au dessus. Q3 75 et 25 . - Lécart interquartile contient au moins 50 des
valeurs de la série. - Lécart interquartile mesure la dispersion sans
tenir compte des valeurs extrêmes.
38Statistiques descriptives
- Après les quartiles, on peut définir de la même
façon les déciles (voire les centiles) dune
série statistique. - Il sagit de regarder les valeurs de la série
correspondant à des fréquences cumulées de 0,1
0,2 0,9. - Pour visualiser la dispersion dune série
statistique, on peut alors représenter une Box
plot ( boîte à moustache ).
39Statistiques descriptives
D1
D9
Min
Max
Q1
Q3
Médiane
40Statistiques descriptives
- 3. Lécart absolu moyen
- moyenne des valeurs absolues des écarts à la
moyenne. - Intérêts
- - Paramètre simples à calculer, prenant en compte
lensemble des données. - Très facile dinterprétation.
- Inconvénient
- Mauvaises propriétés calculatoires (non
linéaire). - Peu utilisés par les logiciels de statistiques.
41Statistiques descriptives
- 4. Variance et écart-type
- On définit la variance comme la moyenne
arithmétique des carrés des écarts à la moyenne.
42Statistiques descriptives
- Dans le cas de données regroupées en k classes
d'effectif ni (variable continue regroupée en
classes ou variable discrète), la formule de la
variance est la suivante
43Statistiques descriptives
- Lécart-type observé correspond à la racine
carrée de la variance observée - Remarque De part sa définition, la variance est
toujours un nombre positif. Sa dimension est le
carré de celle de la variable. Il est toutefois
difficile dutiliser la variance comme mesure de
dispersion car le recours au carré conduit à un
changement dunités. Elle na donc pas de sens
direct contrairement à l'écart-type qui sexprime
dans les mêmes unités que la moyenne.
44Statistiques descriptives
- 5. Le coefficient de variation
- La variance et lécart-type observée sont des
paramètres de dispersion absolue qui mesurent la
variation absolue des données indépendamment de
lordre de grandeur des données. Le coefficient
de variation noté C.V. est un indice de
dispersion relatif prenant en compte ce biais et
est égal à - Exprimé en pour cent, il est indépendant du choix
des unités de mesure permettant la comparaison
des distributions de fréquence dunité
différente.
45Statistiques descriptives
- Exercice 1 La présence des clients dans un
magasin - 1.Calculer la moyenne et la médiane.
- 2. Calculer la variance et lécart-type
46Statistiques descriptives
- Moyenne et médiane
- Moyenne On calcule le centre de chaque classe
ci (i1,..,5). -
47Statistiques descriptives
- 2. La médiane
- On calcule les fréquences et les fréquences
cumulées et on détermine la classe médiane - (25.5 30,5). On fait une interpolation linéaire
Classes effecctif Fréquence Freq cumul
15,520,5 200 0,08 0,08
20,525,5 500 0,2 0,28
25,530,5 1000 0,4 0,68
30,535,5 600 0,24 0,92
35,540,5 200 0,08 1
2500 1
48Statistiques descriptives
- Exercice 2 Variation du CAC 40 au cours dune
semaine (en points). Il y a 8 observations
journalières. - Calculer la moyenne, la variance et lécart-type
- Sur le nouveau marché, la même semaine on
observait une moyenne de 0.8 et un écart-type de
26,05. Est-il préférable dinvestir sur le
nouveau marché ? Certains analystes se fient au
coefficient de variation. Le calculer pour les 2
marchés. Est-il un bon estimateur du risque ?