Title: Diapositiva 1
1PRACTICAS SOBRE LA MODELIZACIÓN DE SERIES
TEMPORALES CON LA METODOLOGÍA DE
BOX-JENKINGS FICO. GR 21
2Ministerio de Economía obtención de series
temporales de variables económicas largas
3Producto Interior Bruto Portugal
Serie Producto Interior Bruto de
Portugal Fuente Ministerio de Economía y
Hacienda Periodicidad Anual
4Metodología Box-Jenkins
La construcción de modelos consta de tres
pasos 1.- Identificación inicial 2.-
Estimación 3.- Validación
5Identificación
- La clase general de modelos de la metodología
Box-Jenkings es la familia de modelos ARIMA con
elementos determinísticos (constante, tendencia
determinística, estacionalidad determinística,
efecto semana santa, efecto días laborables,
atípicos, etc) - En la especificación de estos modelos entran
distintos tipos de parámetros que capturan
distintos rasgos de los datos - El primer paso es determinar si el modelo se debe
formular con los datos originales o con series
transformadas. En todo caso, deben recoger - Evolutividad en varianza
- Evolutividad de la tendencia
- Evolutividad estacional
- El modelo incorporará
- Diferencias regulares
- Diferencia estacional
- Constante
- Factores determinísticos
COMO LA SERIE ES ANUAL NO TIENE ESTACIONALIDAD,
POR TANTO SE PRESCINDE DE LA EVOLUTIVIDAD
ESTACIONAL
6Identificación (gráficos)
- En general, se trabaja con la transformación
logarítmica de la serie original - Homogeneización de la varianza. Estacionariedad
en varianza. - Relación con las tasas de crecimiento
- Por tanto, procederemos a trabajar con las
series en logaritmos - La serie de logaritmos presenta una evolución
alcista, con crecimiento sistemático, a lo largo
de la muestra, por tanto, no tiene media
constante y la serie no presenta un
comportamiento estacionario. Para obtener
estacionariedad y eliminar la tendencia, habrá
que proceder a tomar diferencias. - La primera diferencia de la serie de logaritmos
presenta un comportamiento estacionario en torno
a un valor medio, ligeramente superior a 0.02 (no
tiene porque ser cero). - Parece, por tanto, que con una primera diferencia
ya se ha conseguido la estacionariedad y no
habría que seguir diferenciando. Veremos también
si el correlograma y el test de Dickey-Fuller son
indicativos de que esta transformación es ya
estacionaria. - Se observan tres valores atípicos 1982,1991 y
2009 - En la serie original se reflejan como saltos en
el nivel de la tendencia - En la serie diferenciada se muestran como un
valor atípico puntual, lo que es consecuencia del
proceso de diferenciación
7Identificación (gráficos)
Producto Interior Bruto Portugal
8Identificación (correlogramas)
- El correlograma de la serie original (en log)
presenta un perfil en el que las correlaciones
muestrales disminuyen muy ligeramente a medida
que aumenta la distancia temporal entre las
variables, no existe punto de corte. Es por
tanto, un correlograma característico de series
no estacionarias. - Véase la diferencia con la FAC de un proceso no
estacionario, que por definición no está
definida, al no existir una media constante y,
por tanto, la varianza, las covarianzas y las
correlaciones no están definidas. - El correlograma de la primera diferencia presenta
un punto de corte para el primer retardo. El
resto de correlaciones muestrales no son
significativamente distintas de cero. Por tanto,
presenta un perfil coherente con una serie
estacionaria.
9Identificación (correlogramas)
LGDP
(1-L) LGDP
(1-L)2 LGDP
10Identificación (test de Dickey-Fuller)
- Serie original El valor del estadístico t es
mayor que los valores críticos en tablas para los
distintos niveles de error. En concreto, toma el
valor -1.56. - Por tanto, se acepta la hipótesis de que existe
una raíz unitaria y es necesario diferenciar la
serie para obtener la transformación estacionaria
que elimine dicha raíz unitaria. - Primera diferencia En este caso el valor del
estadístico t es menor que los correspondientes
valores críticos. - Por tanto, se rechaza la hipótesis de que existe
una raíz unitaria. Lo cual es indicativo de que
la correspondiente serie es estacionaria.
- En definitiva, tanto gráficamente, como a partir
del análisis del correlograma y del test de
Dickey-Fuller, se concluye que la primera
diferencia de la serie en logaritmos es
estacionaria en media. - Esta será la serie a partir de la cual se
estimará el modelo - Se van a estimar AR de orden 1,2,3,4 y será a
partir de los criterios de información que se
decidirá que modelo se elige - Se concluirá con el análisis de los residuos para
validar el modelo
11Identificación (test de Dickey y Fuller)
LGDP
(1-L) LGDP
12Estimación
- Las siguientes transparencias recogen los
resultados de estimar sucesivamente modelos
autorregresivos de distinto orden. - Se ha incluido una constante en el modelo, porque
en la etapa de identificación se observó que la
serie estacionaria oscilaba alrededor de un valor
medio distinto de cero. - Si al estimar no fuera significativa se
eliminaría del modelo (el contraste se realiza
mediante el estadístico t) - Con los resultados obtenidos, se presenta un
cuadro comparativo con los criterios de
información de Akaike y Schwarz. Se incluye
además el valor que toma la función de máxima
verosimilitud a modo de información
complementaria.
13Estimación del modelo
Modelo AR(4)
Modelo AR(3)
14Estimación del modelo
Modelo AR(2)
Modelo AR(1)
15 Validación
En el cuadro adjunto se presentan los valores de
los criterios de información y el valor de la
función de máxima verosimilitud en el máximo. Se
observa que a medida que se ha ido reduciendo el
número de retardos del modelo autorregresivo, han
ido disminuyendo los valores de los criterios de
información y aumentando el valor de la función
en el máximo. Por tanto, se concluye que el
modelo que mejor se ajusta a la serie
estacionaria será un AR(1) con constante. Cabe
señalar que en el resto de modelos estimados los
coeficientes no eran significativos. En
definitiva el modelo de la serie
es (1-0.34L)(1-L) Log DGPt 0.03
at Obsérvese que el valor del autorregresivo
coindice con la correlación muestral de orden 1.
16Diagnóstico
Modelo Criterio de Akaike Criterio de Schwarz Máximo función versosimilitud
AR(4) -4.79 -4.57 91.23
AR(3) -4.88 -4.71 94.27
AR(2) -4.88 -4.75 95.76
AR(1) -4.91 -4.88 97.70
17 Validación
El gráfico adjunto recoge los valores que
proporciona el modelo comparado con los datos
reales. También se incluye la serie de
residuos. La serie de residuos presenta un
comportamiento estacionario y aleatorio. Cabe
destacar la presencia de determinados valores
atípicos que se producen en los años 1982, 1991 y
2009, coincidiendo con etapas de crisis económica
en el entorno europeo. Una vez llegados a este
punto, habría que incluir variables dummy para
recoger el impacto de dichos valores atípicos.
18Diagnóstico
19 Validación
El gráfico adjunto el correlograma de los
residuos del modelo AR(1) Como se puede observar
las correlaciones para los distintos retardos no
son significativamente distintas de cero. Además
el valor del estadístico Q para los distintos
retardos es menor que el valor en tablas. Por
ejemplo, para el retardo 10, el valor del
estadístico Q es 3.7, mientras que el valor en
tablas (chi-cuadrado con 10 grados de libertad,
al 95 de confianza) es igual a 18.3 Por tanto,
se concluye que los residuos del modelo presentan
estructura de ruido blanco, lo que nos permite
validar el modelo.
20Diagnóstico
Correlograma de los residuos