2
PRÁCTICAS DE LA ASIGNATURA ECONOMETRIA II. CURSO 2006/2007 Práctica 3 1. Planteamiento y Objetivos de la Práctica
En la presente práctica se propone la modelización univariante por medio del
enfoque de Box-Jenkins de tres series temporales con características distintas. En
cada uno de los ejemplos propuestos hay distintos pasos a detallar, pero con el fin
de ver los tres ejemplos en la sesión práctica, cada profesor puede realizar los que
considere más importantes en cada ejemplo y dejar los pasos omitidos para que los
cubran los alumnos después por su cuenta
Con la presente práctica se intenta que el alumno aprenda a construir
modelos ARIMA univariantes para una serie temporal por medio del enfoque de
Box-Jenkins. La aplicación de esta metodología conlleva recorrer diversas etapas
hasta elaborar el posible modelo generador de los datos, de forma sintética los
pasos a realizar son los siguientes:
• Especificación inicial
• Estimación
• Chequeo o validación
• Utilización del modelo 1
En la etapa de especificación inicial se deberá determinar el orden de
integración de la serie temporal, es decir cual es el número de diferencias que se
requerirán y si una de ellas debe ser anual (estacional) para convertir en
estacionaria a la variable objeto de análisis, Zt (d,s).
Zt = (1-B)d (1-Bs ) D
1 El modelo puede utilizarse, por ejemplo, para predecir, para describir las propiedades del fenómeno económico en cuestión en cuanto a su tendencia, estacionalidad, oscilaciones (cíclicas) estacionarias, impredictibilidad, etc-, para basar sobre él la extracción de señales como el componente estacional
3
Donde: d es el número de diferencias regulares y D las diferencias de tipo
estacional y habitualmente D = 0 ó 1 y se suele cumplir que: 0 ≤ d+D ≤ 2.
Para ello se utiliza tanto el análisis gráfico de la serie, que nos revela
determinadas características relevantes de la misma, como sus correlogramas
simple y parcial y los tests de raíces unitarias.
Una vez decidido el orden d y D, es decir el número de raíces unitarias que
tiene la serie temporal, tanto de tipo regular como estacional, habrá que decidir el
orden del polinomio autorregresivo (p) y el de medias móviles (q) para lo cual
utilizamos como principales instrumentos el correlograma simple y el parcial de la
serie. Los criterios generales que deben servir de guía para determinar el orden p
del polinomio autorregresivo y el orden q del polinomio medias móviles se recogen
en las estructuras de los correlogramas simple (FAC) y parcial (FAP) y que para
los casos más sencillos se han visto en las clases teóricas. Un resumen de las
características de la estructura del correlograma simple y del parcial se recoge en
el esquema adjunto.
Características teóricas de la FAC y de la FAP de los procesos estacionarios Procesos FAC FAP
AR (p) Decrecimiento rápido hacia
cero sin llegar a anularse
P primeras autocorrelaciones
distintas de cero y el resto
ceros
MA (p) q primeras autocorrelaciones
significativas y el resto ceros
Decrecimiento rápido hacia
cero sin llegar a anularse
ARMA (p, q) Decrecimiento rápido hacia
cero sin llegar a anularse
Decrecimiento rápido hacia
cero sin llegar a anularse
Debe quedar claro que la identificación es siempre tentativa por lo que se
deben sugerir varios modelos como posibles procesos generadores de datos. Una
vez que se han sugerido uno o varios modelos se escoge el que parezca más
4
adecuado y se procede a su estimación, apropiado, usualmente el de máxima
verosimilitud pero en Eviews este método no está implementado. Posteriormente se
debe realizar el chequeo ó validación de esas estimaciones, es decir, decidir sobre
varios criterios la validez de dichas estimaciones.
En esta práctica se realiza la modelización de tres series temporales de
datos reales y características distintas. El primer caso se refiere a los gastos de
publicidad de una empresa con frecuencia anual, el segundo analiza el Índice de
Precios de Producción (PPI) de Estados Unidos con frecuencia trimestral y el último
modeliza una serie de frecuencia mensual y con estacionalidad, las viviendas de
nueva construcción en Estados Unidos.
2.Ejemplo1. Gastos en publicidad de una empresa
La serie que se modeliza es la de gastos en publicidad de una determinada
empresa. Su periodicidad es anual y el tamaño muestral abarca 54 observaciones
que comprenden el periodo 1947-2000; dada su frecuencia anual esta serie no
tendrá componente estacional. Los datos de esta variable se encuentran en el
Banco de Datos del curso de econometría II.
El primer paso que debemos dar para elaborar el modelo univariante de las series
es crear en Eviews el workfile con frecuencia anual y tamaño muestral indicado e
importamos los datos, tal y como hemos hecho en las prácticas anteriores. La
variable en Worfile la denominamos Gpubli
Una vez cargados los datos debemos verificar si la serie temporal es
estacionaria y en caso de que no lo sea realizar las transformaciones pertinentes
hasta convertirla en estacionaria. Para ello en primer lugar graficamos la serie
Gpubli, gráfico que se muestra a continuación.
La instrucción en Eviews para obtener el gráfico de la serie es:
Quik/Graph /gpubli/Line Graph
5
0
400
800
1200
1600
2000
10 15 20 25 30 35 40 45 50 55 60
GPUBLI
Gastos en publicidad de una determinada empresa
Se observa que tiene una tendencia creciente muy acentuada,
aproximadamente hasta 1925 y de sentido contrario después, lo que es un claro
signo de que la serie no es estacionaria en media, además ese crecimiento
muestras signos de regularidad por lo que la varianza aparentemente exhibe cierto
grado de estabilidad y no es del todo preciso tomar logaritmos.
En segundo lugar obtenemos los correlogramas
Instrucciones en Eviews para obtener los correlogramas de esta serie (Gpubli)
Quick/Series Statistics/Correlogram/ Gpubli También de forma alternativa en el objeto serie (ventas)
View/Correlogram
6
El correlograma simple (AC) confirma la sospecha anterior sobre la no
estacionariedad de la variable al mostrar un decrecimiento lento. Adicionalmente
llevamos a cabo el test de raíces unitarias de D-F
Instrucciones en Eviews para el test D-F:
Quick/Series Statistics/unit root/Gpubli Null Hypothesis: GPUBLI has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -2.391303 0.1494 Test critical values: 1% level -3.571310
5% level -2.922449
7
10% level -2.599224
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:04 Sample (adjusted): 1912 1960 Included observations: 49 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
GPUBLI(-1) -0.213368 0.089226 -2.391303 0.0212D(GPUBLI(-1)) 0.204352 0.145737 1.402200 0.1680D(GPUBLI(-2)) -0.132356 0.146384 -0.904167 0.3709D(GPUBLI(-3)) -0.000612 0.138474 -0.004422 0.9965D(GPUBLI(-4)) 0.406138 0.138112 2.940633 0.0053
C 207.0751 90.85283 2.279236 0.0277
R-squared 0.349212 Mean dependent var 0.795918Adjusted R-squared 0.273539 S.D. dependent var 228.9130S.E. of regression 195.1087 Akaike info criterion 13.49927Sum squared resid 1636898. Schwarz criterion 13.73092Log likelihood -324.7321 F-statistic 4.614749Durbin-Watson stat 2.008555 Prob(F-statistic) 0.001854
El Valor del estadístico t (-2.391) de GPUBI(-1) es inferior a los valores críticos de
la distribución DF por lo que no se puede rechazar la hipótesis de la existencia de
una raíz unitaria, y por tanto, la serie no es estacionaria
Como un primer paso para eliminar la tendencia y convertir la serie en estacionaria
se prueba con el ajuste de una tendencia lineal determinística a la serie Gpubli y si
es adecuado eliminar la tendencia de la serie original. Para ello, se ajusta una
tendencia determinística a la variable ventas del tipo:
Gpubli = c +β t + µt
Cuya estimación se presenta a continuación
Instrucciones en Eviews para la estimación de la tendencia determinista :
Quick /estimate equation
8
Y en la ventana de la ecuación que se abre escribir: Gpubli c @trend+1 El resultado de la estimación es: Dependent Variable: GPUBLI Method: Least Squares Date: 04/15/07 Time: 08:43 Sample: 1907 1960 Included observations: 54
Variable Coefficient Std. Error t-Statistic Prob.
C 896.8644 103.4431 8.670126 0.0000@TREND+1 1.369240 3.272521 0.418405 0.6774
R-squared 0.003355 Mean dependent var 934.5185Adjusted R-squared -0.015811 S.D. dependent var 371.8789S.E. of regression 374.8072 Akaike info criterion 14.72703Sum squared resid 7304985. Schwarz criterion 14.80070Log likelihood -395.6299 F-statistic 0.175063Durbin-Watson stat 0.348633 Prob(F-statistic) 0.677374
Analizando esos resultados podemos observar que la estimación de los
residuos presentan un estadístico Durbin- Watson próximo a cero, lo que es
indicativo de una fuerte autocorrelación de primer orden y de la existencia una raíz
unitaria y que, por lo tanto, no cumplen las condiciones para que sean ruido
blanco. El gráfico de los residuos la serie Gpubli, que se muestra a continuación,
también muestra esos problemas y nos indica que los residuos se han mantenido
por encima y/o por debajo de la media durante un periodo demasiado largo. Por lo
tanto, ese ajuste no es adecuado puesto que olvida determinadas propiedades
importantes de la serie
9
-800
-400
0
400
800
1200
10 15 20 25 30 35 40 45 50 55 60
GPUBLI Residuals
Dado que el procedimiento anterior no es el adecuado, la tendencia es de
tipo estocástica y, por tanto, utilizamos a continuación el procedimiento de la
diferenciación para convertir a la serie en estacionaria. Tomamos la primera
diferencia en la serie Gpubli para lo que generamos la serie de DGpubli =Gpubli-Gpubli (-1), es decir, transformamos la serie de acuerdo con la siguiente expresión:
Zt =(1-B)Gpubli
La representación gráfica de la serie transformada y sus correspondientes
correlogramas se muestran a continuación.
10
-800
-600
-400
-200
0
200
400
600
10 15 20 25 30 35 40 45 50 55 60
D(GPUBLI,1)
Primera diferencia de la serie Gpubli
11
Tanto el gráfico de la serie DGpubli como su correlograma indican que la
primera diferencia de la serie puede ser estacionaria puesto que oscila en torno a
su nivel medio, aunque en el tramo central de la muestra las observaciones tienen
una intensa volatilidad, y el correlograma tiende a cero con cierta rapidez . No
obstante, se completa este análisis con el test DFA de raíces unitarias que se
muestra a continuación
Test de D-F Aumentado de DGpubli Null Hypothesis: D(GPUBLI) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -7.301027 0.0000 Test critical values: 1% level -3.565430
5% level -2.919952 10% level -2.597905
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(GPUBLI,2) Method: Least Squares Date: 04/15/07 Time: 09:54 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
D(GPUBLI(-1)) -1.324626 0.181430 -7.301027 0.0000D(GPUBLI(-1),2) 0.401645 0.131385 3.057006 0.0036
C 0.638946 29.28717 0.021817 0.9827
R-squared 0.557836 Mean dependent var -3.098039Adjusted R-squared 0.539413 S.D. dependent var 308.1362S.E. of regression 209.1215 Akaike info criterion 13.58073Sum squared resid 2099127. Schwarz criterion 13.69437Log likelihood -343.3086 F-statistic 30.27851
12
Durbin-Watson stat 2.023024 Prob(F-statistic) 0.000000
El test DFA rechaza la hipótesis nula de una raíz unitaria en Dpubli puesto
que el valor del estadístico t (7,30) supera el valor de los puntos críticos de la
distribución DFA. Este resultado corrobora la estacionariedad de la serie Dpubli que
indican el gráfico y el correlograma de la serie
Por lo tanto, de estos resultados se deduce que la transformación que
convertiría a la serie en estacionaria sería:
Zt =(1-B)Gpubli,, Gpubli ∼I(1)
Una vez decidido el grado de integración de la serie, es decir, el número de raíces
unitarias que tiene, se debe determinar cuales son los posibles procesos ARMA
que generan la serie.
El análisis de los correlograma de la serie DPubli nos dice que un modelo que
puede generar la serie es un AR(2), puesto que el correlograma simple tiende a
cero con cierta rápidez, el parcial se anula después del segundo retardo. También
se puede sugerir como un modelo alternativo, un AR(4) puesto que el correlograma
simple se anula después del cuarto retardo, aunque restringiendo a cero los
retardos intermedios. Por otro lado, de la observación del gráfico de la serie que
consideramos estacionaria, D(Publi,1), se observa que su media puede que no sea
distinta de cero, por lo que no procede en principio la inclusión de un término
independiente, el cual es rechazado cuando se incluye en los modelos.
Los modelos sugeridos son:
1.1) ARIMA(2,1,0) ,, (1-φ1B- φ2B2 ) (1-B) Gpubli = C+at
1.2) ARIMA(4,1,0) ,, (1-φ1B- φ2B2 - φ3B3-φ4B4 ) (1-B) Gpubli = C+ at
El análisis de la estructura del correlograma probablemente sugiera algún modelo
adicional pero de momento nos quedamos con los propuestos.
13
Estimación
Una vez especificados varios modelos alternativos como posibles generadores de
la serie se debe proceder a la estimación de los mismos. Para ello en Eviews se
deben dar las siguientes instrucciones para estimar los modelos sugeridos.
Modelo 1.1: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2)
Modelo 1.2: Quick/Estimate Equation/ LS d(Gpubli,1) c ar(1) ar(2) ar(3) ar(4) Los resultados de la estimación de estos modelos se presentan a continuación, sin
embargo algunos componentes del modelo 1.2 no eran significativos y finalmente
se han eliminado figurando en esa ecuación del modelo los componentes cuyos
parámetros son significativos, de hecho se han eliminado ar(1) y ar(3) Estimación Modelo1.1 Dependent Variable: D(GPUBLI) Method: Least Squares Date: 04/14/07 Time: 21:16 Sample (adjusted): 1910 1960 Included observations: 51 after adjustments Convergence achieved after 3 iterations
Variable Coefficient Std. Error t-Statistic Prob.
AR(1) 0.077068 0.130673 0.589779 0.5580AR(2) -0.401640 0.130038 -3.088634 0.0033
R-squared 0.165609 Mean dependent var 0.686275Adjusted R-squared 0.148580 S.D. dependent var 224.3115S.E. of regression 206.9776 Akaike info criterion 13.54152Sum squared resid 2099147. Schwarz criterion 13.61728Log likelihood -343.3089 Durbin-Watson stat 2.023100
Inverted AR Roots .04+.63i .04-.63i
Estimación modelo 1.2 Dependent Variable: D(GPUBLI)
14
Method: Least Squares Date: 04/14/07 Time: 21:26 Sample (adjusted): 1912 1960 Included observations: 49 after adjustments Convergence achieved after 2 iterations
Variable Coefficient Std. Error t-Statistic Prob.
AR(2) -0.268970 0.138461 -1.942575 0.0581AR(4) 0.324983 0.138116 2.352971 0.0229
R-squared 0.248989 Mean dependent var 0.795918Adjusted R-squared 0.233010 S.D. dependent var 228.9130S.E. of regression 200.4774 Akaike info criterion 13.47924Sum squared resid 1888986. Schwarz criterion 13.55646Log likelihood -328.2414 Durbin-Watson stat 1.788707
Inverted AR Roots .67
Una vez estimados los modelos especificados se debe validar dichas estimaciones,
es decir, se debe contrastar la adecuación del modelo a los datos, por medio de
una batería de tests estadísticos y econométricos vistos en clase y que se
encuentran en Eviews en el objeto ecuación .
Validación o chequeo
En la etapa de validación se presentan tres bloques de análisis: Un primero
referente a los resultados de la estimación, un segundo centrado en el análisis de
los residuos y, finalmente, un tercero dedicado a la comparación de modelos
alternativos.
• Análisis de la estimación.- Referente a la significatividad individual de los coeficientes por medio del
estadístico t de student pone de relieve que todos los coeficientes del modelo 1.2
son altamente significativos y mientras que ar(1) del modelo 1.1 no es significativo.
En cuanto a las condiciones de estacionariedad de los modelos estimados,
todas las raíces de los polinomios de retardos caen fuera de circulo de radio
15
unidad, ver cuadros anteriores de estimaciones, debe tenerse en cuenta que
Eviews muestra la inversa de las raíces, por lo que esas inversas caen todas dentro
del circulo de radio unidad.
De la observación de los resultados de la estimación se deduce que el modelo 1.2
presenta un error estandar ligeramente más bajo que el del modelo 1.1 y tanto el
estadístico de Akaike como el criterio de Schwarz son inferiores en el segundo
modelo .
En esta etapa también se suele analizar las correlaciones entre los coeficientes
estimados para verificar la posible existencia de multicolinealidad en el modelo. La
existencia de multicolinalidad indica una falta de precisión en las estimaciones
obtenidas y una cierta inestabilidad de los coeficientes estimados. Para obtener las
correlaciones entre los coeficientes se acude su matriz de correlaciones que
proporciona Eviews, para ello nos situamos en la ecuación estimada y marcamos lo
siguiente:
View/Correlation Matrix
La ejecución de esta instrucción muestra la matriz de coeficientes de la
ecuación estimada, para el modelo 1.1 se tiene:
Matriz de correlaciones del modelo 1
C AR(1) AR(2) C 0.380682 -0.005342 -0.015880
AR(1) -0.005342 0.018437 -0.011620 AR(2) -0.015880 -0.011620 0.016376
Se observa que esa matriz presenta unas correlaciones muy bajas por lo que no
muestra indicios de multicolinealidad. Para el modelo 1.2 se puede verificar de la
misma forma que tampoco presentan problemas de multicolinelidad.
Análisis de los residuos.
.El siguiente paso dentro del proceso de validación es el análisis de los
residuos de ambos modelos. Para ello en el objeto ecuación de Eviews se ofrecen
16
varios contrastes pero nos limitamos al contraste de que los residuos sean ruido
blanco, inspeccionando el correlograma de residuos, el estadístico Q de Box-
Pierce y el gráfico de residuos. Para ello, en Eviews una vez dentro del objeto
ecuación
Instrucciones: View/ Residual Tests/Correlogram-Q-Statistics Los resultados para el modelo.1.2 se presenta en la tabla adjunta y se puede
contemplar que las autocorrelaciones de los residuos no son significativas y entran
dentro de las bandas de confianza, lo que indica que no son distintas de cero. Por
su parte, el estadístico Q no muestra indicios de autocorreción global de los
residuos, puesto que el valor de Q estimado para los diferentes ordenes de
autocorrelación que se muestran en la tabla adjunta es siempre inferior al punto
critico de la χ2 con los correspondientes grados de libertad y los niveles estandar de
significatividad utilizados en el trabajo empírico, lo que nos lleva a rechazar la
hipótesis nula de autocorrelación global de los residuos. el valor de estimado.
Correlograma de los residuos del modelo 1.2
17
Instrucciones Eviews para el gráfico de residuos: View/Actual, Fitted, residuals
-800
-400
0
400
-800
-400
0
400
800
15 20 25 30 35 40 45 50 55 60
Residual Actual Fitted
18
El gráfico de los residuos también apoya la ausencia de autocorrelación residual,
puesto que la gran mayoría de los residuos entran dentro de las bandas de
confianza, con excepción de algún residuo anómalo. Por lo tanto, también muestra
claramente que los residuos son ruido blanco.
De la misma forma que el análisis llevado a cabo para el modelo 1.2 se
puede entrar en el objeto ecuación del modelo 1.1 y verificar que si los residuos son
ruido blanco. De hecho se observa que tanto el correlograma de residuos y el
estadistico Q como el gráfico de residuos no llegan a superar a los del modelo 1.2
Comparación de modelos alternativos.
Del análisis que se acaba de realizar en los dos apartados anteriores se
deduce que el modelo 1.2 superan el conjunto de pruebas estadísticas para validar
sus estimaciones. Además el modelo 1.2 presenta una menor varianza residual y
un menor Akaike, por lo que es preferible al 1.1.
Por lo tanto, los gastos en publicidad de la empresa, Gpubli, que es la
variable que se modelizada, viene explicada de forma satisfactoria por un modelo
sencillo ARIMA(4,0,0) restringiendo a cero los componentes AR(1) y AR(3).
3. Ejemplo 2. El Índice de precios Producción de Estados Unidos
La serie a modelizar es el Índice Precios de Producción de Estados Unidos
de frecuencia trimestral y el periodo muestral abarca 1960:01- 2002:01. Una vez
creado el el WorKfile y establecido el periodo muestral se deben importar los datos
del banco de datos, tal y como se ha hecho en el ejemplo anterior. La serie la
denominamos PPI en el Workfile
El primer paso en la modelización de la serie es su representación gráfica. Para ello
en Eviews, la instrucción es:
Quick/ Graph/ Line Graph /PPI
19
El resultado es el gráfico1a en el que se puede contemplar como la serie GDP
muestra una tendencia fuertemente creciente a lo largo del tiempo. Se realiza la
transformación logarítmica para atenuar la posible no estacionariedad en varianza y
se realiza el gráfico de la serie transformada. Para ello, en Eviews
GENR LPPI=LOG(PPI) y para su representación gráfica :
Quick/ Graph/ Line Graph / LPPI
La representación gráfica de esta serie LPPI se muestra en el gráfico 1b en el cual
se puede contemplar que la nueva serie exhibe también una clara tendencia
creciente lineal, lo que indica que esta serie no es estacionaria en media.
Gráfico 1 a. Evolución de PPI Gráfico 1b. Evolución de log(PPI)
20
40
60
80
100
120
1960 1965 1970 1975 1980 1985 1990 1995 2000
PPI
3.2
3.6
4.0
4.4
4.8
1960 1965 1970 1975 1980 1985 1990 1995 2000
LPPI
También se muestra a continuación el correlograma de LPPI
En Eviews una vez dentro del objeto serie LPPI:
View/Correlogram
20
El correlograma confirma también la no estacionariedad que mostraba el gráfico de
nivel de la serie LPPI puesto que tiende muy lentamente hacia cero
Se realiza también el test de DFA de raíces unitarias, cuyos resultados se presentan
a continuación. Para ello, en Eviews:
Quick/ SERIES STATISTIC/ Unit root / LPPI
21
Test D-F aumentado de la serie LPPI ..
El test DFA no rechaza la hipótesis nula de la existencia de una raíz unitaria en LPPI
puesto que el valor del estadístico t (-1.245) es notablemente inferior a los valores
críticos de la distribución DFA
Si ajustamos una tendencia temporal lineal simple de tipo determinístico a la serie
(LPPI), tal y como hicimos en el capítulo 1 del programa de la asignatura y práctica
1 y en la modelización de la serie ventas que acabamos de realizar, y restamos de
LPPI la serie ajustada podremos comprobar que ese no es un procedimiento
correcto para convertir a la serie en estacionaria. ( se deja al alumno que lo
compruebe). Por lo tanto, es claro que esa tendencia no es determinista sino
estocástica y debemos proceder con diferenciaciones para eliminar esa tendencia.
Comenzamos tomando una primera diferencia regular en la serie LPPI, cuyo gráfico
se muestra a continuación y también su correlograma.
22
Instrucciones en Eviews:
Genr DLPPI=D(LPPI,1) Quick/Graph/Line Graph/DLPPI
Quick/Series Statistic/Correlogram
-.04
-.02
.00
.02
.04
.06
.08
1960 1965 1970 1975 1980 1985 1990 1995 2000
D(LPPI)
Primera deferencia de LPPI
23
El gráfico de DLPPI muestra que la serie podría ser estacionaria y también en ese
sentido apunta el correlograma al mostrar un decaimiento con cierta rapidez. No
obstante, se realiza también el test de DFA, cuyos resultados se muestran a
continuación, y corrobora también la no existencia de una raíz unitaria en la serie
DLPPI y que, por tanto, esa transformación convierte a la serie en estacionaria.
Test DFA de la serie DLPPI Null Hypothesis: D(LPPI) has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=13)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -4.511989 0.0003 Test critical values: 1% level -3.469933
5% level -2.878829 10% level -2.576067
*MacKinnon (1996) one-sided p-values.
24
Augmented Dickey-Fuller Test Equation Dependent Variable: D(LPPI,2) Method: Least Squares Date: 04/14/07 Time: 18:53 Sample (adjusted): 1960Q4 2002Q1 Included observations: 166 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
D(LPPI(-1)) -0.311506 0.069040 -4.511989 0.0000D(LPPI(-1),2) -0.208661 0.078661 -2.652671 0.0088
C 0.002597 0.001046 2.482450 0.0141
R-squared 0.231434 Mean dependent var -1.71E-07Adjusted R-squared 0.222003 S.D. dependent var 0.012602S.E. of regression 0.011115 Akaike info criterion -6.143098Sum squared resid 0.020138 Schwarz criterion -6.086857Log likelihood 512.8771 F-statistic 24.54160Durbin-Watson stat 2.051191 Prob(F-statistic) 0.000000
Por lo tanto la serie LPPI tiene una raíz unitaria y la primera diferencia convierte a
dicha serie en estacionaria una vez eliminada su tendencia. La serie es del tipo
: Zt =(1-B)LPPI,, LPPI∼I(1)
Es decir, es integrable de orden 1 y tiene el siguiente significado:
DLPPI= LPPI- LPPI(-1) = log(PPI)-log(PPI(-1)), que es la tasa de variación intertrimestral de PPI o la tasa de inflación de los precios de producción o a la salida de fabrica.
Determinado el grado de diferenciación ó de raíces unitarias, pasamos a
especificar el orden de los polinomios AR y MA. Del análisis de los correlogramas
de DLPPI se deduce que en la FAC existen 2 ó tres ó quizás 4 coeficientes que son
distintos de cero y después todos son cero, mientras que en la FAP solo existe un
coeficiente significativo, que no es cero, el primero, y después tienden rápidamente
a cero. Esto sugiere que la serie (DLPPI) puede ser generada por modelos que
puede tener una estructura MA hasta orden 3 y un AR(1). Así, los posibles modelos
serian: ARIMA (1,1,3), ARIMA(1;1,2) ó ARIMA(1,1,1).
25
Por otro lado, de la observación del gráfico de la serie DLPPI se deduce que
la media de la serie es distinta de cero por lo que debe incluirse el término constante
en los modelos especificados
Los modelos tentativos serian por tanto:
2.1. ARIMA(1,1,0) ,, (1- φ1 B)(1-B)LPPI= µ +at
2.2. ARIMA(1,1,1) ,, (1- φ1 B)(1-B)LPPI= µ +(1- θ1B)at
2.3. ARIMA(1,1,1)x(0,0,1)s ,, (1- φ1 B) (1-B)LPPI= µ + (1- θ1B)(1-Θ 12B12) at
Estimación La estimación de los modelos anteriores en Eviews se hace por medio de las
siguientes instrucciones:
Quick/ Estimate Equation/ LS DLPPI c ar(1) Quick/ Estimate Equation/ LS DLPPI c ar(1) ma(1) Quick/ Estimate Equation/ LS DLPPI c ar(1) ma(1) sma(4)
Los resultados de la estimación de estos modelos se presentan a continuación:
Estimacion modelo 2.1 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 09:45 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 3 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 0.008359 0.002213 3.777275 0.0002AR(1) 0.604968 0.062102 9.741485 0.0000
R-squared 0.365132 Mean dependent var 0.008398Adjusted R-squared 0.361284 S.D. dependent var 0.014135S.E. of regression 0.011297 Akaike info criterion -6.116710Sum squared resid 0.021057 Schwarz criterion -6.079369Log likelihood 512.7453 F-statistic 94.89653
26
Durbin-Watson stat 2.232988 Prob(F-statistic) 0.000000
Inverted AR Roots .60
Estimacion modelo 2.2 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 10:21 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 7 iterations Backcast: 1959Q4
Variable Coefficient Std. Error t-Statistic Prob.
C 0.008092 0.003629 2.229971 0.0271AR(1) 0.872379 0.058040 15.03057 0.0000MA(1) -0.457266 0.102635 -4.455274 0.0000
R-squared 0.407837 Mean dependent var 0.008398Adjusted R-squared 0.400615 S.D. dependent var 0.014135S.E. of regression 0.010943 Akaike info criterion -6.174369Sum squared resid 0.019640 Schwarz criterion -6.118357Log likelihood 518.5598 F-statistic 56.47532Durbin-Watson stat 1.958243 Prob(F-statistic) 0.000000
Inverted AR Roots .87 Inverted MA Roots .46
Estimacion modelo 2.3 Dependent Variable: D(LPPI) Method: Least Squares Date: 04/14/07 Time: 10:26 Sample (adjusted): 1960Q3 2002Q1 Included observations: 167 after adjustments Convergence achieved after 8 iterations Backcast: 1958Q4 1959Q4
Variable Coefficient Std. Error t-Statistic Prob.
C 0.007848 0.003372 2.327825 0.0212AR(1) 0.814407 0.082838 9.831363 0.0000MA(1) -0.394349 0.124094 -3.177816 0.0018
SMA(4) 0.234611 0.084470 2.777430 0.0061
27
R-squared 0.427921 Mean dependent var 0.008398Adjusted R-squared 0.417392 S.D. dependent var 0.014135S.E. of regression 0.010789 Akaike info criterion -6.196898Sum squared resid 0.018974 Schwarz criterion -6.122216Log likelihood 521.4410 F-statistic 40.64187Durbin-Watson stat 1.963251 Prob(F-statistic) 0.000000
Inverted AR Roots .81 Inverted MA Roots .49-.49i .49+.49i .39 -.49+.49i
-.49+.49i
Validación
En cuanto a los coeficientes de los tres modelos son individualmente significativos,
según el contraste de la t de student.. Todos los modelos cumplen las condiciones
de estacionariedad y de invertibilidad puesto que tanto las raíces de los polinomios
autorregresivos como los de media móvil caen fuera del circulo de radio unidad. A
su vez, las matrices de correlaciones de los coeficientes de estos modelos no
muestran signos de multicolinealidad
Desde el punto de vista del error estandar de los modelos estimados el 2.3 es el
que presenta un valor menor (0,0108) seguido del 2.2 (0.0109). Desde el punto de
vista del criterio de Akaike, el modelo 2.3 presenta un valor inferior (-6.20) seguido
del modelo 2.2 (-6.17).
El análisis de los residuos de los tres modelos estimados a través de sus
correspondientes correlogramas, el estadístico Q y sus gráficos de residuos, que se
presentan a continuación para el modelo 2.3, nos indica que todos ellos cumplen las
condiciones para ser considerados como ruido blanco, excepto el 2.1. No obstante,
el modelo 2.3 es el que cumple esas condiciones con más holgura.
Del análisis anterior de los residuos y de la evaluación de las estimaciones de los
coeficientes de los distintos modelos el modelo preferido es el 2.3 seguido del
modelo 2.2. El modelo 2.1 es desechable desde el punto de vista estadístico dado
que sus residuos no son ruido blanco
28
Correlograma de los residuos del modelo 2.3
Grafico de residuos del modelo 2.3
-.06
-.04
-.02
.00
.02
.04
-.04
-.02
.00
.02
.04
.06
.08
1965 1970 1975 1980 1985 1990 1995 2000
Residual Actual Fitted
El alumno debe analizar los residuos de los modelos 2.2 y 2.3 a través del correlograma y del gráfico de residuos
29
4. Ejemplo 3. Viviendas de nueva construcción en USA
La serie a modelizar es el número de viviendas de nueva construcción en
Estados Unidos expresada en miles, la frecuencia es mensual y el periodo muestral
comprende 1959:06 1992:04. El objetivo que se persigue con este ejercicio es que
el alumno aprenda a construir un modelo univariante de una serie de frecuencia
mensual que tiene una marcada tendencia y estacionalidad.
Una vez creado el fichero de trabajo en Eviews para esa frecuencia y periodo
muestral, de la misma forma como se ha realizado en los dos ejercicios anteriores,
se realiza la representación gráfica de la serie objeto de análisis. La serie se
denomina HS
Instrucciones: Quick/Graph/ HS/Line graph
40
80
120
160
200
240
1960 1965 1970 1975 1980 1985 1990
HS
Viviendas de nueva construcción en USA
Este gráfico no es muy indicativo sobre la estacionariedad o no de la serie en
30
Como hemos visto en los dos ejemplos anteriores el correlograma es un
instrumento útil para verificar la estacionariedad de la serie. A continuación se
presenta el correlograma.
Instrucciones: Una vez en el objeto serie HS, View/ Correlogram En el correlograma de la serie HS se observa que las autocorrelaciones disminuyen
primero, y posteriormente alcanzar un pico relativo en el retardo 12, y disminuyen de
forma acusada en los retardos mayores. Por su parte, las autocorrelaciones
parciales muestran una punta positiva en el retardo 1 y otra negativa en el retardo
13, lo cual apunta a una posible estacionariedad de la serie en niveles.
31
No obstante, realizamos el contraste de Dickey- Fuller aumentado que se adjunta a
continuación:
Instrucciones: Quick/series statistic/Unit Root/HS Contraste de raiz unitaria (DFA) de la serie HS Null Hypothesis: HS has a unit root Exogenous: Constant Lag Length: 4 (Automatic based on SIC, MAXLAG=4)
t-Statistic Prob.*
Augmented Dickey-Fuller test statistic -4.969008 0.0000 Test critical values: 1% level -3.446692
5% level -2.868638 10% level -2.570617
*MacKinnon (1996) one-sided p-values.
Augmented Dickey-Fuller Test Equation Dependent Variable: D(HS) Method: Least Squares Date: 03/28/07 Time: 18:33 Simple (adjusted): 1959M06 1992M04 Included observations: 395 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
HS(-1) -0.148240 0.029833 -4.969008 0.0000D(HS(-1)) 0.219352 0.049430 4.437661 0.0000D(HS(-2)) 0.111332 0.049647 2.242480 0.0255D(HS(-3)) -0.065359 0.049837 -1.311461 0.1905D(HS(-4)) -0.195488 0.049835 -3.922725 0.0001
C 18.73706 3.901098 4.803023 0.0000
R-squared 0.198754 Mean dependent var -0.108354Adjusted R-squared 0.188455 S.D. dependent var 19.94195S.E. of regression 17.96486 Akaike info criterion 8.629785Sum squared resid 125544.3 Schwarz criterion 8.690224Log likelihood -1698.383 F-statistic 19.29878Durbin-Watson stat 1.956461 Prob(F-statistic) 0.000000
32
La hipótesis de raíz unitaria queda fuertemente rechazada, según los resultados del
test DFA de la serie HS, el estadístico t (-4,97) supera ampliamente los valores
críticos de la distribución ADF, lo que confirma la estacionariedad de la serie HS en
niveles, como ya apuntaba de alguna forma el análisis gráfico y el del correlograma.
Para finalizar la etapa de especificación inicial debemos determinar cuales son los
modelos estacionales multiplicativos ARMA (p,q) Χ ARMA(P,Q)S que pueden
generar la serie.
Del análisis del correlograma de la serie HS se deduce que el proceso generador
de datos puede tener un componente autorregresivo regular de orden 1 y otro
estacional de orden 1, es decir un AR(1,0)xSAR(1,0)12.
Por lo tanto, comenzamos la estimación con este modelo
3.1. ARIMA(1,0)×(1,0)12 ,, (1- φ1 B) (1-φ12B12)HS = c+at
3.2. ARIMA(1,0,1)x(1,0,1)s ,, (1- φ1 B) (1-φ12B12) HS= c + (1- θ1B)(1-Θ 12B12) at
Instrucciones: Quick/ Estimate Equation/ HS c ar(1) sar(12) Estimación del modelo 3.1 Dependent Variable: HS Method: Least Squares Date: 03/28/07 Time: 18:38 Sample (adjusted): 1960M02 1992M04 Included observations: 387 after adjustments Convergence achieved after 7 iterations
Variable Coefficient Std. Error t-Statistic Prob.
C 125.7702 15.81167 7.954265 0.0000AR(1) 0.855642 0.026422 32.38374 0.0000
SAR(12) 0.684278 0.037380 18.30602 0.0000
33
R-squared 0.861497 Mean dependent var 127.0121Adjusted R-squared 0.860776 S.D. dependent var 37.98452S.E. of regression 14.17307 Akaike info criterion 8.148286Sum squared resid 77136.31 Schwarz criterion 8.178971Log likelihood -1573.693 F-statistic 1194.255Durbin-Watson stat 2.299600 Prob(F-statistic) 0.000000
Inverted AR Roots .97 .86 .84-.48i .84+.48i .48+.84i .48-.84i .00+.97i -.00-.97i -.48+.84i -.48-.84i -.84-.48i -.84+.48i -.97
Grafico residuos del modelo 3.1
-60
-40
-20
0
20
40
60
1965 1970 1975 1980 1985 1990
HS Residuals
Correlograma residuos del modelo 3.1
34
Estimación Modelo 3.2 Dependent Variable: HS Method: Least Squares Date: 03/28/07 Time: 18:43 Sample (adjusted): 1960M02 1992M04 Included observations: 387 after adjustments Convergence achieved after 22 iterations Backcast: 1959M01 1960M01
Variable Coefficient Std. Error t-Statistic Prob.
C 83.11975 184.3502 0.450880 0.6523AR(1) 0.955059 0.016389 58.27399 0.0000
SAR(12) 0.993375 0.003935 252.4190 0.0000MA(1) -0.227059 0.053509 -4.243383 0.0000
SMA(12) -0.949903 0.012323 -77.08240 0.0000
R-squared 0.906416 Mean dependent var 127.0121Adjusted R-squared 0.905436 S.D. dependent var 37.98452S.E. of regression 11.68070 Akaike info criterion 7.766589Sum squared resid 52119.61 Schwarz criterion 7.817731Log likelihood -1497.835 F-statistic 924.9762Durbin-Watson stat 2.009647 Prob(F-statistic) 0.000000
Inverted AR Roots 1.00 .96 .87-.50i .87+.50i .50+.87i .50-.87i .00+1.00i -.00-1.00i
35
-.50+.87i -.50-.87i -.87-.50i -.87+.50i -1.00
Inverted MA Roots 1.00 .86+.50i .86-.50i .50+.86i .50-.86i .23 .00+1.00i -.00-1.00i -.50+.86i -.50-.86i -.86-.50i -.86+.50i -1.00
Correlograma de los residuos del modelo 3.2
36
-40
-30
-20
-10
0
10
20
30
40
1965 1970 1975 1980 1985 1990
HS Residuals
Validación
El modelo 3.1 presenta todos su coeficientes significativos, según el t ratio, la matriz de coeficientes que se
puede consultar en la ventana de la ecuación no proporciona coeficientes de correlación elevados por lo que no
presentan signos de multicolinealidad. Analizando el correlogramas de los residuos se observa que el
estadistico Q presenta autocorrelación global , por lo que los residuos no son ruido blanco. El modelo, en
principio, no parece válido y además el coeficiente de AR(1) está próximo a 1 (0,9), lo que puede indicar la
necesidad de una nueva diferenciación, en el mismo sentido apunta el valor elevado de la raiz invertida de la
parte autorregresiva (0.97), lo que indica que la serie HS puede que no sea estacionaria
Los coeficientes del modelo 3.2 son altamente significativos y presenta mejoras sobre el modelo anterior, de
hecho el criterio de AIC y el SBC son inferiores y los residuos se parecen a un ruido blanco, tanto de la
observación de correlograma de los residuos como el estadistico. Sin embargo, los coeficientes autorregresivos
tienen valores cercanos a la unidad, lo que indican la necesidad de una difereciación regular y otra estacional,
en el mismo sentido apuntan las raices de los polinomios autorregresivos.
A la vista de los problemas anteriores se sugiere al alumno que pruebe diversos esquemas ARMA con
una diferenciación regular y otra estacional.