apuntes de econometría i (segunda parte)
DESCRIPTION
Apuntes de Econometría I (segunda parte)LemarieSalgadoSerranoTRANSCRIPT
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Regresión con dos variables, estimación de intervalos y prueba de hipótesis:
La teoría de la estimación consta de dos partes, la estimación puntual y la estimación de intervalos. La
primera se ha analizado en los capítulos anteriores, y la segunda se desarrolla a continuación.
*Prerrequisitos estadísticos y estimación de intervalos, algunas ideas básicas: control de lectura
Intervalos de confianza para 1 y 2 :
Donde (1- ) es el coeficiente de confianza, y el nivel de significación, t es la distribución de “Student” y
2
t es el valor crítico que se lee en las tablas con (n – 2) grados de libertad (g de l.), y un nivel
significación de 2
.
De acuerdo al teorema 5:
T= 2/1
2
k
Z
Z i
2/12
22
2/1
2
2
22
2/1
2
22
1
iixx
Var
Z
2
2
2 2
nZ
t =
2/12
22
2/12
22
2/1
2
2
2/12
22
2
2
i
ii
x
x
n
n
x
t=
2
22
ee
12/2/ tttPr
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
12/
2
22
2/ t
ee
tPr
122/2222/ eeteetPr
122/2222/ eeteetPr
122/2222/2 eeteetPr
Ejemplo con la muestra 1:
5091.0ˆ
2 0375.0)ˆ( 2 ee
8 g de l %5
Al 95% de nivel de confianza,
%95)0357.0(306.2509.0)0357.0(306.2509.0 2 tP
Quiere decir que el 95% de los intervalos obtenidos de las 7.5 * 10^10 muestras contendrán al verdadero 2
. El intervalo anterior tiene el 95% de probabilidad de contener el verdadero 2 .
Intervalo de confianza para 2 :
Se define como:
112/1112/1 eeteetPr
Pasa cerca del origen
122/2222/2 eeteetPr
%95)5917.04268.0( 2 tP
306.2025.0 t
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
)1(Pr 2
2
22
21
Donde
21
2
y 2
2
son los valores críticos que se lee en las tablas con (n-2) grados de libertad g. l.
Para muestra caso: 2
2
2 )2(
n
)1(1
)2(
1Pr
2
2
2
2
2
21
n
)1()2()2(
Pr2
)2
(
2
2
2
2
2..1
nn
)1()2()2(
Pr
2
2
2
2
2
)2
1(
2
nn
Ejemplo: con la muestra 1;
2
= 42,1591; 8 g.l 5%
%951797.2
1591.42*8
15346.17
1591.42*8Pr
2
%951
7336.154
11
2347.19Pr
2
Control de lectura: Prueba de Hipótesis comentarios generales.
)1()2(Pr 2
2
2
2
2
21
n
Quiere decir que el 95% de los intervalos
obtenidos de las 7.5 * 10^10 muestras
contendrán al verdadero 2 . El intervalo
anterior tiene el 95% de probabilidad de
contener el verdadero 2 .
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Prueba de hipótesis: método del intervalo de confianza.
Prueba de dos colas:
Se construye un intervalo de confianza para 2 al 95%. Si 2 bajo la 0H se encuentra dentro de este
intervalo no se rechaza la 0H (se acepta la hipótesis nula), pero si esta fuera del intervalo, se rechaza la 0H
(aceptar la 1H ).
Ejemplo: se conoce que 2
=0.5091, pero se postula que:
0H : 2 =0,3 → Hipótesis simple
1H : 2 0,3 → Hipótesis compuesta
Entonces, es el 2
compatible con la 0H ?
Para responder acudimos al intervalo de confianza obtenido anteriormente:
“En última instancia nos tenemos que comparar con los valores poblacionales.”
%955914,04268,0 2 rP
%955914,03,04268,0 rP
La 0H está fuera del intervalo, se rechaza la 0H (se acepta 1H ) al 95% de confianza. (HACER LO MISMO
CON 1
Y CON LAMUESTRA 2)
Prueba de 1 cola:
Se determina de acuerdo al planteamiento de la 1H . Nuevamente se conoce que 2
=0.5091 pero se
postula que 0H : 3.02 ; 1H : 3.02 .
Pr(0.42 2 0.5914) =95%
La 0H esta fuera del intervalo, se rechaza 0H (se acepta 1H ) al 95% de confianza.
Prueba de hipótesis: método de la prueba de significación
Es un procedimiento mediante el cual se utiliza los resultados muéstrales para verificar la verdad o falsedad
de una oH a través de la t de Student
Prueba de dos colas:
)1()Pr(22
ttt
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
)1(
2(
22Pr
2
*
2 )
t
ee
t
12
2
*
222
2
*
2 eeteetPr
Donde 2
*
es el valor de2
bajo la oH , 2
t y 2
t son los valores críticos. El intervalo es conocido como
la “región de aceptación” de la oH y las regiones fuera del intervalo se llama “región de rechazo” o
“regiones criticas” de la oH
Ejemplo: 5091.02
0375.0)2
(
ee
8g. de l 306.2025.0 t
Se puede utilizar las 2 formas:
La primera:
3,0: *
2 oH 3,0: *
21 H
%95306,20357,0
3,0509,0306,2
rP
%95306,286,5306,2 rP
Se rechaza la hipótesis nula y en consecuencias se acepta la 1H .
Región de
Rechazo oH
Región de Rechazo
oH
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
La segunda:
3.02
*
oH 3.02
*
1 H
%95)0375.0(306.23.02
)0375.0(306.23.0Pr
%95)3823.02
2177.0Pr(
%95)3823.0509.02177.0Pr(
Se dice que una prueba es estadísticamente significativa si el valor del estadígrafo de prueba cae en la región
de rechazo de la 0H ; y una prueba es estadísticamente no significativa si el valor del estadígrafo de la
prueba cae en la región de aceptación 0H
Prueba de una cola:
El procedimiento es similar, cambia en el planteamiento de las hipótesis.
Ejemplo: muestra 1. 5091.0ˆ
2 0375.0)ˆ( 2 ee ; 8 g de l
0H :*
2 0,3 → Hipótesis simple
1H : *
2 0,3 → Hipótesis compuesta
Así mismo, se pueden utilizar las dos formas:
0,509
Región de Rechazo
oH
0,2177 0,3 0,3823
3
2,5% Región
de rechazo oH
86.105.0 t
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
La primera:
0357,0
3,0509,0
)( 2
*
22
ee
t
Se rechaza 10 HaceptaseyH
La segunda:
3644.0)0357.0(86.134.0)2
(22
*
eet
8 grados de
libertad.
Rechazo a 0H
Rechazo a 0H
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Prueba de significación para 2
)1(Pr 2
2
22
21
2
2
2 )2(
n
Ejemplo con la muestra 1:
2
= 42.1591 8 g de l
=5%
0H : 2 =85 → Hipótesis simple
1H : 2 85 → Hipótesis compuesta
97.385
1591.42*82
%955346.1797.31797.2 rP Se acepta 0H
Regla práctica “2-t” (Ho : Bi = 0)
Es lo que se utiliza en el trabajo empírico:
Ho: 0i y H1: 0i . Es un mecanismo para establecer si Y tiene relación con la variable explicativa X.
Si el de número de g. de l. es más de 20 al 95 % entonces Ho puede ser rechazada si
2t
i
ii
i
ee
t
Ho: 0i H1: 0i .
pendientelaEsi , por lo que la t de student puede ser, negativo o positivo.
i
i
ee
t
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
“En la nomenclatura internacional Bo , es igual a la intersección. “Gujarati tiene un problema de notación
está al revés.”
Xi = iio XX 2211
Cuando
i > 0 it =
i
i
ee
>2
Cuando
i < 0 it =
i
i
ee
<-2
it =
i
i
ee
>2
Si :2t se rechaza oH y se acepta 1H ; la presencia de la variable a la que pertenece i
es justificada en el
modelo porque es estadísticamente significativa para la variable dependiente.
Si :2t no se rechaza oH y se acepta 1H ; la presencia de la variable a la que pertenece i
no se justifica
en el modelo porque no es estadísticamente significativa para la variable dependiente.
Se dice que una prueba es estadísticamente significativa, o es verdadero, si el valor del estadígrafo de prueba
cae en la región de rechazo, mayor que dos y menor que menos dos. Ahí se rechaza que el regresor es 0, se
acepta que es diferente a 0 y eso quiere decir que la variable es significativa, para la variable dependiente.
Región de
aceptación Ho
2.5% Región de
rechazo de Ho
2.5% Región de
rechazo Ho
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Ejemplo:
iY 24.4545+0.5091 iX
(6.4138) (0.0357)
1t = 813.34138.6
4545.24
2t = 243.140357.0
5091.0
1̂ y 2̂ son estadísticamente significativos.
El valor P:
Denominado el valor de probabilidad, es el nivel de significación mas bajo al cual se puede rechazar una oH
o la probabilidad exacta de cometer un error tipo 1
Nota: La probabilidad de cometer un error tipo 1 es la probabilidad de rechazar la hipótesis cuando es
verdadera; la probabilidad de cometer un error tipo 2 es la probabilidad de acertar la hipótesis cuando es
falsa.
En la practica es la superficie de la región de rechazo determinada por un valor de la t de student (el riesgo)];
a medida que aumenta el valor absoluto de la t de student, disminuye el valor P.
Ejemplo:
1t = 3.8128 valor p = 3.8128
1t = 14.2605 valor p = 0.0000
Análisis de Varianza:
Recordando:
Importante: Los símbolos que no están con asteriscos son desviaciones respecto a la media.
STC = SEC+SRC
22
2iii uyy
22
2
2
ii xy
22
2
2
2iii uxy
La única t de student que no me interesa es la de la intersección. Si la intersección pasa por el origen la
.01
La propensión marginal a consumir
es muy significativa, razón por la
cual
11 y son estadísticamente
significativos.
Conclusiones prácticas del valor p:
Si excede a 0,05 necesitamos la tabla t de
student para ver su valor real.
Cuando tenemos más de 36 la t de
student es dos.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Tabla Anova
Fuente de
Variación
Suma de
Cuadrados
g de l Suma Promedio
de Cuadrados
Debido a regresión
(SEC)
2
2
2 ix
1
2
2
2 ix
Debido a residuos
(SRC)
2
iu
(n-2)
)2(
22
n
ui
Se construye una F
SRCdeSPC
SECdeSPCF
La relación también se puede obtener a partir del teorema 6:
2
2
2
2
22
2
2
2
22
22
11
2
2/
/
Var
n
n
ee
kZ
kZF
2
2
2
22
2
2
2
22
2
2
2
2
2
22
2
2
ii
x
n
n
eex
F
Los grados de libertad son los números de restricciones, y la restricción es el
equivalente al regresor.
En el software E views la prob representa el riesgo.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
2
2
22 )(
ixF
Ho: i =0 ; 1H : i 0
2
22
2
ixF
Si F> que el valor crítico de la distribución F; se rechaza Ho y se acepta 1H .
Si F< que el valor crítico de la distribución F; se acepta Ho.
Ejemplo:
2
=0.5091 2
ix =33000
2 = 421591
1591.42
)33000()5091.0( 2
F = 202.875
F no califica intersección; F califica pendientes B1 B2 B3
De la tabla F, con = 5%; k=1 y k= 8 g. de l. F= 5.32. Se rechaza Ho y se acepta 1H .
Nota: de acuerdo al teorema 7:
kk tF 2
,1 8679.202)24317.14(,1 kF
Aplicación de la regresión: problema de predicción:
Con la regresión muestral estimada, se puede “predecir” valores de Y correspondiente a algún nivel de X.
Hay dos clases de predicción: la predicción media y la predicción individual
Predicción media
Se desea predecir 100/ 0 XYE : el promedio de los consumos cuando en nivel de ingreso es igual a 100
)100(5091.04545.2421 0
XoY
3645.75
oY ---- el valor real de la tabla es 77
Puesto que oY
es un estimador, es probable que éste sea diferente de un verdadero valor. La diferencia entre
los dos dará alguna idea sobre el error de predicción; para evaluar este error es necesario encontrar la
distribución muestral de oY
, o sea su media y su varianza.
021X
oY
0210 )21
()( XXEo
E Y
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Lo que quiere decir que 0Y
está normalmente distribuida con media ( 021 X ); y la varianza es:
)21
()( oXVaro
Var Y
)2
,1
(2)2
()1
()(
CovXVarXVaro
Var ooY
2
2__
22
22
2
22)(
i
Ox
X
i
o
i
io X
xX
xn
XYVar
2
_22
2)(2
i
ooiYVar
xn
XnnXXo
2
2__
2
2)(21
i
ooYVar
x
XXnX
no
2
__
12)(i
o
ox
XX
nYVar
Conocida la Var
0Y y por tanto
oYee se puede plantear la distribución t de Student para construir
intervalos de confianza del verdadero
0X
YE o y hacer pruebas de hipótesis.
Conocida la Var )( 0
y y por tanto ee )( 0
y se puede plantear la distribución t de Student para construir
intervalos de confianza del verdadero )/( 00xyE
y hacer pruebas de hipótesis.
t =
)(
/
0
0
yee
xyEy oo
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
)1(
)(
/
Pr2
0
0
2
t
yee
xyEy
too
)1()(/)(Pr 0
2
000
2
0
yeetyxyEyyeety oo
Ejemplo:
1591.422
1591.42X 2
ix =33000 3645.750
y 2
t =2.306
Var )( 0
y =
33000
)170100(
10
11591.42
2
= 10.4759
3,2366
oYee
%952366,3306,23645,75/2366,3306,23645,75Pr
oo XYE
8281,82/901,67Pr oo XYE
8281,8277901,67Pr
Predicción individual
Se desea predecir el oY (predicción individual) de una de las familias, cuando 100oX
ooo uXY
21
Un buen estimador de 3645,75oY , es probable que este sea diferente de su verdadero valor. La diferencia
entre los dos dará alguna idea sobre el error de predicción. Para evaluar este error es necesario encontrar la
distribución inicial de oY , o sea su media y su varianza.
Hay 75.400 millones de ecuaciones, con 75.400 de oY , por lo que puedo construir una distribución
normal, por lo que necesito la media y la varianza.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
oiooo uEEXEEuXEYE
12121
oo XYE 21
Lo que quiere decir que oY está normalmente distribuido con media oX21 y la va varianza es:
Oo uVarXVaruXVar
2121oYVar
)(2YVar 212
2
1o ooo uVarCovXVarXVar
2
2
2__
2
22
2
2
2
o 2YVar
i
o
i
o
i
i
xXX
xX
xn
X
2
__2
2
o
21YVar
i
ooi
xn
XnXXX
2__22 XnXx ii
2__22 XnxX ii
2
__2
2__2
2
o
21YVar
i
ooi
xn
XnXnXXnx
2
2
0
2
02
0
211
ix
XXXX
nYVar
2
2
02
0
11
ix
XX
nYVar
Conocida la 0YVar y por tanto 0Yee se puede plantear la t de Student para hacer pruebas de hipótesis.
(PUEDE IR EN LA PRUEBA)
0
000 /
Yee
XYEYt
)1(/
Pr20
000
2
t
Yee
XYEYt
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
)1(/Pr 0
2
0000
2
0
YeetYXYEYeetY
Ejemplo:
2
= 42.1591 170X 330002 ix
Y 0 =75.3645 306.22
t
635.5233000
170100
10
111591.42
2
0
YVar
255.70 Yee
%950945.92/6345.58Pr 00 XYE
Control de Lectura: Informe de resultados
Control de Lectura: Evaluación de resultados
Prueba de normalidad de Jarque Bera
Para una variable normalmente distribuida S = 0 Y K = 3, en cuyo caso el estadígrafo J-B = 0 y el valor probabilística es 1; si la
variable no está normalmente distribuida, el estadígrafo J-B aumenta, y el valor p tenderá a cero.
Ejemplo:
S= 0.398346 K=1.890997
J-B= 10
77692.024
3890997.1
6
)398346.0(22
n =Tamaño de la muestra.
S = El sesgo mide si es simétrica o asimétrica.
K=Curtosis
Si el sesgo es igual a cero es absolutamente simétrica. Es decir la moda la mediana y la media coinciden.
Lo que me interesa es el valor probabilística.
Si es que la normal estandarizada tiene un Jarque Bera de cero esa distribución esta normalmente distribuida en un cien por ciento.
Si el Jarque Bera aumenta la probabilidad de que sea normal disminuye.
Cuando K < 3 la distribución es más ancha y más baja que la normal.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Valor p=0.678167.81% EQ01
iii uYY
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
EQ02
iii uYY
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Prueba de autocorreción de primer orden:
Se utiliza el estadígrafo Dublín Watson:
2
2
2
1
t
n
tt
u
uu
WD
2
2
2
11
2 2
t
n
tttt
u
uuuu
WD
2
2
2
1
2
1
2
2 2
t
n
t
n
tt
n
t
u
uuuu
WD
Si n es grande:
Se considera n grande desde un fenómeno conocido como la estacionalidad.
2
2
22
1 ~n
n
tt uu
n
t
n
t UU2
2
1
2 ~
1 2 3 (n-1) n
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
n
t
n
tt
n
t
U
UUU
WD
2
2
2
1
2
2 22
n
t
n
tt
U
UU
WD
2
2
2
1
12
n
t
n
tt
U
UU
2
2
2
1
)1(2
WD
Si aciónautocorrelnoWD
20
Si
aciónautocorrelWD 01
Si
aciónautocorrelWD 41
1 2 3 n-1
111
141
n
0 2 4
Autocorr (+) No Autocorr Autocorr (-)
43 PIBIDP
34 PIBIDP
Autocorr (-)
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Ejemplo: D – W (3,31)
23.1LD 65.1UD
35.265.144 UD
Extensiones del modelo de regresión lineal de dos variables
Regresión a través del origen
Si la nube de puntos está apuntando al origen y la regresión pasa por ahí los mínimos cuadrados si se
cumplen, si la nube de puntos no apunta al origen y la regresión si pasa por ahí, los mínimos cuadrados no
se cumplen.
A)
0
1D1
D
UD 2 4- UD 4 -
1D UD
Autocorr
(+)
Indecisión Indecisión Autocorr
(-)
No hay Autocorrelación
35.265.1 WD
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
B)
A) No se cumple con MCO
B) Se cumple con MCO
Hay ocasiones en las cuales la función de regresión poblacional de dos variables pasa por el origen 01
iii uXY 2 iii uXY
2
ii XY 2
2
2
22
iiiii XYYYu
02 2
2
2
iii
i
XXY
u
02 iii XXY
02
2 iii XXY
02
2 iii XYX
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
22i
ii
X
YX
2
2
2
2
2
2
)(
i
iii
i
iii
X
XX
X
XX
222i
ii
X
X
222i
ii
X
X
Porque las iX no son estocásticas y las 1 son homoscedásticas y no correlacionadas:
2
2
22
22
22
222
22i
i
i
ii
i
ii
X
uE
X
uEX
X
uXEE
2
2
2
2
2
22
)()(
ii
i
XX
EE
Var
2
2
2
iX
)1(
2
2
n
i
Pero el modelo sin intersección tiene algunos problemas.
Primero:
0))((2 2
2
2
iii
iXXY
0))(( 2
iii XXY
0))((
iii XYY
2__
2__
2 1
n
1Var(X) XXEXX
nx iii
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
0
ii X
Es decir los residuos y la variable X no están correlacionados. Sin embargo, en el modelo con intersección,
0i , se puede aseverar que:
2
21
22
)()( iiiiiXYYY
0)1)((2)(
21
1
2
ii
iXY
)( ii YY
=0
0
i
Pero como en el modelo sin intersección,
0i ; no se puede afirmar que la 0
i .
TRAER TABLA 6,1 Y 6,2
Segundo:
Recuérdese que el modelo con intersección, ,01
se demostró que:
____
YY . Pero el modelo sin
intersección, :01
iii YYu
iii uYY
iii uYY
n
u
n
Y
n
Y iii
iu = 0 (esto no necesariamente sucede si 01
; como se demostró anteriormente) entonces:
0iu
iuYY
____
__
__
YY
Tercero:
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
El coeficiente de determinación en el modelo con intersección, 01
, siempre es positivo. (La suma
estimada de cuadrados es un numero positivo, positivo para positivo da un coeficiente de determinación
positivo). Pero en el modelo sin intersección, 01
, puede ser negativo:
2
2
2 11i
i
ySTC
SRC
STC
SRCSTC
STC
SECr
En el modelo con intersección, 01
: SRCSECSTC ; STCSRC . Y por tanto, el 2r siempre
será positivo.
En el modelo sin intersección, 01
:
iii
XY 2
22
2
22
2
2
2
2 2iiiiiii
XXXY
02 2
2
22
2
2
iiiiiii XXXY
222
2
2
iiiXY
22
2
22
iiiXY
Por otro lado:
__
YYy ii
2____
2
2__
2 2 YYYYYYy iiii
2____22 2 YnYYYy iii
n
YY
i
__
iYYn__
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
2__2
2__2__22 2 YnYYnYnYy iii
2__22 YnyY ii
22
2
2__22
iii XYnyu
Si:
22
2
2__
iXYn
SRC > STC
Y entonces, el 2r será negativo.
Se acostumbra calcular con:
22
2
ii
i
sYX
Xr
Aunque no es comparable con el 2r convencional tiene un intervalo de 10 2 r y no está incorporando en
los paquetes econométricos. En conclusión, en todos los modelos se debe incluir la intersección para que los
mínimos cuadrados se cumplan.
Ejemplo: consideremos la información de la tabla 6.1; 57821.36GAFY y 94210.28GPMX (Ejer-
6.1)
GAFEQ :1 C GPM
GAF= GMP069084.1279719.1
(7.688560) (0.238315)
0.166445 4.486004
La t de Student de 1
están más bajo que 2 y por eso el valor probabilístico es de 0.8719, entonces, se
puede concluir que 01
GAFEQ :2 GPM
GAF=1.089912 GMP
(0.191551)
5.689922
Realizar:
43 PIBIDP
34 PIBIDP
Autocorr (-)
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
La diferencia entre 069084.1 y 1.089912 no e mucha; sin embargo, en general en estos casos se debe
mantener la intersección para que se cumplan los mínimos cuadrados ordinarios.
La variable incide en la variable dependiente.
Si la t de student de la intersección está baja, pasa cerca del origen.
- Si hago que pase por el origen no se cumplen los mínimos cuadrados ordinarios no se cumplen.
Econometricamente la regresión no sirve.
- Técnicamente no sirve.
-Cuando la intersección es cero ( 1 ) el software informático me indica.
-En todos los modelos que yo proponga debemos incluir una intersección para asegurarnos que los mínimos
cuadrados ordinarios se cumplan para asegurarnos que todo es verdadero.
Escalas y unidades de medición:
Regresor
significativo,
pero no se
cumplen los
MCO.
Pasa cerca del
origen
122/2222/2 eeteetPr
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
El problema: hay alguna diferencia en los resultados de la regresión si las unidades en las cuales se miden
las variables Y y X son distintas? De ser así, como se debe proceder?
iii
XY 21
iiYWY
1
* ii
XWX2
*
(los valores estrellados son con diferentes variables)
Donde 1
W y 2
W , se denominan factores de escala, 1
W puede ser igual o diferente a 2
W :
***
2
*
1
* ˆˆˆiii uXY
*2
**
*
2ˆ
i
ii
x
yx **
2
**
1ˆˆ XY
*2
*2
2**
1ˆ
i
i
xn
XVar
*2
2**
2ˆ
ixVar
2
ˆˆ
2*
2*
n
ui
Con las siguientes relaciones:
ii YwY 1
* , ii ywy 1
* , ii XwX 2
*
ii xwx 2
* , ii uwu ˆˆ2
* , YwY 1
* y XwX 1
*
2
2
1
2
2
21
2
2
12
2*
**
2)(
))((
w
w
x
yx
w
ww
xw
ywxw
x
yx
i
ii
i
ii
i
ii
112121122
2
11
**
2
**
1
wXYwXwYwXw
w
wYwXY
2
2
1
*
2
w
w
11
*
1
w
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
22
1
2
22
1
2
2*
2*
2222
w
nw
n
w
n
w
n
i
i
iii
i
22
1
2* w
1
2
1
*
1 VarwVar
2
2
1*
2 Var
w
wVar
s
2
2
2
2*
*2ˆˆ
1ii
ii
i
i
yw
uw
y
ur
2
2
2*
22
1
2
1
2
1*2ˆ
1ˆ
ry
u
yw
uwr
i
i
i
22* rr
Ejemplo: consideremos la información de la tabla 6.2 :
IDP1= 146,5929, IDP2 = 146592.9
PIB1= 455,2486, PIB2 = 455248,6
PRIMERA ECUACIÓN:
EQ01: IDP1 C PIB1
(W1=1) (W2=1)
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
IDP1= -1026,498 + 0.3016PIB
(257,5874) (0,0399900)
-3,985047 7,558482
27,66351)ˆ( 1 Var
001592,0)ˆ( 2 Var
4988,2969ˆ 2 (Esta información la obtenemos mediante la calculadora)
49311,542
r2= 0,877170
SEGUNDA ECUACIÓN:
EQ02: IDP2 C PIB2
10001 W 10002 W
IDP2= -1026498+0.301583 PIB2
(257587.4) (0.039900)
-3.985047 7.558482
10*
1 10*64.6var
001592.0var *
2
29694988002*
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
11.54493*
877170.02* r
TERCERA ECUACIÓN
EQ03: IDP1 c PIB2
1i
W 10002W
IDP1= -1026.498 + 0.000302 PIB2
(257.5874) (.399510* )
(-3.98504) (7.558482)
27.66351*
1
Var
9*
210*59.1
Var
4988.29692*
49311.54*
877170.02* r
Regresión sobre las variables estandarizadas:
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Para evitar el problema anterior se puede plantear la regresión con ambas variables estandarizadas.
Y
ii
S
YYY
*
X
ii
S
XXX
*
***
2
*
1
* ˆˆˆiii uXY
XY *
2
**
1ˆˆ 00 ** XY
En este caso, si la variable independiente estandarizada se aumenta en una desviación estándar, la variable
dependiente estandarizada se incrementa en *
2
desviaciones estándar. Por otro lado:
2*
**
2**
****
2*
***
2
)(
))((
i
ii
i
ii
i
ii
X
YX
XX
YYXX
x
yx
2
2
2
*
2)(
))((
i
ii
i
ii
xSy
yxSx
Sx
XX
SxSy
YYXX
Sy
Sx2
*
2
Ejemplo: consideremos la información de la tabla 6.2; (ejemplo 6,2)
0ˆ *
1
***
2
* ˆˆiii uXY
Análisis de 0* Y
01111 **
i
y
i
yY
ii y
nSYY
nSS
YY
nY
nY
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
IB1))/@stdev(P@mean(PIB11(3 PIBPIB
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
IB2))/@stdev(P@mean(PIB22(4 PIBPIB
DP1))/@stdev(I@mean(IDP11(3 IDPIDP
DP2))/@stdev(I@mean(IDP22(4 IDPIDP
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
EQ 5= IDP3 c PIB3
Dependent Variable: IDP3
Method: Least Squares
Date: 06/05/07 Time: 09:30
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 1.78E-16 0.117552 1.51E-15 1.0000
PIB3 0.936574 0.123910 7.558482 0.0001
R-squared 0.877170 Mean dependent var 0.000000
Adjusted R-squared 0.861816 S.D. dependent var 1.000000
S.E. of regresión 0.371731 Akaike info criterion 1.035563
Sum squared resid 1.105470 Schwarz criterion 1.096080
Log likelihood -3.177815 F-statistic 57.13064
Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066
3936574.010*78.13 16 PIBIDP
(0.117552) (0.123910)
1510*5.1
7.558482
877170.02 r 861816.02 r = r cuadrado ajustado.
EQ 6: IDP3 PIB3
Dependent Variable: IDP3
Method: Least Squares
Date: 06/05/07 Time: 09:32
Sample: 1988 1997
Included observations: 10
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Variable Coefficient Std. Error t-Statistic Prob.
PIB3 0.936574 0.116824 8.016980 0.0000
R-squared 0.877170 Mean dependent var 0.000000
Adjusted R-squared 0.877170 S.D. dependent var 1.000000
S.E. of regression 0.350471 Akaike info criterion 0.835563
Sum squared resid 1.105470 Schwarz criterion 0.865821
Log likelihood -3.177815 Durbin-Watson stat 0.614662
IDP3=0.936574 PIB3
(0.116824)
(8.01698)
877170.02 r 877170.02 r
El r y el r cuadrado son los mismo.
EQ 7= IDP4 c PIB4
Dependent Variable: IDP4
Method: Least Squares
Date: 06/05/07 Time: 09:48
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -6.15E-18 0.117552 -5.23E-17 1.0000
PIB4 0.936574 0.123910 7.558482 0.0001
R-squared 0.877170 Mean dependent var -4.44E-17
Adjusted R-squared 0.861816 S.D. dependent var 1.000000
S.E. of regression 0.371731 Akaike info criterion 1.035563
Sum squared resid 1.105470 Schwarz criterion 1.096080
Log likelihood -3.177815 F-statistic 57.13064
Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066
4936574.010*15.64 18 PIBIDP
(0.117552) (0.123910)
1710*23.5 7.558482
877170.02 r 861816.02 r
EQ 8: IDP4 PIB4
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
Dependent Variable: IDP4
Method: Least Squares
Date: 06/05/07 Time: 09:49
Sample: 1988 1997
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
PIB4 0.936574 0.116824 8.016980 0.0000
R-squared 0.877170 Mean dependent var -4.44E-17
Adjusted R-squared 0.877170 S.D. dependent var 1.000000
S.E. of regression 0.350471 Akaike info criterion 0.835563
Sum squared resid 1.105470 Schwarz criterion 0.865821
Log likelihood -3.177815 Durbin-Watson stat 0.614662
IDP4=0.936574 PIB4
(0.116824)
(8.01698)
877170.02 r 877170.02 r
La regresión con variables estandarizadas es el único modelo que cruza por el origen cumpliendo los MCO.
Independientemente de cómo se plantea las variables, la regresión es la misma. La interpretación es: si el
PIB aumenta en una desviación estándar, el IDP se incrementa en 0.94 desviaciones estándar. Nótese que en
el modelo sin intersección el 2r es igual al 2r .
Formas funcionales de los modeles de regresión
Modelos log-lineal (log-log):
Es la manera más sencilla de obtener una elasticidad. Es el mejor indicador de todos los indicadores.
Realizar:
43 PIBIDP
34 PIBIDP
Si el PIB aumenta en una desviación
Estandar el IDP aumenta en 0,94
desviaciones estandar. Recordemos que
aumenta por que tiene signo positivo.
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
También denominado modelo de elasticidad constante, por que mide la elasticidad de Y con respecto a X.
Supongamos la función exponencial (Coub Douglas).
iu
ii eXY 2
1
Y
X
dX
dY
X
dXY
dY
EYX *
2
1
1
21
2
2
i
i
u
i
i
u
iYX
eX
XeXE
iii uXY 21 lnlnln
iii uXY 2lnln
Linealizar es sacar los logaritmos a ambos lados.
Consideremos la información de la tabla 6.3;
GSE=135.2642, GBD=65.25941, GBP=61.19171, GCP=160.5416 (Ejer-6.3)
*Generalmente expresar una variable con tres letras*
*ese log es el logaritmo naperiano (base e) ya no se trabaja con el logaritmo decimal*
LGSE=LOG(GSE)
LGBD=LOS(GBD)
LGBP=LOG(GBP)
LGCP=LOG(GCP)
Vamos a ver la elasticidad de los tres primeros cuando el gasto total aumenta
EQ01: LGSE C LGCP
Dependent Variable: LGBD
Method: Least Squares
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3
Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000
R-squared 0.984969 Mean dependent var 6.407036
Adjusted R-squared 0.984253 S.D. dependent var 0.106162
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130
Durbin-Watson stat 2.363903 Prob(F-statistic) 0.000000
LGSE=0.130296 + 0.919989LGCP
(0.064914) (0.007681) error estándar
(1.591280) (119.7712) t de student
La intersección esta pasando cerca del origen, no en el origen, pero como yo necesito que exista la
intersección para que se cumplan los MCO yo no le hago caso a la t de student de la regresión.
Cuando los gastos de consumo personal total aumenta en un 1% (no el logaritmo de los gastos), entonces los
gastos en servicios (GSE) aumenta en 0.92%. Si el signo es negativo el GSE disminuye.
EQ02= LGBD C LGCP
Dependent Variable: LGBD
Method: Least Squares
Date: 06/07/07 Time: 08:10
Sample: 1993Q1 1998Q3 Included observations: 23
Variable Coefficient Std. Error t-Statistic Prob.
C -9.697098 0.434127 -22.33702 0.0000
LGCP 1.905633 0.051370 37.09622 0.0000
R-squared 0.984969 Mean dependent var 6.407036
Adjusted R-squared 0.984253 S.D. dependent var 0.106162
S.E. of regression 0.013322 Akaike info criterion -5.715894
Sum squared resid 0.003727 Schwarz criterion -5.617155
Log likelihood 67.73278 F-statistic 1376.130
Durbin-Watson stat 2.363903 Prob(F-statistic) 0.000000
LGBD= -9.697098 + 1.905633LGCP
(0.434127) (0.051370) error estándar
-22.33702 37.09622 t de student
La intersección pasa lejos del origen, por que la t de student es alta 22.33702 (nada mas no hay otra
explicación que dar)
Si los gastos totales aumenta en 1% los gastos en bienes duraderos (GBD) se incrementaran en 1.91%
(aprox)
EQ03= LGBP C LGCP
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
LGBP = 0.780076 + 0.767695 LGCP
(0.077143) (0.009128) error estándar
10.11202 84.10016 t de student
Si los gastos totales aumentan en 1% los gastos en bienes perecederos se incrementaran en 0.77% (aprox)
Modelo log-lin:
También denominado semilog por que solamente una variable aparece en forma logarítmica, mide la tasa de
crecimiento instantáneo de variables.
t
ot rYY )1(
)1log(lnln rtYY ot
01 lnY r 1ln2
tt utY 21ln
2 mide el cambio relativo de Y(%) debido a un cambio de t, se conoce como la semielasticidad de Y
respecto a t.
Modelo de tendencia lineal:
En lugar de estimar el modelo anterior, algunas veces se estima el siguiente.
tt utY 21
Que se denomina modelo de tendencia lineal, la variable de tiempo (t) se conoce como la variable de
tendencia, que puede ser creciente o decreciente.
Mide el cambio de Y en valores absolutos por una unidad de tiempo.
En el examen necesitamos las cifras de view/ estimation out put
Modelo lin-log control de lectura
Ejemplo: consideremos la información de la tabla 6.3, (Ejer. 6.3).
:4EQ LGSE C t
LGSE: 7.788347 + 0.007466t
(0.002289) (0.000167)
3402.198 44.71844
La tasa de crecimiento instantáneo de los gastos en servicios es de 0.747%
:5EQ LGBD C t
LGBD= 6.221691+0.015445t
(0.0007597) (0.000554)
PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA
Felipe Lemarie Jorge Salgado Juan C. Serrano
818.9877 27.87711
La tasa de crecimiento instantáneo de los gastos en bienes duraderos es de 1.54%.
(Las cifras q me debe poner es del view stimation output cifras decimales q se deben declarar)
:6EQ LGBP C t
LGBP=7.192967+0.006229t
(0.002077) (0.000151)
3463.080 41.11945
La tasa de crecimiento instantáneo de los gastos en bienes perecederos es de 0.623%
:7EQ LGCP C t
LGCP= 8.353433+0.008114t
(0.002342) (0.000171)
3566.568 47.50231
La tasa de crecimiento instantáneo de los gastos en consumo personal total es de 0.81%
:9EQ GBD c t
GBD= 496.0818 + 9.442095t
(5.540763) (0.404102)
Los gastos en bienes duraderos han aumentado en 9.44 dólares trimestrales
19.79 equivale al 0.747%
:10EQ GBP c t
GBP=1327.086 + 8.952273
(3.55064) (0.244693)
395.5467 36.58567
Los gastos en bienes perecederos han aumentado en 8.95 dólares trimestralmente
EQ11: GCP c t