apuntes de econometría i (segunda parte)

PONTIFICIA UNIVERSIDAD CATÓLICA DEL ECUADOR APUNTES DE ECONOMETRÍA I ECONOMISTA LINCOLN MAIGUASHCA

Felipe Lemarie Jorge Salgado Juan C. Serrano

Regresión con dos variables, estimación de intervalos y prueba de hipótesis:

La teoría de la estimación consta de dos partes, la estimación puntual y la estimación de intervalos. La

primera se ha analizado en los capítulos anteriores, y la segunda se desarrolla a continuación.

*Prerrequisitos estadísticos y estimación de intervalos, algunas ideas básicas: control de lectura

Intervalos de confianza para 1 y 2 :

Donde (1- ) es el coeficiente de confianza, y el nivel de significación, t es la distribución de “Student” y

2

t es el valor crítico que se lee en las tablas con (n – 2) grados de libertad (g de l.), y un nivel

significación de 2

.

De acuerdo al teorema 5:

T= 2/1

2

k

Z

Z i

2/12

22

2/1

2

2

22

2/1

2

22

1

iixx

Var

Z

2

2

2 2

nZ

t =

2/12

22

2/12

22

2/1

2

2

2/12

22

2

2

i

ii

x

x

n

n

x

t=

2

22

ee

12/2/ tttPr



12/

2

22

2/ t

ee

tPr

122/2222/ eeteetPr

122/2222/ eeteetPr

122/2222/2 eeteetPr

Ejemplo con la muestra 1:

5091.0ˆ

2 0375.0)ˆ( 2 ee

8 g de l %5

Al 95% de nivel de confianza,

%95)0357.0(306.2509.0)0357.0(306.2509.0 2 tP

Quiere decir que el 95% de los intervalos obtenidos de las 7.5 * 10^10 muestras contendrán al verdadero 2

. El intervalo anterior tiene el 95% de probabilidad de contener el verdadero 2 .

Intervalo de confianza para 2 :

Se define como:

112/1112/1 eeteetPr

Pasa cerca del origen

122/2222/2 eeteetPr

%95)5917.04268.0( 2 tP

306.2025.0 t



)1(Pr 2

2

22

21

Donde

21

2

y 2

2

son los valores críticos que se lee en las tablas con (n-2) grados de libertad g. l.

Para muestra caso: 2

2

2 )2(

n

)1(1

)2(

1Pr

2

2

2

2

2

21

n

)1()2()2(

Pr2

)2

(

2

2

2

2

2..1

nn

)1()2()2(

Pr

2

2

2

2

2

)2

1(

2

nn

Ejemplo: con la muestra 1;

2

= 42,1591; 8 g.l 5%

%951797.2

1591.42*8

15346.17

1591.42*8Pr

2

%951

7336.154

11

2347.19Pr

2

Control de lectura: Prueba de Hipótesis comentarios generales.

)1()2(Pr 2

2

2

2

2

21

n

Quiere decir que el 95% de los intervalos

obtenidos de las 7.5 * 10^10 muestras

contendrán al verdadero 2 . El intervalo

anterior tiene el 95% de probabilidad de

contener el verdadero 2 .



Prueba de hipótesis: método del intervalo de confianza.

Prueba de dos colas:

Se construye un intervalo de confianza para 2 al 95%. Si 2 bajo la 0H se encuentra dentro de este

intervalo no se rechaza la 0H (se acepta la hipótesis nula), pero si esta fuera del intervalo, se rechaza la 0H

(aceptar la 1H ).

Ejemplo: se conoce que 2

=0.5091, pero se postula que:

0H : 2 =0,3 → Hipótesis simple

1H : 2 0,3 → Hipótesis compuesta

Entonces, es el 2

compatible con la 0H ?

Para responder acudimos al intervalo de confianza obtenido anteriormente:

“En última instancia nos tenemos que comparar con los valores poblacionales.”

%955914,04268,0 2 rP

%955914,03,04268,0 rP

La 0H está fuera del intervalo, se rechaza la 0H (se acepta 1H ) al 95% de confianza. (HACER LO MISMO

CON 1

Y CON LAMUESTRA 2)

Prueba de 1 cola:

Se determina de acuerdo al planteamiento de la 1H . Nuevamente se conoce que 2

=0.5091 pero se

postula que 0H : 3.02 ; 1H : 3.02 .

Pr(0.42 2 0.5914) =95%

La 0H esta fuera del intervalo, se rechaza 0H (se acepta 1H ) al 95% de confianza.

Prueba de hipótesis: método de la prueba de significación

Es un procedimiento mediante el cual se utiliza los resultados muéstrales para verificar la verdad o falsedad

de una oH a través de la t de Student

Prueba de dos colas:

)1()Pr(22

ttt



)1(

2(

22Pr

2

*

2 )

t

ee

t

12

2

*

222

2

*

2 eeteetPr

Donde 2

*

es el valor de2

bajo la oH , 2

t y 2

t son los valores críticos. El intervalo es conocido como

la “región de aceptación” de la oH y las regiones fuera del intervalo se llama “región de rechazo” o

“regiones criticas” de la oH

Ejemplo: 5091.02

0375.0)2

(

ee

8g. de l 306.2025.0 t

Se puede utilizar las 2 formas:

La primera:

3,0: *

2 oH 3,0: *

21 H

%95306,20357,0

3,0509,0306,2

rP

%95306,286,5306,2 rP

Se rechaza la hipótesis nula y en consecuencias se acepta la 1H .

Región de

Rechazo oH

Región de Rechazo

oH



La segunda:

3.02

*

oH 3.02

*

1 H

%95)0375.0(306.23.02

)0375.0(306.23.0Pr

%95)3823.02

2177.0Pr(

%95)3823.0509.02177.0Pr(

Se dice que una prueba es estadísticamente significativa si el valor del estadígrafo de prueba cae en la región

de rechazo de la 0H ; y una prueba es estadísticamente no significativa si el valor del estadígrafo de la

prueba cae en la región de aceptación 0H

Prueba de una cola:

El procedimiento es similar, cambia en el planteamiento de las hipótesis.

Ejemplo: muestra 1. 5091.0ˆ

2 0375.0)ˆ( 2 ee ; 8 g de l

0H :*

2 0,3 → Hipótesis simple

1H : *

2 0,3 → Hipótesis compuesta

Así mismo, se pueden utilizar las dos formas:

0,509

Región de Rechazo

oH

0,2177 0,3 0,3823

3

2,5% Región

de rechazo oH

86.105.0 t



La primera:

0357,0

3,0509,0

)( 2

*

22

ee

t

Se rechaza 10 HaceptaseyH

La segunda:

3644.0)0357.0(86.134.0)2

(22

*

eet

8 grados de

libertad.

Rechazo a 0H

Rechazo a 0H



Prueba de significación para 2

)1(Pr 2

2

22

21

2

2

2 )2(

n

Ejemplo con la muestra 1:

2

= 42.1591 8 g de l

=5%

0H : 2 =85 → Hipótesis simple

1H : 2 85 → Hipótesis compuesta

97.385

1591.42*82

%955346.1797.31797.2 rP Se acepta 0H

Regla práctica “2-t” (Ho : Bi = 0)

Es lo que se utiliza en el trabajo empírico:

Ho: 0i y H1: 0i . Es un mecanismo para establecer si Y tiene relación con la variable explicativa X.

Si el de número de g. de l. es más de 20 al 95 % entonces Ho puede ser rechazada si

2t

i

ii

i

ee

t

Ho: 0i H1: 0i .

pendientelaEsi , por lo que la t de student puede ser, negativo o positivo.

i

i

ee

t



“En la nomenclatura internacional Bo , es igual a la intersección. “Gujarati tiene un problema de notación

está al revés.”

Xi = iio XX 2211

Cuando

i > 0 it =

i

i

ee

>2

Cuando

i < 0 it =

i

i

ee

<-2

it =

i

i

ee

>2

Si :2t se rechaza oH y se acepta 1H ; la presencia de la variable a la que pertenece i

es justificada en el

modelo porque es estadísticamente significativa para la variable dependiente.

Si :2t no se rechaza oH y se acepta 1H ; la presencia de la variable a la que pertenece i

no se justifica

en el modelo porque no es estadísticamente significativa para la variable dependiente.

Se dice que una prueba es estadísticamente significativa, o es verdadero, si el valor del estadígrafo de prueba

cae en la región de rechazo, mayor que dos y menor que menos dos. Ahí se rechaza que el regresor es 0, se

acepta que es diferente a 0 y eso quiere decir que la variable es significativa, para la variable dependiente.

Región de

aceptación Ho

2.5% Región de

rechazo de Ho

2.5% Región de

rechazo Ho



Ejemplo:

iY 24.4545+0.5091 iX

(6.4138) (0.0357)

1t = 813.34138.6

4545.24

2t = 243.140357.0

5091.0

1̂ y 2̂ son estadísticamente significativos.

El valor P:

Denominado el valor de probabilidad, es el nivel de significación mas bajo al cual se puede rechazar una oH

o la probabilidad exacta de cometer un error tipo 1

Nota: La probabilidad de cometer un error tipo 1 es la probabilidad de rechazar la hipótesis cuando es

verdadera; la probabilidad de cometer un error tipo 2 es la probabilidad de acertar la hipótesis cuando es

falsa.

En la practica es la superficie de la región de rechazo determinada por un valor de la t de student (el riesgo)];

a medida que aumenta el valor absoluto de la t de student, disminuye el valor P.

Ejemplo:

1t = 3.8128 valor p = 3.8128

1t = 14.2605 valor p = 0.0000

Análisis de Varianza:

Recordando:

Importante: Los símbolos que no están con asteriscos son desviaciones respecto a la media.

STC = SEC+SRC

22

2iii uyy

22

2

2

ii xy

22

2

2

2iii uxy

La única t de student que no me interesa es la de la intersección. Si la intersección pasa por el origen la

.01

La propensión marginal a consumir

es muy significativa, razón por la

cual

11 y son estadísticamente

significativos.

Conclusiones prácticas del valor p:

Si excede a 0,05 necesitamos la tabla t de

student para ver su valor real.

Cuando tenemos más de 36 la t de

student es dos.



Tabla Anova

Fuente de

Variación

Suma de

Cuadrados

g de l Suma Promedio

de Cuadrados

Debido a regresión

(SEC)

2

2

2 ix

1

2

2

2 ix

Debido a residuos

(SRC)

2

iu

(n-2)

)2(

22

n

ui

Se construye una F

SRCdeSPC

SECdeSPCF

La relación también se puede obtener a partir del teorema 6:

2

2

2

2

22

2

2

2

22

22

11

2

2/

/

Var

n

n

ee

kZ

kZF

2

2

2

22

2

2

2

22

2

2

2

2

2

22

2

2

ii

x

n

n

eex

F

Los grados de libertad son los números de restricciones, y la restricción es el

equivalente al regresor.

En el software E views la prob representa el riesgo.



2

2

22 )(

ixF

Ho: i =0 ; 1H : i 0

2

22

2

ixF

Si F> que el valor crítico de la distribución F; se rechaza Ho y se acepta 1H .

Si F< que el valor crítico de la distribución F; se acepta Ho.

Ejemplo:

2

=0.5091 2

ix =33000

2 = 421591

1591.42

)33000()5091.0( 2

F = 202.875

F no califica intersección; F califica pendientes B1 B2 B3

De la tabla F, con = 5%; k=1 y k= 8 g. de l. F= 5.32. Se rechaza Ho y se acepta 1H .

Nota: de acuerdo al teorema 7:

kk tF 2

,1 8679.202)24317.14(,1 kF

Aplicación de la regresión: problema de predicción:

Con la regresión muestral estimada, se puede “predecir” valores de Y correspondiente a algún nivel de X.

Hay dos clases de predicción: la predicción media y la predicción individual

Predicción media

Se desea predecir 100/ 0 XYE : el promedio de los consumos cuando en nivel de ingreso es igual a 100

)100(5091.04545.2421 0

XoY

3645.75

oY ---- el valor real de la tabla es 77

Puesto que oY

es un estimador, es probable que éste sea diferente de un verdadero valor. La diferencia entre

los dos dará alguna idea sobre el error de predicción; para evaluar este error es necesario encontrar la

distribución muestral de oY

, o sea su media y su varianza.

021X

oY

0210 )21

()( XXEo

E Y



Lo que quiere decir que 0Y

está normalmente distribuida con media ( 021 X ); y la varianza es:

)21

()( oXVaro

Var Y

)2

,1

(2)2

()1

()(

CovXVarXVaro

Var ooY

2

2__

22

22

2

22)(

i

Ox

X

i

o

i

io X

xX

xn

XYVar

2

_22

2)(2

i

ooiYVar

xn

XnnXXo

2

2__

2

2)(21

i

ooYVar

x

XXnX

no

2

__

12)(i

o

ox

XX

nYVar

Conocida la Var

0Y y por tanto

oYee se puede plantear la distribución t de Student para construir

intervalos de confianza del verdadero

0X

YE o y hacer pruebas de hipótesis.

Conocida la Var )( 0

y y por tanto ee )( 0

y se puede plantear la distribución t de Student para construir

intervalos de confianza del verdadero )/( 00xyE

y hacer pruebas de hipótesis.

t =

)(

/

0

0

yee

xyEy oo



)1(

)(

/

Pr2

0

0

2

t

yee

xyEy

too

)1()(/)(Pr 0

2

000

2

0

yeetyxyEyyeety oo

Ejemplo:

1591.422

1591.42X 2

ix =33000 3645.750

y 2

t =2.306

Var )( 0

y =

33000

)170100(

10

11591.42

2

= 10.4759

3,2366

oYee

%952366,3306,23645,75/2366,3306,23645,75Pr

oo XYE

8281,82/901,67Pr oo XYE

8281,8277901,67Pr

Predicción individual

Se desea predecir el oY (predicción individual) de una de las familias, cuando 100oX

ooo uXY

21

Un buen estimador de 3645,75oY , es probable que este sea diferente de su verdadero valor. La diferencia

entre los dos dará alguna idea sobre el error de predicción. Para evaluar este error es necesario encontrar la

distribución inicial de oY , o sea su media y su varianza.

Hay 75.400 millones de ecuaciones, con 75.400 de oY , por lo que puedo construir una distribución

normal, por lo que necesito la media y la varianza.



oiooo uEEXEEuXEYE

12121

oo XYE 21

Lo que quiere decir que oY está normalmente distribuido con media oX21 y la va varianza es:

Oo uVarXVaruXVar

2121oYVar

)(2YVar 212

2

1o ooo uVarCovXVarXVar

2

2

2__

2

22

2

2

2

o 2YVar

i

o

i

o

i

i

xXX

xX

xn

X

2

__2

2

o

21YVar

i

ooi

xn

XnXXX

2__22 XnXx ii

2__22 XnxX ii

2

__2

2__2

2

o

21YVar

i

ooi

xn

XnXnXXnx

2

2

0

2

02

0

211

ix

XXXX

nYVar

2

2

02

0

11

ix

XX

nYVar

Conocida la 0YVar y por tanto 0Yee se puede plantear la t de Student para hacer pruebas de hipótesis.

(PUEDE IR EN LA PRUEBA)

0

000 /

Yee

XYEYt

)1(/

Pr20

000

2

t

Yee

XYEYt



)1(/Pr 0

2

0000

2

0

YeetYXYEYeetY

Ejemplo:

2

= 42.1591 170X 330002 ix

Y 0 =75.3645 306.22

t

635.5233000

170100

10

111591.42

2

0

YVar

255.70 Yee

%950945.92/6345.58Pr 00 XYE

Control de Lectura: Informe de resultados

Control de Lectura: Evaluación de resultados

Prueba de normalidad de Jarque Bera

Para una variable normalmente distribuida S = 0 Y K = 3, en cuyo caso el estadígrafo J-B = 0 y el valor probabilística es 1; si la

variable no está normalmente distribuida, el estadígrafo J-B aumenta, y el valor p tenderá a cero.

Ejemplo:

S= 0.398346 K=1.890997

J-B= 10

77692.024

3890997.1

6

)398346.0(22

n =Tamaño de la muestra.

S = El sesgo mide si es simétrica o asimétrica.

K=Curtosis

Si el sesgo es igual a cero es absolutamente simétrica. Es decir la moda la mediana y la media coinciden.

Lo que me interesa es el valor probabilística.

Si es que la normal estandarizada tiene un Jarque Bera de cero esa distribución esta normalmente distribuida en un cien por ciento.

Si el Jarque Bera aumenta la probabilidad de que sea normal disminuye.

Cuando K < 3 la distribución es más ancha y más baja que la normal.



Valor p=0.678167.81% EQ01

iii uYY



EQ02

iii uYY



Prueba de autocorreción de primer orden:

Se utiliza el estadígrafo Dublín Watson:

2

2

2

1

t

n

tt

u

uu

WD

2

2

2

11

2 2

t

n

tttt

u

uuuu

WD

2

2

2

1

2

1

2

2 2

t

n

t

n

tt

n

t

u

uuuu

WD

Si n es grande:

Se considera n grande desde un fenómeno conocido como la estacionalidad.

2

2

22

1 ~n

n

tt uu

n

t

n

t UU2

2

1

2 ~

1 2 3 (n-1) n



n

t

n

tt

n

t

U

UUU

WD

2

2

2

1

2

2 22

n

t

n

tt

U

UU

WD

2

2

2

1

12

n

t

n

tt

U

UU

2

2

2

1

)1(2

WD

Si aciónautocorrelnoWD

20

Si

aciónautocorrelWD 01

Si

aciónautocorrelWD 41

1 2 3 n-1

111

141

n

0 2 4

Autocorr (+) No Autocorr Autocorr (-)

43 PIBIDP

34 PIBIDP

Autocorr (-)



Ejemplo: D – W (3,31)

23.1LD 65.1UD

35.265.144 UD

Extensiones del modelo de regresión lineal de dos variables

Regresión a través del origen

Si la nube de puntos está apuntando al origen y la regresión pasa por ahí los mínimos cuadrados si se

cumplen, si la nube de puntos no apunta al origen y la regresión si pasa por ahí, los mínimos cuadrados no

se cumplen.

A)

0

1D1

D

UD 2 4- UD 4 -

1D UD

Autocorr

(+)

Indecisión Indecisión Autocorr

(-)

No hay Autocorrelación

35.265.1 WD



B)

A) No se cumple con MCO

B) Se cumple con MCO

Hay ocasiones en las cuales la función de regresión poblacional de dos variables pasa por el origen 01

iii uXY 2 iii uXY

2

ii XY 2

2

2

22

iiiii XYYYu

02 2

2

2

iii

i

XXY

u

02 iii XXY

02

2 iii XXY

02

2 iii XYX



22i

ii

X

YX

2

2

2

2

2

2

)(

i

iii

i

iii

X

XX

X

XX

222i

ii

X

X

222i

ii

X

X

Porque las iX no son estocásticas y las 1 son homoscedásticas y no correlacionadas:

2

2

22

22

22

222

22i

i

i

ii

i

ii

X

uE

X

uEX

X

uXEE

2

2

2

2

2

22

)()(

ii

i

XX

EE

Var

2

2

2

iX

)1(

2

2

n

i

Pero el modelo sin intersección tiene algunos problemas.

Primero:

0))((2 2

2

2

iii

iXXY

0))(( 2

iii XXY

0))((

iii XYY

2__

2__

2 1

n

1Var(X) XXEXX

nx iii



0

ii X

Es decir los residuos y la variable X no están correlacionados. Sin embargo, en el modelo con intersección,

0i , se puede aseverar que:

2

21

22

)()( iiiiiXYYY

0)1)((2)(

21

1

2

ii

iXY

)( ii YY

=0

0

i

Pero como en el modelo sin intersección,

0i ; no se puede afirmar que la 0

i .

TRAER TABLA 6,1 Y 6,2

Segundo:

Recuérdese que el modelo con intersección, ,01

se demostró que:

____

YY . Pero el modelo sin

intersección, :01

iii YYu

iii uYY

iii uYY

n

u

n

Y

n

Y iii

iu = 0 (esto no necesariamente sucede si 01

; como se demostró anteriormente) entonces:

0iu

iuYY

____

__

__

YY

Tercero:



El coeficiente de determinación en el modelo con intersección, 01

, siempre es positivo. (La suma

estimada de cuadrados es un numero positivo, positivo para positivo da un coeficiente de determinación

positivo). Pero en el modelo sin intersección, 01

, puede ser negativo:

2

2

2 11i

i

ySTC

SRC

STC

SRCSTC

STC

SECr

En el modelo con intersección, 01

: SRCSECSTC ; STCSRC . Y por tanto, el 2r siempre

será positivo.

En el modelo sin intersección, 01

:

iii

XY 2

22

2

22

2

2

2

2 2iiiiiii

XXXY

02 2

2

22

2

2

iiiiiii XXXY

222

2

2

iiiXY

22

2

22

iiiXY

Por otro lado:

__

YYy ii

2____

2

2__

2 2 YYYYYYy iiii

2____22 2 YnYYYy iii

n

YY

i

__

iYYn__



2__2

2__2__22 2 YnYYnYnYy iii

2__22 YnyY ii

22

2

2__22

iii XYnyu

Si:

22

2

2__

iXYn

SRC > STC

Y entonces, el 2r será negativo.

Se acostumbra calcular con:

22

2

ii

i

sYX

Xr

Aunque no es comparable con el 2r convencional tiene un intervalo de 10 2 r y no está incorporando en

los paquetes econométricos. En conclusión, en todos los modelos se debe incluir la intersección para que los

mínimos cuadrados se cumplan.

Ejemplo: consideremos la información de la tabla 6.1; 57821.36GAFY y 94210.28GPMX (Ejer-

6.1)

GAFEQ :1 C GPM

GAF= GMP069084.1279719.1

(7.688560) (0.238315)

0.166445 4.486004

La t de Student de 1

están más bajo que 2 y por eso el valor probabilístico es de 0.8719, entonces, se

puede concluir que 01

GAFEQ :2 GPM

GAF=1.089912 GMP

(0.191551)

5.689922

Realizar:

43 PIBIDP

34 PIBIDP

Autocorr (-)



La diferencia entre 069084.1 y 1.089912 no e mucha; sin embargo, en general en estos casos se debe

mantener la intersección para que se cumplan los mínimos cuadrados ordinarios.

La variable incide en la variable dependiente.

Si la t de student de la intersección está baja, pasa cerca del origen.

- Si hago que pase por el origen no se cumplen los mínimos cuadrados ordinarios no se cumplen.

Econometricamente la regresión no sirve.

- Técnicamente no sirve.

-Cuando la intersección es cero ( 1 ) el software informático me indica.

-En todos los modelos que yo proponga debemos incluir una intersección para asegurarnos que los mínimos

cuadrados ordinarios se cumplan para asegurarnos que todo es verdadero.

Escalas y unidades de medición:

Regresor

significativo,

pero no se

cumplen los

MCO.

Pasa cerca del

origen

122/2222/2 eeteetPr



El problema: hay alguna diferencia en los resultados de la regresión si las unidades en las cuales se miden

las variables Y y X son distintas? De ser así, como se debe proceder?

iii

XY 21

iiYWY

1

* ii

XWX2

*

(los valores estrellados son con diferentes variables)

Donde 1

W y 2

W , se denominan factores de escala, 1

W puede ser igual o diferente a 2

W :

***

2

*

1

* ˆˆˆiii uXY

*2

**

*

2ˆ

i

ii

x

yx **

2

**

1ˆˆ XY

*2

*2

2**

1ˆ

i

i

xn

XVar

*2

2**

2ˆ

ixVar

2

ˆˆ

2*

2*

n

ui

Con las siguientes relaciones:

ii YwY 1

* , ii ywy 1

* , ii XwX 2

*

ii xwx 2

* , ii uwu ˆˆ2

* , YwY 1

* y XwX 1

*

2

2

1

2

2

21

2

2

12

2*

**

2)(

))((

w

w

x

yx

w

ww

xw

ywxw

x

yx

i

ii

i

ii

i

ii

112121122

2

11

**

2

**

1

wXYwXwYwXw

w

wYwXY

2

2

1

*

2

w

w

11

*

1

w



22

1

2

22

1

2

2*

2*

2222

w

nw

n

w

n

w

n

i

i

iii

i

22

1

2* w

1

2

1

*

1 VarwVar

2

2

1*

2 Var

w

wVar

s

2

2

2

2*

*2ˆˆ

1ii

ii

i

i

yw

uw

y

ur

2

2

2*

22

1

2

1

2

1*2ˆ

1ˆ

ry

u

yw

uwr

i

i

i

22* rr

Ejemplo: consideremos la información de la tabla 6.2 :

IDP1= 146,5929, IDP2 = 146592.9

PIB1= 455,2486, PIB2 = 455248,6

PRIMERA ECUACIÓN:

EQ01: IDP1 C PIB1

(W1=1) (W2=1)



IDP1= -1026,498 + 0.3016PIB

(257,5874) (0,0399900)

-3,985047 7,558482

27,66351)ˆ( 1 Var

001592,0)ˆ( 2 Var

4988,2969ˆ 2 (Esta información la obtenemos mediante la calculadora)

49311,542

r2= 0,877170

SEGUNDA ECUACIÓN:

EQ02: IDP2 C PIB2

10001 W 10002 W

IDP2= -1026498+0.301583 PIB2

(257587.4) (0.039900)

-3.985047 7.558482

10*

1 10*64.6var

001592.0var *

2

29694988002*



11.54493*

877170.02* r

TERCERA ECUACIÓN

EQ03: IDP1 c PIB2

1i

W 10002W

IDP1= -1026.498 + 0.000302 PIB2

(257.5874) (.399510* )

(-3.98504) (7.558482)

27.66351*

1

Var

9*

210*59.1

Var

4988.29692*

49311.54*

877170.02* r

Regresión sobre las variables estandarizadas:



Para evitar el problema anterior se puede plantear la regresión con ambas variables estandarizadas.

Y

ii

S

YYY

*

X

ii

S

XXX

*

***

2

*

1

* ˆˆˆiii uXY

XY *

2

**

1ˆˆ 00 ** XY

En este caso, si la variable independiente estandarizada se aumenta en una desviación estándar, la variable

dependiente estandarizada se incrementa en *

2

desviaciones estándar. Por otro lado:

2*

**

2**

****

2*

***

2

)(

))((

i

ii

i

ii

i

ii

X

YX

XX

YYXX

x

yx

2

2

2

*

2)(

))((

i

ii

i

ii

xSy

yxSx

Sx

XX

SxSy

YYXX

Sy

Sx2

*

2

Ejemplo: consideremos la información de la tabla 6.2; (ejemplo 6,2)

0ˆ *

1

***

2

* ˆˆiii uXY

Análisis de 0* Y

01111 **

i

y

i

yY

ii y

nSYY

nSS

YY

nY

nY



IB1))/@stdev(P@mean(PIB11(3 PIBPIB



IB2))/@stdev(P@mean(PIB22(4 PIBPIB

DP1))/@stdev(I@mean(IDP11(3 IDPIDP

DP2))/@stdev(I@mean(IDP22(4 IDPIDP



EQ 5= IDP3 c PIB3

Dependent Variable: IDP3

Method: Least Squares

Date: 06/05/07 Time: 09:30

Sample: 1988 1997

Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob.

C 1.78E-16 0.117552 1.51E-15 1.0000

PIB3 0.936574 0.123910 7.558482 0.0001

R-squared 0.877170 Mean dependent var 0.000000

Adjusted R-squared 0.861816 S.D. dependent var 1.000000

S.E. of regresión 0.371731 Akaike info criterion 1.035563

Sum squared resid 1.105470 Schwarz criterion 1.096080

Log likelihood -3.177815 F-statistic 57.13064

Durbin-Watson stat 0.614662 Prob(F-statistic) 0.000066

3936574.010*78.13 16 PIBIDP

(0.117552) (0.123910)

1510*5.1

7.558482

877170.02 r 861816.02 r = r cuadrado ajustado.

EQ 6: IDP3 PIB3



Date: 06/05/07 Time: 09:32

Sample: 1988 1997





PIB3 0.936574 0.116824 8.016980 0.0000



S.E. of regression 0.350471 Akaike info criterion 0.835563


Log likelihood -3.177815 Durbin-Watson stat 0.614662

IDP3=0.936574 PIB3

(0.116824)

(8.01698)

877170.02 r 877170.02 r

El r y el r cuadrado son los mismo.

EQ 7= IDP4 c PIB4



Date: 06/05/07 Time: 09:48

Sample: 1988 1997



C -6.15E-18 0.117552 -5.23E-17 1.0000

PIB4 0.936574 0.123910 7.558482 0.0001

R-squared 0.877170 Mean dependent var -4.44E-17




Log likelihood -3.177815 F-statistic 57.13064


4936574.010*15.64 18 PIBIDP

(0.117552) (0.123910)

1710*23.5 7.558482

877170.02 r 861816.02 r

EQ 8: IDP4 PIB4





Date: 06/05/07 Time: 09:49

Sample: 1988 1997



PIB4 0.936574 0.116824 8.016980 0.0000

R-squared 0.877170 Mean dependent var -4.44E-17




Log likelihood -3.177815 Durbin-Watson stat 0.614662

IDP4=0.936574 PIB4

(0.116824)

(8.01698)

877170.02 r 877170.02 r

La regresión con variables estandarizadas es el único modelo que cruza por el origen cumpliendo los MCO.

Independientemente de cómo se plantea las variables, la regresión es la misma. La interpretación es: si el

PIB aumenta en una desviación estándar, el IDP se incrementa en 0.94 desviaciones estándar. Nótese que en

el modelo sin intersección el 2r es igual al 2r .

Formas funcionales de los modeles de regresión

Modelos log-lineal (log-log):

Es la manera más sencilla de obtener una elasticidad. Es el mejor indicador de todos los indicadores.

Realizar:

43 PIBIDP

34 PIBIDP

Si el PIB aumenta en una desviación

Estandar el IDP aumenta en 0,94

desviaciones estandar. Recordemos que

aumenta por que tiene signo positivo.



También denominado modelo de elasticidad constante, por que mide la elasticidad de Y con respecto a X.

Supongamos la función exponencial (Coub Douglas).

iu

ii eXY 2

1

Y

X

dX

dY

X

dXY

dY

EYX *

2

1

1

21

2

2

i

i

u

i

i

u

iYX

eX

XeXE

iii uXY 21 lnlnln

iii uXY 2lnln

Linealizar es sacar los logaritmos a ambos lados.

Consideremos la información de la tabla 6.3;

GSE=135.2642, GBD=65.25941, GBP=61.19171, GCP=160.5416 (Ejer-6.3)

*Generalmente expresar una variable con tres letras*

*ese log es el logaritmo naperiano (base e) ya no se trabaja con el logaritmo decimal*

LGSE=LOG(GSE)

LGBD=LOS(GBD)

LGBP=LOG(GBP)

LGCP=LOG(GCP)

Vamos a ver la elasticidad de los tres primeros cuando el gasto total aumenta

EQ01: LGSE C LGCP

Dependent Variable: LGBD


Date: 06/07/07 Time: 08:10

Sample: 1993Q1 1998Q3



C -9.697098 0.434127 -22.33702 0.0000

LGCP 1.905633 0.051370 37.09622 0.0000





S.E. of regression 0.013322 Akaike info criterion -5.715894

Sum squared resid 0.003727 Schwarz criterion -5.617155

Log likelihood 67.73278 F-statistic 1376.130


LGSE=0.130296 + 0.919989LGCP

(0.064914) (0.007681) error estándar

(1.591280) (119.7712) t de student

La intersección esta pasando cerca del origen, no en el origen, pero como yo necesito que exista la

intersección para que se cumplan los MCO yo no le hago caso a la t de student de la regresión.

Cuando los gastos de consumo personal total aumenta en un 1% (no el logaritmo de los gastos), entonces los

gastos en servicios (GSE) aumenta en 0.92%. Si el signo es negativo el GSE disminuye.

EQ02= LGBD C LGCP

Dependent Variable: LGBD


Date: 06/07/07 Time: 08:10

Sample: 1993Q1 1998Q3 Included observations: 23


C -9.697098 0.434127 -22.33702 0.0000

LGCP 1.905633 0.051370 37.09622 0.0000



S.E. of regression 0.013322 Akaike info criterion -5.715894

Sum squared resid 0.003727 Schwarz criterion -5.617155

Log likelihood 67.73278 F-statistic 1376.130


LGBD= -9.697098 + 1.905633LGCP

(0.434127) (0.051370) error estándar

-22.33702 37.09622 t de student

La intersección pasa lejos del origen, por que la t de student es alta 22.33702 (nada mas no hay otra

explicación que dar)

Si los gastos totales aumenta en 1% los gastos en bienes duraderos (GBD) se incrementaran en 1.91%

(aprox)

EQ03= LGBP C LGCP



LGBP = 0.780076 + 0.767695 LGCP

(0.077143) (0.009128) error estándar

10.11202 84.10016 t de student

Si los gastos totales aumentan en 1% los gastos en bienes perecederos se incrementaran en 0.77% (aprox)

Modelo log-lin:

También denominado semilog por que solamente una variable aparece en forma logarítmica, mide la tasa de

crecimiento instantáneo de variables.

t

ot rYY )1(

)1log(lnln rtYY ot

01 lnY r 1ln2

tt utY 21ln

2 mide el cambio relativo de Y(%) debido a un cambio de t, se conoce como la semielasticidad de Y

respecto a t.

Modelo de tendencia lineal:

En lugar de estimar el modelo anterior, algunas veces se estima el siguiente.

tt utY 21

Que se denomina modelo de tendencia lineal, la variable de tiempo (t) se conoce como la variable de

tendencia, que puede ser creciente o decreciente.

Mide el cambio de Y en valores absolutos por una unidad de tiempo.

En el examen necesitamos las cifras de view/ estimation out put

Modelo lin-log control de lectura

Ejemplo: consideremos la información de la tabla 6.3, (Ejer. 6.3).

:4EQ LGSE C t

LGSE: 7.788347 + 0.007466t

(0.002289) (0.000167)

3402.198 44.71844

La tasa de crecimiento instantáneo de los gastos en servicios es de 0.747%

:5EQ LGBD C t

LGBD= 6.221691+0.015445t

(0.0007597) (0.000554)



818.9877 27.87711

La tasa de crecimiento instantáneo de los gastos en bienes duraderos es de 1.54%.

(Las cifras q me debe poner es del view stimation output cifras decimales q se deben declarar)

:6EQ LGBP C t

LGBP=7.192967+0.006229t

(0.002077) (0.000151)

3463.080 41.11945

La tasa de crecimiento instantáneo de los gastos en bienes perecederos es de 0.623%

:7EQ LGCP C t

LGCP= 8.353433+0.008114t

(0.002342) (0.000171)

3566.568 47.50231

La tasa de crecimiento instantáneo de los gastos en consumo personal total es de 0.81%

:9EQ GBD c t

GBD= 496.0818 + 9.442095t

(5.540763) (0.404102)

Los gastos en bienes duraderos han aumentado en 9.44 dólares trimestrales

19.79 equivale al 0.747%

:10EQ GBP c t

GBP=1327.086 + 8.952273

(3.55064) (0.244693)

395.5467 36.58567

Los gastos en bienes perecederos han aumentado en 8.95 dólares trimestralmente

EQ11: GCP c t

apuntes de econometría i (segunda parte)

Documents