tipos de datos transversales:observaciones sobre individuos, hogares, empresas, países, etc., en un...

29
Tipos de datos Transversales: Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10, Modelos A y B). Series de tiempo: Observaciones sobre ingreso, consumo, tasas de interés, etc., a lo largo de un periodos (años, meses, trimestres…) (Capítulos 11–13, Modelo C) Datos de panel: Observaciones transversales sobre los mismos individuos, hogares, etc., a lo largo de cierto periodo de tiempo. (Capítulo 14, Modelo B) 1 Durante este curso trabajaremos con los tres tipos de datos descritos arriba. TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A

Upload: eustaquio-blando

Post on 22-Jan-2016

222 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Tipos de datos

Transversales: Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10, Modelos A y B).

Series de tiempo: Observaciones sobre ingreso, consumo, tasas de interés, etc., a lo largo de un periodos (años, meses, trimestres…) (Capítulos 11–13, Modelo C)

Datos de panel: Observaciones transversales sobre los mismos individuos, hogares, etc., a lo largo de cierto periodo de tiempo. (Capítulo 14, Modelo B)

1

Durante este curso trabajaremos con los tres tipos de datos descritos arriba.

TIPOS DE MODELOS DE REGRESIÓN Y SUPUESTOS PARA EL MODELO A

Page 2: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Tipos de modelos

Modelo A: Datos transversales con regresores no-estocásticos. Sus valores observados en una muestra no tienen componentes estocásticos o aleatorios.

Modelo B: Datos transversales con regresores estocásticos. Los valores de los regresores son elegidos, de manera aleatoria e independiente, desde una población definida.

Modelo C: Datos de series de tiempo. Los valores de los regresores pueden mostrar persistencia o dependencia temporal. Las regresiones con series de tiempo pueden implicar complejos problemas técnicos que, al inicio, podremos pasar por alto.

2

Diferentes modelos de regesión son apropiados para disntintos tipos de datos. Nosotros consideraremos tres tipos de modelos de regresión, como se muestra arriba.

Page 3: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

3

Comenzaremos con el Modelo A por simple conveniencia analitica. Este modelo nos permite discutir el análisis de regresión dentro de un marco teórico “simple” conocido como el “Modelo Clásico de Regresión Lineal”.

Tipos de modelos

Modelo A: Datos transversales con regresores no-estocásticos. Sus valores observados en una muestra no tienen componentes estocásticos o aleatorios.

Modelo B: Datos transversales con regresores estocásticos. Los valores de los regresores son elegidos, de manera aleatoria e independiente, desde una población definida.

Modelo C: Datos de series de tiempo. Los valores de los regresores pueden mostrar persistencia o dependencia temporal. Las regresiones con series de tiempo pueden implicar complejos problemas técnicos que, al inicio, podremos pasar por alto.

Page 4: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

4

En el Capítulo 8, reemplazamos el modelo clásico por un supuesto más débil pero más realista y adecuado para regresiones con datos de corte transversal: que los regresores son una muestra aleatoria de una población definida.

Tipos de modelos

Modelo A: Datos transversales con regresores no-estocásticos. Sus valores observados en una muestra no tienen componentes estocásticos o aleatorios.

Modelo B: Datos transversales con regresores estocásticos. Los valores de los regresores son elegidos, de manera aleatoria e independiente, desde una población definida.

Modelo C: Datos de series de tiempo. Los valores de los regresores pueden mostrar persistencia o dependencia temporal. Las regresiones con series de tiempo pueden implicar complejos problemas técnicos que, al inicio, podremos pasar por alto.

Page 5: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A (regresores no-estocásticos)

A.1: El modelo es lineal en sus parámetros y está correctamente especificado: Y = 1 + 2X + u

Ejemplos de modelos que no son lineales en los parámetros:

Y = 1 + 2X2 + 3X3 + 23X4 + u

5

‘Lineal en sus parámetros’ significa que cada término del lado derecho una incluye una como un factor simple y sin relación alguna con las otras s. Aplazaremos la discusión sobre asuntos de linealidad y no-linealidad hasta el Capítulo 4.

uXY 21

Page 6: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.2: Existe cierta variación en el regresor en la muestra

6

Debe existir cierta variación en el regresor en la muestra. De lo contrario, no podríamos explicar ninguna variación observada en Y.

Page 7: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.2: Existe cierta variación en el regresor en la muestra

7

Si intentáramos estimar una regresión de Y en X, cuando X es constante, no podríamos calcular los coeficientes de regresión. El numerador y el denominador de la expresión para b2 serían iguales a cero. Y tampoco podríamos obtener b1.

.00

, allfor If 2 biXX i

22

XX

YYXXb

i

ii

Page 8: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

8

Asumimos que el valor esperado del término de error para cualquier observación debe ser cero. El término de error será a veces positivo, a veces negativo, pero no debe tener una tendencia sistemática en cualquier dirección.

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Y = 1 + 2X + u

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 9: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

9

Realmente, si incluimos un intercepto en la ecuación de regresión, es razonable asumir que esta condición se satisface de manera automática.

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 10: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

10

El papel del intercepto es capturar cualquier tendencia sistemática pero constante observada en Y y que no esté explicada por el/los regresor(es).

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 11: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

11

Supongamos que el término de error tuviera una media poblacional distinta de cero.

0)( uiuE

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 12: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

12

Defina una nueva variable aleatoria vi = ui – u.

0)( uiuE

uii

uiii

vX

vXY

1*12

*1

21

where

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 13: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

13

Entonces podemos reescribir el modelo como se muestra. vi se convierte en el nuevo término de error y el intercepto ha absorbido a la constante u.

0)( uiuE

uii

uiii

vX

vXY

1*12

*1

21

donde

Page 14: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

14

El término de error en el modelo revisado satisface ahora el supuesto A.3.

0)( uiuE

uii

uiii

vX

vXY

1*12

*1

21

where

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 15: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

15

Es claro que la interpretación del intercepto cambia un poco pues ahora ha absorbido el componente distinto de cero del término de error, además de la información que incluía previamente.

0)( uiuE

uii

uiii

vX

vXY

1*12

*1

21

where

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 16: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

16

Esto es generalmente aceptable porque el papel de la constante es captar cualquier tendencia sistemática en Y no explicada por el/los regresor(es).

0)( uiuE

uii

uiii

vX

vXY

1*12

*1

21

where

Supuestos para el Modelo A

A.3 El término de error tiene valor esperado cero

E(ui) = 0 para toda i

Suponga Yi = 1 + 2Xi + ui

Defina vi = ui – u

Entonces E(vi) = E(ui – u) = E(ui) – E(u) = u – u = 0

Page 17: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

17

Asumimos que el término de error es homoscedástico, lo que significa que, para cada observación, el término de error proviene de una distribución con varianza poblacional constante.

Supuestos para el Modelo A

A.4 El término de error es homoscedástico

iuui todapara22

Page 18: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

18

En el lenguaje de la sección de muestreo y estimadores del repaso estadístico, esto es un concepto “asumido de antemano”, pues suponemos el comportamiento potencial del término de error aún antes de generar la muestra.

Supuestos para el Modelo A

A.4 El término de error es homoscedástico

iuui todapara22

Page 19: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

19

Una vez que hemos generado la muestra, el término de error resultará mayor para algunas observaciones, y más pequeño para otras, pero no debe haber ninguna razón para que éste sea más errático en algunas observaciones que en otras.

Supuestos para el Modelo A

A.4 El término de error es homoscedástico

iuui todapara22

Page 20: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

20

Puesto que E(ui) = 0, por el supuesto A.3, la varianza poblacional de ui es igual a E (ui2), así

que la condición puede también ser escrita como se muestra.

Supuestos para el Modelo A

A.4 El término de error es homoscedástico

iuui todapara22

222iuiu uEuE

i

iuE ui todapara)( 22

Page 21: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.4 El término de error es homoscedástico

21

Si no se cumple el supuesto A.4, los coeficientes de regresión de OLS serán ineficientes y se podrían obtener resultados más confiables usando una técnica de regresión modificada. Esto será discutido en el Capítulo 7.

iuui todapara22

222iuiu uEuE

i

iuE ui todapara)( 22

Page 22: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.5 Los valores del término de error tienen distribuciones independientes

ui se distribuye independientemente de uj para todo j ≠ i

22

Asumimos que no existe autocorrelación en el término de error. Es decir que no debe haber ninguna asociación sistemática entre los errores de dos observaciones cualquiera.

Page 23: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

23

Por ejemplo, el que el término de error sea grande y positivo para una observación i, no implica que el error también sea grande y positivo en la siguiente observación--ni grande y negativo, o pequeño y positivo, o pequeño y negativo, etc.--en última instancia.

Supuestos para el Modelo A

A.5 Los valores del término de error tienen distribuciones independientes

ui se distribuye independientemente de uj para todo j ≠ i

Page 24: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.5 Los valores del término de error tienen distribuciones independientes

ui se distribuye independientemente de uj para todo j ≠ i

24

Este supuesto implica que la covarianza poblacional entre ui y uj es cero. Nótese que ui y uj

tienen ambas una media poblacional igual a cero, dado el supuesto A.3, y que E(uiuj) se puede expresar como E(ui)E(uj) siempre que ui y uj sean independientes entre sí (ver el repaso).

0)()(

)()])([(

ji

jiujuiuu

uEuE

uuEuuEji

Page 25: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.5 Los valores del término de error tienen distribuciones independientes

ui se distribuye independientemente de uj para todo j ≠ i

25

Si este supuesto no se cumple, OLS producirá otra vez estimadores ineficientes. El capítulo 12 discute este tipo de problemas y la manera de atenderlos. Las violaciones de este supuesto en datos de corte transversal son raras (y muy frecuentes en series de tiempo y de tipo panel).

0)()(

)()])([(

ji

jiujuiuu

uEuE

uuEuuEji

Page 26: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

26

Usualmente asumimos que el término de error tienen una distribución normal. La justifación de este supuesto esta basada en el Teorema de Límite Central.

Supuestos para el Modelo A

A.6 El término de error tiene una distribución normal

Page 27: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

27

Esencialmente, el Teorema del Límite Central indica que, si una variable aleatoria es el resultado compuesto de los efectos de una gran cantidad de variables aleatorias, ésta tendrá una distribución aproximadamente normal incluso si sus componentes no la tienen, siempre y cuando ninguno de ellos tenga un efecto dominante.

Supuestos para el Modelo A

A.6 El término de error tiene una distribución normal

Page 28: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Supuestos para el Modelo A

A.6 El término de error tiene una distribución normal

28

Y como el término de error u se compone de un gran número de factores no incluidos explícitamente en la regresión, entonces podemos asumir que u se distribuya normalmente--incluso si no sabemos nada sobre la distribución de aquellos factores no incluidos.

Page 29: Tipos de datos Transversales:Observaciones sobre individuos, hogares, empresas, países, etc., en un momento determinado en el tiempo. (Capítulos 1–10,

Copyright Christopher Dougherty 1999–2006. This slideshow may be freely copied for personal use.

21.06.06