f. vela / j. f. islas / análisis econométrico con stata profesor: noé becerra rodríguez octubre...

53
F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

Upload: olalla-prudencio

Post on 06-Jan-2015

5 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Análisis econométrico con Stata

Profesor: Noé Becerra Rodríguez

octubre 2013

1

Page 2: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Sesión 1I. Descripción del CursoII. Elementos básicos

Qué es StataCómo obtener ayudaManejando la base de datos

III. Estadísticas Descriptivas y GráficosTablas con frecuencias relativasHistogramas

2

Page 3: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Sesión 1I. Descripción del CursoII. Funciones básicos

Qué es StataCómo obtener ayudaManejando la base de datos

III. Estadísticas Descriptivas y GráficosTablas con frecuencias relativasHistogramas

3

Page 4: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Descripción

En este curso se muestran algunas técnicas de regresión que permiten estimar relaciones entre variables, desarrollar pruebas de hipótesis y predecir valores futuros de variables en función del modelo considerado.

El curso tiene un carácter aplicado y busca mostrar como utilizar Stata.

4

Page 5: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Objetivos

Ofrecer los elementos básicos vinculados a las técnicas econométricas de regresión lineal y algunos modelos no lineales

Dotar del manejo básico del Stata para poder llevar a cabo un análisis empírico basado en los conocimientos teóricos adquiridos

5

Page 6: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Sesión 1I. Descripción del CursoII. Funciones básicos

¿Qué es Stata?Cómo obtener ayudaManejando la base de datos

III. Estadísticas Descriptivas y GráficosTablas con frecuencias relativasHistogramas

6

Page 7: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Stata es una herramienta computacional diseñada para realizar análisis estadístico la cual fue creada en 1985 por StataCorp.

El denominativo de Stata es una abreviación de las palabras “Statistics" y "data ".

Actualmente es utilizado tanto en instituciones académicas como en empresas donde sus usuarios se ubican en las áreas de la economía, sociología, ciencia política, ciencias de la salud y epidemiología.

7

Page 8: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Sus capacidades incluyen :

- Manejo y organización de datos- Graficación.- Análisis estadístico .- Simulación.- Programación de tareas.

8

Page 9: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

• Actualmente, en el mercado se encuentra la versión 13.

• Su lenguaje computacional es C.

• Existen versiones para plataformas en Windows, Mac, UNIX y LINUX.

9

Page 10: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Stata ofrece diferentes extensiones en los archivos por él creados:

ado archivos de programas automáticamente cargadodo archivo de tareasdta base de datosgph gráficalog textomata codigos de Matammat matriz matasmcl texto para Stata

10

Page 11: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Sesión 1I. Descripción del CursoII. Elementos básicos

¿Qué es Stata?¿Cómo obtener ayuda?Manejando la base de datos

III. Estadísticas Descriptivas y GráficosTablas con frecuencias relativasHistogramas

11

Page 12: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Stata tiene varias formas de encontrar ayuda:

La forma más sencilla de encontrar ayuda es ejecutar el comando help seguido de la función sobre la cual requerimos información

help summarize

Además en el Menú principal la opción abre un submenú con diversas alternativas para solicitar ayuda

12

Page 13: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

¿preguntas?

13

Page 14: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Conceptos básicos

14

Page 15: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Clasificación de las variables

Nivel de medición

Escala de medición

Función en la investigación

Discretas

Continuas

Nominales Ordinales Intervalo Continuas

Dependiente(s)

Independiente(s)

15

Page 16: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Escalas de medición de las variables

Nominales: nombres o clasificaciones que se utilizan para datos en categorías distintas y separadas.

Ordinales: son las que clasifican las observaciones en categorías con un orden significativo.

Intervalo: medidas numéricas en la cual el valor cero es arbitrario pero la diferencia entre valores es importante.

Razón: medidas numéricas en las cuales el valor cero es un valor fijo y la diferencia entre valores es importante.

16

Page 17: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Pantalla inicial de Stata

17

Page 18: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Ejercicio

sysuse uslifeexp.dta describe notes edit summar le sum le, d sum sum, d help recode sum le, d

18

Page 19: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Ejercicio

recode le (39.1/68.1=0) (68.1/70=1) (70/76.7=2), gen (lev_le) sum lev_le tab lev_le

histogram le histogram le, normal

scatter le_male le_female

graph box le

19

Page 20: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

¿Qué es el análisis de regresión?

Es una metodología estadística que es utiliza la relación entre dos o más variables, de manera tal que la variable de respuesta o de resultado, puede ser predecida a partir de otra(s) variable(s).

Es una herramienta utilizada en distintas áreas del conocimiento.

Sirve también como medio en la contrastación de hipótesis y/o teorías con la realidad a través de modelos estadísticos.

20

Page 21: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Análisis de regresión

Relación funcional vs relación estadística.

Linealidad vs no linealidad

Selección de variables predictoras.

Forma funcional.

21

Page 22: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Tipo de datos Corte transversalUn conjunto de datos de una muestra de individuos, hogares, empresas, ciudades, estados o países tomados en un punto del tiempo en particular.

Observación SALA EDUCA EXPER SEXO EDO

1 3.10 11 2 1 0

2 3.24 12 22 1 1

3 3.00 11 44 0 0. ..

525 11.56 16 5 0 0

526 3.50 8 7 1 0

Observación Año SALA EDUCA EXPER SEXO EDO

1 1950 3.10 11 2 1 0

2 1951 3.24 12 22 1 1

3 1952 3.00 11 44 0 0. . . . . . .. . . . . . .. . . . . . .

50 1999 11.56 16 5 0 0

51 2000 3.50 8 7 1 0

Serie de tiempo

Observaciones de distintas variables efectuadas en el tiempo.

22

Page 23: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Panel

Es la combinación de datos de corte transversal con datos en series de tiempo donde tienen como característica principal que las unidades de observación son siempre los mismos.

Observación Año PRECASA ANTI CUARTOS AREA

1 1993 85,500 42 3 1

2 1993 67,300 36 3 0

3 1993 134,000 10 4 1. . . . . .. . . . . .. . . . . .

250 1993 243,600 4 4 0

251 1995 65,000 44 3 1252 1995 182,400 38 3 0

. . . . . .

. . . . . .

. . . . . .520 1995 57,200 16 4 0

23

Page 24: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Tema 2. El modelo de regresión lineal simple (MRSL)

24

Page 25: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Temas Modelo de regresión lineal simple. Estimaciones puntuales de los mínimos

cuadrados. Estimaciones puntuales y predicciones

puntuales. Suposiciones del modelo y el error estándar. Prueba de significancia individual para la

pendiente y la ordenada al origen. Intervalos de confianza y de predicción. Coeficientes de determinación y correlación

simples. Una prueba F para el modelo.

25

Page 26: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

Requisitos básicos:

i) las variables dependiente (y) e independiente (x) son de intervalo al menos;

ii) la relación entre la variable dependiente (y) y la variable independiente (x) es aproximadamente lineal

26

Page 27: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

Diagramade

dispersión

10

020

030

040

050

060

0w

ork

20 40 60 80 100 120lot

observamos: - tendencia positiva- puntos dispersos alrededor de la línea

Fuente: Kutner et. al. (2005:19).

27

Page 28: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

Diagramade

dispersión

10

020

030

040

050

060

0

20 40 60 80 100 120lot

work Fitted values

Fuente: Kutner et. al. (2005:19).

28

Page 29: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

Diagramade

dispersión

050

10

015

020

0m

ort

ality

0 10000 20000 30000 40000gnppc

Fuente: Fox (2008: 62).

29

Page 30: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

y = μy|x + = β0 + β1x + donde

μy|x = β0 + β1x es el valor medio de la variable dependiente y

cuando el valor de la variable independiente es x.

β0 = ordenada al origen (valor medio de y cuando x = 0)

β1 = pendiente ( valor medio de y cuando x una unidad)

es un término de error: describe los efectos de todos los factores no incluidos en el modelo

30

Page 31: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

Si β0 = 62.37 y β1 = 3.57, entonces cuando lot = 60, el valor medio estimado de horas trabajadas

μy|x = β0 + β1x = 62.36586 + 3.570202(65)

= 294.4 horas trabajadas.

31

Page 32: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Modelo de regresión lineal simple

β0 y β1 se llaman parámetros de regresión. Ya que no conocemos los valores reales de β0

y β1 , debemos estimarlos con los datos de la muestra.

La interpretación de β0 en ocasiones no es aplicable.

Importante: observamos que estas variables se mueven juntas, mas no podemos deducir claramente una relación causa-efecto.

32

Page 33: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Estimaciones puntuales de los mínimos cuadrados

n

xxxSS

yn

yxyxyyxxSS

donde

SS

SSb

iixx

iiiiiixy

xx

xy

2

2

1

Estimación puntual de los mínimos cuadrados de la pendiente β1

33

Page 34: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Estimaciones puntuales y predicciones puntuales

010ˆ xbby

Estimación puntual del valor medio de la variable dependiente cuando el valor de la variable independiente es x0

se predice = 0

34

Page 35: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Estimaciones puntuales y predicciones puntuales

Se puede demostrar que estas estimaciones puntuales dan un valor de la suma de los errores cuadráticos (SSE) que es menor que la que se obtiene con cualesquiera otros valores de b0 y b1. Se les llaman estimaciones puntuales de los mínimos cuadrados.

La recta se llama recta de regresión de mínimos cuadrados

La ecuación se llama ecuación de predicción de mínimos cuadrados.

35

Page 36: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Suposiciones del modelo y el error estándar Suposiciones

1. A cualquier valor dado de x, la media de la población de los valores potenciales del término error es igual a cero.

2. Suposición de varianza constante. A cualquier valor dado de x, tiene una varianza que no depende del valor de x.

3. Suposición de normalidad. A cualquier valor dado de x, tiene una distribución normal.

4. Suposición de independencia. Cualquier valor del término error es estadísticamente independiente de cualquier otro valor de .

36

Page 37: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Suposiciones del modelo y el error estándar En otras palabras

— dado un valor de x, la población de valores potenciales del término de error tiene una distribución normal, con valor medio 0 y varianza σ2 que no depende de x.

— La población de valores potenciales de y|x tiene distribución normal con valor medio de β0 + β1x y varianza σ2 que no depende de x.

— Es más probable que la suposición de independencia se viole cuando se utilizan series de tiempo en un estudio de regresión.

37

Page 38: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Suposiciones del modelo y el error estándar

22

n

SSEs

Error cuadrático medio = estimación puntual de σ2

error estándar = estimación puntual de σ

2n

SSEs

n

i

n

i

n

i

n

iiiiiii yxbybyyySSE

1 1 1 110

22ˆ

vary|x

38

Page 39: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Prueba de la significancia de la pendiente y la ordenada al origen

Hipótesis nula: β1 = 0

nivel de significancia α (0.10, 0.05, 0.01) los valores p se basan en n-2 grados de libertad Se rechaza la hipótesis nula si se cumple la

condición de punto de rechazo de alguna de las hipótesis alternativas, o si p < α

39

Page 40: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Prueba de la significancia de la pendiente y la ordenada al origen

xx

bSS

1

Si se cumplen los supuestos de la regresión, entonces la población de todos los valores posibles de b1 es normalmente distribuida con valor medio β1 y desviación estándar

cuya estimación puntual es

xx

bSS

ss 1

40

Page 41: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Prueba de la significancia de la pendiente y la ordenada al origen

1

1

bs

bt

y la población de todos los valores posibles de la estadística de prueba t

tiene una distribución t con n – 2 grados de libertad.

41

Page 42: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Prueba de la significancia de la pendiente y la ordenada al origen

Hipótesis alternativa

Condición de punto de rechazo

Valor p

Ha : β1 ≠ 0 2 (área bajo la curva t a la derecha de |t|)

Ha : β1 > 0 área bajo la curva t a la derecha de t

Ha : β1 < 0 área bajo la curva t a la izquierda de t

)2(2/|| ntt

2 ntt

2 ntt

42

Page 43: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

1

22/1 b

n stb

Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para la pendiente verdadera β1 es

43

Page 44: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

xxSS

xx

ndv

201

..

Si se cumplen las suposiciones de la regresión, un valor de distancia (v.d.) para un valor particular x0 de x (para la regresión lineal simple) es

44

Page 45: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

..ˆ 22/ dvsty n

Si se cumplen las suposiciones de la regresión, un intervalo de confianza de 100(1-α)% para el valor medio de y cuando la variable independiente es x0 es

45

Page 46: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

La población de todos los errores posibles de predicción está normalmente distribuida con media cero y desviación estándar

σ√1 + valor de distancia

La estimación puntual es

s√1 + valor de distancia

Se llama error estándar del error de predicción

46

Page 47: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

..1ˆ 22/ dvsty n

Si se cumplen las suposiciones de la regresión, un intervalo de predicción 100(1-α)% para un valor individual de y cuando la variable independiente es x0 es

47

Page 48: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Intervalos de confianza y de predicción

Nótese que el intervalo de predicción es mayor que el intervalo de confianza: mayor incertidumbre acerca del término de error.

Entre más alejado del valor medio es xi, mayores son los intervalos de confianza y de predicción.

48

Page 49: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Coeficientes de determinación y correlación simples

En el caso del modelo de regresión lineal simple,

1. Variación total = Σ(yi-y)2

2. Variación explicada = Σ(yi-y)2

3. Variación inexplicada = Σ(yi-yi)2

4. Variación total = Variación explicada + Variación inexplicada

5. El coeficiente de determinación simple es

r2 = (variación explicada)/(variación total)

6. El r2 es la proporción de la variación total en los n valores observados de la variable dependiente que explica el modelo de regresión lineal simple

49

Page 50: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Coeficientes de determinación y correlación simples

2

2

rr

rr

Coeficiente de correlación simple (r) entre y y x si b1 > 0

si b1 < 0

donde b1 es la pendiente de la recta de mínimos cuadrados que relaciona y con x. Este coeficiente de correlación mide la fuerza de la relación lineal entre y y x.

50

Page 51: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Coeficientes de determinación y correlación simples

yyxx

xy

SSSS

SSr

También se puede calcular mediante la fórmula

51

Page 52: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Coeficientes de determinación y correlación simples

21

2

r

nrt

La correlación de la población de todas las combinaciones posibles de valores observados de x e y se denomina ρ.

Para probar la hipótesis nula H0: ρ = 0, utilizamos la estadística de prueba

52

Page 53: F. VELA / J. F. ISLAS / Análisis econométrico con Stata Profesor: Noé Becerra Rodríguez octubre 2013 1

F. VELA / J. F. ISLAS /

Prueba F para el modeloEstadística F global

Variación inexplicada /1 F(modelo) =

(Variación explicada)/(n-2)

Podemos rechazar H0:β1=0 y aceptar Ha: β1≠0 en el nivel de significan-

cia α si se cumple alguna de:

F(modelo)>F[α]

Valor p < α

En el punto F[α] se basa en 1 grado de libertad para el numerador y n-2

grados de libertad para el denominador.

53