apunte econometria - josé miguel benavente

162
Econometría I Profesores: 1 Jose Miguel Benavente Andrés Otero Javiera Vásquez Julio 2004 1 Cualquier error es responsabilidad exclusiva de los autores.

Upload: juan-lizana

Post on 30-Sep-2015

75 views

Category:

Documents


14 download

DESCRIPTION

Econometría es la ciencia que aplica métodos matemáticos y estadísticos al análisis de datos económicos, con el objetivo de dotar de una base empírica a una teoría económica, para así refutarla o verificarla.

TRANSCRIPT

  • Econometra I

    Profesores:1

    Jose Miguel BenaventeAndrs Otero

    Javiera Vsquez

    Julio 2004

    1Cualquier error es responsabilidad exclusiva de los autores.

  • ndice general

    1. Introduccin 5

    2. Modelo de Regresin Lineal 8

    2.1. Anlisis de Regresin . . . . . . . . . . . . . . . . . . . . . . . . . 8

    2.1.1. Qu es una regresin? . . . . . . . . . . . . . . . . . . . . 8

    2.1.2. Relaciones estadsticas versus relaciones determinsticas . . 9

    2.1.3. Regresin versus Causalidad . . . . . . . . . . . . . . . . . 10

    2.1.4. Regresin versus Correlacin . . . . . . . . . . . . . . . . . 10

    2.2. Anlisis de regresin con dos variables . . . . . . . . . . . . . . . 14

    2.2.1. Funcin de regresin poblacional (FRP) . . . . . . . . . . 16

    2.2.2. Especificacin estocstica de la funcin de regresin pobla-cional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

    2.2.3. Funcin de regresin muestral . . . . . . . . . . . . . . . . 18

    2.2.4. Propiedades de un Estimador . . . . . . . . . . . . . . . . 21

    2.3. Modelo de regresin con dos variables . . . . . . . . . . . . . . . . 24

    2.3.1. Mtodo de Mnimos Cuadrados Ordinarios . . . . . . . . . 24

    2.3.2. Supuestos detrs del mtodo MCO . . . . . . . . . . . . . 31

    2.3.3. Errores estndar de los Estimadores Mnimos CuadradosOrdinarios . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

    1

  • 2.3.4. Estimador Mnimo Cuadrado Ordinario de 2 . . . . . . . 36

    2.4. Modelo de Regresin con k variables . . . . . . . . . . . . . . . . 38

    2.4.1. Representacin Matricial del Modelo de Regresin Lineal . 38

    2.4.2. Estimador Mnimo Cuadrados Ordinarios . . . . . . . . . . 39

    2.5. Propiedades del estimador MCO . . . . . . . . . . . . . . . . . . . 41

    2.5.1. Propiedad de mejor estimador lineal insesgado . . . . . . . 42

    2.5.2. Teorema de Gauss-Markov . . . . . . . . . . . . . . . . . . 42

    2.6. Geometra del Estimador MCO . . . . . . . . . . . . . . . . . . . 44

    2.7. Bondad de Ajuste y Anlisis de Varianza . . . . . . . . . . . . . . 45

    2.7.1. Modelo de Regresin Lineal en Desvos . . . . . . . . . . . 45

    2.7.2. Anlisis de Varianza . . . . . . . . . . . . . . . . . . . . . 47

    2.7.3. Bondad de Ajuste: R2 y R2 . . . . . . . . . . . . . . . . . 48

    2.8. Inferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50

    2.8.1. Test t (Una hiptesis lineal) . . . . . . . . . . . . . . . . . 53

    2.8.2. Test F (Conjunto de hiptesis lineales) . . . . . . . . . . . 61

    2.8.3. Intervalos de Confianza . . . . . . . . . . . . . . . . . . . . 61

    2.8.4. Test de Normalidad (Test de Jarque-Bera) . . . . . . . . . 63

    2.9. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

    2.9.1. Medicin de la precisin de la prediccin . . . . . . . . . . 67

    2.10. Estimacin Mximo Verosmil (EMV) . . . . . . . . . . . . . . . . 74

    2.10.1. Propiedades de los estimadores MV . . . . . . . . . . . . . 75

    2.10.2. Estimacin MV . . . . . . . . . . . . . . . . . . . . . . . . 76

    2.11. Inferencia en el contexto MV . . . . . . . . . . . . . . . . . . . . . 80

    2.11.1. Test de Razn de Verosimilitud (LR) . . . . . . . . . . . . 80

    2

  • 2.11.2. Test de Wald (W) . . . . . . . . . . . . . . . . . . . . . . . 81

    2.11.3. Test del Multiplicador de Lagrange (LM) . . . . . . . . . . 81

    2.12. Algunas acotaciones respecto a la estimacin y la inferencia MV . 85

    3. Forma Funcional y Especificacin 87

    3.1. Regresores Estocsticos en el Modelo de Regresin Lineal . . . . . 87

    3.2. Incorporacin de No Linealidades . . . . . . . . . . . . . . . . . . 89

    3.2.1. Test de No Linealidades Omitidas (Test de Reset) . . . . . 90

    3.3. Variables Dummies o cualitativas . . . . . . . . . . . . . . . . . . 92

    3.3.1. Posibles usos de las variables Dummies . . . . . . . . . . . 97

    3.4. Variable Dependiente Rezagada . . . . . . . . . . . . . . . . . . . 101

    3.4.1. Ejemplo y advertencias sobre el uso de variable dependienterezagada como regresor . . . . . . . . . . . . . . . . . . . . 103

    3.5. Seleccin de Modelos . . . . . . . . . . . . . . . . . . . . . . . . . 105

    3.5.1. Ejemplo: Retornos a la educacin, diferencias entre hom-bres y mujeres . . . . . . . . . . . . . . . . . . . . . . . . . 106

    3.6. Regresin Particionada . . . . . . . . . . . . . . . . . . . . . . . . 109

    3.7. Omisin de Variables Relevantes . . . . . . . . . . . . . . . . . . . 110

    3.7.1. Impacto sobre el Insesgamiento . . . . . . . . . . . . . . . 110

    3.7.2. Impacto sobre la Varianza . . . . . . . . . . . . . . . . . . 111

    3.7.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112

    3.8. Inclusin de Variable Irrelevantes . . . . . . . . . . . . . . . . . . 114

    3.8.1. Impacto sobre Insesgamiento . . . . . . . . . . . . . . . . . 114

    3.8.2. Impacto sobre Varianza . . . . . . . . . . . . . . . . . . . 114

    3.8.3. Ejemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115

    3

  • 3.9. Perturbaciones no Esfricas . . . . . . . . . . . . . . . . . . . . . 117

    3.9.1. Consecuencias de estimacin por MCO . . . . . . . . . . . 118

    3.9.2. Estimacin Eficiente: Mnimos Cuadrados Generalizados . 118

    3.9.3. Test de Hiptesis . . . . . . . . . . . . . . . . . . . . . . . 119

    3.9.4. Estimacin cuando es desconocida:Mnimos Cuadrados Factibles . . . . . . . . . . . . . . . . 120

    3.9.5. Heterocedasticidad . . . . . . . . . . . . . . . . . . . . . . 121

    3.9.6. Autocorrelacin . . . . . . . . . . . . . . . . . . . . . . . . 130

    4. Problemas con los datos 149

    4.1. Multicolinealidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

    4.1.1. Multicolinealidad Exacta y Multicolinealidad Aproximada 151

    4.1.2. Deteccin de Multicolinealidad . . . . . . . . . . . . . . . 151

    4.1.3. Otros mtodos de deteccin de multicolinealidad . . . . . . 153

    4.1.4. Remedios contra la Multicolinealidad . . . . . . . . . . . . 155

    4.2. Error de Medicin . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

    4.2.1. Estimacin por Variables Instrumentales . . . . . . . . . . 159

    4.2.2. Test de Hausman . . . . . . . . . . . . . . . . . . . . . . . 160

    4

  • Captulo 1

    Introduccin

    Econometra es la ciencia que aplica mtodos matemticos y estadsticos al anli-sis de datos econmicos, con el objetivo de dotar de una base emprica a unateora econmica, para as refutarla o verificarla.

    ^ (1.1)

    Aunque la econometra parece ser tan antigua como la misma ciencia econmica,slo en 1930 se crea la Sociedad Economtrica, la cual sistematiz su estudio yprctica. En 1933 se lanza el primer nmero de Econometrica en el que RagnanFrish (uno de los fundadores de la Sociedad Economtrica, a quin de hecho, sele acredita el haber acuado el trmino "Econometra") destaca: "La experienciaha mostrado que cada uno de estos tres puntos de vista, el de la estadstica, lateora econmica y las matemticas, es necesario, pero por si mismo no suficientepara una comprensin real de las relaciones cuantitativas de la vida econmicamodera. Es la unin de los tres aspectos lo que constituye una herramienta deanlisis potente. Es la unin lo que constituye la econometra".

    Sin embargo, las metodologas aplicadas en econometra (los tres puntos de vistade Frish), no han sido utilizados exclusivamente por la ciencia econmica. Otrasciencias naturales tambin han aprovechado sus ventajas. Sin embargo, en elcampo del comportamiento econmico adquieren especial particularidad y rele-vancia, en tanto el ambiente y el comportamiento econmicos, son esencialmenteno-experimentales, colocndonos en situaciones donde todas las variables rele-vantes parecen moverse constantemente y donde existen factores impredeciblesque pueden alterar los resultados. Es por esto que la econometra es esencial-mente una ciencia no determinstica, donde se reconoce la existencia de factores

    5

  • Capitulo 1: IntroduccinEconometra I

    FACEA, Universidad de Chile

    esencialmente impredecibles que determinan nuestras conclusiones.

    La metodologa economtrica se puede detallar (a grandes rasgos) segn lo enun-cia la Figura 1. En primer lugar contamos con una teora econmica que buscavalidez. Para ella, es necesario encontrar su equivalente modelo economtrico(relaciones matemticas que describan el comportamiento de los agentes involu-crados). Para estimar entonces dicho modelo, se necesita de la ecuacin resultantedel modelo, los datos que ella implica y los supuestos bajo los cuales se construye.Slo una vez que contamos con dichos ingredientes se procede a estimar cuan-titativamente las predicciones o implicancias expuestas por la teora econmicainicial. Luego, se debe realizar inferencia o pruebas de hiptesis, las cuales nos in-dicarn si nuestros resultados son estadsticamente significativos. Si la respuestaes si, entonces slo queda realizar las predicciones pertinentes y las recomenda-ciones de poltica asociadas. Si la respuestas es no, entonces, debemos revisar losposibles errores que existan a nivel de teora o metodologa.

    TEORIA ECONOMICA

    MODELO ECONOMETRICO

    ECUACION DATOS SUPUESTOS

    ESTIMACION

    INFERENCIA Y PRUEBA DE HIPOTESIS

    PREDICCIONES Y RECOMENDACIONES DE POLITICA

    SI NO

    TEORIA VERIFICADA

    6

  • Capitulo 1: IntroduccinEconometra I

    FACEA, Universidad de Chile

    Esta breve descripcin no es ms que una somera vista a lo que realmente implicahacer econometra. El camino no est exento de dificultades (en trminos de lacalidad de los datos, de la dificultad de medir las variables que la teora indica,de los supuestos que realizamos, etc), sin embargo, esto, ms que una dificultad,implica un desafo.

    7

  • Captulo 2

    Modelo de Regresin Lineal

    2.1. Anlisis de Regresin

    2.1.1. Qu es una regresin?

    La regresin es un elemento fundamental en la Econometra, corresponde a unestudio de dependencia entre una variable dependiente y una o ms variablesexplicativas. El anlisis de regresin tiene como objeto estimar y/o predecir elpromedio poblacional de la variable dependiente para valores fijos de la(s) vari-able(s) explicativa(s).Por ejemplo, observemos la Figura 1, en el eje de las abscisas tenemos nuestravariable explicativa (X): notas controles, y en el eje de las ordenadas tenemosnuestra variable dependiente (Y): nota examen.

    Notas de los controlesFigura 1: Distribucin de las Notas del Examen vs. Promedio Notas de

    Controles

    8

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Podemos observar dos cosas: primero, para cada nota posible en los controles(3.0, 4.0,..) tenemos un rango o distribucin de notas en el examen y segundo,el promedio de notas en el examen es mayor mientras mayores son notas de loscontroles. Esto ltimo se puede apreciar al trazar una recta que una los valorespromedios de notas en examen para cada nota en los controles (linea negra del laFigura 1), la que corresponde a la recta de regresin. Esta nos permite, paracada nivel de edad, predecir la estatura promedio correspondiente.

    2.1.2. Relaciones estadsticas versus relaciones determins-ticas

    La calidad de un producto, por ejemplo el vino, depender de como fue su cosechay por lo tanto, de variables como la temperatura al que estuvo expuesta la uva, lacantidad de lluvia, sol y los fertilizantes. La relacin entre estas variables explica-tivas y la calidad del vino tiene una naturaleza estadstica, ya que si bien estasvariables ayudan al productor de vino a saber ms o menos como ser la cosecha,no podr predecir en forma exacta la calidad del producto debido a los erroresinvolucrados en estas variables y porque pueden haber otros factores difciles demedir que estn afectando la calidad del vino.La variable dependiente, en este caso la calidad del vino, tiene una variabilidadaleatoria, ya que no puede ser explicada en su totalidad por las variables explica-tivas.

    En la econometra nos interesa la dependencia estadstica entre variables, dondetratamos con variables aleatorias, es decir, variables que tienen una distribucinde probabilidad. La dependencia determinstica, por el contrario, trata relacionescomo la ley de gravedad de Newton1, las que son exactas (no tienen naturalezaaleatoria).

    1La ley de gravedad de Newton plantea que toda partcula en el universo atrae a cualquierotra partcula con una fuerza directamente proporcional al producto de sus masas e inversamenteproporcional al cuadrado de la distancia entre ellas: F=k(m1m2r2 ), donde F=fuerza, m1 y m2son la masa de las dos partculas, r es la distancia y k una constante de proporcionalidad. Estaes una relacin determinstica, ya que para valores de masas, distancia y constante sabemosexactamente a la fuerza que se atraen estas partculas. Si alguna de las variables estuvieramedida con error, la ley de Newton pasa a ser una relacin estadstica, y F se convierte en unavariable aleatoria.

    9

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.1.3. Regresin versus Causalidad

    Es importante tener claro que la regresin es una relacin estadstica, que noimplica causalidad apriori. En el ejemplo del vino, no hay una razn estadsticapara suponer que la lluvia no depende de la calidad del vino. Pero nuestro sentidocomn nos hace considerar como variable dependiente la calidad del vino y no lalluvia. Es importante recordar de aqu en adelante que una relacin estadsticano puede por s misma implicar en forma lgica una causalidad.

    2.1.4. Regresin versus Correlacin

    El Anlisis de Correlacin est estrechamente relacionado con el de regresinaunque conceptualmente son dos cosas muy diferentes. El anlisis de correlacintiene como objetivo medir el grado de asociacin lineal entre dos variables, medidaa travs del coeficiente de correlacin. Por ejemplo, se puede estar interesadoen medir el grado de correlacin entre aos de educacin y salario. En cambio, elanlisis de regresin trata de estimar o predecir el valor promedio de salario paraun nivel dado de educacin.

    Las diferencias fundamentales son que, en el anlisis de regresin, tenemos unavariable dependiente y una o ms explicativas, la que son tratadas en formaasimtrica: la variable dependiente es aleatoria, tiene una distribucin de proba-bilidad, en cambio las variables explicativas toman valores fijos. En el anlisis decorrelacin las variables son tratadas de forma simtrica: la correlacin entre edu-cacin y salario es igual a la correlacin entre salario y educacin. Adems ambasvariables son aleatorias. As, si x e y son dos variables aleatorias, el coeficiente decorrelacin se define de la siguiente manera:

    yx =E {[x E(x)] [y E(y)]}

    var(x)var(y)=

    xy2x

    2y

    Lo que se calcula para una muestra de la siguiente forma:

    yx =

    ni=1

    [xi X

    ] [yi Y

    ]ni=1

    [xi X

    ]2ni=1

    [yi Y

    ]2con X = 1

    n

    ni=1 xi e Y =

    1n

    ni=1 yi.

    De ahora en adelante denotaremos con un a los estimadores de un estadsti-co obtenidos a partir de informacin muestral.

    10

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ejemplo 1: Portales de Internet, correlacin entre nmero de visitas y valor dela empresa:

    Ejemplo 2: Correlacin entre Empleo y Producto (serie de tiempo):

    11

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ejemplo 3: Correlacin entre Producto per-capita y ranking ftbol:

    Ejemplo 4: Correlacin entre temperatura media del da y estudiantes ausentesa clases:

    12

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Algunas precauciones con el coeficiente de correlacin:

    Cuidado cuando el grado de correlacin muestral depende de solo unaspocas observaciones.

    El coeficiente de correlacin mide una relacin lineal. Por lo tanto, unavariable puede depender de otra an cuando la correlacin sea cero si larelacin es no lineal.

    Correlacin no implica causalidad econmica, es slo una relacin estads-tica.

    Correlacin puede indicar relacin espuria.

    No olvidar que la correlacin muestral es una variable aleatoria y que porlo tanto, el coeficiente por si slo no garantiza la existencia de una relacinestadstica entre las series.

    13

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.2. Anlisis de regresin con dos variables

    Para esta seccin asumiremos que existe una variable dependiente (Y) que esexplicada por slo una variable (X).

    Consideremos el siguiente ejemplo. En la Tabla 1 se presentan datos de salariosy nivel de educacin para una poblacin de 60 individuos 2

    Tabla 1: Salarios y Aos de EducacinAos de Educacin (X)

    Salario (Y) 8 9 10 11 12 13 14 15 16 1716000 18260 15000 15000 20000 20000 21912 35000 40000 6000032868 36520 40000 40000 50000 54780 60000 73040 90000 12000050000 54780 58000 60000 73040 80000 89000 100000 105000 16578480000 82170 90000 90000 100000 100500 120000 140000 180000 250000100000 109560 120000 120000 140000 160000 200000 230000 280000 365200150000 170000 182600 188973 219120 257880 300000 400000 434686 600000219120 273900 280000 328680 365200 400000 500000 600000 730400 1095600300000 365200 380000 434120 500000 550000 650000 883085 1000000 1643400547800 730400 913000 821700 1064558 1460800 1500000 1826000 2487041 4000000

    E(Y|X) 166199 204532 230956 233164 281324 342662 382324 476347 594125 922220

    La poblacin tiene 10 niveles distintos de educacin, que van desde 8 a 17. Paracada uno de estos niveles tenemos 9 individuos con distintos salarios. A pesar de lavariabilidad en los salarios para cada nivel educacional considerado, en promedioel salario se incrementa a medida que los aos de educacin aumentan. Estoltimo se puede verificar al calcular el promedio para cada nivel de educacin, loque se presenta en la ltima linea de la Tabla 1, estos corresponden a los valoresesperados condicionales, ya que dependen de los valores dados de la variable X.En la Figura 2, los valores medios condicionales estn marcados con una cruz. Launin de estos valores representa la Recta de regresin poblacional, dondeel trmino poblacional se refiere a que estamos trabajando con el total de lapoblacin.

    010

    0000

    020

    0000

    030

    0000

    040

    0000

    0sa

    lario

    8 10 12 14 16 18

    x xx x

    x xx

    x xx

    Figura 2: Distribucin de los salarios para distintos niveles de educacin.

    Recta de regesinpoblacional (RRP)

    Escolaridad

    2Una poblacin de 60 individuos puede parecer un poco pequea, pero por el momentoconsideremos que estas familias son el total existente

    14

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Definicin: La curva de regresin poblacional es simplemente el lugar geomtri-co de las medias condicionales de la variable dependiente para los valores fijos dela(s) variable(s) explicativa(s).

    En el ejemplo anterior los valores de Y (salario) no estaban distribuidos de formasimtrica en torno al valor promedio para cada valor X, desde ahora asumiremosque esto si se cumple, tal como lo podemos apreciar en la Figura 3.

    Figura 3: Ingreso semanal y Gasto semanal. Distribucin simtrica

    En este ejemplo, se ve la relacin entre ingreso semanal y gasto en consumosemanal, para cada nivel de ingreso se tiene un rango de gasto que se distribuyeen forma simtrica entorno al valor promedio condicional de gasto.

    15

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.2.1. Funcin de regresin poblacional (FRP)

    De lo anterior es claro que la media condicional E(Y|Xi) es funcin de Xi, dondeXi es un valor dado de X:

    E(Y |Xi) = f(Xi) (2.1)donde f() es una funcin cualquiera, en el ejemplo anterior era una funcin lineal.La ecuacin (2.1) se denomina Regresin Poblacional.

    Que forma tiene f() es una pregunta emprica, aunque muchas veces la teora nospuede ayudar bastante. Supongamos que en nuestro ejemplo anterior el salarioesta relacionado linealmente con la educacin, as podemos suponer que la funcinde regresin poblacional E(Y|Xi) es una funcin lineal de Xi, es decir:

    E(Y |Xi) = 1 + 2Xi (2.2)donde 1 y 2 se denominan coeficientes de regresin. As el objetivo es estimar1 y 2 a partir de datos de X e Y.

    2.2.2. Especificacin estocstica de la funcin de regresinpoblacional

    En los dos ejemplos anteriores veamos que a medida que se incrementa la vari-able explicativa (educacin o ingreso), el valor promedio de la variable dependi-ente (salario o gasto) tambin se incrementaba. Sin embargo, este patrn se dasolo a nivel de promedios. A nivel individual esto no es necesariamente cierto.En la Tabla 1 podemos ver que el individuo que gana menos ingreso con 9 aosde educacin, gana menos que el individuo con 8 aos de educacin con mayorsalario.

    Existe una dispersion de los valores individuales de Yi en torno al promediocondicional de esta variable. De esta forma, podemos definir:

    ui = Yi E(Y |Xi)o

    Yi = E(Y |Xi) + ui (2.3)donde ui es una variable aleatoria no observable que toma valores positivos o neg-ativos. Este trmino surge pues no se puede esperar que todas las observaciones

    16

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Yi sean igual al promedio condicional a Xi.

    Recordemos que la regresin es una relacin estadstica, a pesar de conocer losvalores de Xi, esto no nos permite predecir en forma exacta Yi. Lo que no pode-mos explicar debido a que tiene naturaleza aleatoria se representa a travs de ui,denominado trmino de error estocstico.Entonces siguiendo el ejemplo de la Figura 3, podemos decir que el gasto de unafamilia individual (Yi) corresponde a la suma de dos componentes:

    E(Y|Xi), que corresponde a la media de gasto de todas las familias con elmismo nivel de ingresos Componente Determinsticoui Componente Aleatorio

    Si E(Y|Xi) es lineal en Xi, podemos escribir la ecuacin (2.3) de la siguienteforma:

    Yi = E(Y |Xi) + ui= 1 + 2Xi + ui (2.4)

    Tomando el valor esperado condicional en Xi a la ecuacin (2.4):

    E(Yi|Xi) = E[E(Y |Xi)|Xi] + E(ui|Xi)= E(Y |Xi) + E(ui|Xi) (2.5)

    Debido a que E(Yi|Xi) = E(Y |Xi), implica que:

    E(ui|Xi) = 0 (2.6)

    As, el supuesto de que la recta de regresin pasa a travs de las medias condi-cionales de Y, implica que la media condicional de ui es cero.

    17

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.2.3. Funcin de regresin muestral

    En la mayora de los fenmenos econmicos a estudiar, no disponemos de lasobservaciones totales de la poblacin, como hemos supuesto hasta ahora. En laprctica se tiene alcance nada ms que a una muestra de los valores de Y quecorresponden a unos valores fijos de X. En este caso tenemos que estimar la fun-cin de regresin poblacional en base a informacin muestral.

    Los datos poblacionales asociados a la Figura 3 son los siguientes:

    Tabla 2. Ingreso familiar (X) y Gasto en consumo (Y).Y|X 80 100 120 140 160 180 200 220 240 260

    Gasto en 55 65 79 80 102 110 120 135 137 150consumo 60 70 84 93 107 115 136 137 145 152familiar 65 74 90 95 110 120 140 140 155 175semanal 70 80 94 103 116 130 144 152 165 178(Y) 75 85 98 108 118 135 145 157 175 180

    - 88 - 113 125 140 - 160 189 185- - - 115 - - - 162 - 191

    Media Condicional 65 77 89 101 113 125 137 149 161 173

    Supongamos que nosotros no conocemos estos datos, es decir, no tenemos accesoa las observaciones correspondientes a la poblacin total. Tenemos a nuestra dis-posicin slo una muestra (Tabla 3), la que ha sido obtenida de forma aleatoriade la poblacin.Es importante notar que a partir de una poblacin podemos sacar una gran can-tidad de muestras en forma aleatoria y en la realidad nosotros observamos solouna de ellas. Debido a esta variabilidad en las muestras podremos estimar la FRPpero no de manera precisa. Para ejemplificar esto supongamos que adems de lamuestra en la Tabla 3 se saco otra muestra (Tabla 4) a partir de la informacinpoblacional.

    Tabla 3. Muestra aleatoriade la poblacin en tabla 2.Y X70 8065 10090 12095 140110 160115 180120 200140 220155 240150 260

    Tabla 4. Muestra aleatoriade la poblacin en tabla 2.Y X55 8088 10090 12080 140118 160120 180145 200135 220145 240175 260

    18

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Al graficar los datos de las Tablas 3 y 4 obtenemos los diagramas de dispersion enla Figura 4. En este diagrama se han trazado dos rectas de regresin mues-tral: FRM1 corresponde a la primera muestra y FRM2 corresponde a la segunda.Como vemos, no es posible asegurar cual de las dos rectas muestrales representamejor la recta de regresin poblacional.

    Entonces es importante tener en mente que las rectas de regresin muestral rep-resentan la recta de regresin poblacional, pero debido a fluctuaciones muestralespueden ser consideradas slo como una aproximacin.

    Como contraparte muestral la funcin de regresin muestral puede escribirsecomo:

    Yi = 1 + 2Xi (2.7)

    donde Yi es el estimador de E(Y|Xi), 1 es el estimador de 1 y 2 es el estimadorde 2.

    Figura 4: Rectas de Regresin basadas en dos muestras distintas

    Definicin: Un estimador es una regla, frmula o mtodo que dice cmo deter-minar el parmetro poblacional a partir de la informacin suministrada por lamuestra disponible.

    De igual manera que para el caso poblacional la funcin de regresin muestral

    19

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    tambin tiene una representacin estocstica:

    Yi = 1 + 2Xi + ui (2.8)

    Entonces, el objetivo del Anlisis de Regresin es estimar la Funcin de regresinpoblacional:

    Yi = 1 + 2Xi + ui (2.9)

    con base en la Funcin de regresin muestral:

    Yi = 1 + 2Xi + ui (2.10)

    Esta aproximacin se puede ver en la Figura 5:

    Figura 5: Rectas de Regresin muestral y poblacional

    En trminos de la funcin de regresin muestral, la Yi observada puede ser ex-presada como:

    Yi = Yi + ui (2.11)

    y en trminos de la funcin de regresin poblacional puede ser expresada como:

    Yi = E(Y |Xi) + ui (2.12)

    20

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    En la figura 5 podemos notar que para todo Xi a la derecha del punto A, Yisobreestima E(Y |Xi). De igual manera, para cualquier punto a la izquierda de A,Yi subestima E(Y |Xi). Esta sobreestimacin y subestimacin del modelo pobla-cional es inevitable debido a las fluctuaciones muestrales.

    Cmo se puede construir la funcin de regresin muestral para 1y 2 que este lo ms cerca de los valores verdaderos (poblacionales) de1 y 2?

    2.2.4. Propiedades de un Estimador

    Un estimador, siendo funcin de la muestra, es una variable aleatoria y tiene supropia distribucin de probabilidad.

    Las propiedades de los estimadores son las siguientes:

    1. Se denomina sesgo a la diferencia entre el valor esperado del estimador ysu verdadero valor: E() . De esta forma, se dice que es un estimadorinsesgado si E() = .

    2. El estimador es eficiente o de mnima varianza si no hay ningn otro esti-mador insesgado que tenga una varianza menor que . En general se trata deutilizar estimadores de varianza pequea, pues de este modo la estimacines ms precisa.

    3. El Error Cuadrtico Medio (ECM) es una propiedad de los estimadores quemezcla los conceptos de eficiencia e insesgamiento. El ECM de se definecomo:

    ECM() = E[( )2]Lo que se puede expresar equivalentemente de la siguiente manera:

    ECM() = V ar() + [Sesgo()]2

    4. La ltima propiedad de un estimador es la consistencia. El estimador es consistente si converge (en el limite) al verdadero valor del parmetro.Se dice que la sucesin de variables aleatorias X1, X2,...,Xn converge enprobabilidad a la variable aleatoria (o constante) X si:

    > 0, lmn

    Pr[|Xn X| < ] = 1Esto se denota plim Xn = X. Dos reglas tiles al respecto son:

    21

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    plim(XY

    )=plimX

    plimY

    plim (X Y )=plimX plimY

    Ejemplo: Tenemos una variable yi que esta compuesta por la suma de un com-ponente fijo o determinstico (c) y un componente aleatorio(ui):

    yi = ccomponente fijo

    + uicomponente aleatorio

    Si ui N(0, 2u), entonces:

    = E(yi) = c

    V (yi) = E[(yi E(yi))2] = E[u2i ] = 2u

    22

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ahora consideremos el siguiente estimador de la esperanza de yi, la media mues-tral:

    = Y =1

    n(y1 + y2 + ...+ yn) =

    1

    n

    ni=1

    yi

    Veamos que propiedades tiene este estimador:

    Insesgamiento: E() =

    E() = E(Y)

    = E

    (1

    n(y1 + y2 + ...+ yn)

    )=

    1

    n(E(y1) + E(y2) + ...+ E(yn))

    dado que E(yi) = E(c) + E(ui) 0

    = c,

    E() = c =

    Eficiencia: V ar()1 siempre se cumple que es ms eficiente (menor vari-anza) que 1.

    Error Cuadrtico Medio: Como es un estimador insesgado de aligual que 1, el error cuadrtico medio de ambos estimadores es igual a lavarianza del estimador, de esta forma tiene menor error cuadrtico medioque 1.

    Consistencia: es un estimador consistente dado que:

    plim() = plim(Y ) = c

    Ya que si lmn V ar(Y ) = 0 plim(Y ) = c.

    23

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.3. Modelo de regresin con dos variables

    2.3.1. Mtodo de Mnimos Cuadrados Ordinarios

    De la seccin anterior tenamos que el error estimado era:

    ui = Yi Yi= Yi 1 2Xi (2.13)

    es decir, los residuos son simplemente la diferencia entre los valores verdaderos yestimados de Y.

    Si queremos que la funcin de regresin muestral sea lo ms cercana posiblea la poblacional, debemos tratar de escoger los coeficientes de regresin (los s)de forma tal que los errores sean lo ms pequeos posible. De acuerdo a estoun criterio para escoger la funcin de regresin muestral podra ser minimizarla suma de los los errores:

    ui =

    (Yi Yi), sin embargo este criterio no es

    muy bueno. Observemos la Figura 6, existe una gran diferencia en la magnitudde los errores, sin embargo en la suma de los errores todos reciben el mismo peso.Debido a esto es posible que la suma de los errores sea muy pequea cercana acero, incluso cuando la dispersion de los errores en torno a la funcin de regresinmuestral es alta.

    Figura 6: Mnimos Cuadrados Ordinarios

    24

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Este problema puede ser solucionado al considerar la suma de los errores alcuadrado como criterio a minimizar, en este caso los errores ms lejos recibenun mayor peso:

    u2i =

    (Yi Yi)2

    =

    (Yi 1 2Xi)2 (2.14)

    El Mtodo de Mnimos Cuadrados Ordinarios (MCO) escoge 1 y 2 deforma tal que para una muestra dada,

    u2i sea lo ms pequeo posible.

    Entonces el problema que este mtodo propone resolver es el siguiente:

    mn1,2

    (Yi 1 2Xi)2 (2.15)

    las condiciones de primer orden de este problema son:

    u2i

    1= 2

    (Yi 1 2Xi) = 2

    ui = 0 (2.16)

    u2i

    2= 2

    (Yi 1 2Xi)Xi = 2

    uiXi = 0 (2.17)

    Simplificando (2.16) y (2.17) obtenemos las ecuaciones normales:Yi = n1 + 2

    Xi (2.18)

    YiXi = 1

    Xi + 2

    X2i (2.19)

    Debemos resolver un sistema con dos ecuaciones y dos incgnitas. De la ecuacin(2.18) podemos despejar 1:

    1 =

    Yi 2

    Xi

    n(2.20)

    reemplazando (2.20) en (2.19):

    YiXi =

    (Yi 2

    Xi

    n

    )

    Xi + 2

    X2i (2.21)

    De esta forma, el estimador de 2 es:

    2 =n YiXi XiYin X2i (Xi)2 (2.22)

    25

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    El que puede ser escrito de la siguiente forma (hacerlo):

    2 =

    xiyix2i

    (2.23)

    donde xi = Xi X e yi = Yi Y , con X = 1nn

    i=1Xi e Y =1n

    ni=1 Yi

    Reemplazando (2.22) en (2.20):

    1 =

    X2i

    Yi

    Xi

    XiYin X2i (Xi)2 (2.24)

    = Y 2X (2.25)

    Los resultados (2.23) y (2.25) podran haber sido obtenidos de igual forma, expre-sando inicialmente el modelo de regresin en desviaciones con respecto a la media.

    El modelo de regresin original es:

    Yi = 1 + 2Xi + ui

    si le restamos el promedio de esta:

    Y = 1 + 2X + ui (2.26)

    y recordando que el valor esperado del trmino de error es 0, tenemos el siguientemodelo de regresin lineal expresado en desviaciones con respecto a la media:

    (Yi Y ) = 2(Xi X) + uiyi = 2xi + ui

    As el problema de Mnimos Cuadrados Ordinarios es:

    mn2

    (yi 2xi)2

    La condicin de primer orden de este problema es:

    u2i

    2= 2

    (yi 2xi)xi = 0

    As obtenemos el mismo estimador de 2, encontrado en (2.23), y 1 se obtienesimplemente despejando la ecuacin (2.26):

    1 = Y 2X

    26

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    que corresponde a lo mismo en la ecuacin (2.25).

    Una vez estimados los coeficientes de regresin mediante MCO y utilizando lainformacin muestral, la recta de regresin muestral (Yi = 1 + 2Xi) puede serobtenida fcilmente.

    Ejemplo 1: Disponemos datos de una empresa qumica sobre el gasto que el-la realiza en Investigacin y Desarrollo (I+D) y las ganancias anuales de estacompaa:

    Ao Gasto en I+D Ganancia Anual(Millones de dlares) (Millones de dlares)

    1990 2 201991 3 251992 5 341993 4 301994 11 401995 5 31

    Ahora debemos debemos determinar de que forma como cambia el promediocondicional de la variable dependiente (Ganancias) cuando cambia el valor fijo dela variable explicativa (Gasto en I+D).

    La forma muestral de la recta de regresin: E(Yi|Xi) = 1 + 2Xi requiere deter-minar el valor estimado de estos parmetros, para lo cual utilizaremos el mtodo

    27

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    de mnimos cuadrados ordinarios:

    2 =n YiXi XiYin X2i (Xi)2 2 =

    YiXi nXYX2i n(X)2

    Utilicemos los datos para obtener los clculos necesarios para computar el esti-mador de 2:

    Ao Gasto en I+D (X) Ganancia Anual (Y )(n=6) (Millones de dlares) (Millones de dlares) XY X2

    1990 2 20 40 41991 3 25 75 91992 5 34 170 251993 4 30 120 161994 11 40 440 1211995 5 31 155 25Suma

    X=30

    Y=180

    XY=1000

    X2=200

    X =

    Xn

    X = 306

    X = 5 Media de los valores de la variable dependienteY =

    Yn

    Y = 1806

    Y = 30 Media de los valores de la variable independiente

    De esta forma,

    2 =1000 6 5 30200 6 (5)2

    =1000 900200 150

    =100

    50

    2 = 2

    1 = Y 2X= 30 2 5= 30 10

    1 = 20

    De esta forma, la recta de regresin muestral estimada es:

    Y = 20 + 2 X

    28

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Con esta ecuacin en mano, el gerente de I+D de esta compaa puede predecirel promedio en ganancias futuras anuales a partir de la cantidad presupuestadade gasto en Investigacin y Desarrollo. Por ejemplo, si la compaa presupuestagastar 8 millones de dlares en I+D el prximo ao, entonces debe ganar aprox-imadamente 36 millones de dlares durante este ao.

    Ejemplo 2: Tenemos los siguientes datos de portales de internet, con los cualesqueremos ver el impacto promedio del nmero de visitas en el valor de la empresa:

    vempresa visitas y-ybar x-xbar (y-ybar)*(x-xbar) (x-xbar)^2 ygorro ugorroAOL 134844 50 108787.6 30.6 3331621.0 937.9 98976.5 35867.5Yahoo 55526 38 29469.6 18.6 548871.8 346.9 70403.7 -14877.7Lycos 5533 28 -20523.4 8.6 -177014.1 74.4 46593.1 -41060.1Cnet 4067 8 -21989.4 -11.4 250129.1 129.4 -1028.3 5095.3Juno Web 611 8 -25445.4 -11.4 289441.1 129.4 -1028.3 1639.3NBC Internet 4450 16 -21606.4 -3.4 72921.5 11.4 18020.3 -13570.3Earthlink 2195 5 -23861.4 -14.4 343007.3 206.6 -8171.5 10366.5El sitio 1225 2 -24831.4 -17.4 431445.1 301.9 -15314.7 16539.7Promedio 26056.4 19.4 26056.4 0Suma 5090422.9 2137.91 2381.12

    -20076.8

    29

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Utilizando estos datos tenemos:ni=1

    (Xi X)2 = 2137,9ni=1

    (Yi Y )(Xi X) = 5090422,9

    2 =5090422,9

    2137,9= 2381,1

    1 = 26056,4 2381,1 19,4 = 20076,8

    30

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.3.2. Supuestos detrs del mtodo MCO

    En el anlisis de regresin nuestro objetivo no es slo obtener los valores de 1 y2 sino tambin hacer inferencia sobre los verdaderos 1 y 2. Nos interesa saberque tan cerca estn 1 y 2 de sus contraparte poblacional o que tan cerca esta Yide la verdadera E(Y|Xi). La Funcin de regresin poblacional: Yi = 1+2Xi+ui,nos muestra que Yi depende de Xi y ui. As, los supuestos hechos para estas dosvariables son fundamentales para lograr una interpretacin vlida de los valoresestimados de la regresin. Mientras no se especifique la forma como se generanXi y ui, no hay forma de hacer inferencia estadstica sobre Yi ni sobre 1 y 2.

    Supuesto 1: Modelo de regresin lineal, el modelo de regresin es lineal enparmetros:

    Yi = 1 + 2Xi + ui

    Supuesto 2: Los valores de X son fijos, X se supone no estocstica. Esto im-plica que el anlisis de regresin es un anlisis de regresin condicional,condicionado a los valores dados del regresor X.

    Supuesto 3: El valor medio del error ui es igual a cero. Dado el valor deX, el valor esperado del trmino de error ui es cero:

    E(ui|Xi) = 0

    Lo que nos dice este supuesto es que los factores que no estn consideradosen el modelo y que estn representados a travs de ui, no afectan sistemti-camente el valor de la media de Y. Es decir, los valores positivos de ui secancelan con los valores negativos de ui. De esta forma, el efecto promediode ui sobre Y es cero. Ver Figura 7.

    31

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Figura 7: Distribucin condicional del trmino de error ui

    Supuesto 4: Homocedasticidad o igual varianza de ui. Dado el valor deX, la varianza de ui es la misma para todas las observaciones:

    var(ui|Xi) = E[ui E(ui)|Xi]2= E(u2i |Xi) por supuesto 3= 2

    En la Figura 8 podemos apreciar el significado del supuesto de homocedas-ticidad, la variacin alrededor de la recta de regresin es la misma paratodos los valores de X. Esto implica que la funcin de densidad del trminode error ui es la misma.

    Figura 8: Homocedasticidad

    32

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Por el contrario, el la Figura 9 observamos el caso cuando la varianza deltrmino de error varia para cada Xi, en este caso particular la varianza delerror aumenta en la medida que Xi crece.

    Figura 9: Heterocedasticidad

    Esto se conoce como Heterocedasticidad o varianza desigual, lo que seexpresa de la siguiente manera:

    var(ui|Xi) = 2i (2.27)

    Supuesto 5: No existe autocorrelacin entre los errores. Dado dos valoresde X, Xi y Xj, con i 6= j, la correlacin entre ui y uj es cero:

    cov(ui, uj|Xi, Xj) = E{[ui E(ui)]|Xi}{[uj E(uj)]|Xj}= E(ui|Xi)(uj|Xj)= 0

    Si en la Funcin de regresin poblacional Yi = 1 + 2Xi + ui, ui estacorrelacionado con uj, entonces Yi no depende solamente de Xi sino tambinde uj. Al imponer le supuesto 5 estamos diciendo que solo se considerarel efecto sistemtico de Xi sobre Yi sin preocuparse de otros factores quepueden estar afectando a Y, como la correlacin entre los us.

    Supuesto 6: La covarianza entre ui y Xi es cero E(uiXi) = 0:

    cov(ui, Xi) = E[ui E(ui)][Xi E(Xi)]= E[ui(Xi E(Xi)] por supuesto E(ui) = 0= E(uiXi) E(ui)E(Xi) por supuesto E(Xi) no estocastica= E(uiXi) por supuesto E(ui) = 0

    = 0

    33

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Como mencionamos en la seccin 2.2.2 se supone que X y u tienen una in-fluencia separada sobre Y (determinstica y estocstica, respectivamente),ahora si X y u estn correlacionadas, no es posible determinar los efectosindividuales sobre Y.Este supuesto se cumple automticamente si X es no estocstica y el supuesto3 se cumple.

    Supuesto 7: El nmero de observaciones n debe ser mayor que el nmerode parmetros por estimar. El nmero de observaciones tiene que sermayor que el nmero de variables explicativas, de otra forma no se puederesolver el sistema de ecuaciones. Supongamos que tenemos una sola obser-vacin para nuestra variable dependiente y nuestra variable explicativa (Y1y X1), el modelo de regresin es tal que tiene intercepto, es decir:

    Y1 = 1 + 2X1 + u1

    el estimador MCO de 2 es :

    2 =

    xiyix2i

    donde xi = XiX e yi = YiY , sin embargo con una observacin X1 = Xe Y1 = Y , as 2 no esta determinado y as tampoco podemos determinar1.

    Supuesto 8: Variabilidad en los valores de X. No todos los valores de X enuna muestra deben ser iguales, var(X) debe ser un nmero finito positivo.Si las X son las mismas Xi = X, de esta forma ni 2 ni 1 pueden serestimados.

    Supuesto 9: El modelo de regresin esta correctamente especificado.Esto es muy importante, ya que por ejemplo la omisin de variables impor-tantes en el modelo, o la eleccin de la forma funcional inadecuada, o laconsideracin de supuestos estocsticos equivocados sobre las variables delmodelo, harn cuestionable la validez de la interpretacin de la regresinestimada. (Aspectos que veremos ms adelante).

    34

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.3.3. Errores estndar de los Estimadores Mnimos Cuadra-dos Ordinarios

    Como vimos en la seccin 2.3.1, los valores estimados para 1 y 2 dependen delos datos muestrales, sin embargo, los datos cambian de una muestra a otra y aslos valores estimados tambin, por eso es necesario tener una medida que nos per-mita decir que tan cercano son los valores estimados a los valores poblacionalesde los parmetros.La medida que utilizaremos para medir la precisin del estimador es el error es-tndar, que es la desviacin estndar de la distribucin muestral del estimador,la que a su vez es la distribucin del conjunto de valores del estimador obtenidosde todas las muestras posibles de igual tamao de una poblacin dada.

    Recordemos el estimador MCO de 2:

    2 =

    xiyix2i

    donde yi = 2xi+ui (modelo poblacional en desviaciones con respecto a la media).De esta forma reemplazando yi en el estimador de 2:

    2 =

    xi(2xi + ui)

    x2i

    = 2

    x2ix2i

    +

    uixix2i

    = 2 +

    uixix2i

    Aplicando valor esperado a la expresin anterior:

    E(2) = 2 + E

    (uixix2i

    )= 2 +

    (E(ui)xix2i

    )por supuesto 2

    = 2 por supuesto 3 (2.28)

    La ecuacin (2.28) nos dice que en valor esperado el estimador MCO de 2 esigual a su verdadero valor. Esta propiedad del estimador MCO se conoce comoinsesgamiento.

    35

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ahora procedamos a calcular la varianza de el estimador MCO de 2:

    var(2) = E[2 E(2)]2= E(2 2)2

    = E

    ([

    xiui]2

    [

    x2i ]2

    )Por supuesto 4 E(u2i ) = 2 y por supuesto 6 E(uiuj) = 0, esto implica que:

    var(2) =2x2i

    (2.29)

    2.3.4. Estimador Mnimo Cuadrado Ordinario de 2

    Ahora debemos estimar el parmetro poblacional 2, como este corresponde alvalor esperado de u2i y ui es una estimacin de ui, por analoga:

    2 =

    ni=1 u

    2i

    npareciera ser un estimador razonable. Pero los errores de MCO, estn estimadosimperfectamente si los comparamos con los errores poblacionales, ya que depen-den de una estimacin de 1 y 2. Veamos esto con ms detalle:

    Partiendo del Regresin poblacional expresado en desviaciones con respecto ala media:

    yi = 2xi + (ui u) (2.30)y recordando tambin que:

    ui = yi 2xi (2.31)Al sustituir (2.30) en (2.31), se obtiene:

    ui = 2xi + (ui u) 2xiElevando al cuadrado la expresin anterior, aplicando sumatoria y tomando valoresperado:

    E(

    u2i

    )= E(2 2)2

    x2i + E

    [(ui u)2

    ]

    (i)

    2E[(2 2)

    xi(ui u)

    ]

    (ii)

    = var(2)

    x2i + (n 1)var(ui) 2E[

    xiuix2i

    xi(ui u)

    ]= 2 + (n 1)2 22= (n 2)2

    36

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    (i) E[

    (ui u)2]

    = E[

    (u2i 2uiu+ u2)]

    = E[

    u2i 2u

    ui + nu2]

    = E[

    u2i 2un

    n

    ui + nu

    2]

    = E[

    u2i 2nu2 + nu2]

    = E[

    u2i nu2]

    = E

    [u2i n

    (uin

    )2]= n2 n

    n2

    = (n 1)2

    (ii) E[(2 2)

    xi(ui u)

    ]= E

    [(2 2)

    xi(ui u)

    ]= E

    [xiuix2i

    xi(ui u)

    ]= E

    [(

    xiui)2

    x2i u

    xiui

    xi

    x2i

    ]= 2

    Por lo tanto se define el estimador de la varianza 2 como:

    2 =

    u2i

    n 2 (2.32)

    De forma tal que, 2 es un estimador insesgado de 2:

    2 =1

    n 2E(

    u2i

    )= 2

    37

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.4. Modelo de Regresin con k variables

    Ahora abandonemos la simplificacin de solo usar dos variables, de ahora en ade-lante generalizaremos el modelo de regresin lineal para que pueda tener hasta kvariables explicativas.

    Aclaracin: haremos un cambio de notacin, cada observacin i de la variabledependiente ser denotada por yi y cada observacin i de una variable explicati-va, por ejemplo X1, ser denotada por x1i. Ahora las variables en minscula nosignifica que estn en desvos.

    El Modelo de Regresin Poblacional en este caso es:

    yi = 1 + 2x2i + 3x3i + ...+ kxki + ui i = 1, ..., n

    2.4.1. Representacin Matricial del Modelo de RegresinLineal

    El modelo con k variables explicativas puede ser expresado en notacin matricial.En efecto, cada variable explicativa xj, con j=1,..., k, es un vector columna dedimensin n, al igual que la variable dependiente y el trmino de error. De estemodo, el modelo puede ser reescrito de la siguiente forma:

    y1y2...

    yn

    =11...1

    1 +

    x21x22

    ...x2n

    2 +

    x31x32

    ...x3n

    3 + ...+

    xk1xk2

    ...xkn

    k +

    u1u2...

    un

    Donde las variables explicativas se pueden agrupar en una sola matriz de dimen-sin nk, que denotaremos simplemente como X, de esta manera el modelo seexpresa de la siguiente forma:

    y1y2...

    yn

    =1 x21 x31 xk11 x22 x32 xk2...

    ...... . . .

    ...1 x2n x3n xkn

    12...

    k

    +

    u1u2...

    un

    Y = X + u(2.33)donde Y es un vector de dimensin n1, X es la matriz de variables explicativasde dimensin nk y u es un vector correspondiente al trmino de error con di-mensin n1.

    38

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ahora debemos expresar la distribucin del trmino de error en trminos ma-triciales:

    E(u) =

    E(u1)E(u2)

    ...E(un)

    = 0n1

    E(uu) =

    E(u21) E(u1u2) E(u1un)E(u2u1) E(u

    22) E(u2un)

    ...... . . .

    ...E(unu1) E(unu2) E(u2n)

    =2 0 00 2 0...

    ... . . ....

    0 0 2

    = 2 InnDe los supuestos 3, 4 y 5, tenemos entonces que el trmino de error tiene lasiguiente distribucin:

    u (0n1

    , 2 Inn

    )(2.34)

    2.4.2. Estimador Mnimo Cuadrados Ordinarios

    El mtodo de MCO, plantea que los parmetros del modelo pueden ser estimadosminimizando la suma de los errores al cuadrado (SE()), la que en trminosmatriciales equivale a:

    SE() =ni=1

    u2i = uu

    donde u = Y X. Entonces el problema de minimizar la suma de los errores alcuadrado se expresa de la siguiente forma:

    mn

    SE() = mn

    [(Y X)(Y X)

    ]= mn

    [Y Y 2X Y + X X

    ]

    SE()

    = 2X Y + 2X X = 0

    = (X X)1X Y (2.35)

    39

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    De (2.35) tenemos:

    X (Y X) = 0 X u = 0 (2.36)(2.36) es la condicin de ortogonalidad.

    De esta forma, el vector de parmetros estimados se obtiene de resolver elsiguiente sistema de ecuaciones normales:

    X X = X Y

    1 1 1 1x2,1 x2,2 x2,3 x2,nx3,1 x3,2 x3,3 x3,n...

    ...... . . .

    ...xk,1 xk,2 xk,3 xk,n

    1 x2,1 x3,1 xk,11 x2,2 x3,2 xk,21 x2,3 x3,3 xk,3...

    ...... . . .

    ...1 x2,n x3,n xk,n

    123...k

    =

    1 1 1 1x2,1 x2,2 x2,3 x2,nx3,1 x3,2 x3,3 x3,n...

    ...... . . .

    ...xk,1 xk,2 xk,3 xk,n

    y1y2y3...yn

    n

    ni=1 x2,i

    ni=1 x3,i

    ni=1 xk,in

    i=1 x2,in

    i=1 x22,i

    ni=1 x2,ix3,i

    ni=1 x2,ixk,in

    i=1 x3,in

    i=1 x3,ix2,in

    i=1 x23,i

    ni=1 x3,ixk,i

    ......

    ... . . ....n

    i=1 xk,in

    i=1 xk,ix2,in

    i=1 xk,ix3,i n

    i=1 x2k,i

    123...k

    =

    ni=1 yin

    i=1 yix2,ini=1 yix3,i

    ...ni=1 yixk,i

    Es importante recordar que el estimador MCO esta definido solo cuando la matriz(XX) es invertible, lo que ocurre siempre y cuando:

    1. Las k columnas de la matriz X sean linealmente independientes.

    2. Se disponga al menos de tantas observaciones como variables explicativas,es decir: n k.(Supuesto 7)

    Pongamos atencin en el segundo supuesto, cuando n=k la matriz X tiene dimen-sin kk, por lo tanto salvo que no se cumpla el supuesto 8, X es invertible, y deesta forma (X X)1 = X1(X )1 y por lo tanto:

    = (X X)1X Y = X1(X )1X Y = X1Y (2.37)

    40

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    el vector de residuos u = Y X = Y X(X1Y ) = Y Y = 0n, de esta formael ajuste es perfecto, ya que todos los residuos son cero, la suma residual de igualforma toma el mnimo valor posible, cero.Sin embargo, esta no es una caracterstica deseable, el ajuste perfecto ocurreporque tenemos una muestra muy reducida. Esto trae como consecuencia pocorobustez e imprecisin en las estimaciones. Si escogemos una nueva muestra, delmismo tamao que la anterior, obtendremos otro estimador con suma residual0, que puede diferir en forma arbitraria del anterior.

    Para lograr estimaciones precisas de los parmetros, es necesario tener un nmerode observaciones notablemente superior al de las variables explicativas. La difer-encia n-k se conoce como el nmero de grados de libertad de la estimacin.

    2.5. Propiedades del estimador MCO

    Notemos que el vector es un vector aleatorio, ya que depende del vector deerrores:

    = (X X)1X Y = (X X)1X (X + u) = + (X X)1X u (2.38)

    E() = E() + E[(X X)1X u]

    = + (X X)1X E(u)

    La esperanza de es el mismo parmetro, ya que este es un constante (valorpoblacional), y por supuestos 2 y 3 el segundo trmino de la expresin anteriores cero,

    E() = (2.39)

    Es decir, el estimador MCO es insesgado, tal como lo habamos mostrado en laecuacin (2.28).

    De (2.38) podemos definir el error de estimacin o sesgo como:

    = (X X)1X u

    41

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Ahora calculemos la varianza de :

    var() = E[( E()) ( E())]= E[( ) ( )]= E[(X X)1X uuX(X X)1]

    = (X X)1X E(uu)X(X X)1

    = (X X)1X (2In)X(X X)1

    = 2(X X)1 (2.40)

    Para poder estimar la varianza de necesitamos reemplazar 2 en (2.40) por suestimador insesgado:

    2 =uun k

    2.5.1. Propiedad de mejor estimador lineal insesgado

    Se dice que , es el mejor estimador lineal insesgado (MELI) de si se cumplelo siguiente:

    1. El lineal, es decir, es una funcin lineal de una variable aleatoria, como lavariable y en el modelo de regresin.

    2. Es insesgado, es decir, su valor esperado, E(), es igual a el verdaderovalor, .

    3. Tiene varianza mnima dentro de la clase de todos los estimadores linealesinsesgados; un estimador insesgado como varianza mnima es conocido comoun estimador eficiente.

    2.5.2. Teorema de Gauss-Markov

    Proposicin: El estimador MCO es el estimador lineal insesgado ptimo, en elsentido de que cualquier otro estimador lineal e insesgado tiene una matriz de co-varianza mayor que la del estimador MCO. Es decir, el estimador MCO es MELI.

    Demostracin: Sea = Ay un estimador lineal de , donde A es una matriz

    42

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    kn. Denotemos A = A (X X)1X , de modo que:

    = [A+ (X X)1X ]Y

    = [A+ (X X)1X ](X + u)

    = AX + + [A+ (X X)1X ]u

    Aplicando esperanza a la expresin anterior:

    E() = AX + + [A+ (X X)1X ]E(u)

    = AX +

    El estimador ser insesgado solo si la matriz A es tal que AX=0kk. De estaforma:

    = + [A+ (X X)1X ]u

    y su matriz de covarianza ser:

    cov() = E[( )( )]= E{([A+ (X X)1X ]u)([A+ (X X)1X ]u)}= 2AA + 2(X X)1

    cov()

    Como la matriz AA es semidefinida positiva, se concluye la diferencia entre lacovarianza de y es una matriz semidefinida positiva, con lo que la covarianzade es mayor o igual a la covarianza de

    43

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.6. Geometra del Estimador MCO

    Recordemos que el modelo de regresin muestral tiene la siguiente expresin:

    Y = X + u

    la que puede ser reescrita de la siguiente forma:

    Y = PY +MY (2.41)

    donde P se denomina matriz de proyeccin y se define de la siguiente manera:

    P = X(X X)1X

    Adems se tiene que M=I-P. De acuerdo a la ecuacin (2.36) el estimador MCO estal que los errores son ortogonales a las X, es decir se deben escoger los parmet-ros de forma tal que el vector de errores sea ortogonal al espacio formados porlas variables explicativas.

    As, el estimador MCO nos permite descomponer Y en dos trminos ortogonalesentre si: el primer componente puede ser escrito como una combinacin linealde las columnas x y el segundo es un componente ortogonal a X (el trmino deerror), tal como lo muestra (2.41). Esto se representa grficamente en la Figura10.

    Col X

    Y

    MY

    PY

    0

    Figura 10: Descomposicin Ortogonal de Y

    x1

    x2

    El trmino PY alternativamente se puede ver como la proyeccin de Y en elespacio barrido por las Xs y MY como la proyeccin de Y es el espacio ortogonala las Xs.

    44

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.7. Bondad de Ajuste y Anlisis de Varianza

    El objetivo de esta seccin es introducir un criterio de ajuste de nuestra regre-sin, es decir, un criterio que nos indique cuan bien se ajusta nuestro modelo ala muestra.

    En principio, podramos pensar que la suma de los residuos cuadrados, es de-cir, nuestro criterio original de ajuste, es una buena opcin: a menor sea ste,mejor es nuestro ajuste. Sin embargo, la suma de los residuos cuadrados puedeser arbitrariamente escalada al multiplicar la variable dependiente (Y) por el fac-tor de escala deseado, lo cual invalida su uso como criterio de ajuste.

    Por ello, se ha desarrollado un criterio que elimine el problema anterior. Di-cho estadstico ya no se basar en la magnitud de un valor (como la suma delos cuadrados de los residuos), sino que intentar preguntarse si la variacin delas variables independientes (X) explica la variacin de la variable independi-ente, como veremos ms adelante. Para ello analizaremos con un poco ms deprofundidad el modelo de regresin lineal en desvos con respecto a la media ypresentaremos la llamada descomposicin de varianza (o anlisis de varianza),ambos, insumos fundamentales para obtener nuestro estadstico de bondad deajuste.

    2.7.1. Modelo de Regresin Lineal en Desvos

    Sea el modelo poblacional usual con k variables:

    yi = 1 + 2x2i + 3x3i + + kxki + ui (2.42)

    donde i = 1 . . . n y cuya contraparte estimada es:

    yi = 1 + 2x2i + 3x3i + + kxki + ui (2.43)

    Luego, si sumamos para todas las observaciones y dividimos a ambos lados porel tamao muestral n, tenemos:

    Y = 1 + 2x2 + 3x3 + + kxk (2.44)

    por lo cual:

    1 = Y 2x2 + 3x3 + + kxk (2.45)

    45

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    La ecuacin (2.45) muestra que el trmino independiente de una regresin quedadeterminado por el resto de los k-1 coeficientes involucrados. Finalmente, noteque restando las ecuaciones (2.43) y (2.44) obtenemos:

    yi Y = 2(x2i x2) + 3(x3i x3) + + k(xki xk) + ui (2.46)

    la cual es una expresin similar a (2.43), excepto por dos importantes diferencias.Primero, el modelo no posee constante y segundo, las variables se encuentranexpresadas en desvos con respecto a la media. A pesar de ello, note que los coe-ficientes y los residuos son los mismos en ambos modelos.

    De lo anterior surge un importante corolario respecto del trmino constante denuestro modelo. En general, el inters del investigador se centra en el impacto delos regresores sobre la variable dependiente, por lo cual, el trmino constante noes ms que una correccin que garantiza que los promedios muestrales de ambosmiembros del modelo economtrico coincidan.

    Para transformar en desvos con respecto a la media un modelo en trminos ma-triciales, introduciremos una matriz fundamental para el anlisis de esta seccin.Denotaremos por M0 una matriz de n n, definida como:

    M0 = Inn

    ii

    n=

    1 0 00 1 0...

    ... . . ....

    0 0 1

    1n1 1 11 1 1...

    ... . . ....

    1 1 1

    =1 1

    n 1

    n 1

    n 1n

    1 1n 1

    n...... . . .

    ... 1

    n 1

    n 1 1

    n

    donde I es la identidad (nn) e i corresponde al vector unitario de dimensin n.Dicha matriz es singular, simtrica (M0=M0) e idempotente (M0M0=M0). Engeneral, M0 es conocida como matriz de desvos, ya que resta a cada columna dela matriz involucrada, su media aritmtica. Por ejemplo, es fcil comprobar que:

    M0Y = Y 1niiY =

    y1y2...yn

    1nn

    i=1 yini=1 yi...ni=1 yi

    =y1 Yy2 Y

    ...yn Y

    Por lo tanto, nuestro modelo expresado en matrices, puede ser expresado en tr-minos de desvo con respecto a la media como:

    M0Y =M0X +M0u (2.47)

    46

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.7.2. Anlisis de Varianza

    Suponga entonces el siguiente modelo poblacional:

    Y = X + u

    donde Y corresponde a una vector n 1, X corresponde a nuestra matriz de re-gresores que incluye un trmino constante, tal que X es de n k y u correspondea nuestro vector de errores de n 1.

    Buscamos entonces definir la variacin de la variable dependiente (Suma de loscuadrados totales = TSS) como3:

    TSS =ni=1

    (Yi Y )2 (2.48)

    Para encontrar entonces una expresin para (2.48), de la ecuacin (2.47) tenemosque nuestro modelo estimado en desvos con respecto a la media es:

    M0Y =M0X +M0u

    con lo cual, al particionar nuestra matriz X en X = [i X2], nuestro vector deparmetros en = [1 2] y considerando que M0i = 0 y que M0u = u,tenemos que:

    M0Y = M0i1 +M0X22 +M

    0u

    = M0X22 + u (2.49)

    Luego, para formar la TSS(suma de los cuadrados totales o la suma de los cuadra-dos de las desviaciones de Y con respecto a su media), de la ecuacin (2.48),multiplicamos por Y la ecuacin (2.49):

    Y M0Y = Y (M0X22 + u)

    = (X + u)(M0X22 + u)

    = X M0X22 + X u+ uM0X22 + uu

    Y M0Y = 2X 2M0X22 + u

    u (2.50)TSS = ESS +RSS (2.51)

    donde el segundo y el tercer trmino desaparecen gracias a que los residuos estima-dos son, por construccin, ortogonales a las variables explicativas 4. La igualdad

    3Note que para dicha definicin utilizamos los cuadrados de la desviaciones, ya que la sumade las desviaciones es siempre cero.

    4Ya que X u = X (Y X) = X Y X Y = 0.

    47

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    anterior es conocida como la descomposicin de varianza. El trmino de laizquierda corresponde a TSS o la suma de los cuadrados de las desviaciones dela variable dependiente. En otras palabras, la variabilidad de Y. En la derecha seencuentra la variabilidad de las variables independientes o regresores y la variabil-idad de los errores. Cul es entonces el objetivo?: descomponer la varianza dela variable dependiente aquella parte que es explicada por la regresin (ESS) deaquella parte explicada por los residuos (RSS). Por qu?: porque intuitivamente,la regresin se ajusta mejor si las desviaciones de Y se explican en su mayor partepor desviaciones de X y no por desviaciones de los residuos.

    2.7.3. Bondad de Ajuste: R2 y R2

    Definimos entonces la bondad de ajuste del modelo a travs del siguiente estad-grafo llamado tambin coeficiente de determinacin:

    R2 =ESS

    TSS(2.52)

    es decir, como la proporcin de la varianza de Y que es explicada por la varianzade la regresin. Alternativamente:

    R2 = 1 RSSTSS

    (2.53)

    Note que:

    1. El coeficiente de determinacin es siempre menor a 1. Ello porque RSS TSS y por lo tanto RSS

    TSS 1.

    2. El anlisis de varianza anterior fue derivado bajo el supuesto que el modeloinclua una constante (por ello utilizbamos la matriz M0). En dicho caso,necesariamente R2 0. En caso de que el modelo no incluya una constante,se debe utilizar la frmula (2.5.2) utilizando TSS=YY (sin desvos).

    3. Al agregar regresores al modelo, el R2 nunca decrecer (se mantendr con-stante o aumentar)

    4. No es claro cuan bueno sea como predictor de ajuste.

    Para ver este ltimo punto, suponga que usted posee el siguiente modelo pobla-cional:

    Y = 1 + 2X + u

    48

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    donde X es un vector (n 1). Suponga ahora que restamos X a ambos lados denuestro modelo. Obtenemos entonces:

    Y X = 1 + X + u

    Si 2 1, entonces es fcil verificar que el R2 del primer modelo ser cercano a1, mientras que el del segundo sera cercano a cero, a pesar de que los modelosson matemticamente equivalentes. A pesar de lo anterior, en trabajos aplicados,el R2 es ampliamente utilizado, por lo cual se recomienda su publicacin.

    Retrocedamos ahora al punto tres. El nos dice que el coeficiente de determinacinprobablemente crecer al incluir regresores. Ello plantea incentivos a incluir re-gresores no relevantes para nuestro modelo, con el fin de obtener un mejor ajuste.Porqu sucede esto?, ya que al incluir regresores, la RSS necesariamente decrece(o en el mejor de los casos se mantiene), mientras que la TSS permanece constante.

    Por esta razn se cre el coeficiente de determinacin ajustado, el cual corrige elR2 original por los grados de libertad del numerador y el denominador. Entonces,definimos el R2 ajustado (R2) como:

    R2 = 1 uu/(n k)

    Y MY/(n 1) (2.54)

    o equivalentemente:

    R2 = 1 (1R2) (n 1)(n k) (2.55)

    49

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.8. Inferencia

    Una vez que hemos estimado nuestra regresin muestral, es necesario preguntarsecuan buena aproximacin es dicha regresin de la poblacional. Para que la aprox-imacin sea cercana, es condicin necesaria que los parmetros incluidos en laregresin muestral sea estadsticamente distintos de cero (en caso contrario, nopertenecen a la regresin poblacional). As, uno de nuestros objetivos puede serel testear la significancia individual de los parmetros.

    Pero lo anterior es slo una de las preguntas que como investigadores podemosestar interesados en responder. Por ejemplo, en la estimacin de la funcin deproduccin de una firma, que asumimos Cobb Douglas (Y = AKLeu o en loga-ritmo lnY = lnA+ lnK+ lnL+u), podemos estar interesados en descubrir sila firma presenta rendimientos constantes, crecientes o decrecientes a la escala, locual se reflejar en que + > o 1. Por lo tanto, ello podra ser otra hiptesisinteresante de plantearse. Tambin podra ser interesante descubrir si todos losparmetros a la vez son distintos de cero, o de algn valor determinado.

    La gama de preguntas posibles respecto del valor de los parmetros es slo aco-tada por la pregunta que el investigador desee responder. Nuestro objetivo es,por lo tanto, desarrollar los mtodos de inferencia y contraste de hiptesis quenos permitan responder, en el contexto de una regresin muestral particular, laspreguntas anteriores.

    Dos notas precautorias. En esta seccin nos ocuparemos de restricciones o hipte-sis lineales sobre los coeficientes. Restricciones no lineales son ms escasas eneconometra aplicada y se desarrollan en contexto de un modelo particular. Se-gundo, en todo lo que se refiere a este apartado, asumiremos que los errores denuestra regresin muestral siguen una distribucin normal (ya veremos porqu).

    Entonces, sea nuestro modelo poblacional

    Y = X + u

    donde X es una matriz de (n k),u e Y son vectores (n 1) y es vector de(k 1).

    Sean entonces las siguientes hiptesis:

    1. H0: i = 0 Plantea que el regresor Xi no posee influencia alguna sobre Y.Este es el test ms comn y nos referiremos a l como test de significancia.

    50

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2. H0: i = i0 Plantea que el regresor Xi posee un impacto determinadopor i0 sobre Y.

    3. H0: i + j=1 Plantea que la suma de los regresores Xi y Xj poseen unimpacto conjunto de magnitud 1.

    4. H0: i = j Plantea que los regresores Xi y Xj poseen el mismo impactosobre Y.

    5. H0: i=0 i=2. . . k Plantea que todos los regresores conjuntamente,excepto la constante, son cero.

    6. H0: l=0 donde el vector ha sido particionado en dos (l y p) con di-mensiones (kl 1) y (kp 1) respectivamente, tal que kl + kp = k. Planteaentonces que un subconjunto de parmetros son estadsticamente no signi-ficativos.

    Todas las hiptesis anteriores pueden ser resumidas en la siguiente expresin:

    R = r

    donde R es una matriz de (q k) constantes conocidas (ceros o unos), cuyo obje-tivo ser seleccionar los parmetros a testear, cuyo nmero de filas, q, representael nmero de restricciones. A su vez, r es un vector de dimensin q y contiene elreal al cual es restringido cada parmetro. Veamos como sern las matrices R yr en cada una de nuestras hiptesis:

    1. R=[0. . . 010 . . . 0]; r=0; q=1donde 1 se encuentra en la i-sima posicin

    2. R=[0. . . 010 . . . 0]; r=i0; q=1donde 1 se encuentra en la i-sima posicin

    3. R=[0. . . 010 . . . 010 . . . 0]; r=1; q=1donde 1 se encuentra en la i-sima posicin y en la j-sima posicin.

    4. R=[0. . . 010 . . . 0-10 . . . 0]; r=0; q=1donde 1 se encuentra en la i-sima posicin y en la j-sima posicin.

    5. R=[0q1 Ik1]; r=0; q=k 1

    6. R=[0kikj Iki ]; r=0; q=ki

    51

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Entonces, nuestra hiptesis nula corresponde a:

    H0 : R = r (2.56)

    con lo cual, slo nos resta derivar el test que nos permita rechazar o no rechazarnuestra nula. La construccin del estadgrafo es como sigue. Dado que MCO(bajo los supuestos relevantes) es insesgado, tenemos que E() = , por lo tanto,E(R) = R, mientras que la varianza de R corresponde a

    V [R] = E[R( )( )R]= RV ar()R

    = 2R(X X)1R

    Necesitamos an un supuesto ms para determinar la distribucin muestral denuestra nula. Dado que es funcin de u y u N(0, 2), entonces N(, 2(X X)1)y por lo tanto R N(r, 2R(X X)1R), entonces:

    N [, 2(X X)1] (2.57)y

    R N [R, 2R(X X)1R] (2.58)y si la nula R = r es cierta:

    (R r) N [0, 2R(X X)1R] (2.59)luego estandarizamos, con lo cual:

    (R r)2R(X X)1R

    N [0, 1] (2.60)

    Adems, se puede demostrar que (hacerlo)5:

    uu2

    2(nk) (2.61)

    Luego, se puede demostrar que (hacerlo)6:

    (R r)[2R(X X)1R]1(R r) 2q (2.62)5Basta con recordar que si x corresponde a un vector de realizaciones normales (0,1), por lo

    cual x N(0, 2I) y A corresponde a una matriz simtrica e idempotente de rango n, entonces12x

    Ax 2n . Finalmente, recuerde que u =MY =Mu y que el rango de una matriz simtricae idempotente es su traza.

    6Basta con recorder que si el vector x, de dimensin n, es tal que x N(0,), entonces,x1x 2n.

    52

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    luego, combinando los dos resultados anteriores, se puede demostrar que (hacer-lo)7:

    [(R r)[R(X X)1R]1(R r)]/quu/(n k) F(q,nk) (2.63)

    El test expuesto en (2.63) corresponde a la forma general del test F. Dicho testes de utilidad para testear cualquier hiptesis de la forma expuesta en (2.56). Acontinuacin veremos subcasos de dicho test general.

    2.8.1. Test t (Una hiptesis lineal)

    Reescribiendo el test F como:

    [(R r)[RV ar()R]1(R r)] F(q,nk)y haciendo el reemplazo respectivo de R y r correspondientes a las hiptesis 1 o2 (H0: i = 0 = i0), llegaremos a:

    F =( i0)2V ar(i)

    F (1, n k) (2.64)

    Recordando que t2 es una caso particular de una F con un grado de libertad enel numerador, tenemos que:

    t = i0V ar(i)

    tnk (2.65)

    Lo anterior es conocido como el test t (test de significancia) y en su versin msutilizada corresponde a t =

    V ar(i), donde se busca testear la hiptesis nula de

    que el parmetro es cero.El test t tambin cubre los casos 3. y 4.. En el caso 3. por ejemplo (H0: i+j=1),el estadgrafo corresponder a:

    t =i + j 1

    V ar(i) + 2Cov(i, j) + V ar(j) tnk (2.66)

    La distribucin t es simtrica y se aproxima a la normal para tamaos de muestras7Slo un poquito de lgebra y recordar como se construye una distribucin F(q, n-k) a partir

    de la divisin de dos 2 con grados de libertad q en el numerador y n-k en el denominador.

    53

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    grandes, sin embargo, la t posee colas ms gruesas que la normal (lo cual es mspronunciado en muestras pequeas: n30). La siguiente figura expone la relacinentre la distribucin t y la normal:

    Distribucin Normal

    Distribucin t

    Probabilidad

    0

    Nota precautoria:

    Toda la derivacin anterior se basa en el estricto supuesto de normalidad delos errores. En caso de que los mismos no distribuyan normal, la distribucindel test F (y por lo tanto el del t) es desconocida en muestras finitas. Sin em-bargo, es posible demostrar que t a N(0, 1), es decir, que el test t distribuyeasintticamente normal. Luego, los valores crticos de t y (normal estndar)se encuentran sumamente cerca si n-k30, por lo cual, en trminos prcticos noimporta mucho cual de ellas escojamos para los valores crticos (a menos que lamuestra sea especialmente pequea).

    Finalmente, nos queda examinar los criterios de rechazo del test y los nivelesde confianza. Como usted recordar de sus clases de estadstica, lo anterior de-pende de como especifiquemos la hiptesis alternativa. A continuacin, pasamosa revisar este punto.

    54

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Criterio de Rechazo y Nivel de Confianza

    Una vez que hemos calculado el valor del test para nuestra nula particular (ovalor calculado), resta calcular el valor crtico o el valor que nos indica la tabla t.Dicho valor crtico nos dir si nuestra nula es falsa o si no podemos afirmar que loes. La eleccin de dicho valor crtico se toma desde la tabla de distribucin t y elnmero debe ser escogido tomado en cuenta el nivel de significancia escogido(1%, 5% o 10%), el cual a su vez determina el nivel de confianza del test(99%, 95% o 90%, respectivamente). El nivel de confianza posee una explicacinintuitiva: Nuestro estadgrafo es funcin de la muestra con lo que estamos traba-jando, por lo cual, si contramos con una gran nmero de ellas y con cada unapudisemos calcular nuestro estadgrafo, el nivel de confianza indica el porcenta-je de veces que calculamos nuestro estadgrafo en que realmente no rechazamoslo cierto o rechazamos correctamente lo falso. La forma en que se distribuya laprobabilidad de rechazo, es decir, el nivel de significancia, depende de nuestrahiptesis alternativa. A continuacin revisamos dicho asunto. Test de una cola

    Supongamos que nuestra hiptesis es:

    H0 : i = io

    H1 : i > io

    donde i0 R. En dicho caso, el estadgrafo es calculado segn lo propuesto en laseccin anterior. El punto est en como acumulamos la probabilidad de rechazo.En este caso, el total de la probabilidad de rechazo se acumula en la cola derechade la distribucin, como lo muestra la siguiente figura8:

    8Por qu en la cola derecha? Porque la probabilidad de rechazo, es decir, el nivel de sig-nificancia, nos indica hasta donde puedo tolerar un valor mayor a io, por lo cual, carecera desentido que la zona de rechazo se encuentre en la cola izquierda de la distribucin. Por ejemplo,si io=0, la distribucin de nuestro estadgrafo se centra en cero (vea la frmula), por lo cual lahiptesis alternativa correspondera a que el parmetro es positivo. el punto es cun positivopuedo aceptar que sea?.

    55

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Probabilidad

    No se RechazaSe Rechaza (5%)

    por lo tanto, rechazaremos nuestra hiptesis nula de que el coeficiente es cerocontra la hiptesis alternativa que el parmetro es mayor que io, si el valor cal-culado del test es mayor al valor crtico de la tabla t. En el caso que H1 sea queel parmetro es menor a io, entonces la probabilidad de rechazo se concentra enla cola izquierda y se rechaza la nula en el caso que el valor calculado sea menorque el valor crtico de la tabla t.

    Test de dos colas

    Supongamos que nuestra hiptesis es:

    H0 : i = io

    H1 : i 6= io

    En este caso estamos repartiendo uniformemente la probabilidad de rechazo enambas colas de la distribucin como lo muestra la siguiente figura (al 95% deconfianza):

    56

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Probabilidad

    No se RechazaSe Rechaza (2,5%)Se Rechaza (2,5%))

    Por lo tanto, rechazaremos la nula si el valor calculado es en mdulo mayor queel valor crtico de tabla. Note que en este caso, la probabilidad de rechazo sereparte un partes iguales en ambas colas. Ello se justifica en que la distribucint corresponde a una distribucin simtrica.

    Error de Tipo I, Error de Tipo II, Tamao y Potencia de un test

    Antes de continuar, veremos cuatro conceptos estadsticos importantes que nosindican caractersticas de nuestro test.

    1. Error de Tipo I (ETI): Corresponde a la probabilidad de rechazar lanula cuando es cierta.

    2. Error de Tipo II (ETII): Corresponde a la probabilidad de aceptar lanula cuando es falsa.

    3. Tamao del Test: Corresponde la probabilidad de cometer ETI. Se definecomo el nivel de significancia del test ().

    4. Potencia del Test: Corresponde a la probabilidad de rechazar la nulacuando es falsa. Se define como Potencia =1-ETII.

    El ptimo para el investigador sera minimizar ambos tipos de errores y tener untest con un menor tamao y mayor potencia posibles, sin embargo, note que el

    57

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    tamao del test y por lo tanto, el ETI, es una variable endgena al investigador,en tanto que l decide con que nivel de confianza trabajar. Luego, el objetivo setransforma en, dado un nivel de confianza, minimizar la ocurrencia de ETII.

    Intuitivamente, si usted escoge un nivel de significancia pequeo (1%, por ejemp-lo), sus zonas de rechazo sern pequeas, con lo cual, inevitablemente, la zona deno rechazo crece, lo cual implica que por minimizar el ETI, ha aumentado el ETII.

    P-value

    Otra forma alternativa al valor crtico de tabla para rechazar o no rechazar nues-tra nula, corresponde al uso de los llamados p-values, los cuales son reportadosen cualquier paquete estadstico. El p-value (p) se define como:

    p = p(tcalculado) = P (|Z| |tcalculado|) = 2(1 (|tcalculado|)) (2.67)es decir, el p-value representa la probabilidad de que el valor crtico (t de tabla, ennuestro caso), sea mayor al valor t calculado, es decir, describe el nivel de signif-icancia exacto asociado a un resultado economtrico en particular. Por ejemplo,un p-value de 0.07 indica que un coeficiente es estadisticamente significativo enun nivel de 0.07 (o con un 93% de confianza).

    Ejemplo:

    Suponga el siguiente Modelo de Regresin Lineal Simple:

    Yi = 1 + 2Xi + ui para i = 1, ..., N

    Adems posee la siguiente informacin muestral de X e Y:

    Y 2 5 6 7X 0 10 18 20

    El estimador MCO de 1 y 2 es el siguiente:

    =

    [12

    ]=

    [4 4848 824

    ]1 [20298

    ]=

    [2,19350,2338

    ]La matriz de varianzas y covarianzas de es:

    V () = 2u(XX)1

    =0,436

    2

    [4 4848 824

    ]1=

    [0,180866 0,0105360,010536 0,000878

    ]58

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    Primero veamos el ajuste de este modelo, es decir, en que grado la variable xexplica a la variable y, para lo cual calculemos el R2 y R2:

    R2 = 1 RSSTSS

    = 14

    i=1 u2i4

    i=1(Yi Y )2= 1 0,436

    14= 0,969

    R2

    = 1 RSS/2TSS/3

    = 14

    i=1 u2i /24

    i=1(Yi Y )2/3= 0,953

    Como podemos ver, el grado de ajuste del modelo es bastante bueno, como elmodelo incluye constante, el R2 se puede interpretar como la proporcin de lavariabilidad de la variable independiente que es explicada por la variabilidad dela variable dependiente, la que en este caso alcanza un 97%.

    Ahora veamos si estos parmetros estimados son significativos a un 95% de con-fianza, para lo cual realizaremos un test t de significancia a cada uno de ellos:

    1. Test de significancia de 1:H0 : 1 = 0

    H1 : 1 6= 0

    t =1

    V ar(1) t2

    De esta forma, el valor calculado para el estadstico t es:

    tc =2,193548387

    0,180866= 5,157850523

    El valor de tabla del estadstico t a un 95% de confianza y con dos gradosde libertad es 4,303.

    Probabilidad

    No seRechaza Se

    Rechaza(2,5%)

    SeRechaza(2,5%))

    t(2)=4,303 t(2)=4,303

    tc=5,158

    59

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    De esta forma, se rechaza la hiptesis nula de que 1=0, y por lo tanto elparmetro estimado resulta ser estadsticamente significativo.

    2. Test de significancia de 2:H0 : 2 = 0

    H1 : 2 6= 0

    t =2

    V ar(2) t2

    De esta forma, el valor calculado para el estadstico t es:

    tc =0,233870968

    0,000878= 7,892762865

    El valor de tabla del estadstico t a un 95% de confianza y con dos gradosde libertad es 4,303.

    Probabilidad

    No seRechaza Se

    Rechaza(2,5%)

    SeRechaza(2,5%))

    t(2)=4,303 t(2)=4,303

    tc=7,893

    De esta forma, se rechaza la hiptesis nula de que 2=0, y por lo tanto elparmetro estimado resulta ser estadsticamente significativo.

    3. TAREA: Testee la siguiente hiptesis nula:

    H0 : 1 2 = 2

    H1 : 1 2 6= 2

    60

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.8.2. Test F (Conjunto de hiptesis lineales)

    Los casos 6. y 5. corresponden a un conjunto de hiptesis a testear. En el caso5. corresponda a un subconjunto particular de parmetros, mientras que el caso6. corresponda a la nula de que todos ellos eran cero, menos la constante. Endichos casos se aplica la frmula del test F segn la ecuacin (2.63) y los criteriosde rechazo siguen lo expuesto en la seccin anterior.

    Sin embargo, en ambos casos podemos derivar expresiones alternativas para nue-stro test.

    Todas las pendientes del modelo son cero: En este caso, se puededemostrar que el test F puede expresarse como:

    F =ESS/(k 1)RSS/(n k) F(k1,nk) (2.68)

    o alternativamente, utilizando la definicin del R2:

    F =R2/(k 1)

    (1R2)/(n k) F(k1,nk) (2.69)

    Un subconjunto de las pendientes del modelo son cero: En estecaso, se puede demostrar que el test F puede expresarse como:

    F =(uu uu)/k2uu/(n k) F (k2, n k) (2.70)

    donde u denotan los residuos MCO restringidos (donde k2 representa elnmero de regresores que han sido restringidos a cero), mientras que urepresentan los residuos del modelo MCO original.

    2.8.3. Intervalos de Confianza

    Una forma alternativa (o mejor dicho complementaria) de examinar la significan-cia estadstica de un parmetro ( o un conjunto de ellos) es a travs de intervalosde confianza (IC). Ellos nos indican, dado un nivel de confianza, el rango devalores admisibles del coeficiente que se estima. Los niveles de confianza gen-eralmente utilizados son 99%, 95% y 90% (al igual que en los test de hiptesis),

    61

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    donde el tamao de los mismos es necesariamente decreciente9.

    Una manera natural de obtener el IC asociado a i es a travs del test t aso-ciado. Vimos entonces que l corresponde a:

    i i0V ar(i)

    tnk

    entonces, si deseamos un IC del (1-)% de confianza (es decir, de % de signifi-cancia) para el parmetro i, basta obtener de las tablas de distribucin el valor correspondiente, es decir:

    1 = PrZ/2 i i0

    V ar(i) Z1/2

    = Pr

    Z1/2 i i0V ar(i)

    Z1/2

    = Pr

    [i Z1/2

    V ar(i) i0 i + Z1/2

    V ar(i)

    ]donde la tercera expresin se obtiene de despejar i0 de la segunda. Note que elintervalo ha sido construido en base a una distribucin simtrica (como la t o lanormal), por lo cual el valor de tabla a escoger debe corresponder a /2.

    Note adems que dicho intervalo est construido slo en base a constantes cono-cidas. Una vez construido, se puede contrastar la nula (H0: i = i0) al nivelde significancia sencillamente observando si i0 pertenece al intervalo (en cuyocaso no rechazamos la nula) o se encuentra fuera de l (en cuyo caso rechazamosla nula)10. Nuevamente, la validez de dicho intervalo de confianza depende crti-camente del supuesto de distribucin de los errores. En el caso que el valor Zse obtenga de la tabla t, como ya sabemos, estamos suponiendo que los erroressiguen una distribucin normal. Un caso ms general es utilizar los valores crticosde la distribucin normal estndar.

    Tambin es posible derivar regiones de confianza, es decir, IC de confianza si-multneos para una conjunto de parmetros, sin embargo, su utilizacin es escasa

    9Intuitivamente, ya que a ms exacta es mi estimacin del rango posible, con menos confianzapuedo afirmar estar en lo correcto.

    10Una forma fcil de verlo es pensando en i0=0, es decir, que la variable xi no ayuda aexplicar y.

    62

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    en econometra aplicada (a menos que su pregunta puntual lo requiera!).

    Finalmente derivaremos el intervalo de confianza para la varianza de los errores.Sabemos de la ecuacin (2.61) que:

    uu2

    2nk

    (n k)22

    2nk (2.71)

    Utilizando la misma lgica que utilizamos para el IC de un parmetro , tenemosque el IC para 2 corresponde a:[

    (n k)22nk,

    2 (n k)2

    2nk,1

    ]= (1 ) (2.72)

    Note que los valores crticos utilizados corresponden a 2nk,1 y 2nk,, ya quela distribucin 2 es una distribucin asimtrica.

    2.8.4. Test de Normalidad (Test de Jarque-Bera)

    Consideramos ahora el problema de utilizar los momentos de los residuos MCOpara hacer inferencia sobre la distribucin de los errores poblacionales. Dado quealgunas de las propiedades de MCO y de la inferencia dependen del supuesto denormalidad en los errores, es importante poseer un contraste para dicho supuesto.Como es sabido, la distribucin normal es simtrica y mesocrtica. La simetraimplica que el tercer momento poblacional E(u3) en torno a la media, es cero. Elhecho que sea mesocrtica implica que la kurtosis es 3 (es decir, el ancho de lascolas de la distribucin, el cual se mide utilizando el cuarto momento en tornoa la media). Recordemos entonces que el coeficiente de simetra poblacional sedefine como:

    S =E(u3)

    (2)32

    mientras que la kurtosis (o coeficiente de):

    K =E(u4)

    (2)2

    63

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    En base a los anteriores, Bera y Jarke (1981), propusieron el siguiente estadgrafo,construido bajo la nula de normalidad:

    JB = n

    [S

    6+(K 3)2

    24

    ]a 2(2)

    Donde los estimadores muestrales del coeficiente de asimetra y kurtosis se ob-tienen al considerar que un estimador natural de:

    r = E[ur]

    corresponde a:

    mr =1

    n

    ni=1

    uri

    Note que el estadgrafo est definido en trminos del exceso de kurtosis, porlo cual, a menor sea el valor, menor es la probabilidad de rechazar la nula denormalidad. Note adems que el estadstico es esencialmente no constructivo, entrminos de que no nos indica que camino seguir en caso de rechazar la nula,adems de que no rechazar normalidad no implica confirmar su existencia. Sinembargo, en la prctica corresponde al test ms utilizado.

    64

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile

    2.9. Prediccin

    La prediccin es una de las herramientas ms atractivas y utilizadas en Econometra.Si el modelo que hemos escogido confirma la teora en consideracin, es decir,a sobrevivido a las pruebas de hiptesis, podemos utilizar el modelo estimadoY = X para predecir. La prediccin se puede efectuar para un valor puntual dela variable dependiente, y0, correspondiente a un valor dado de los regresores, x0,o predecir el valor esperado E[y0/x0] condicional a las variables explicativas.

    Supongamos primero que queremos predecir un valor individual de Y, y0, asoci-ado a un vector de regresores x0j con j = 1, 2..., k de dimensin 1 k.

    De acuerdo con el modelo economtrico se tiene que y0 = 1+x022+.....+x0kk+u0.Para predecir el valor de y0 podemos utilizar la estimacin MCO del modelo,y0 = x0.

    De esta forma, el error de prediccin estar dado por :

    e0 = y0 y0 = x0( ) + u0

    En donde se distinguen dos fuentes del error de prediccin

    El error en la estimacin del vector

    El error estocstico inherente al modelo u0

    Sin embargo, si consideramos que el estimador MCO es insesgado y mantenemoslos supuestos de nuestro modelo de regresin lineal, es trivial mostrar que el valoresperado del error de prediccin ser cero. Adems, podemos calcular la varianzadel error de prediccin:

    V ar(e0) = E[x0( )( )x0 + 2x0( )u0 + u0u0]

    V ar(e0) = 2 + 2x

    0(X X)1x0

    La varianza del error de prediccin depender de la matriz de regresores X dedimensin n k que se utiliz para obtener las estimaciones de . Sabemos quea mayor dispersion de las variables explicativas menor varianza tendrn nues-tras estimaciones MCO11. Adems depender del vector x0 que hemos asumido

    11Es posible y se recomienda derivar una expresin para la varianza del error de prediccinutilizando un modelo con 2 regresores. En est expresin se aprecia claramente la dependenciade la varianza del error de prediccin con la dispersion en torno a la media de las variablesexplicativas.

    65

  • Capitulo 2: Modelo de Regresin LinealEconometra I

    FACEA, Universidad de Chile