econometría licenciatura en economÍa - uagrm l. …

32
Econometría LICENCIATURA EN E CONOMÍA - UAGRM L. FERNANDO ESCOBAR C.

Upload: others

Post on 28-Jul-2022

10 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Econometría LICENCIATURA EN ECONOMÍA - UAGRM

L. FERNANDO ESCOBAR C.

Page 2: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Contenido

1. Motivación: Reducir el tamaño de una clase, ¿mejora la educación primaria?

2. Relaciones causales entre variables

3. Modelo de Regresión Lineal

– Modelo de Regresión Lineal Simple

– Modelo de Regresión Lineal Múltiple

– Mínimos Cuadrados Clásicos

• Estimación

• Inferencia Estadística

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 2

Page 3: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

¿QUÉ ES LA ECONOMETRÍA?

• Muchas decisiones económicas, de negocios y de políticas públicas se basan en entender las relaciones de variables en la práctica.

• Estas decisiones requieren respuestas numéricas a preguntas numéricas. Por ejemplo:

• Reducir el tamaño de una clase, ¿mejora la educación primaria? El argumento es el siguiente: Menos alumnos en la clase más atención a cada uno por parte de los maestros menos interrupciones aumenta el aprendizaje mejora las notas.

• Pero ¿Cuál es el efecto preciso sobre la educación primaria de la reducción del tamaño de las clases? Reducir el tamaño de clases cuesta dinero hay que contratar más maestros si la escuela está completa hay que construir más aulas.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 3

Page 4: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

¿QUÉ ES LA ECONOMETRÍA?

• Quien toma la decisión de reducir el tamaño de las clases debe comparar costos y beneficios. Para hacer esto hay que tener una estimación precisa de los potenciales beneficios ¿el efecto sobre la educación es grande o pequeña? ¿ es posible que no haya ningún efecto de la reducción del tamaño de la clase sobre la educación?

• Para responder a estas preguntas se necesita examinar evidencia empírica, basada en datos, que relacione la educación primaria con el tamaño de las clases.

• La econometría es la herramienta que permite dar respuestas cuantitativas a este tipo de preguntas cualitativas.

• Otros ejemplos

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 4

Page 5: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

OTRO EJEMPLO: ASIGNACIÓN DEL BJP

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 5

Page 6: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

OTRO EJEMPLO: ASIGNACIÓN DEL BJP

Impactos potenciales sobre:

• la pobreza

• la indigencia

• la matriculación escolar

• la participación en el mercado laboral

• el empleo informal

• la desigualdad en la distribución del ingreso

• …

• el embarazo adolecente?

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 6

Page 7: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

¿QUÉ ES LA ECONOMETRÍA? • La medición de los efectos de la política económica no es

sencilla en el ejemplo de la educación primaria, es posible que el resultado de mejores notas en clases más pequeñas pueda deberse a otros factores podría ser que las escuelas con clases de menor tamaño reciban alumnos de las clases más ricas de la sociedad los alumnos en las clases más pequeñas tienen más oportunidades de aprender fuera de la escuela.

• La econometría es una herramienta que permite aislar el efecto de las clases más pequeñas sobre la educación primaria de otros factores como pueden ser las características socioeconómicas de las familias de los alumnos.

• La teoría económica sugiere respuestas de la dirección de estos efectos pero la respuesta numérica se obtiene analizando datos de la realidad.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 7

Page 8: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

¿QUÉ ES LA ECONOMETRÍA? • Como las respuestas numéricas se basan en datos tienen algún

grado de incertidumbre (diferentes conjuntos de datos dan diferentes respuestas).

• El marco conceptual del análisis econométrico no solo debe dar respuestas numéricas a estas preguntas sino que también debe dar una medida de cuan precisa es la respuesta numérica.

• En términos un poco más técnicos, la pregunta de si reducir el tamaño de las clases mejora la educación implica una relación causal entre esas variables.

• En términos coloquiales una acción se dice que produce un resultado si ese resultado es consecuencia directa de la acción: – Tocar una olla caliente causa que nos quememos. – Correr durante un largo tiempo causa que nos cansemos. – Poner fertilizante en una huerta de tomates causa que se produzcan

más tomates.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 8

Page 9: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales

• En econometría, existen dos formas alternativas de analizar relaciones causales entre variables: la modelización estructural y el enfoque experimental (y/o cuasi-experimental).

• La modelización estructural descansa fundamentalmente en la teoría económica para guiar el trabajo empírico.

• El enfoque experimental (cuasi-experimental) trata de identificar los efectos causales a través de eventos o situaciones específicas y deja para un segundo paso la generalización de la evidencia empírica encontrada.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 9

Page 10: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales: Leamer (1983)

• A quienes suscriben al enfoque experimental les gustaría proyectar la imagen de un agricultor experimental que divide su huerta en pequeñas parcelas y luego aleatoriamente selecciona el nivel de fertilizante (“el tratamiento”) que se aplicará en cada parcela.

• Si a ciertas parcelas se le aplica cierto nivel de fertilizante y a otras no (“el control”), entonces la diferencia entre el crecimiento promedio de los tomates fertilizados y el crecimiento promedio de los tomates no fertilizados mide el efecto del fertilizante sobre el crecimiento de los tomates.

• El humilde trabajo del econometrista experimental es solo determinar si esa diferencia es grande como para sugerir un efecto real del fertilizante sobre los tomates.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 10

Page 11: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales: Leamer (1983)

• El trabajo del econometrista estructural es un poco diferente y se asemeja más al de un agricultor que nota que los tomates crecen más en las parcelas debajo de árboles donde hay pájaros que “abonan” la tierra.

• Sin embargo, cuando el agricultor presenta su evidencia en la reunión anual de la Asociación de Agricultores Ecológicos, otro agricultor en la audiencia le dice que el usó los mismos datos y llegó a la conclusión de que montos moderados de sombra de los árboles hacen que los tomates crezcan más.

• Un brillante economista en la sala observa que las dos hipótesis planteadas son indistinguibles, dados los datos disponibles. Menciona las palabras problema de identificación que si bien nadie entiende que quiere decir, las pronuncia con tanta autoridad que es totalmente convincente. Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 11

Page 12: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales: Leamer (1983)

• La reunión continua en los pasillos con discusiones acaloradas sobre si esta es la clase de trabajos que amerita la promoción de “agricultor asociado” a “agricultor plenario” con los “iluministas” totalmente en contra y los “aviofilos” completamente a favor de la promoción.

• No piensen que necesariamente hay una diferencia sustancial entre un planteo, el experimental, y otro, el estructuralista.

• El cuento de Leamer refleja la diferencia entre los dos enfoques. Uno utiliza datos experimentales mientras que el otro utiliza datos observacionales.

• En otras palabras, en el planteo experimental, el fertilizante se asigna aleatoriamente a las parcelas mientras que en el otro, “la naturaleza” hace la asignación.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 12

Page 13: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales: Leamer (1983)

• Es enteramente posible que la asignación aleatoria coincida con la de la naturaleza con las parcelas debajo de los árboles recibiendo el fertilizante y las restantes parcelas no.

• En este caso el experimento aleatorizado y el estructural coinciden.

• Para formalizar un poco esta discusión y ver el verdadero valor de la aleatorización considere el siguiente modelo estructural proveniente de la teoría económica:

𝑌𝑖 = 𝛼 + 𝛽𝐹𝑖 + 𝛾𝐿𝑖 + 𝑢𝑖 (1) Dónde: 𝑌𝑖 crecimiento de los tomates en la parcela i; 𝐹𝑖 es el nivel de fertilizante aplicado en la parcela i; 𝐿𝑖 es la cantidad de sol que recibe la parcela i y 𝑢𝑖 es la influencia no especificada sobre el crecimiento de los tomates en la parcela i. β es el efecto del fertilizante y es el objeto de nuestro estudio.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 13

Page 14: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales: Leamer (1983)

• Note que en este caso, el efecto del fertilizante sobre el crecimiento de los tomates es 𝛽 + 𝛽∗ en lugar de 𝛽 . El coeficiente 𝛽∗ mide el sesgo provocado por la utilización de datos observacionales y la omisión de uno de los factores que afectan el crecimiento de los tomates.

• Este sesgo aparece, como veremos más adelante, no solo por omisión de variables, sino por errores de medida en F o por simultaneidad.

• Con los datos disponibles no hay forma de medir la magnitud del sesgo 𝛽∗. Uno debe decidir independientemente de los datos, usualmente a través de supuestos que no pueden ser confirmados por los datos, cuan buena será la estimación estructural.

• La diferencia formal con un experimento aleatorizado son los parámetros 𝛼∗ y 𝛽∗. Si el fertilizante se asigna aleatoriamente en las parcelas 𝜶∗ y 𝜷∗ son exactamente iguales a cero.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 14

Page 15: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales

• El econometrista experimental que nota que el fertilizante y la luz del sol están correlacionados puede corregir el diseño de su experimento. Puede, por ejemplo, asignar el fertilizante de forma tal de cubrir aleatoriamente parcelas con sol y parcelas bajo los árboles.

• El econometrista estructural, por definición, no puede controlar el nivel de luz del sol que recibe cada parcela. Pero, lo que si puede hacer es incluir una variable que mida la luz de sol recibida por cada parcela en el modelo a ser estimado. El método de regresión múltiple que vamos a ver en este curso puede ser utilizado entonces para obtener estimaciones del efecto del fertilizante sobre el crecimiento de los tomates.

• En el mundo real, la experimentación aleatoria con personas es difícil de administrar y controlar, es muy costosa y muchas veces no es ética. (Piense en el ejemplo del tamaño de las clases sobre la educación).

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 15

Page 16: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales

• Debido a estos problemas, en economía, los datos experimentales son raros. En general, la mayoría de los datos en economía se obtienen observando el comportamiento del mundo real.

• Los datos observacionales se obtienen a través de encuestas, datos administrativos y datos históricos.

• Como el ejemplo de Leamer sugiere, los datos observacionales imponen un desafío importante no solo a los intentos de la econometría para medir efectos causales sino también a las herramientas econométricas que deben utilizarse para obtener esa medición.

• En el mundo real el nivel de tratamiento (el nivel de fertilizante en el ejemplo) no se asigna aleatoriamente y entonces es difícil distinguir este efecto de otros factores relevantes (la luz solar en el ejemplo).

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 16

Page 17: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Análisis de Relaciones Causales

• Muchos de los métodos econométricos que vamos a ver en este curso, están dedicados a tratar de identificar efectos causales cuando se utilizan datos observacionales.

• Tanto los datos observacionales como los experimentales vienen en tres formatos:

– Datos de corte transversal.

– Datos de series temporales.

– Datos de panel.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 17

Page 18: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• La directora de la escuela primaria “San Martín” debe decidir si contratar más maestros y busca su asesoramiento.

• Si contrata más maestros podría reducir a la mitad el número de alumnos por maestro.

• Los padres de los alumnos de la escuela quieren clases más reducidas de forma que sus hijos reciban una atención más personalizada. Por otro lado, contratar más maestros tiene un costo monetario que podría utilizarse para otros gastos (mejoras/reformas edilicias por ejemplo).

• La pregunta que le hace la directora es, si disminuyo el tamaño de las clases, ¿Cuál es el efecto sobre el desempeño de los alumnos?

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 18

Page 19: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • Primero: ¿Cuál es la variable correcta para medir

desempeño de los alumnos? – Satisfacción de los padres

– Desarrollo personal de los alumnos

– Salario futuro en el mercado de trabajo

– Desempeño en pruebas estandarizadas

• Reformulamos la pregunta: si se disminuye el tamaño de las clases, ¿Cuál es el efecto sobre el desempeño de los alumnos en las pruebas estandarizadas?

𝛽𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 =𝑐𝑎𝑚𝑏𝑖𝑜 𝑒𝑛 𝑙𝑎𝑠 𝑛𝑜𝑡𝑎𝑠 𝑑𝑒 𝑙𝑎𝑠 𝑝𝑟𝑢𝑒𝑏𝑎𝑠

𝑐𝑎𝑚𝑏𝑖𝑜 𝑒𝑛 𝑒𝑙 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑐𝑙𝑎𝑠𝑒𝑠 =

∆ 𝑁𝑜𝑡𝑎𝑠

∆ 𝑇𝑎𝑚𝑎ñ𝑜 (3)

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 19

Page 20: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • La ecuación (3) es la pendiente de la linea recta:

𝑁𝑜𝑡𝑎𝑠 = 𝛽0 + 𝛽𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒𝑇𝑎𝑚𝑎ñ𝑜 (4) • Obviamente, algo no está bien con el modelo de la ecuación (4).

– Una escuela puede tener mejores maestros o usar mejores libros – Aún cuando haya dos escuelas comparables en tamaño de las clases,

maestros y libros, las notas pueden diferir por otros factores (alumnos provenientes de familias más ricas; mayor número de inmigrantes en una de las dos escuelas etc.)

– Aún cuando haya dos escuelas comparables en todas estas características las notas en las pruebas estandarizadas pueden diferir por razones enteramente aleatorias como ser el desempeño de los alumnos en el día particular del examen.

• Una versión completa del modelo debiera incorporar todos estos otros factores:

𝑁𝑜𝑡𝑎𝑠 = 𝛽0 + 𝛽𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒𝑇𝑎𝑚𝑎ñ𝑜 + 𝑂𝑡𝑟𝑜𝑠 𝑓𝑎𝑐𝑡𝑜𝑟𝑒𝑠 (5)

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 20

Page 21: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • En notación más general, llamemos 𝑌𝑖a la nota promedio en las

pruebas estandarizadas en la i-esima escuela, 𝑋𝑖es el tamaño promedio de las clases en la i-esima escuela y dejemos que 𝑢𝑖denote todos los otros factores que afectan las notas de las pruebas estandarizadas en la i-esima escuela:

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (6)

• La ecuación (6) se denomina modelo de regresión lineal simple. • 𝑌𝑖 se denomina variable dependiente. • 𝑋𝑖se denomina regresor o variable explicativa. • La primera parte de la ecuación (6), 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 , se

denomina función de regresión poblacional. • La ordenada al origen 𝛽0 y la pendiente de la recta 𝛽1 son los

parámetros poblacionales. Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 21

Page 22: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• Imaginemos una ciudad hipotética con una población total de 50 escuelas.

• Supongamos que estamos interesados en estudiar la relación que existe entre el tamaño de las clases (X) y las notas que obtienen los alumnos en las pruebas estandarizadas (Y).

• Más específicamente, asumamos que queremos predecir la nota promedio en la población de escuelas, sabiendo el tamaño de las clases en cada escuela.

• Con este objetivo en mente, supongamos que dividimos a las 50 escuelas en 10 grupos de aproximadamente el mismo tamaño de clases y examinamos las notas promedio en las pruebas estandarizadas en cada grupo de escuelas.

• Considere los siguientes datos hipotéticos de notas y tamaño de las clases:

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 22

Page 23: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• Cada columna de la tabla nos da la distribución de las notas en las pruebas estandarizadas, Y, correspondiente a un determinado tamaño de las clases X. Esto es la distribución condicional de Y dado X.

• Para cada una de las distribuciones condicionales de Y podemos calcular su media, conocida como la esperanza condicional:𝐸(𝑌𝑖 𝑋𝑖) .

• Veamos los datos de la tabla en una figura: Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 23

Tamaño de la clase (alumnos por maestro)

20 25 30 35 40 45 50 55 60 65

Notas de las

pruebas

estandarizadas

69 67 63 60 57 52 51 48 45 42

72 70 64 61 58 55 53 50 47 43

76 71 68 66 62 59 55 54 52 49

79 77 75 70 66 64 60 57 54 51

85 78 75 72 69 67 63 58 55 53

Notas promedio 76 73 69 66 62 59 56 53 51 48

Page 24: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 24

Page 25: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• La figura anterior muestra claramente que, aunque hay variaciones en las notas promedio por escuela, la nota promedio en cada grupo de escuelas decrece cuando el tamaño de las clases aumenta.

• Esto es lo mismo que decir que la esperanza condicional de Y decrece a medida que X crece.

• Esta observación puede ser vista a través de la línea que conecta los puntos que representan las esperanzas condicionales de Y para los distintos valores de X.

• Esta línea se conoce como Línea de Regresión Poblacional, o más generalmente, Curva de Regresión Poblacional.

• Geométricamente, una curva de regresión poblacional es el locus de las esperanzas condicionales de la variable dependiente para diferentes valores de la(s) variable(s) explicativa(s). Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 25

Page 26: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• De las observaciones anteriores, es claro que la esperanza condicional 𝐸(𝑌𝑖 𝑋𝑖) es una función de 𝑋𝑖 . Simbólicamente:

𝐸(𝑌𝑖 𝑋𝑖) = 𝑓(𝑋𝑖) Donde 𝑓(𝑋𝑖) denota alguna función de la variable explicativa 𝑋𝑖. En nuestro ejemplo hipotético, 𝐸(𝑌𝑖 𝑋𝑖) es una función lineal de 𝑋𝑖.

• Por lo tanto, una primera aproximación a nuestra hipótesis de trabajo es que 𝐸(𝑌𝑖 𝑋𝑖) es lineal en 𝑋𝑖 del tipo:

𝐸(𝑌𝑖 𝑋𝑖) = 𝛽0 + 𝛽1𝑋𝑖 (7) Donde 𝛽0 y 𝛽1 son parámetros fijos desconocidos que se llaman coeficientes de regresión.

• Nosotros estamos interesados en estimar este tipo de modelos.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 26

Page 27: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • De la figura presentada pudimos concluir que a medida que

aumentaba el tamaño de las clases, las notas promedio por grupos de escuelas disminuían. Pero qué podemos decir acerca de las notas promedio en una escuela cualquiera en relación al tamaño de sus clases?

• En principio, dado el tamaño de las clases, las notas en cada escuela fluctúan alrededor de las notas promedio de todas las escuelas que tienen ese tamaño de las clases.

• Por lo tanto, podemos expresar el desvío de las notas promedio en la escuela i, 𝑌𝑖, alrededor de su valor esperado como:

𝑢𝑖 = 𝑌𝑖 − 𝐸(𝑌𝑖 𝑋𝑖) ó

𝑌𝑖 = 𝐸(𝑌𝑖 𝑋𝑖) + 𝑢𝑖 (8) Donde 𝑢𝑖 es una variable aleatoria no observable que puede tomar valores positivos o negativos.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 27

Page 28: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • Cómo podemos interpretar la ecuación (8)? • Podemos decir que la nota promedio en una escuela particular,

i, puede ser expresada como la suma de dos componentes – 𝐸(𝑌𝑖 𝑋𝑖) que es simplemente la nota promedio de todas las escuelas

con el mismo tamaño de clases; y – 𝑢𝑖, que es el componente aleatorio o no sistemático y que refleja si la

nota promedio de la escuela i está por encima o por debajo de la nota promedio de su grupo.

• Si 𝐸(𝑌𝑖 𝑋𝑖) se asume lineal en 𝑋𝑖 entonces la ecuación (8) puede escribirse como:

𝑌𝑖 = 𝐸(𝑌𝑖 𝑋𝑖) + 𝑢𝑖 (9)

𝑌𝑖 = 𝛽0 + 𝛽1𝑋𝑖 + 𝑢𝑖 (10) • La ecuación (10) establece que la nota promedio de una escuela

está linealmente relacionada con el tamaño de sus clases más un término aleatorio. Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 28

Page 29: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • Hasta ahora, hemos evitado hablar de muestras. Pero en la

práctica lo que nosotros tenemos es simplemente una muestra aleatoria tomada desde la población objetivo.

• Como ilustración, asumamos que no conocemos la población de las 50 familias sino que lo que tenemos es una muestra de valores de Y correspondientes a los valores dados de X.

• La pregunta que nos tenemos que hacer es si es posible con los datos de la muestra predecir la nota promedio en las pruebas estandarizadas para toda la población desde los valores muestrales correspondientes a X.

• En otras palabras, podemos estimar la función de regresión poblacional desde los datos muestrales?

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 29

X 20 25 30 35 40 45 50 55 60 65

Y 72 77 63 72 66 59 55 50 55 49

Page 30: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • Como uno ya puede imaginarse, puede ser que no podamos

estimar la función de regresión poblacional muy precisamente debido a las fluctuaciones muestrales.

• Un gráfico puede ayudarnos a ver esto más claramente. La siguiente figura muestra los datos muestrales junto con una línea de regresión muestral que está dibujada de forma tal que “ajuste” el gráfico razonablemente bien.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 30

Page 31: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple • La línea de la última figura se conoce con el nombre de línea de

regresión muestral. • Supuestamente, representa la línea de regresión poblacional,

pero debido a las fluctuaciones muestrales es a lo sumo una aproximación a la verdadera función poblacional.

• Análogo a la función de regresión poblacional podemos definir la función de regresión muestral como:

𝑌 𝑖 = 𝛽 0 + 𝛽 1𝑋𝑖 (11)

Donde 𝑌 𝑖 es la estimación de 𝐸(𝑌𝑖 𝑋𝑖) y 𝛽 0 y 𝛽 1 son los estimadores de los parámetros poblacionales, 𝛽0 y 𝛽1 , respectivamente. • De la misma forma en que expresamos a la función de regresión

poblacional para una escuela particular, podemos expresar a la función de regresión muestral como:

𝑌𝑖 = 𝛽 0 + 𝛽 1𝑋𝑖 + 𝑢 𝑖 (12)

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 31

Page 32: Econometría LICENCIATURA EN ECONOMÍA - UAGRM L. …

Regresión Lineal Simple

• La pregunta crítica es: dado que la función de regresión muestral es una aproximación de la verdadera función de regresión poblacional, podemos considerar algún método que haga que esta aproximación sea lo más cercana posible?

• En otras palabras, cómo deberíamos construir la función de regresión muestral tal que los estimadores 𝛽 0 𝑦 𝛽 1 sean tan cercanos como sea posible a los valores de los parámetros poblacionales 𝛽0 y 𝛽1 aunque no conozcamos sus verdaderos valores?

• La respuesta es el método de estimación de mínimos cuadrados clásicos.

• En lugar de desarrollarlo para el modelo de regresión lineal simple, consideremos el modelo más general.

Noviembre 2016, Econometría L. Fernando Escobar C. (UAGRM) 32