análisis de regresión...•el análisis de regresión trata del estudio de la dependencia de una...

72
Análisis de regresión

Upload: others

Post on 10-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Análisis de regresión

Page 2: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Origen del término regresión

• Francis Galton acuñó el término regresión en un ensayo famoso de 1886.

“La estatura de los niños de padres de determinada estatura tienden a regresar a la estatura promedio de la población total”

• La ley de regresión universal de Galton fue confirmada por su amigo Karl Pearson, quien reunió más de 1000 registros de estaturas de miembros de grupos familiares, confirmando la teoría de Galton, que llamó “regresión a la mediocridad”

Estadística 2020 - Prof. Tamara Burdisso2Unidad 5 – Análisis de regresión

Page 3: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Origen del término regresión

• La interpretación moderna del término regresión en muy diferente.

• El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas) con el objetivo de estimar o predecir la media o valor promedio poblacional de la variable dependiente en términos de los valores conocidos o fijos (en muestras repetidas) de las variables explicativas.

Estadística 2020 - Prof. Tamara Burdisso3Unidad 5 – Análisis de regresión

Page 4: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Enfoque del análisis de regresión

• A Francis Galton le interesaba las razones de estabilidad en la distribución de las estaturas dentro de una población

Estadística 2020 - Prof. Tamara Burdisso4

En el enfoque moderno de regresión, el interés radica en conocer como cambia la estatura promedio de los hijos a partir del conocimiento de la estatura de sus padres, i.e. predecir la estatura de los hijos a partir de la estatura de los padres.

Unidad 5 – Análisis de regresión

Page 5: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Enfoque del análisis de regresión: ejemplos en economía

• La dependencia del consumo personal respecto del ingreso personal neto disponible (después de impuestos). Con un análisis de este tipo se calcula la propensión marginal a consumir (PMC), i.e. el cambio promedio del consumo ante un cambio de una unidad monetaria en el ingreso real.

• Un monopolista que puede fijar precio o cantidad (pero no ambos factores) y quiera conocer la demanda de un bien con diversos precios. Tal experimento permite estimar la elasticidad precio de la demanda del bien, i.e. la respuesta a variaciones del precio, y permite determinar el precio que maximiza las ganancias.

Estadística 2020 - Prof. Tamara Burdisso5Unidad 5 – Análisis de regresión

Page 6: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

• Cual es la tasa de cambio de los salarios nominales en relación con la tasa de desempleo?. La representación de esta relación es la célebre curva de Phillips, que relaciona los cambios en los salarios nominales con la tasa de desempleo. Un diagrama de dispersión de este tipo permite al economista laboral predecir el cambio promedio en los salarios nominales con una cierta tasa de desempleo. Tal conocimiento sirve para establecer supuestos sobre el proceso inflacionario en una economía, pues es probable que los incrementos en los salarios monetarios se reflejen en incrementos de precios.

• En economía monetaria se sabe que, si se mantienen constantes otros factores, cuanto mayor sea la tasa de inflación π, menor será la proporción k del ingreso que la gente deseará mantener en forma de dinero. Un análisis cuantitativo de esta relación permite predecir la cantidad de dinero, como proporción del ingreso, que la gente deseará mantener con diversas tasas de inflación.

Estadística 2020 - Prof. Tamara Burdisso6

Enfoque del análisis de regresión: ejemplos en economía

Unidad 5 – Análisis de regresión

Page 7: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Regresión y causalidad

• El análisis de regresión tiene que ver con la dependencia de una variable respecto de otras variables, pero esto no necesariamente implica causalidad.

• “Una relación estadística, por más fuerte y sugerente que sea, nunca podrá establecer una conexión causal: nuestras ideas de causalidad deben provenir de cuestiones externas y, en último término, de una u otra teoría” (M. G. Kendall y A. Stuart, The Advanced Theory of Statistics)

• Una relación estadística por sí misma no implica causalidad: hay que recurrir al sentido común o a cuestiones teóricas.

• El rendimiento del cultivo depende de la lluvia (sentido común)

• El consumo depende del ingreso real disponible (teoría económica)

Estadística 2020 - Prof. Tamara Burdisso7Unidad 5 – Análisis de regresión

Page 8: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Regresión y correlación

• El análisis de correlación se relaciona con el de regresión, aunque conceptualmente los dos son muy diferentes.

• En el análisis de correlación, el objetivo principal es medir la fuerza o el grado de asociación lineal entre dos variables. Recordemos que el coeficiente de correlación, mide esta fuerza de asociación (lineal).

• En el análisis de regresión, en cambio, se trata de estimar o predecir el valor promedio de una variable con base en los valores fijos en muestras repetidas de otras variables.

Estadística 2020 - Prof. Tamara Burdisso8Unidad 5 – Análisis de regresión

Page 9: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Regresión y correlación

• La regresión y la correlación presentan diferencias que vale la pena destacar.

• En el análisis de regresión hay una asimetría en el tratamiento a las variables dependientes y explicativas. La variable dependiente es aleatoria o estocástica, i.e., tiene una distribución de probabilidad. Las variables explicativas se asumen que toman valores fijos (en muestras repetidas).

• En el análisis de correlación, se tratan dos variables cualesquiera en forma simétrica y se asume que ambas variables son aleatorias.

• La teoría de correlación asume aleatoriedad de las variables.

• Gran parte de la teoría de regresión está condicionada al supuesto de que la variable dependiente es estocástica y que las variables explicativas son fijas o no estocásticas

Estadística 2020 - Prof. Tamara Burdisso9Unidad 5 – Análisis de regresión

Page 10: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Terminología en el análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso10Unidad 5 – Análisis de regresión

Page 11: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

• Supongamos que tenemos 2 muestras de tamaño n. Sean

• La covarianza muestral se define como

• Y el coeficiente de correlación muestral se define como

Medida de asociación entre dos variables

nn yyyxxx ,...,y ,...,, 2121

1

))((

−−=

n

yyxxs

ii

xy

Estadística 2020 - Prof. Tamara Burdisso11

)1()()1()(

1

))((

22 −−−−

−−

==

nyynxx

n

yyxx

ss

sr

ii

ii

yx

xy

xy

Unidad 5 – Análisis de regresión

Page 12: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

• El coeficiente de correlación toma valores entre -1 y 1.

• Si el coeficiente de correlación es igual a 1, se tiene una asociación lineal positiva perfecta, intensidad máxima.

• Si el coeficiente de correlación es igual a -1, se tiene una asociación lineal negativa perfecta, intensidad máxima.

• Si el coeficiente de correlación es igual a 0, indica que no hay relación lineal.

Medida de asociación entre dos variables

11 − xyr

Estadística 2020 - Prof. Tamara Burdisso12Unidad 5 – Análisis de regresión

Page 13: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

13

Análisis de regresión con dos variables

13Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 14: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

14

Análisis de regresión con dos variables

• Vamos a comenzar tomando una muestra aleatoria de tamaño n=100 de la base de datos.

• Supongamos por el momento que la muestra se trata de la población.

• Dejemos para más adelante como evaluar el impacto de diferentes muestras en nuestras estimaciones.

14Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 15: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

15

Diagrama de puntos: Ingreso del hogar vs. gasto del hogar

15Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 16: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

16

Esperanza condicional vs. esperanza incondicional

16

< a $2.000 $2.000 - $4.000 $4.000 - $6.000 $6.000 - $8.000 $8.000 - $10.000 > a $10.000 Total muestral

Ingreso promedio $ 1.291 $ 2.871 $ 5.069 $ 6.756 $ 8.701 $ 12.801 $ 5.018

Gasto promedio $ 2.553 $ 2.717 $ 4.879 $ 5.728 $ 6.255 $ 9.377 $ 4.488

13 29 26 17 9 6 100

Ingresos de los hogares

Cantidad de

hogares

• ¿Cual es el valor esperado del gasto mensual de un hogar?

• ¿Cual es el valor esperado del gasto mensual de un hogarcuyos ingresos promedios rondan los $5.000?

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 17: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

17

Esperanza condicional vs. esperanza incondicional

17

FRP: funcion de regresion poblacional

Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 18: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

18

Esperanza condicional o media condicional

18Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 19: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

19

Función de regresión poblacional (FRP)

19Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 20: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

20

Función de regresión poblacional (FRP)

20Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 21: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 21

Función de regresión poblacional (FRP) lineal

Estadística 2015 - Cátedra Prof. Tamara Burdisso21

Estadística 2020 - Prof. Tamara Burdisso

Page 22: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 22

Modelo de regresión lineal

Estadística 2015 - Cátedra Prof. Tamara Burdisso22

Estadística 2020 - Prof. Tamara Burdisso

Page 23: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 23

Función de regresión poblacional (FRP) estocástica

Estadística 2015 - Cátedra Prof. Tamara Burdisso23Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 24: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

24

Esperanza condicional o media condicional

24Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 25: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 25

Función de regresión poblacional (FRP) estocástica

Estadística 2015 - Cátedra Prof. Tamara Burdisso25Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

𝜀𝑖

Page 26: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 26

Función de regresión poblacional (FRP) estocástica

Estadística 2015 - Cátedra Prof. Tamara Burdisso26

Estadística 2020 - Prof. Tamara Burdisso

Page 27: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 27

La perturbación estocástica o el término de error

Estadística 2015 - Cátedra Prof. Tamara Burdisso27Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 28: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 28

La perturbación estocástica o el término de error

Estadística 2015 - Cátedra Prof. Tamara Burdisso28Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 29: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 29

La perturbación estocástica o el término de error

Estadística 2015 - Cátedra Prof. Tamara Burdisso29Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 30: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

30

Modelo de regresión lineal con una variable: resumen

30Unidad 5 – Análisis de regresión Estadística 2020 - Prof. Tamara Burdisso

Page 31: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

31

Modelo de regresión lineal con una variable: interpretación de los parámetros

• La pendiente 𝛽2 mide el cambio marginal en 𝑌 asociado a una unidad de cambio en 𝑋.

• El intercepto, 𝛽1 , es el valor de la recta de regresión cuando 𝑋 = 0. En algunas regresiones el intercepto tiene una interpretación útil. En otras (como en este caso) no tiene ningún significado económico. En estos casos se lo piensa desde la matemática, como el coeficiente que determina el nivel de la recta de regresión.

• El otro factor es el 𝜀𝑖, o término de error. En este caso incorporó todos los otros factores que afectan los gastos y que no dependen del ingreso. Se trata de un término no observable.

Estadística 2020 - Prof. Tamara Burdisso 31Unidad 5 – Análisis de regresión

Page 32: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 32

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso32

• Hasta ahora estuvimos trabajando con una muestra tomadaal azar, pero asumimos que se trataba de la población.

• La realidad es que la población no la conocemos. Y lo que estamos tratando de estimar es la función (recta) de regresión poblacional (FRP) que desconocemos.

• Lo mejor que podemos hacer es estimar la FRP mediante una muestra, a la que llamaremos función (recta) de regresión muestral (FRM).

• ¿Se puede estimar la FRP a partir de los datos de la muestra?

• ¿Será precisa esta estimación de la FRP? Incertidumbre muestral.

• Tomemos otra muestra aleatoria de n=100 y veamos que ocurre.Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 33: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 33

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso33

FRM1

FRM2

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 34: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 34

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso34

FRM1FRM2

FRM3

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 35: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 35

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso35Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 36: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 36

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso36Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 37: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 37

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso37

𝑒𝑖

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 38: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 38

Resultados de la regresión lineal

• La regresión lineal brinda dos resultados importantes:

1. Los valores predichos 𝑌𝑖 de la variable dependiente en función de la variable independiente 𝑋𝑖.

2. El cambio marginal de la variable dependiente (gasto) que reporta መ𝛽2 ante un cambio unitario de la variable independiente (ingreso).

Estadística 2015 - Cátedra Prof. Tamara Burdisso38Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 39: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 39

Estimación: el método de cuadrados mínimos (MCO)

• Dos son los métodos de estimación mas frecuentes:

1. El método de mínimos cuadrados ordinarios (MCO) o “ordinary leastsquares” (OLS).

2. El método de máxima verosimilitud o “maximun likelihood”.

• Bajo determinadas condiciones ambos métodos arrojan los mismos estimadores para መ𝛽1 y መ𝛽2

• Vamos a utilizar el MCO para estimar መ𝛽1 y መ𝛽2 . Este método fue desarrollado por Gauss (S. XVIII) y es el método de estimación mas utilizado en la práctica. Además es un método que tiene propiedades deseables desde el punto de vista estadístico (consistencia e insesgadez de መ𝛽1 y መ𝛽2 ).

Estadística 2015 - Cátedra Prof. Tamara Burdisso39Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 40: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 40

Estimación: el método de cuadrados mínimos (MCO)

• Recordemos que la FRP es 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝜀𝑖 .

• Sin embargo la FRP no es observable y debemos estimarla mediante una muestra con la FRM,

𝑌𝑖 = መ𝛽1 + መ𝛽2𝑋𝑖 + 𝑒𝑖

𝑌𝑖 = 𝑌𝑖 + 𝑒𝑖

𝑒𝑖= 𝑌𝑖 − 𝑌𝑖

𝑒𝑖= 𝑌𝑖 − መ𝛽1 + መ𝛽2𝑋𝑖

𝑒𝑖= 𝑌𝑖 − መ𝛽1 − መ𝛽2𝑋𝑖

Estadística 2015 - Cátedra Prof. Tamara Burdisso40Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 41: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 41

Función de regresión muestral

Estadística 2015 - Cátedra Prof. Tamara Burdisso41

𝑒1

𝑒2

𝑒3

𝑒4

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 42: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 42

Estimación: el método de cuadrados mínimos (MCO)

minimizar σ𝑖=1𝑛 𝑒𝑖

2 = minimizarσ𝑖=1𝑛 𝑌𝑖 − 𝑌𝑖

2

minimizar σ𝑖=1𝑛 𝑌𝑖 − መ𝛽1 − መ𝛽2𝑋𝑖

2

• Se deriva respecto de los valores desconocidos መ𝛽1 y መ𝛽2 y se iguala a cero

𝜕 σ𝑖=1𝑛 𝑒𝑖

2

𝜕𝛽1= −2 σ𝑖=1

𝑛 𝑌𝑖 − መ𝛽1 − መ𝛽2𝑋𝑖 = 0

𝜕 σ𝑖=1𝑛 𝑒𝑖

2

𝜕𝛽2= −2 σ𝑖=1

𝑛 𝑌𝑖 − መ𝛽1 − መ𝛽2𝑋𝑖 𝑋𝑖 = 0

Estadística 2015 - Cátedra Prof. Tamara Burdisso42Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 43: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 43

Estimación: el método de cuadrados mínimos (MCO)

• Con un poco de álgebra se llega a que la solución del sistemade ecuaciones normales es:

መ𝛽2 =σ𝑖=1𝑛 𝑋𝑖 − ത𝑋 𝑌𝑖 − ത𝑌

σ𝑖=1𝑛 𝑋𝑖 − ത𝑋 2

=𝑆𝑋𝑌

𝑆𝑋2

መ𝛽1 = ത𝑌 − መ𝛽2 ത𝑋

• Además podemos reescribir መ𝛽2 en término del coeficiente de correlación

መ𝛽2 =𝑆𝑋𝑌

𝑆𝑋2 =

𝑆𝑋𝑌𝑆𝑌

𝑆𝑋2𝑆𝑌

=𝑆𝑋𝑌𝑆𝑌𝑆𝑋𝑆𝑌𝑆𝑋

= 𝑟𝑋𝑌𝑆𝑌𝑆𝑋

Estadística 2015 - Cátedra Prof. Tamara Burdisso43Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 44: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 44

Estimación: el método de cuadrados mínimos (MCO)

• Notar que la recta de regresión siempre pasa por ത𝑋, ത𝑌

• Recordemos que መ𝛽1 = ത𝑌 − መ𝛽2 ത𝑋

• Sustituyendo መ𝛽1en la recta de regresión 𝑌𝑖 = መ𝛽1 + መ𝛽2𝑋𝑖 se tiene

𝑌𝑖 = ത𝑌 − መ𝛽2 ത𝑋 + መ𝛽2𝑋𝑖

𝑌𝑖 = ത𝑌 + መ𝛽2 𝑋𝑖 − ത𝑋

𝑌𝑖 − ത𝑌 = መ𝛽2 𝑋𝑖 − ത𝑋

• Por lo tanto cuando 𝑋𝑖 = ത𝑋 resulta que 𝑌𝑖 = ത𝑌 , y por ende la ecuación de regresión siempre pasa ത𝑋, ത𝑌

Estadística 2015 - Cátedra Prof. Tamara Burdisso44Unidad 5 – Análisis de regresión

Estadística 2020 - Prof. Tamara Burdisso

Page 45: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 45

Función de regresión muestral: ejemplo muestra 1

Estadística 2015 - Cátedra Prof. Tamara Burdisso45

Dependent Variable: GASTOS_M1Method: Least SquaresDate: 10/10/19 Time: 19:36Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 1534.152 470.3554 3.261686 0.0015INGRESO_M1 0.588552 0.080329 7.326786 0.0000

R-squared 0.353911 Mean dependent var 4487.571Adjusted R-squared 0.347318 S.D. dependent var 3000.105S.E. of regression 2423.748 Akaike info criterion 18.44381Sum squared resid 5.76E+08 Schwarz criterion 18.49592Log likelihood -920.1907 Hannan-Quinn criter. 18.46490F-statistic 53.68180 Durbin-Watson stat 2.273001Prob(F-statistic) 0.000000

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 46: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 46

Función de regresión muestral: ejemplo muestra 1

Estadística 2019 - Cátedra Prof. Tamara Burdisso46

• ¿Cómo se interpreta መ𝛽2 ?

• ¿Cómo se obtiene 𝑌𝑖 ?

Dependent Variable: GASTOS_M1Method: Least SquaresDate: 10/10/19 Time: 19:36Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 1534.152 470.3554 3.261686 0.0015INGRESO_M1 0.588552 0.080329 7.326786 0.0000

R-squared 0.353911 Mean dependent var 4487.571Adjusted R-squared 0.347318 S.D. dependent var 3000.105S.E. of regression 2423.748 Akaike info criterion 18.44381Sum squared resid 5.76E+08 Schwarz criterion 18.49592Log likelihood -920.1907 Hannan-Quinn criter. 18.46490F-statistic 53.68180 Durbin-Watson stat 2.273001Prob(F-statistic) 0.000000

መ𝛽1

መ𝛽2

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 47: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 47

Función de regresión muestral: ejemplo muestra 2

Estadística 2019 - Cátedra Prof. Tamara Burdisso47

Dependent Variable: GASTOS_M2Method: Least SquaresDate: 10/08/19 Time: 19:17Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 2062.348 434.3770 4.747828 0.0000INGRESO_M2 0.470420 0.063727 7.381856 0.0000

R-squared 0.357342 Mean dependent var 4644.695Adjusted R-squared 0.350785 S.D. dependent var 3195.839S.E. of regression 2575.012 Akaike info criterion 18.56489Sum squared resid 6.50E+08 Schwarz criterion 18.61700Log likelihood -926.2447 Hannan-Quinn criter. 18.58598F-statistic 54.49179 Durbin-Watson stat 2.086219Prob(F-statistic) 0.000000

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 48: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Módulo 5- Análisis de regresión 48

Función de regresión muestral: ejemplo muestra 3

Estadística 2019 - Cátedra Prof. Tamara Burdisso48

Dependent Variable: GASTOS_M3Method: Least SquaresDate: 10/08/19 Time: 19:20Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 1736.649 484.1497 3.587007 0.0005INGRESO_M3 0.501499 0.057249 8.759908 0.0000

R-squared 0.439154 Mean dependent var 5013.232Adjusted R-squared 0.433431 S.D. dependent var 4083.877S.E. of regression 3073.966 Akaike info criterion 18.91912Sum squared resid 9.26E+08 Schwarz criterion 18.97123Log likelihood -943.9561 Hannan-Quinn criter. 18.94021F-statistic 76.73599 Durbin-Watson stat 2.228648Prob(F-statistic) 0.000000

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

Page 49: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

49

Fundamentos del modelo de regresión

• Notar que la estimación puntual de መ𝛽1 y መ𝛽2 que brinda el método de MCO, fue solo desarrollos matemáticos. La

estadística no intervino en la obtención de መ𝛽1 y መ𝛽2.

• Pero si el objetivo es algo más que obtener estimadores

puntuales para መ𝛽1 y መ𝛽2, y lo que se desea es inferir sobre los parámetros poblaciones desconocidos 𝛽1 y 𝛽2 a partir de sus contrapartes muestrales, entonces vamos a tener que recurrir a mas información respecto de la forma en que se generan los 𝑌𝑖.

• Pero 𝑌𝑖 = 𝛽1 + 𝛽2𝑋𝑖 + 𝜀𝑖, entonces depende de 𝑋𝑖 𝑦 𝜀𝑖 .

• Por lo tanto hay que hacer supuestos sobre la forma en que se generan 𝑋𝑖 𝑦 𝜀𝑖 .

Estadística 2020 - Prof. Tamara Burdisso 49Unidad 5 – Análisis de regresión

Page 50: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

50

Fundamentos del modelo de regresión

• Se trata de los supuestos del modelo de Gauss Markov.

• Estos supuestos parecen bastante abstractos. Pero tratar de entenderlos es escencial para comprender cuando MCO arroja estimaciones de los coeficientes de regresión de utilidad.

Estadística 2020 - Prof. Tamara Burdisso 50Unidad 5 – Análisis de regresión

Page 51: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

51

Fundamentos del modelo de regresión

• Supuesto #1: La distribución condicional de 𝜀𝑖 dado 𝑋𝑖 tiene media cero, i.e. 𝐸 𝜀𝑖/𝑋𝑖 = 0 y 𝐸 𝜀𝑖 = 0 si las 𝑋𝑖 son no estocásticas.

• Supuesto #2: 𝑋𝑖 , 𝑌𝑖 es una muestra i.i.d. para i=1,…,n. extraída de la distribución conjunta de 𝑋𝑖 e 𝑌𝑖

• Supuesto #3: 𝑋𝑖 e 𝜀𝑖 tienen momentos finitos de orden 4, i.e.

0 < 𝐸 𝑋𝑖4 < ∞ y 0 < 𝐸 𝜀𝑖

4 < ∞. Este supuesto limita la

probabilidad de tener valores extremos de 𝑋𝑖 , 𝑌𝑖 .

• Supuesto #4: Los 𝜀𝑖 son variables aleatorias que tienen media 0

y varianza constante. 𝐸(𝜀𝑖) = 0 y 𝑉𝑎𝑟(𝜀𝑖) = 𝐸 𝜀𝑖2 = 𝜎2

Estadística 2020 - Prof. Tamara Burdisso 51Unidad 5 – Análisis de regresión

Page 52: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

Unidad 5- Análisis de regresión 52

El poder explicativo del modelo de regresión: el R2

• ¿Cuan bien la regresión estimada describe los datos?

• La variable independiente o regresor, ¿da cuenta de mucha o poca variabilidad en la variable dependiente?

• Las observaciones muestrales ¿están agrupadas alrededor de la recta de regresión, o por el contrario están todas dispersas?

• El 𝑅2 y el error estándar de la regresión (o la varianza de la regresión, o la varianza del error del modelo) son una indicación de cuan bien la recta de regresión ajusta a los datos observados.

Estadística 2020 - Prof. Tamara Burdisso 52

Page 53: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

53

El poder explicativo del modelo de regresión: el R2

• El R2 es una medida que varía entre 0 y 1, y da cuenta de la fracción de la variabilidad de 𝑌𝑖 que es explicada por 𝑋𝑖.

• Las definiciones de valor predicho y residuo nos permiten expresar a Yi como la suma de (ver en el gráfico)

𝑌𝑖 = 𝑌𝑖 + 𝑒𝑖

• Una de las propiedades de MCO es que el promedio muestral de los residuos 𝑒𝑖 es 0.

• Además el promedio de los 𝑌𝑖 es igual a ത𝑌

• El punto ത𝑋, ത𝑌 está siempre sobre la recta de regresión estimada.

Estadística 2020 - Prof. Tamara Burdisso53

Unidad 5 – Análisis de regresión

Page 54: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

54

El poder explicativo del modelo de regresión: el R2

• Definamos tres sumas al cuadrado que son claves en la definición del 𝑅2 .

• Ellas son la suma de cuadrados total SCT, la suma de cuadrados explicada SCE y la suma de cuadrados de residuos SCR.

• Notar que Yi − ത𝑌 = 𝑌i − ത𝑌 + 𝑌𝑖 − 𝑌𝑖

• SCT = σ Yi − ത𝑌 2 SCE = σ 𝑌i − ത𝑌2

SCR = σ 𝑌𝑖 − 𝑌𝑖2

• La cantidad de variabilidad explicada por el modelo de regresión lineal es la SCE porque

• SCE = σ 𝑌i − ത𝑌2= σ መ𝛽2 𝑋𝑖 − ത𝑋 2 = መ𝛽2σ 𝑋𝑖 − ത𝑋 2

Estadística 2020 - Prof. Tamara Burdisso54

Unidad 5 – Análisis de regression

Page 55: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

55

El poder explicativo del modelo de regresión: el R2

• SCT = σ Yi − ത𝑌 2 SCE = σ 𝑌i − ത𝑌2

SCR = σ 𝑌𝑖 − 𝑌𝑖2

• La SCT es una medida de la suma de cuadrados total de los desvíos de 𝑌𝑖 en torno a su valor medio ത𝑌, que es explicado por la suma de los cuadrados de los desvíos debidos a la regresión más la suma de los cuadrados de los residuos 𝑒𝑖 o la parte no explicada por el modelo de regresión (ver gráfico).

• Con un poco de álgebra se prueba que SCT = SCE + SCR

•SCT

SCT=

SCE

SCT+

SCR

SCT

• 1 =SCE

SCT+

SCR

SCT→ 𝑅2 =

SCE

SCT= 1 −

SCR

SCT

Estadística 2020 - Prof. Tamara Burdisso55Unidad 5 – Análisis de regresión

Page 56: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

56

El poder explicativo del modelo de regresión: el R2

Estadística 2020 - Prof. Tamara Burdisso56Unidad 5 – Análisis de regresión

𝑒𝑖

Page 57: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

57

Correlación y el R2

• El 𝑅2 de una regresión de 𝑌 sobre un único regresor 𝑋, es igual al cuadrado del coeficiente de regresión entre 𝑋 e 𝑌.

• 𝑅2 = 𝑟𝑋,𝑌2 → 𝑟𝑋,𝑌 = 𝑅2

Estadística 2020 - Prof. Tamara Burdisso57

Unidad 5 – Análisis de regresión

Page 58: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

58

El poder explicativo del modelo de regresión: el R2

• 0 ≤ 𝑅2 ≤ 1

• Si መ𝛽2 = 0 entonces 𝑋 no explica nada de la variabilidad de 𝑌, los valores predichos de 𝑌 basados en la regresión es exactamente ത𝑌 . Por lo tanto la SCE = 0 y el 𝑅2 = 0.

• Por el contrario si 𝑋 explica toda la variabilidad de la 𝑌, el 𝑅2 = 1.

• Por lo general, la interpretación del 𝑅2 suele multiplicarse por 100, y se lee como el porcentaje de la variación muestral en Yexplicada por el modelo de regresión, i.e. la variación en 𝑋.

• Cuidado con la interpretación del 𝑅2 =SCE

SCT= 1 −

SCR

SCT

Estadística 2020 - Prof. Tamara Burdisso58

Unidad 5 – Análisis de regresión

Page 59: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

59

El error estándar de la regresión

• La suma de los cuadrados de los errores se utiliza para obtener una estimación de la varianza del error del modelo 𝜀𝑖, que a su vez esta varianza nos va a servir para realizar la inferencia estadística del modelo de regresión.

• De acuerdo al supuesto #4 𝐸(𝜀𝑖) = 0 y 𝑉𝑎𝑟(𝜀𝑖) = 𝜎2

• Una estimación de la varianza del error del modelo esta dada por

ො𝜎2 = 𝑆𝑒2 =

σ𝑖=1𝑛 𝑒𝑖

2

𝑛 − 2=

𝑆𝐶𝑅

𝑛 − 2

• Se divide por n-2 porque se estimaron dos parámetros መ𝛽1 y መ𝛽2

• Este estimador de la varianza del error del modelo es la base para la inferencia estadística en el modelo de regresión.

Estadística 2020 - Prof. Tamara Burdisso59Unidad 5 – Análisis de regresión

Page 60: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

60

El poder explicativo del modelo de regresión: el R2

60

Dependent Variable: GASTOS_M1Method: Least SquaresDate: 10/10/19 Time: 19:36Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 1534.152 470.3554 3.261686 0.0015INGRESO_M1 0.588552 0.080329 7.326786 0.0000

R-squared 0.353911 Mean dependent var 4487.571Adjusted R-squared 0.347318 S.D. dependent var 3000.105S.E. of regression 2423.748 Akaike info criterion 18.44381Sum squared resid 5.76E+08 Schwarz criterion 18.49592Log likelihood -920.1907 Hannan-Quinn criter. 18.46490F-statistic 53.68180 Durbin-Watson stat 2.273001Prob(F-statistic) 0.000000

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

SCRො𝜎

𝑆𝑌 =σ𝑖=1𝑛 𝑌𝑖 − ത𝑌 2

𝑛 − 1

ത𝑌

Page 61: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

61

Inferencia estadística

• Hasta el momento estudiamos la estimación de los parámetros de modelo de regresión lineal con dos variables.

• Mediante el método MCO, obtuvimos estimaciones 𝛽1, 𝛽2y 𝜎2

que llamamos መ𝛽1 , መ𝛽2 y ො𝜎2 = 𝑆𝑒2. Dado que son estimadores

estos valores cambian de muestra en muestra.

• La estimación es la mitad de trabajo que debemos realizar, la otra mitad es la inferencia o test de hipótesis.

• Se debe tener presente que, en el análisis de regresión, el objetivo no solo consiste en estimar la FRM, sino utilizar la FRM para realizar inferencia sobre la FRP.

• Por lo tanto querríamos saber cuan cerca esta መ𝛽2del verdadero 𝛽2 o ො𝜎2del verdadero 𝜎2.

Estadística 2020 - Prof. Tamara Burdisso61

Unidad 5 – Análisis de regresión

Page 62: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

62

Inferencia estadística

• Entonces como መ𝛽1 , መ𝛽2 y ො𝜎2 son variables aleatorias es necesario conocer sus valores medios, sus varianzas y sus distribuciones de probabilidad para poder realizar la inferencia.

• Para hallar las distribuciones de estos estimadores se deben recurrir a los supuestos de Gauss Markov, que enumeramos anteriormente.

• Si se cumple el supuesto #4 (los 𝜀𝑖 son variables aleatorias que tienen media 0 y varianza constante. 𝐸(𝜀𝑖) = 0 y 𝑉𝑎𝑟(𝜀𝑖) =𝐸 𝜀𝑖

2 = 𝜎2 ) y además si se asume que los 𝜀𝑖 son normales y las 𝑋𝑖 son fijas, entonces 𝑌𝑖 también tiene distribución normal con la misma varianza de los 𝜀𝑖.

Estadística 2020 - Prof. Tamara Burdisso62

Unidad 5 – Análisis de regresión

Page 63: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

63

Inferencia estadística

• Entonces a partir de los supuestos de Gauss Markov sumado a la normalidad de los 𝜀𝑖 se pueden obtener las propiedades de los estimadores

• Son insesgados

• Son de mínima varianza en la clase de estimadores insesgados, i.e. son eficientes

• Son consistentes (a medida que el tamaño de muestra crece a ∞, convergen a los valores poblacionales.

• Y como los 𝜀𝑖 son normales se tiene que

Estadística 2020 - Prof. Tamara Burdisso63

Unidad 5 – Análisis de regresión

Page 64: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

64

Distribuciones de probabilidad de መ𝛽1 y መ𝛽2

• 𝐸 መ𝛽1 = 𝛽1 𝑉𝑎𝑟 መ𝛽1 = 𝜎𝛽12 =

σ 𝑋𝑖

𝑛 σ 𝑋𝑖− ത𝑋 2 𝜎2

• O en forma compacta መ𝛽1~𝑁 𝛽1, 𝜎𝛽12

• 𝐸 መ𝛽2 = 𝛽2 𝑉𝑎𝑟 መ𝛽2 = 𝜎𝛽22 =

𝜎2

σ 𝑋𝑖− ത𝑋 2

• O en forma compacta መ𝛽2~𝑁 𝛽2, 𝜎𝛽22

• Por lo tanto se puede afirmar que

• 𝑍 =𝛽1−𝛽1

𝜎𝛽1

y 𝑍 =𝛽2−𝛽2

𝜎𝛽2

tienen distribución 𝑁 0,1

Estadística 2020 - Prof. Tamara Burdisso64

Unidad 5 – Análisis de regresión

Page 65: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

65

Distribuciones de probabilidad de መ𝛽1 y መ𝛽2

Estadística 2020 - Prof. Tamara Burdisso65

Unidad 5 – Análisis de regresión

Page 66: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

66

Intervalo de confianza para መ𝛽1 y መ𝛽2

• 𝑍 =𝛽2−𝛽2

𝜎𝛽2

=𝛽2−𝛽2

𝜎2

σ 𝑋𝑖−ഥ𝑋2

=𝛽2−𝛽2 σ 𝑋𝑖− ത𝑋 2

𝜎

• Pero no conocemos 𝜎 . Pero ො𝜎2 = 𝑆𝑒2 =

σ𝑖=1𝑛 𝑒𝑖

2

𝑛−2=

𝑆𝐶𝑅

𝑛−2es

un estimador insesgado de 𝜎2

• Por lo tanto ො𝜎𝛽22 =

𝑆𝑒2

σ 𝑋𝑖− ത𝑋 2 =𝑆𝑒2

𝑛−1 𝑆𝑋2

• Y sabemos que cuando reemplazamos 𝜎𝛽2por ො𝜎𝛽2puede escribirse como

Estadística 2020 - Prof. Tamara Burdisso66

Unidad 5 – Análisis de regresión

Page 67: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

67

Intervalo de confianza para መ𝛽1 y መ𝛽2

• 𝑡 =𝛽2−𝛽2

ෝ𝜎𝛽2

=𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟−𝑝𝑎𝑟á𝑚𝑒𝑡𝑟𝑜

𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒𝑙 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟=

𝛽2−𝛽2

ෝ𝜎2

σ 𝑋𝑖−ഥ𝑋2

=

=𝛽2−𝛽2 σ 𝑋𝑖− ത𝑋 2

ෝ𝜎

• El estadístico 𝑡 tiene una distribución 𝑡 de student con 𝑛 − 2 grados de libertad.

• El intervalo de confianza para 𝛽2 al 100 1 − 𝛼 %:

• መ𝛽2 ± 𝑡 Τ𝛼 2∗ ො𝜎𝛽2

• Notar que la varianza de መ𝛽2 depende de 𝑆𝑒2 y 𝑆𝑋

2

Estadística 2020 - Prof. Tamara Burdisso67

Unidad 5 – Análisis de regresión

Page 68: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

68

Intervalo de confianza para መ𝛽1 y መ𝛽2

• Idem para 𝛽1 al 100 1 − 𝛼 % : መ𝛽1 ± 𝑡 Τ𝛼 2∗ ො𝜎𝛽1

• Donde ො𝜎𝛽1 =1

𝑛+

ത𝑋2

σ 𝑋𝑖− ത𝑋 2 𝑆𝑒2 =

1

𝑛+

ത𝑋2

𝑛−1 𝑆𝑋2 𝑆𝑒

2

• Recordar la interpretación del intervalo de confianza

• 𝑃 መ𝛽2 − 𝑡 Τ𝛼 2∗ ො𝜎𝛽2 ≤ 𝛽2≤ መ𝛽2 + 𝑡 Τ𝛼 2

∗ ො𝜎𝛽2 = 1 − 𝛼

Estadística 2020 - Prof. Tamara Burdisso68

Unidad 5 – Análisis de regresión

Page 69: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

69

Intervalo de confianza para 𝜎2

• Para la varianza del modelo 𝜎2, se tiene que 𝑛 − 2ෝ𝜎2

𝜎2

se distribuye según una chi-cuadrado con 𝑛 − 2grados de libertad, siempre que los 𝜀𝑖 sean normales.

• 𝑃 𝑛 − 2ෝ𝜎2

𝜒ൗ𝛼 2

2 ≤ 𝜎2 ≤ 𝑛 − 2ෝ𝜎2

𝜒ൗ1−𝛼2

2 = 1 − 𝛼

Estadística 2020 - Prof. Tamara Burdisso69

Unidad 5 – Análisis de regresión

Page 70: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

70

Test de hipótesis para መ𝛽1 y መ𝛽2

• Recordemos que 𝑡 =𝛽2−𝛽2

ෝ𝜎𝛽2

~𝑡𝑛−2

• 𝐻0: 𝛽2 = 𝛽2∗ 𝑣𝑠. 𝐻𝐴: 𝛽2 ≠ 𝛽2

• Todos los paquetes estadísticos evalúan la siguiente hipótesis 𝐻0: 𝛽2 = 0 𝑣𝑠. 𝐻𝐴: 𝛽2 ≠ 0

• Pero uno puede decidir que evaluar ya que conoce መ𝛽2y ො𝜎𝛽2 para construer el test de hipotesis que desee, tanto bilateral como unilateral a derecha o izquierda.

• Idem para𝛽1y 𝜎2

Estadística 2020 - Prof. Tamara Burdisso70

Unidad 5 – Análisis de regresión

Page 71: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

71

La significatividad estadística del መ𝛽2

71

Dependent Variable: GASTOS_M1Method: Least SquaresDate: 10/10/19 Time: 19:36Sample: 1 100Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob.

C 1534.152 470.3554 3.261686 0.0015INGRESO_M1 0.588552 0.080329 7.326786 0.0000

R-squared 0.353911 Mean dependent var 4487.571Adjusted R-squared 0.347318 S.D. dependent var 3000.105S.E. of regression 2423.748 Akaike info criterion 18.44381Sum squared resid 5.76E+08 Schwarz criterion 18.49592Log likelihood -920.1907 Hannan-Quinn criter. 18.46490F-statistic 53.68180 Durbin-Watson stat 2.273001Prob(F-statistic) 0.000000

Unidad 5 – Análisis de regresiónEstadística 2020 - Prof. Tamara Burdisso

ො𝜎𝛽2𝑡 =

መ𝛽2ො𝜎𝛽2

~𝑡𝑛−2

𝐻0: 𝛽2 = 0 𝑣𝑠. 𝐻𝐴: 𝛽2 ≠ 0

Valor-p asociado al estadístico t

መ𝛽2

Idem para መ𝛽1

Page 72: Análisis de regresión...•El análisis de regresión trata del estudio de la dependencia de una variable (variable dependiente) respecto de una o más variables (variables explicativas)

72

Bibliografía para Análisis de Regresión

• Newbold, Paul (2008) . Sexta Edición. Estadística para los negocios y la economía. Pearson. Prentice Hall. Cápitulo 11

• Gujarati, Damodar y D. C. Porter (2009). Quinta Edición. Econometría. Mc Graw Hill. Capítulos 1 a 5.

• Stock, James y M.W. Watson (2003). Introduction toEconometrics. Addison Wesley. Cápitulos 1 a 4.

Estadística 2020 - Prof. Tamara Burdisso72

Unidad 5 – Análisis de regresión