prácticas excel - uc3mejercicios adicionales • una vez completadas las tareas anteriores, y...

20
Prácticas Excel Estadística II Práctica 1I: Estimación de modelos de regresión lineal simple y múltiple martes, 16 de julio de 13

Upload: others

Post on 07-Apr-2020

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Prácticas Excel Estadística II

Práctica 1I:Estimación de modelos de regresión lineal

simple y múltiple

martes, 16 de julio de 13

Page 2: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Objetivo de la práctica

• Objetivo:

• Analizar datos de ocupación en función del PIB y el nivel de estudios, por Comunidades Autónomas

• Tareas a realizar:

• Estimar modelos de regresión y evaluar su significación

• Emplearlos para predicción

• Comprobar el cumplimiento de las hipótesis

martes, 16 de julio de 13

Page 3: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Datos

• Datos a emplear en esta práctica:

• INE (EPA y Contabilidad Regional) años 2008 y 2009:

• Niveles de ocupación por Comunidades

• PIB por habitante

• Porcentajes de la población con estudios universitarios

• Disponibles en el fichero “DatosContReg12.xlsx”

martes, 16 de julio de 13

Page 4: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Obtención de datos

• Datos disponibles en la página Web del Instituto Nacional de Estadística

• (1) Acceder a la página www.ine.es

• (2) Seleccionar enlace a “INEbase”

(1) Página Web INE

(2) Botón acceso INEbase

martes, 16 de julio de 13

Page 5: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Análisis de datos

• Emplearemos la herramienta “Análisis de datos” de Excel

• Asegúrate que esté instalada

• Para ello:

• (1) En la pestaña “Datos”

• (2) Verifica que aparece la opción “Análisis de datos”

• Si no lo está, comprueba en la práctica 1 como instalarla

(1) Pestaña “Datos”

(2) Opción “Análisis de datos”

martes, 16 de julio de 13

Page 6: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Análisis de datos

• En Excel, carga el fichero “DatosContReg12.xlsx”

• (1) Seleccionamos la pestaña “Datos ejercicio”

• Diagrama de dispersión

• (2) Selecciona las columnas de datos “Empleo” y “PIB”

• (3) Ve a la opción “Insertar”

• (4) En “Gráficos” selecciona “Dispersión”

(2) Seleccionar “Empleo” y “PIB”

(3) Insertar

(1) Pestaña “Datos ejercicio”

(4) Dispersión

martes, 16 de julio de 13

Page 7: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Diagrama de dispersión

• Diagrama de dispersión

• (1) Selecciona las ventana del gráfico

• (2) En “Herramientas de gráficos”

• (3) Selecciona el diseño de gráfico preferido

(3) Diseño de gráfico

(1) Ventana del gráfico

(2) Herramientas de gráficos

martes, 16 de julio de 13

Page 8: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Análisis de regresión

• Modelo de regresión lineal simple para la variable “Empleo” en función de “PIB”

• Seleccionamos:

• (1) “Datos”

• (2) “Análisis de datos”

• (3) “Regresión”

(3) Regresión

(1) Datos (2) Análisis de datos

martes, 16 de julio de 13

Page 9: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Regresión

• Datos de entrada:

• (1) Variable dependiente

• (2) Variable independiente

• (3) Salida de datos (en la hoja)

• (4) Nivel de confianza para intervalos de parámetros

• (5) Diagnósticos para residuos

• (6) Gráfico normalidad

(2) Variable independiente (3) Salida de datos(1) Variable dependiente

(4) Nivel de confianza (5) Diagnósticos residuos (6) Gráfico normalidad

martes, 16 de julio de 13

Page 10: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Salida regresión

• Valores obtenidos:

• (1) Coeficientes del modelo

• (2) Coeficiente de determinación R2

• (3) p-valor de los contrastes de significación

• (4) Intervalos de confianza para los coeficientes

(1) Coeficientes del modelo

(2) Coeficiente de determinación

(3) p-valor de contrastes

(4) Intervalos de confianza coeficientes del modelo

martes, 16 de julio de 13

Page 11: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Interpretación de resultados

• ¿Cuál es el modelo estimado?

ŷ = 0.184 + 0.0112 x

• Qué valor toma el coeficiente de determinación

R2 = 0.933

• ¿Es significativo el modelo?

p-valor = 3.12 10-10

• Intervalo de confianza al 95% para la pendiente:

[ 0.0095 ; 0.0128 ]

martes, 16 de julio de 13

Page 12: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Predicción• Valor estimado ŷ para x0 = 22.32

• (1) Estimación puntual:

ŷ = 0.184 + 0.0112 x 22.32 = 0.434

• Intervalo de confianza

• (2) Error estándar

• (3) Valor de sR2 de tabla ANOVA

• (4) Intervalo de confianza

(1) Estimación puntual

(4) Intervalo de confianza

(3) Varianza residual

SEy

=

s

s

2R

✓1 +

1n

+(x0 � x)2

(n� 1)s2x

IC0.05(y) = y ⌥ t15;0.025 SEy

(2) Error estándar

martes, 16 de julio de 13

Page 13: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Diagnóstico del modelo (I)

• Valores de los residuos

• (1) Selecciona “Residuos estándares” en “Residuales”

• (2) Analiza los valores obtenidos bajo “Residuos estándares”

• ¿Hay algún valor que sea muy elevado bajo una distribución normal estándar?

• ¿Observación 16 (País Vasco)?

(1) Selecciona “Residuos estándares”

(2) Analiza los valores de los residuos estándares

martes, 16 de julio de 13

Page 14: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

• Gráfico de residuos

• (1) Selecciona “Gráfico de residuales” en “Residuales”

• (2) Analiza el gráfico buscando posibles indicaciones de:

• No linealidad

• Heterocedasticidad

• ¿Observas algún patrón en el gráfico?

Diagnóstico del modelo (II)(1) Seleccionar “Gráfico de residuales”

(2) Analizar el gráfico

martes, 16 de julio de 13

Page 15: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

• Gráfico de normalidad de los residuos

• (1) Selecciona “Gráfico de probabilidad normal” en “Probabilidad normal”

• El gráfico representa los valores de y frente a las probabilidades bajo una normal

• Debiera mostrar una línea recta bajo normalidad en y

• (2) Analiza el gráfico buscando desviaciones de linealidad

Diagnóstico del modelo (III)(1) Seleccionar “Gráfico de probabilidad normal”

(2) Analizar el gráfico

martes, 16 de julio de 13

Page 16: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Regresión múltiple

• Datos de entrada:

• (1) Variable dependiente

• (2) Variables independientes

• La diferencia con el caso anterior

• (3) Salida de datos (en la hoja)

(2) Variables independientes

(3) Salida de datos

(1) Variable dependiente

martes, 16 de julio de 13

Page 17: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Salida regresión múltiple

• Valores obtenidos:

• (1) Coeficientes del modelo

• (2) Coeficiente de determinación R2

• (3) p-valor del contraste de significación global

• (4) p-valor de los contrastes de significación individuales

• (5) Intervalos de confianza para los coeficientes

(1) Coeficientes del modelo

(2) Coeficiente de determinación

(4) p-valor contrastes significación individuales

(5) Intervalos de confianza coeficientes del modelo

(3) p-valor contraste de significación global

martes, 16 de julio de 13

Page 18: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Interpretación de resultados

• ¿Cuál es el modelo estimado?

ŷ = 0.189 + 0.0143 x1 - 0.407 x2

• ¿Es globalmente significativo el modelo?

p-valor = 2.50 10-11

• ¿Son significativos los coeficientes de las variables indep.?

p-valor(β1) = 4.48 10-10 , p-valor(β2) = 1.17 10-3

• Efecto de un aumento del 5% en la proporción de la población con estudios superiores en Castilla y León:

Δŷ = -0.407 x 0.05 x 0.194 = -0.004

martes, 16 de julio de 13

Page 19: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Ejercicios adicionales

• Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos del año 2009:

1. Estimes el modelo de regresión lineal simple

• ¿Cambia mucho la relación respecto del año anterior?

2. Estimes el modelo de regresión lineal múltiple

• ¿Cambia mucho el coeficiente del porcentaje de personas con estudios superiores?

martes, 16 de julio de 13

Page 20: Prácticas Excel - UC3MEjercicios adicionales • Una vez completadas las tareas anteriores, y utilizando los datos disponibles en la pestaña “Datos INE”, se pide que, con datos

Ejercicios adicionales

• También:

3. Estima un modelo de regresión lineal múltiple que explique la ocupación en función de

• El PIB por habitante y

• El porcentaje de la población con estudios de doctorado

I. ¿Es significativo el modelo?

II. ¿Es significativo el coeficiente del porcentaje con estudios de doctorado?

martes, 16 de julio de 13