taller modelo de regresi n lineal

Upload: ignacius-valdebenito

Post on 08-Jan-2016

37 views

Category:

Documents


0 download

DESCRIPTION

Regresión lineal

TRANSCRIPT

Taller Modelo de Regresin LinealEstadstica IIProblema 1. El siguiente conjunto de datos era tomado sobre grupos de trabajadoras de Inglaterra y Gals en el perodo de 1970-72. Cada grupo est formado por trabajadores de la misma profesin (mdicos, trabajadores textiles, decoradores,...etc,) y en cada uno de los veinticinco grupos muestreados se han observado dos variables: el ndice de estandarizado de consumo de cigarrillos (variable regresora x) y el ndice de muertes por cncer de pulmn (variable dependiente y). (Occupational mortality: the registar generals decennial supplement for England and Wales, 1970-72, series Ds, n.1, London:HMSO,149).1. Estudiar el modelo de regresin lineal del ndice de mortalidad frente al ndice de fumadores interpretndolos parmetros estimados.2. Calcular la tabla ANOVA. Conclusiones.3. Realice las pruebas de significancia de los parmetros estimados.4. Determine el coeficiente de determinacin e interprete su valor.5. Comprobar si se verifican las hiptesis del modelo.

x yx y x y

778410288133146

13711691104115128

117123104129105115

94128107868779

116155112969185

102101113144100120

1111181101397660

931131251136651

88104

Problema 2. En el archivo Problema-5-10 se encuentran datos relativos a partidos de la liga ACB de baloncesto. Se desea estudiar si existe alguna relacin lineal entre la variable, puntos por partido (PUNTPART) que es capaz de anotar un jugador de baloncesto respecto a las siguientes variables explicatorias: - La altura del jugador (ALTURA).- Los minutos que juega por partido (MINPART). - Los balones que pierde por partido (BPPART). - Las faltas personales cometidas por partido (FPPART). - El porcentaje en tiros de campo por partido (porcentaje obtenido de los tiros de dos y tres puntos conseguidos e intentados) (POR_TC).(Recogida de datos: Los datos para realizar la regresin se han obtenido a partir de la Gua Oficial Liga 1989-1990, de la ACB (Asociacin de Clubs de Baloncesto), para lo cual se han seleccionado 62 jugadores al azar de entre el total.) En base a estos datos, se pide:1. Ajustar un modelo de regresin a estos datos, sin excluir ninguna variable e interpretar el resultado. Es el ajuste bueno?2. Cree que pueda existir multicolinealidad en el modelo anterior?3. Con el modelo anterior Cules son las observaciones atpicas y/o influyentes?4. Puede existir un modelo de regresin lineal ms adecuado segn estos datos? Justificar la respuesta.5. Analice los supuestos del modelo.Problema 3. En el archivo Problema-5-14 se presentan datos de contaminacin atmosfrica en 41 ciudades de EEUU relativos a los aos 1969-71. La variable de inters es Y =contenido deSO2 en el aire en microgramos por metro cbico y se desea estudiar su relacin con seis variables regresoras, dos relativas a ecologa humana y cuatro al clima. Son las siguientes: X1=temperatura media anual en grados Farenheit. X2=nmero de fbricas con ms de 20 empleados X3=nmero de habitantes, en miles X4=Velocidad media del viento al ao en millas por hora X5=precipitacin media anual en litros por pulgada X6=nmero medio de das con lluvia al ao El objetivo del estudio es encontrar un modelo de regresin mltiple que explique adecuadamente el comportamiento de la variable Y, mediante el proceso de seleccin de variables:a) hacia adelante, mostrando todos los pasos del algoritmo.b) hacia atrs, mostrando todos los pasos del algoritmo.Del modelo resultante, realice prueba de significancia del modelo, inferencia sobre los parmetros estimados, validacin de los supuestos del modelo y determine la calidad de ajuste.