taller_regresión lineal

7
ESTADISTICA DESCRIPTIVA Y EXPLORATORIA TALLER No 5 - Profesor: OSCAR F. SOTO B. 1. Una agencia desea estimar los gastos en alimentación de una familia con base en el ingreso y su tamaño. Los datos que se encuentran en la tabla siguiente representan los gastos de alimentación por mes en miles de dólares, contra el ingreso mensual, y el tamaño de la familia, para 15 familias que se seleccionaron al azar en cierta localidad geográfica. Gastos en alimentación mensual Ingreso mensual en miles Tamaño de la familia 0,43 2,1 3 30,31 1,1 4 0,32 0,9 5 0,46 1,6 4 1,25 6,2 4 0,44 2,3 3 0,52 1,8 6 0,29 1 5 1,29 8,9 3 0,35 2,4 2 0,35 1,2 4 0,78 4,7 3 0,43 3,5 2 0,47 2,9 3 0,38 1,4 4 a) Analice comparativamente la asimetría y el apuntamiento de las tres variables anteriores, establezca una recta de regresión entre gastos en alimentación e ingresos. b) Establezca la ecuación de la línea resistente. Chequee los residuales y si estos no se ajustan, haga el proceso iterativo tres pasos más. 2. Para un grupo de 56 regiones del país se conocen los siguientes resultados referentes a la longitud de carreteras sin asfaltar (X) y longitud de carreteras asfaltadas (Y), en miles de kilómetros: M(X) = 20 ; M(Y) = 21 ; M(X 2 ) = 2000 ; M(Y 2 ) = 2842 ; COV ( X,Y ) = -4,9 Determine la varianza del total de carreteras, entendido como las asfaltadas mas las sin asfaltar. 3. Si la varianza de la suma de dos variables es 10 y la varianza de su diferencia es 4, obtenga la covarianza entre las dos variables.

Upload: alejandro-lopez

Post on 24-Jul-2015

248 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Taller_regresión lineal

ESTADISTICA DESCRIPTIVA Y EXPLORATORIA

TALLER No 5 - Profesor: OSCAR F. SOTO B.

1. Una agencia desea estimar los gastos en alimentación de una familia con base en el ingreso y su tamaño. Los datos que se encuentran en la tabla siguiente representan los gastos de alimentación por mes en miles de dólares, contra el ingreso mensual, y el tamaño de la familia, para 15 familias que se seleccionaron al azar en cierta localidad geográfica.  

Gastos en alimentación mensual Ingreso mensual en miles Tamaño de la familia

0,43 2,1 3

30,31 1,1 4

0,32 0,9 5

0,46 1,6 4

1,25 6,2 4

0,44 2,3 3

0,52 1,8 6

0,29 1 5

1,29 8,9 3

0,35 2,4 2

0,35 1,2 4

0,78 4,7 3

0,43 3,5 2

0,47 2,9 3

0,38 1,4 4

a) Analice comparativamente la asimetría y el apuntamiento de las tres variables anteriores, establezca una recta de regresión entre gastos en alimentación e ingresos.

b) Establezca la ecuación de la línea resistente. Chequee los residuales y si estos no se ajustan, haga el proceso iterativo tres pasos más.

  2. Para un grupo de 56 regiones del país se conocen los siguientes resultados referentes a la longitud de

carreteras sin asfaltar (X) y longitud de carreteras asfaltadas (Y), en miles de kilómetros:

M(X) = 20 ; M(Y) = 21 ; M(X2) = 2000 ; M(Y2) = 2842 ; COV ( X,Y ) = -4,9Determine la varianza del total de carreteras, entendido como las asfaltadas mas las sin asfaltar.

3. Si la varianza de la suma de dos variables es 10 y la varianza de su diferencia es 4, obtenga la covarianza entre las dos variables.

4. En cierto análisis de regresión lineal se encontró que la varianza residual y la varianza explicada de la variable estimada eran iguales. Interpretándolo, determine el coeficiente de determinación de las variables consideradas.

5. Sean X et Y variables asociadas de una manera perfecta con V(X) = 4 y V(Y) = 16. Para U = - 2 - 0,5 X y W = 5 + 0,2 Y obtenga el coeficiente de correlación

6. Con base en los datos de 20 años de la empresa PROINVESTA, se encontraron los siguientes resultados de un estudio:

X = ventas; Y = costos de publicidadC = 1500 + 0,2Y C = costo de producción

U = 2500 + 50 X U = utilidad

Page 2: Taller_regresión lineal

Calcular el coeficiente de correlación entre utilidades y gastos, si se sabe que el coeficiente de correlación entre ventas y publicidad es de 0,9. Comente el resultado obtenido.

7. En una m.a.s. de 60 empresas inversionistas, se observó el valor de sus inversiones en industria (Y) y el de las inversiones en ganadería (X), expresadas en millones de pesos, encontrándose:M(X) = 4; M(Y) = 3; V(X) = 64; V(Y) = 49; r = -0,7

Suponiendo relación lineal entre las dos variables, se podrá aceptar el supuesto de que al invertir 1,5 millones de pesos en industria, las empresas tienden a invertir por lo menos 5,8 millones de pesos en ganadería?

8. En una m.a.s. de 10 comerciales de T.V. se observó su duración en segundos (X) y su costo en cien miles de pesos (Y), para su emisión en horario AA. Se encontró que:

M(X) = 18; M(Y) = 1,2: V(X) = 8; V(Y) = 2; COV(X,Y) = 4

La emisión de propagandas en horario AAA, representa un aumento del 35% en los costos y una disminución del 20% en la duración.Estime el costo promedio de las propagandas que emitidas en horario AAA, duren 25 segundos.

9. De un análisis de regresión rectilínea se tomaron los resultados siguientes, obtenidos de 20 observaciones:

M(X2 ) = 81; M(Y2 )=49; COV(X,Y) = 50; M(XY) = 62; M(X) + M(Y) = 7; M(X)>M(Y)

Calcule e interprete el valor del error estándar de estimación de la recta de regresión de Y en función de X.

10. Para un grupo de 8 familias se ha realizado un estudio sobre el número de componentes (Y) y el número de cuartos habitables de la vivienda (X), obteniéndose:

Y* = 2 + 0,8X; M(Y) = 10; V(X) = 50; V(Y) = 64Estime el número de cuartos habitables, para una familia formada por 7 componentes.

11. La línea de mercado de capitales de la teoría del portafolio postula, para inversiones eficientes, una relación lineal directa entre el retorno esperado y el riesgo, expresado en términos de la volatilidad del mercado (desviación estándar), como la siguiente:

Ei = β0 + β1σi, donde Ei es el retorno esperado sobre el portafolio i, y σi es la desviación estándar del retorno. Dados los siguientes datos, contraste la evidencia con la teoría.

Ei 14.6 10 10.5 12 11.9 12.4 14.8 15.7 10.9 14.4 11σi 15.3 9.2 13.5 16.3 15.6 12.1 16.8 19.3 13.7 21.4 11.9

}12. El 31 de Diciembre de 1992 se tenían los siguientes valores para los 15 empleados de una empresa, siendo X1=salario semanal y X2=años de servicio:

M(X1) = 3820; M(X2) = 4; S1 =40.000; S2 =25; S12 = 300

Si el 31 de diciembre de 2008 los empleados eran exactamente los mismos y los salarios fueron aumentados en 76% desde 1992, pruebe la hipótesis de que entre salarios y años de servicio existe independencia lineal, al 31 de diciembre de 2008.

13. Ante el problema del transporte en Bogotá, se determino estudiar la relación entre las variables distancia al sitio de trabajo (X kms) y el tiempo empleado en llegar a él (Y minutos). Para ello se seleccionaron al azar 15 empleados y se obtuvo la siguiente información:

X: 3 5 7 8 10 11 12 12 13 15 15 16 18 19 20

Page 3: Taller_regresión lineal

Y: 7 20 20 15 25 17 20 35 26 25 35 32 44 37 45

a. Utilizando el modelo lineal, estime el tiempo empleado por un obrero que resida a 17 kms del lugar de trabajo.b. Se podrá aceptar que el incremento en el tiempo empleado para llegar al sitio de empleo, por cada km adicional de distancia, es por lo menos de 1,5 minutos?

14. Al observar el número de hijos (X) y los gastos familiares mensuales en alimentación (Y en millones de pesos) en una muestra de 10 familias del barrio Modelo de Bogotá, se encontró:

X : 1 5 3 2 4 3 1 5 1 6Y : 2 3 5 4 6 5 1 4 1 1

Con se podrá aceptar el supuesto de que al ajustar una recta de regresión, donde Y sea la variable explicada, su varianza residual es por lo menos de 3,5?

15. Para un grupo de empleados de la empresa PROINVESTA, se sabe que la varianza de sus salarios es de 300 y la de sus gastos es de 240. Además la covarianza entre los salarios y los gastos es de 150. Si X representa salarios y Y gastos, se conoce que:

Ahorros: W = 4X - 2Y ; Impuestos: I = 0,5X - 0,2Y

Calcule el coeficiente de determinación entre ahorros e impuestos, interpretando el resultado obtenido.

16. Para un grupo de empresas de alimentos se hizo un análisis de sus ventas (X) y sus gastos en publicidad (Y), del cual se obtuvieron los siguientes datos para una m.a.s. de 45 de tales empresas, expresados en millones de pesos:

M(X) = 10; M(Y) = 1; V(X) = 4; V(Y) = 225; COV(X,Y) = 2

Se estableció luego que las utilidades netas (U) y los costos generales (G), eran de la forma: U = 2,5 + 0,5X G = 1,5 + 0,2YEstime las utilidades netas de una empresa que tenga costos generales de 3 millones de pesos, suponiendo relación lineal entre estas variables.

17. Durante 20 años se obtuvieron los siguientes datos sobre ventas anuales (X) y gastos en publicidad (Y), expresados en millones de pesos, para la pequeña industria:E(X) = 18 ; E(Y) = 1,2 ; V(X) = 8 ; V(Y) = 2 ; COV (X,Y) = 4

En los cinco años siguientes se observó un aumento en los gastos de publicidad del 20%, lo cual originó un aumento en las ventas del 54%. Estime, para después de los cinco años, las ventas de la pequeña industria, si se gastan en publicidad 1,5 millones de pesos

18. La siguiente información se refiere al consumo de café en USA (Y) en relación con el precio observado al detal promedio (X), 1990-2000.

Año Y: Tazas diarias por persona

X: precio por libra

1990 2.57 0.771991 2.5 0.741992 2.35 0.721993 2.3 0.731994 2.25 0.761995 2.2 0.751996 2.11 1.081997 1.94 1.811998 1.97 1.391999 2.06 1.22000 2.02 1.17

Page 4: Taller_regresión lineal

a. Encuentre e INTERPRETE los valores de los parámetros de una supuesta relación lineal entre el precio por libra y el número diario de tazas consumidas por persona.

b. De acuerdo a la teoría microeconómica del consumidor, un bien se considera necesario en la medida en que las variaciones en su demanda reaccionen menos que proporcionalmente ante las variaciones en los precios, es decir, si su demanda es inelástica con respecto al precio. ¿Era el café, en el periodo comprendido entre 1990 y 2000, un bien necesario dentro de la cesta de consumo norteamericana?

19. Se llevo a cabo un estudio para determinar la relación entre el número de años de experiencia X y el salario anual Y para una profesión en particular en una región geográfica dada. Se seleccionó una muestra aleatoria de 17 personas, y se obtuvo la siguiente información:

Años de experiencia 13 16 30 2 8 31 19 20 1Salario anual actual (miles de dolares)

26.1 33.2 36.1 16.5 26.4 36.4 33.8 36.5 16.9

Años de experiencia 4 27 25 7 15 13 6 10Salario anual actual (miles de dolares)

19.8 36.0 36.5 21.4 31.0 31.4 19.1 24.6

a. Grafique los datos y con base en la gráfica determine si un ajuste lineal es suficiente.b. Ajuste un modelo lineal e interprete los coeficientes de regresión estimados.c. Estime el salario promedio para una persona que ejerce esta profesión, la cual tiene 12

años de experiencia.

20. La siguiente tabla presenta información acerca del precio de las acciones (Y) y los precios al consumidor (X) expresados en cambios porcentuales anuales para un corte transversal de16 países.

TASA CRECIMIENTO % ANUALPrecios de las acciones (Y) Precios al consumidor (X)

Australia 5 4.3Austria 11.1 4.6Bélgica 3.2 2.4Canadá 7.9 2.4Chile 25.5 26.4Dinamarca 3.8 4.2Finlandia 11.1 5.5Alemania 9.9 4.7

India 13.3 2.2Irlanda 1.5 4

Israel 6.4 4Italia 8.9 8.4Japón 8.1 3.3México 13.5 4.7Países Bajos 4.7 5.2Francia 7.5 3.6

Suponiendo que la anterior información es aplicable en términos generales a Colombia, estime por medio del modelo de regresión lineal simple, el valor del crecimiento en los precios de las acciones de Colombia, cuyo incremento anual en los precios al consumidor fue de 6.49.

21. El gerente de una industria desea determinar si existe una relación lineal entre el número de unidades Y, armadas por los operadores de una línea de ensamble, y el lapso X que transcurre antes de que se presente una falla. Con base en una muestra aleatoria de operadores de la línea de ensamble, se observa la siguiente información:

Page 5: Taller_regresión lineal

Tiempo (horas) 1 2 3 4Unidades ensambladas 25, 29, 23, 31 55, 65, 63, 59 73, 75, 74, 71 90, 88, 91, 87

a. Grafique los datos b. Estime una ecuación de regresión lineal c. Estime el número de unidades armadas si el proceso operacional comienza fallando. d. El gerente de producción asegura que el número de unidades ensambladas es independiente del tiempo transcurrido entre la presencia de fallas, con base en los anteriores datos, se podría rechazar la aseveración de tal gerente?

22. Los siguientes datos representan el producto nacional bruto X y los gastos de consumo Y en miles de millones de dólares para los años 1980-1990, en el país de los Chimilas

Año 1980 1981 1982 1983 1984 1985 1986 1987 1988 1989 1990X 737.2 756.6 800.3 832.5 876.4 929.3 984.8 1011.4 1058.1 1087.6 1085.6Y 452.0 461.4 482.0 500.5 528.0 557.5 585.7 602.7 634.4 657.9 672.1

a. Ajuste un modelo lineal en interprete los coeficientes de regresión estimados.b. Hágase una gráfica de los residuos estandarizados contra el tiempo. ¿Se puede detectar

algún patrón?

23. En muchas agencias gubernamentales y compañías privadas, el problema de identificar aquellos factores que son importantes para predecir la aptitud para el trabajo de los aspirantes a obtener un empleo constituye un proceso continuo El procedimiento usual es el de aplicar al solicitante un conjunto de pruebas apropiadas y tomar la decisión de contratarlo o no con base en los resultaos de estas. El asunto clave es conocer a priori que pruebas pueden predecir la aptitud para el trabajo de una persona. Supóngase que el personal de una compañía ha desarrollado cuatro pruebas para una determinada clasificación con respecto al trabajo. Estas pruebas se aplicaron a 13 individuos que fueron contratados por la compañía. Después de un periodo de dos años cada uno de estos empleados se clasifica de acuerdo con su aptitud para el trabajo. Las pruebas establecidas dos años atrás fueron la entrevista, la prueba de conocimientos, prueba psicológica y la prueba de ingles.  

empleado Calif. actual Entre. Conoc. p. Psicol. Ingles.

1 94 122 121 96 89

2 71 108 115 98 78

3 82 120 115 95 90

4 76 118 117 93 95

5 111 113 102 109 109

6 64 112 96 90 88

7 109 109 129 102 108

8 104 112 119 106 105

9 80 115 101 95 88

10 73 111 95 95 84

11 127 119 118 107 110

12 88 112 110 100 87

13 99 120 89 105 97

 Construya la matriz de covarianzas para las cinco variables y con base en ella discuta la posible relación lineal entre las diferentes parejas de variables.