practica regresion lineal 2010 (16)

11
TEMA: Regresión y Correlación El método estadístico que investiga y define la relación funcional entre dos o más variables se llama REGRESIÓN, y la ecuación de la función matemática constituye la FUNCION DE REGRESION O MODELO DE REGRESION. El análisis del grado de asociación o modelo de regresión, constituye la CORRELACION. Cuando se relacionan dos variables, se tratará de una regresión simple y correlación simple, en tanto, cuando se considera la relación entre tres o más variables se hablará de regresión múltiple y correlación múltiple. Por su parte, si la función de regresión corresponde a una línea recta se trata de regresión lineal, y si es curva (parábola, exponencial, etc.) se denomina regresión no lineal. REGRESION SIMPLE LINEAL Considerando la ecuación de la recta: Y = a + b x Los parámetros a y b son determinados al aplicar el método de los mínimos cuadrados con las siguientes fórmulas: CORRELACION LINEAL La correlación lineal expresa el grado de asociación o afinidad entre las variables consideradas. Se llamará CORRELACION SIMPLE cuando se trata de analizar la relación entre dos variables. Se llamará CORRELACION RECTILINEA O LINEAL si la función es una recta, y de CORRELACION NO LINEAL cuando la función es una curva o una función de grado superior. COEFICIENTE DE CORRELACION RECTILINEA. El coeficiente de correlación rectilínea, es el estadígrafo que expresa o mide el grado de asociación o afinidad entre las variables relacionadas y se denota por “r” la cual se define como: r = Donde:

Upload: jhony-quiliche-vasquez

Post on 09-Aug-2015

525 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Practica Regresion Lineal 2010 (16)

TEMA: Regresión y Correlación

El método estadístico que investiga y define la relación funcional entre dos o más variables se llama REGRESIÓN, y la ecuación de la función matemática constituye la FUNCION DE REGRESION O MODELO DE REGRESION.

El análisis del grado de asociación o modelo de regresión, constituye la CORRELACION.Cuando se relacionan dos variables, se tratará de una regresión simple y correlación simple, en tanto, cuando se considera la relación entre tres o más variables se hablará de regresión múltiple y correlación múltiple. Por su parte, si la función de regresión corresponde a una línea recta se trata de regresión lineal, y si es curva (parábola, exponencial, etc.) se denomina regresión no lineal.

REGRESION SIMPLE LINEAL

Considerando la ecuación de la recta:Y = a + b x

Los parámetros a y b son determinados al aplicar el método de los mínimos cuadrados con las siguientes fórmulas:

CORRELACION LINEALLa correlación lineal expresa el grado de asociación o afinidad entre las variables consideradas.Se llamará CORRELACION SIMPLE cuando se trata de analizar la relación entre dos variables. Se llamará CORRELACION RECTILINEA O LINEAL si la función es una recta, y de CORRELACION NO LINEAL cuando la función es una curva o una función de grado superior.

COEFICIENTE DE CORRELACION RECTILINEA. El coeficiente de correlación rectilínea, es el estadígrafo que expresa o mide el grado de asociación o afinidad entre las variables relacionadas y se denota por “r” la cual se define como:

r =

Donde:

= =

Page 2: Practica Regresion Lineal 2010 (16)

EJERCICIOS DE APLICACIÓN 1. Las ventas de línea blanca varían según el estado del mercado de casas nuevas: cuando las ventas de casas nuevas son buenas, también lo son las de lavaplatos, lavadoras de ropa, secadoras y refrigeradores. Una asociación de comercio compiló los siguientes datos históricos ( en miles de unidades) de las ventas de línea blanca y la construcción de casas.

Construcción de casas (miles)

Ventas de línea blanca (en miles)

2 52.5 5.53.2 63.6 73.3 7.24 7.7

4.2 8.44.6 94.8 9.75 10

a) Desarrolle una ecuación para la relación entre las ventas de línea blanca (en miles) y la construcción de casas (en miles).b) Grafique el diagrama de dispersión e indique si (r<0) ó (r>0) ó (r=0)c) La construcción de casas durante el año próximo será de hasta 8.0 mil casas. Calcule las ventas de línea blanca para el próximo año.d) Calcule e interprete el coeficiente de correlación.

2. Suponga que la directora del Departamento de Salubridad de Chapel Hill está interesada en la relación que existe entre la antigüedad de un camión basura y los gastos anuales de reparación que debe esperar. Con el fin de determinar esta relación, la directora ha reunido información de cuatro de los camiones de la ciudad.

Número del camión

Antigúedad del camón en años

Gastos de rep. Durante el último año en cientos de dólares

101 5 7

102 3 7

103 3 6

104 1 4

a. Determine la variable independiente y dependiente.

b. Obtenga la ecuación de la recta de regresión.

Page 3: Practica Regresion Lineal 2010 (16)

c. Si una ciudad tiene un camión de 4 años de antigüedad, ¿Cómo podría la directora usar la ecuación para predecir los gastos anuales de reparación para este camión?

3. Una compañía de máquinas despachadoras automáticas posee y controla un número muy grande de máquinas de cierto tipo. Las máquinas están instaladas en diversos sitios y tienen diferentes antigüedades. Los registros de la compañía muestran entre otras cosas, en relación con cada máquina activa, la cantidad de dinero que se gasta en su mantenimiento en su último año (completo) de uso. De ese lote de máquinas tomamos una muestra al azar de n=10 máquinas y, anotando el costo de mantenimiento de cada una, y su último año de uso, se obtiene:

Años de uso

Costo de mantenimiento(dólares)

4 1482 1283 1335 1542 1183 1454 1435 1594 1423 127

a) Determine la variable dependiente(Y) y la variable independiente(X):

Y=X=

b) Estime la ecuación de regresión lineal:

c) Realice un pronóstico para el costo de mantenimiento de una de las máquinas vendedoras durante su segundo año de uso.

d) Grafique el diagrama de dispersión e indique si (r<0) ó (r>0) ó (r=0)

e) Calcule e interprete el coeficiente de correlación “r”

4. Se seleccionó una muestra de 12 casas vendidas la semana pasada en una ciudad de EEUU. ¿Puede concluirse que a medida que aumenta la extensión

Page 4: Practica Regresion Lineal 2010 (16)

del inmueble (indicada en miles de pies cuadrados), el precio de venta (en miles de dólares) aumenta también?

Extensión Precio de venta Extensión Precio de venta(miles de pies

cuadrados)(miles de dólares)

(miles de pies cuadrados)

(miles de dólares)

1,4 100 1,3 1101,3 110 0,8 851,2 105 1,2 1051,1 120 0,9 751,4 80 1,1 701 105 1,1 95

a) Determine la ecuación de regresión e interprétela.

b) Calcule el coeficiente de correlación e interprételo.

5. La National Highway Association estudia las relaciones entre el número de licitadores para un proyecto de carretera, y la propuesta ganadora (la de más bajo costo) para el proyecto. De particular interés es si el número de postores aumenta o disminuye el importe de la licitación ganadora.

Proyecto Número deOferta

ganadora Proyecto Número deOferta

ganadora

licitadores(millones

de $) licitadores(millones de

$)1 9 5,1 9 6 10,32 9 8 10 6 83 3 9,7 11 4 8,84 10 7,8 12 7 9,45 5 7,7 13 7 8,66 10 5,5 14 7 8,17 7 8,3 15 6 7,88 11 5,5

a) Determine la ecuación de regresión e interprétela. ¿más licitadores tienden a aumentar o disminuir el importe de la propuesta ganadora?

b) Estime el monto de la oferta ganadora si hubiese once licitadores.

6. En los siguientes datos aparece el precio al menudeo de 12 computadoras portátiles, seleccionados al azar, junto con sus velocidades de procesador correspondientes en gigahertz.

Page 5: Practica Regresion Lineal 2010 (16)

Computadora

Velocidad Precio

1 2 26892 1.6 12293 1.6 14194 1.8 25895 2 28496 1.2 13497 2 29298 1.6 18499 2 281910 1.6 266911 1 124912 1.4 1159

a) Elabore una ecuación lineal que sirva para describir cómo depende el precio de la velocidad del procesador.

b) Con base en su ecuación de regresión, ¿hay alguna computadora que parezca tener, de manera particular un precio menor o mayor?

c) Calcule e interprete el coeficiente de correlación.

7. El ingreso anual disponible y los gastos de consumo de 12 familias, seleccionadas aleatoriamente, en una zona de nuestra ciudad ha sido en miles de soles, los siguientes:

Gastos de Ingreso Anual (miles)consumo(miles)

7 812 1518 2030 3520 2824 258 811 138 76 610 1218 15

a) Determine la variable dependiente(Y) y la variable independiente(X):Y=

Page 6: Practica Regresion Lineal 2010 (16)

X=

b) Estime la ecuación de regresión lineal:

c) Estimar el ingreso anual de una familia que tiene un gasto en consumo anual de 19 000 soles

d) Grafique el diagrama de dispersión e indique si (r<0) ó (r>0) ó (r=0)

e) Calcule e interprete el coeficiente de correlación “r”

8. Una compañía eléctrica, estudia las relaciones entre los consumos de energía (en miles de kilo watts-hora, kw) y el número de habitaciones en una residencial privada unifamiliar. Una muestra aleatoria de 10 casas produjo los siguientes resultados:

Número de habitaciones Consumo (miles de Kwh.)

12 99 714 106 510 88 610 810 105 47 7

a. Determine la variable dependiente (y) y la variable independiente (x) Y = X =

b. Estime la ecuación de regresión lineal:

Y = a + b X

Y = + X

c. Evalúe el consumo (en miles de kilo watts-hora, Kwh.), para una casa de 13 habitaciones.

9. El departamento de producción de una fábrica desea explorar la relación entre el número de obreros que arman n ensambles y la cantidad

Page 7: Practica Regresion Lineal 2010 (16)

de estos producida. Como experimento se asignaron grupos de trabajadores para verificar su producción y los resultados obtenidos fueron los siguientes:

Número de ensambladores

Producción en 1h (unidades)

2 154 251 105 403 30

a. Determine la variable dependiente (y) y la variable independiente(x) Y = X =

b. Estime la ecuación de regresión lineal:

Y = a + b X

Y = + X

c. Para 6 ensambladores ¿Cuál es la producción horaria esperada?

d. Calcule e interprete el valor del coeficiente de regresión lineal“ r ”

10. Un fabricante de pantalones de mezclilla sabe que un presupuesto considerable para anunciar en televisión su producto creará una demanda de éste entre los compradores de los almacenes. La tabla que sigue muestra las cantidades (en miles de dólares) que se gastan para anunciar la línea de otoño de pantalones de mezclilla durante 8 años y el número de pantalones (en miles) vendidas de cada línea para el otoño.

Cantidad gastada en la publicidad por televisión

(en miles de dólares)

Número de pantalones vendidos(en miles)

50 4565 6075 80

100 95125 120140 150170 145195 190

a) Determine la variable dependiente(Y) y la variable independiente(X):

Page 8: Practica Regresion Lineal 2010 (16)

Y=X=

b) Estime la ecuación de regresión lineal:

c) Estimar el número de pantalones que se espera vender con un presupuesto de publicidad por televisión de un quinto de millón de dólares.

d) Grafique el diagrama de dispersión e indique si (r<0) ó (r>0) ó (r=0)

e) Calcule e interprete el coeficiente de correlación “r”

11. Suponga que el señor Sánchez observa el precio y el volumen de venta de leche durante 10 semanas seleccionadas al azar. Los datos que ha recabado se muestran en la siguiente tabla.

Datos de galones de leche

Semana Nivel semanal de ventas, Y

(miles de gal)

Precio de venta ($)X

1 10 1.30

2 6 2.00

3 5 1.70

4 12 1.50

5 10 1.60

6 15 1.20

7 5 1.60

8 12 1.40

9 17 1.00

10 20 1.10

El coeficiente de correlación de la muestra de -0.86 indica una relación bastante negativa entre Y y X, -mientras el precio del galón de leche aumenta, el número de galones vendidos disminuyeLa pregunta que podría surgir enseguida es: ¿qué tanto desciende el volumen a medida que aumenta el precio? Esta pregunta sugiere dibujar

Page 9: Practica Regresion Lineal 2010 (16)

una línea recta a través de los puntos de los datos expuestos en el diagrama de dispersión.

12. El procesamiento de carbón sin tratar implica el “lavado”, en donde se elimina la ceniza de carbón (no orgánico, material incombustible). El artículo “Quantifying Sampling Precision for Coal Ash Using Gy’s Discrete Model of the Fundamental Error” proporciona los datos relacionados con los porcentajes de ceniza con el volumen de una partícula de carbón. Se midieron los porcentajes promedio de ceniza para seis volúmenes de partículas de carbón. Los datos son los siguientes:

Volumen (cm3) 0.01 0.06 0.58 2.24 15.55 276.02Porcentaje de

ceniza 3.32 4.05 5.69 7.06 8.17 9.36

a) Determine la variable dependiente (Y) y la variable independiente(X):

Y=X=

b) Estime la ecuación de regresión lineal:

c) Grafique el diagrama de dispersión e indique si (r<0) ó (r>0) ó (r=0)

d) Calcule e interprete el coeficiente de correlación “r”