regresión lineal

9
GIMNASIO LOS PINOS ÁREA DE MATEMÁTICAS ESTADISTICA A continuación encontrará una breve explicación del procedimiento explicado y trabajado en clase acerca de la regresión lineal. Encontrara un ejemplo de dicho procedimiento y una serie de ejercicios por medio de los cuales se espera realizar el cierre de la temática. El taller será entregado en día indicado y tendrá como complemento un quiz de control del mismo REGRESION LINEAL En la práctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe alguna relación inherente entre ellas. Por ejemplo, en un caso industrial se puede saber que el contenido de alquitrán en el producto de salida de un proceso químico está relacionado con la temperatura con la que se lleva a cabo. Puede ser interesante desarrollar un método de predicción, esto es, un procedimiento para estimar el contenido de alquitrán para varios niveles de temperatura tomados de información experimental. El aspecto estadístico del problema consiste entonces en lograr la mejor estimación de la relación entre las variables. Para la mayoría de las aplicaciones, existe una clara distinción entre las variables en cuanto a su papel dentro del proceso experimental. Muy a menudo se tiene una sola variable dependiente o respuesta Y, la cual no se controla en el experimento. Esta respuesta depende de una variable independiente o de regresión X. Generalmente en el análisis de regresión se utiliza una línea recta por su simplicidad en el cálculo matemático. El modelo matemático que describe una relación lineal cuando se estima el valor de y en función de x está dada así: ^ y=bx +c ó ^ y=Bx+C ó ^ y=β 1 x +β 0 . ^ y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. B = b = β 1 es la pendiente de la recta, C = c = β 0 corresponde al coeficiente de posición u origen en la ordenada. De acuerdo a la ecuación general de la recta, en la cual tenemos dos incógnitas (b y c), requiere para su solución de un sistema de dos ecuaciones normales. (1) 1 y= b x+ nc 1 Sistema de ecuaciones de 2x2 se soluciona por los métodos de igualación, reducción, sustitución y determinantes.

Upload: jorgevalencia75

Post on 12-Jun-2015

4.722 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Regresión lineal

GIMNASIO LOS PINOSÁREA DE MATEMÁTICAS

ESTADISTICA

A continuación encontrará una breve explicación del procedimiento explicado y trabajado en clase acerca de la regresión lineal. Encontrara un ejemplo de dicho procedimiento y una serie de ejercicios por medio de los cuales se espera realizar el cierre de la temática. El taller será entregado en día indicado y tendrá como complemento un quiz de control del mismo

REGRESION LINEAL

En la práctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe alguna relación inherente entre ellas. Por ejemplo, en un caso industrial se puede saber que el contenido de alquitrán en el producto de salida de un proceso químico está relacionado con la temperatura con la que se lleva a cabo. Puede ser interesante desarrollar un método de predicción, esto es, un procedimiento para estimar el contenido de alquitrán para varios niveles de temperatura tomados de información experimental. El aspecto estadístico del problema consiste entonces en lograr la mejor estimación de la relación entre las variables.

Para la mayoría de las aplicaciones, existe una clara distinción entre las variables en cuanto a su papel dentro del proceso experimental. Muy a menudo se tiene una sola variable dependiente o respuesta Y, la cual no se controla en el experimento. Esta respuesta depende de una variable independiente o de regresión X.

Generalmente en el análisis de regresión se utiliza una línea recta por su simplicidad en el cálculo matemático. El modelo matemático que describe una relación lineal cuando se estima el valor de y en función de x está dada así: y=bx+c ó y=Bx+C ó y=β1 x+β0.

y es la variable que se va a estimar en función de otra variable (x) que se supone conocida. B = b = β1 es la pendiente de la recta, C = c = β0 corresponde al coeficiente de posición u origen en la ordenada.

De acuerdo a la ecuación general de la recta, en la cual tenemos dos incógnitas (b y c), requiere para su solución de un sistema de dos ecuaciones normales.

(1)1 ∑ y=b∑ x+nc

(2) ∑ xy=b∑ x2+c∑ x

EJEMPLO:

Las calificaciones de un grupo de estudiantes en su reporte de medio año (x) y en los exámenes finales (y) fueron los siguientes:

X 77 50 71 72 81 94 96 99 67y 82 66 78 34 47 85 99 99 68

a. Estime los coeficientes de regresión y la línea de regresión lineal.b. Estime la calificación del examen final de un estudiante que obtuvo una calificación de 85 en el reporte

de medio año.

1 Sistema de ecuaciones de 2x2 se soluciona por los métodos de igualación, reducción, sustitución y determinantes.

Page 2: Regresión lineal

Solución:

a. Para hallar los coeficientes de regresión se debe solucionar el sistema de ecuaciones por cualquiera de los métodos vistos, reducción, igualación, sustitución o determinantes.

X Y x^2 y^2 xy 77 82 5929 6724 6314 50 66 2500 4356 3300 71 78 5041 6084 5538 72 34 5184 1156 2448 81 47 6561 2209 3807 94 85 8836 7225 7990 96 99 9216 9801 9504 99 99 9801 9801 9801 67 68 4489 4624 4556

∑ 707 658 57557 51980 53258

Solucionando por reducción obtendremos los coeficientes de regresión b y c

658=707b+9c (1)

53258=57557b+707c (2 )

Multiplicando (1) por -707 y (2) por 9 obtenemos

−465206=−499849b−6363c(3)

479322=518013b+6363c (4 )

Reduciendo el sistema obtenemos:

479322=518013b+6363c (4 )

−465206=−499849b−6363c (3 )

14116=18164b (5 )

Despejando b de (5);

b=1411618164

b=0.7771

Reemplazando b en (1); para hallar el valor de c

658=707(0.7771)+9c

658=549.4097+707c

Despejando c;

c=658−549.4097707

c=12.0656

Por lo tanto la línea de regresión y=bx+c es: y=0.7771x+12.0656(6).

Page 3: Regresión lineal

b. Para estimar la calificación del examen final de un estudiante teniendo en cuenta la calificación del reporte de medio año reemplazamos 85 en (6)

y=0.7771 (85 )+12.0656

y=66.0535+12.0656

y=78.1191

El siguiente diagrama de dispersión muestra el comportamiento de los datos recolectados y la línea de regresión de la situación planteada.

40 50 60 70 80 90 100 1100

20

40

60

80

100

120

f(x) = 0.777141598766792 x + 12.0623210746532R² = 0.314727186372275

Calificaciones

Examen de medio año

Exam

en F

inal

Page 4: Regresión lineal

ACTIVIDAD

1. El estudio "Development of LIFTEST, A Dynamic Technique to Assess Individual Capability to Lift Material” se llevó a cabo, en 1982 en la Virginia Polytechnic Instituto and State University, con objeto de determinar si ciertas mediciones de la resistencia estática del brazo tenían alguna influencia en las características de la "elevación dinámica" de un individuo. Veinticinco individuos se sometieron a pruebas de resistencia y después se les pidió que llevaran a cabo una prueba de levantamiento de pesas en la cual debían levantar el peso en forma dinámica por encima de la cabeza. Los datos fueron los siguientes:

IndividuoResistenciadel brazo, x

Levantamiento dinámico, y

1 17.3 71.72 19.3 48.33 19.5 88.34 19.7 75.05 22.9 91.76 23.1 100.07 26.4 73.38 26.8 65.09 27.6 75.0

10 28.1 88.311 28.2 68.312 28.7 96.7

IndividuoResistencia del brazo, x

Levantamiento dinámico, y

13 29.0 76.714 29.6 78.315 29.9 60.016 29.9 71.717 30.3 85,018 31,3 85.019 36.0 88.320 39.5 100.021 40.4 100.022 44.3 100.023 44.6 91.724 50.4 100.025 55.9 71.7

a. Estime los valores de los coeficientes de regresión para la curva de regresión lineal.b. Determine la estimación puntual de 30.

2. Se llevó a cabo un estudio acerca de la cantidad de azúcar refinada mediante un cierto proceso a varias temperaturas diferentes. Los datos se codificaron y registraron en el siguiente cuadro.

Temperatura, x Azúcar transformaday

1.0 8.11.1 7.81.2 8.51.3 9.81.4 9.51.5 8.91.6 8.61.7 10.21.8 9.31.9 9.22.0 10.5

a. Determine la línea de regresión lineal.b. Calcule la cantidad promedio de azúcar refinada que se produce cuando la temperatura codificada es 1.75

3. En un tipo de espécimen metálico de prueba, la resistencia normal está funcionalmente relacionada con la resistencia de corte. El siguiente es un conjunto de datos experimentales codificados para las dos variables:

Resistencia normal Resistencia de corte26.8 26.525.4 27.328.9 24.223.6 27.127.7 23.623.9 25.924.7 26.328.1 22.526.9 21.727.4 21.422.6 25.825.6 24.9

a. Determine la línea de regresión.b. Calcule la resistencia de corte para un esfuerzo normal de 24.5 kilogramos por centímetro cuadrado.

Page 5: Regresión lineal

4. Las cantidades de un compuesto químico y, que se disuelven en 100 gramos de agua a diferentes tem-peraturas, x, se registraron como sigue:

X (C°) Y gramos0 8 6 8

15 12 10 1430 25 21 2445 31 33 2860 44 39 4275 48 51 44

a. Determine la ecuación de la línea de regresión.b. Grafique la recta en un diagrama de dispersión.c. Estime la cantidad de compuesto químico que se disuelve en 100 gramos de agua a 50° C.

5. Se aplica una prueba de ubicación de matemáticas a todos los alumnos de primer grado que están ingresando a una institución de enseñanza superior. No se admiten a los que obtienen una calificación inferior a 35 en el curso regular de matemáticas y se les coloca en una clase de regularización. Las calificaciones del examen de ubicación y del examen final de 20 estudiantes que tomaron el curso regular fueron las siguientes

Examen de ubicación

Calificación del curso

Examen de ubicación

Calificación del curso

50 53 90 5435 41 80 9135 61 60 4840 56 60 7155 68 60 7165 36 40 4735 11 55 5360 70 50 6890 79 65 5735 59 50 79

a. Dibuje un diagrama de dispersión.b. Encuentre la ecuación de la línea de regresión para pronosticar las calificaciones del curso a

partir de las pruebas de ubicación.c. Grafique la línea en el diagrama de dispersión.d. Si 60 es la calificación mínima de pase, ¿abajo de qué calificación obtenida en la prueba de

ubicación se les debe negar la admisión a este curso regular a los futuros estudiantes?

6. Un comerciante al menudeo llevó a cabo un estudio para determinar la relación entre los gastos de publicidad semanal y las ventas. Se obtuvieron los siguientes datos:

Costos de publicidad ($)

Ventas ($)

40 38520 40025 39520 36530 47550 44040 49020 42050 56040 52525 48050 510

a. Dibuje un diagrama de dispersión.b. Encuentre la ecuación de la línea de regresión para pronosticar las ventas semanales

resultantes de los gastos de publicidad.c. Estime las ventas semanales cuando los gastos de publicidad ascienden a $35.

Page 6: Regresión lineal

7. Se obtuvieron los siguientes datos para determinar la relación entre la calificación obtenida en clase en el nivel de secundaria y el promedio puntual de calificación al final del primer año de bachillerato:

Prom. puntual de calificación y

Decíl de calificación, x

Prom. puntual de calificación y

Decíl de calificación, x

1.93 3 1.40 82.55 2 1.45 41.72 1 1.72 82.48 1 3.80 12.87 1 2.13 51.87 3 1.81 61.34 4 2.33 13.03 1 2.53 12.54 2 2.04 22.34 2 3.20 2

a. Encuentre la ecuación de la línea de regresión para pronosticar el promedio puntual de calificación de alumnos del primer año de bachillerato provenientes de escuela secundaria.

b. Pronostique el promedio puntual de calificación para una estudiante de primer año cuya calificación en secundaria está en el tercer decil de su clase de graduación.