coop 3 esta di stica

14
Universidad Don Bosco Facultad de Ingeniería Evaluación: Trabajo cooperativo N°3: Regresión y Correlación. Alumnos: Aguilar Hernández, Kevin Rodolfo AH120463 Carrillo Calderón, Vladimir Arturo. CC121955 Maltez Hernández, Diana Abigail MH120437 Lara Sosa, Alejandro Jesús LS120399 Morales Pineda, Christian Alexander MP121117 Asignatura Estadística I Fecha de Entrega.

Upload: vladimir-carrillo

Post on 26-Nov-2015

102 views

Category:

Documents


3 download

TRANSCRIPT

Universidad Don Bosco

Facultad de Ingeniera

Evaluacin:Trabajo cooperativo N3: Regresin y Correlacin.

Alumnos:Aguilar Hernndez, Kevin Rodolfo AH120463Carrillo Caldern, Vladimir Arturo. CC121955Maltez Hernndez, Diana Abigail MH120437Lara Sosa, Alejandro Jess LS120399 Morales Pineda, Christian Alexander MP121117

AsignaturaEstadstica I

Fecha de Entrega.Ciudadela Don Bosco, 4 de noviembre del 2013.

1. DEFINICION DE LOS CONCEPTOS DE REGRESION Y CORRELACION Regresin:Laregresin estadsticaoregresin a la mediaes la tendencia de una medicin extrema a presentarse ms cercana a la media en una segunda medicin. La regresin se utiliza para predecir una medida basndonos en el conocimiento de otra. Correlacin: Enprobabilidadyestadstica, lacorrelacinindica la fuerza y la direccin de unarelacin linealyproporcionalidadentre dosvariables estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad

2. LINEA DE REGRESION O RECTA DE MINIMOS CUADRADOSSe llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida.La recta de los mnimos cuadrados que aproxima el conjunto de puntos (x1, y1), (x2, y2), (x3, y3),., (xn, yn) tomando en cuenta a Y como variable dependiente tiene por ecuacinY=ax+b (ecuacin pendiente-ordenada al origen) A esta ecuacin suele llamarse recta de regresin de Y sobre X, y se usa para estimar los valores de Y para valores dados de X.El trabajo consiste en encontrar las constantes a y b las cuales se llaman coeficientes de regresin. Estos coeficientes de regresin se obtienen mediante las ecuaciones llamadas ecuaciones normales las cuales se obtienen as: Sea y=ax+b Luego las ecuaciones normales son: y=ax+nb (1)xy=ax2 + bx (2) Las constantes quedan fijadas al resolver simultneamente las ecuaciones anteriormente encontradas, es decir, al resolver el anterior sistema de ecuaciones. Que se llaman las ecuaciones normales para la recta de mnimos cuadrados.3. Dos ejemplos de aplicacin de la recta de mnimos cuadrados.1) Los costos de las jornadas de trabajo en una empresa constructora en medio ao se presentan a continuacin. Cules sern los costos en una jornada de trabajo de 40 horas?MESHORAS (X)COSTO (Y)

ENERO10.00400

FEBRERO12.50500

MARZO17.50500

ABRIL20.00600

MAYO50.001,500

JUNIO30.00900

TOTAL140.004,400

Solucin: MESHORAS (X)COSTO (Y)(X)(Y)X2

ENERO10.004004000100

FEBRERO12.505006250156

MARZO17.505008750306

ABRIL20.0060012000400

MAYO50.001,500750002,500

JUNIO30.0090027000900

TOTAL140.004,400133,0004,363

Luego sustituyendo en las ecuaciones normales, resulta:1.

2.

Por tanto; a= 27.667 y b= 87.747 Entonces Con esta ecuacin de mnimos cuadrados se pueden predecir los costos totales aproximados de acuerdo a las horas laboradas.Los costos en una jornada de trabajo de 40 horas son: R/ 2) Los siguientes dados relacionan la cantidad diaria de accidentes de trnsito en las rutas de acceso de un centro comercial de San Salvador con la cantidad de gente que llega diariamente al centro comercial.-Si las visitas fueran fueran de 4 miles de personas. Cuntos accidentes de trnsito se esperan?XY

Visitas diarias al centro comercial (en miles)Cantidad de accidentes automovilsticos diarios

23

34

2.53

3.16

Solucin:XYXYX2

2364

34129

2.537.56.25

3.1618.69.61

Total: 10.51644.128.86

Luego sustituyendo en las ecuaciones normales, resulta:1.

2. Por tanto a= 2.2077 y b= -1.8506Entonces con la ecuacin de recta de mnimos cuadrados

Para X= 4 (miles de visitas)

R/ Se esperan aproximadamente 7 accidentes de transito

4. ESCRIBE TRES TIPOS DE CURVAS REDUCIBLES A LA FORMA LINEA. FUNCIN EXPONENCIAL, POTENCIAL Y LOGARTMICA

El problema de ajustar un modelo potencial, de la forma Y=AX+ b y uno Exponencial Y=AB^ X se reduce al de la funcin lineal, con solo tomar logaritmos. Modelo potencial: Si tomamos logaritmos en la expresin de la funcin potencial, obtendremos: Log Y = log A +b log X Como vemos es la ecuacin de una recta: Y=a+bX, donde ahora a = log A. De modo que el problema es sencillo, basta con transformar Y en log Y y X en log X y ajustar una recta a los valores transformados. El parmetro b del modelo potencial coincide con el coeficiente de regresin de la recta ajustada a los datos transformados, y A lo obtenemos mediante el antilog(a). Modelo exponencial: Tomando logaritmos en la expresin de la funcin exponencial, obtendremos: logY = logA + logB X Tambin se trata de la ecuacin de una recta Y=a+bX, pero ahora ajustndola a logY y a X; de modo que, para obtener el parmetro A del modelo exponencial, basta con hacer antilog(a), y el parmetro B se obtiene tomando antilog (b). Modelo logartmico: La curva logartmica Y = a + b logX es tambin una recta, pero en lugar de estar referida a las variables originales X e Y, est referida a logX y a Y. Hemos visto, cmo, a pesar de ser inicialmente modelos mucho ms complejos que el de una recta, estos tres ltimos se reducen al modelo lineal sin ms que transformar adecuadamente los datos de partida.Ejemplo:Las cifras siguientes sondatossobre el porcentaje de llantas radiales producidas por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas:Miles de Millas recorridas (X)1251525303540

Porcentaje til (Y)9995855530242015

a) Ajustar los datos a una curva exponencial usando el mtodo de mnimos cuadrados

Se llena la siguiente tabla:

XYLog YX^2 X log Y

199199611996

295197843955

5851929259647

1555174022526105

2530147762536928

3024138090041406

35201301122545536

40151176160047044

X= 153logY=1297759X^2= 4605XlogY=21261769

Por otra parte se tiene que

Entonces sustituimos para encontrar log y log asi:1297759= (8) log+ log (153)21261769= log (153) + log (4605)

Utilizando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos que: Log = 2.02749722 = Log = -0.02119205= 0.9523749198Por otra parte se sabe que: Log Y= Log +X Log Y= Entonces Log Y= 2.02749722 0.02119205X

5. RESUELVA UN EJEMPLO DE APLICACIN DE LA PARABOLA DE MINIMOS CUADRADOS La siguiente tablamuestralapoblacinde un pas en los aos 1960-2010 en intervalos de 5 aos. Ajustar los datos a una parbola de mnimos cuadrados

Ao19601965197019751980198519901995200020052010

Poblacin (millones)4.525.186.257.428.169.1210.9211.6212.6813.1213.97

a) Ajustar los datos a una parbola de mnimos cuadradosb) Estimar la poblacin para los aos 2015 y 2020

SOLUCIONES:

a) Ajustar los datos a una parbola de mnimos cuadrados

Realizamos la siguiente tablaAO XYXYX^2 X^3 X^4(X^2)Y

1960-54.52-22.625-125625113

1965-45.18-20.7216-6425682.88

1970-36.25-39.479-278156.25

1975-27.42-14.844-81629.68

1980-18.16-8.161-118.16

198509.1200000

1990110.9210.9211110.92

1995211.6223.24481646.48

2000312.6838.0492781114.12

2005413.1252.481664256209.92

2010513.9769.8525125625349.25

=0102.96109.46110019581020.66

Con estos datos y por medio de las ecuaciones que formamos podemos realizar la parbola de mnimos cuadrados as:

Formando las ecuaciones:

Encontrando las constantes a, b y c 102.96= a(11)+ b(0) + c(110)109.46= a (0) + b(110) +c(0)1020.66=a(110)+ b(0)+c(1958)Usando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos las constantes a, b y c que tiene el siguiente valor: a= 9.4641 b=0.9950 c=-0.010Con el valor de estas constantes, podemos armar nuestra ecuacin de parbola de mnimos cuadrados as:

b) Estimar la poblacin para los aos 2015 y 2020

Para el ao de 2015 se tiene un X=6, entonces la poblacin es:

Para el ao 2020 le corresponde un X=7, entonces la poblacin es:

6. DEFINA LOS SIGUIENTES CONCEPTOSVariacin total.Vase la siguiente grafica que representa el diagrama de la variacin total.

En la grafica se ha trazado, entre los puntos (x,y) que constituyen el diagrama de dispersin, la lnea terica de la ecuacin de regresin y la lnea que representa la media aritmticade Y. Si levantamos una perpendicular desde un valor cualquiera de X, por ejemplo en X1, la desviacin total de Y con respecto a su media, queda dividida en dos variaciones: variacin no explicada y la variacin explicada es decir:Variacin total = variacin no explicada + variacin explicada.

Variacin explicada: Es la variacin en con respecto a su media, y se le llama variacin explicada.

Variacin no explicada:Se refiere a otros factores que pueden influir en el comportamiento de la variable dependiente; por ejemplo, en el caso de probar un abono qumico en la fertilizacin de una determinada parcela cultivada de caf, donde X son las distintas aplicaciones de abono y Y la produccin; las variaciones en la produccin Y tambin pueden deberse a otras variables como el tipo de suelo, el clima, etc. Entonces, como estas variables no entran en el anlisis del comportamiento de la produccin, a (Y-)2 se le llama variacin no explicada.

El coeficiente de correlacin, expresado en funcin de estas variaciones es:

Coeficiente de determinacin r2Al cuadrado de r se le llama coeficiente de determinacin o sea:

El coeficiente r2 expresa la proporcin de la varianza de Y asociada con la varianza de Xi.

Coeficiente de correlacin rYa hemos dicho anteriormente, que la correlacin mide la intensidad o fuerza con que estn relacionadas las variables, y ser medida por el coeficiente r de relacin.Tipos de correlacin:Atendiendo a la relacin de las variables:a) Correlacin directa o positiva: cuando por aumentos en la variable independiente ocurren tambin aumentos en la variable dependiente; o, si disminuye la variable independiente, ocurren disminuciones en la variable dependiente.

b) Correlacin inversa o negativa: cuando por aumentos en la variable independiente ocurren disminuciones en la variable dependiente; o, si disminuye la variable independiente, ocurren aumentos en la variable dependiente.El coeficiente r de correlacin toma valores entre 0 y 1 para la positiva; y para la correlacin inversa o negativa el valor de r oscilara entre 0 y -1.Un valor de r=1 r=-1 se interpreta diciendo que existe correlacin perfecta entre las variables. En forma positiva o negativa respectivamente. Un valor de r=0, significa que no existe ninguna relacin entre las variables; por ejemplo si quisiramos relacionar las variables inteligencia y estatura; es obvio que el valor dar sera cero, o un valor acercndose a cero. De lo dicho anteriormente se concluye que entre ms se acerca el valor de ra 1 ms asociacin existe entre las variables, y entre ms se acerque a cero menos relacin hay entre las variablesBibliografa

http://www.monografias.com/trabajos16/metodos-lineales/metodos-lineales.shtml

Estadstica: Elementos de estadstica descriptiva y probabilidad, Gildaberto Bonilla, 2da edicin San Salvador, El Salvador UCA Editores, 1993 (impresin de 2012).

Estadstica Elemental, Robert Johnson, Grupo editorial Iberoamrica 1990, Impreso en Mxico, D.F. Enero, 1991.

Estadstica para ciencias e ingeniera, John B Kennedy and Adam M. Neville, segunda edicin, 1982, HARLA, S.A de C.V