coop 3 esta di stica
Post on 26-Nov-2015
102 Views
Preview:
TRANSCRIPT
Universidad Don Bosco
Facultad de Ingeniera
Evaluacin:Trabajo cooperativo N3: Regresin y Correlacin.
Alumnos:Aguilar Hernndez, Kevin Rodolfo AH120463Carrillo Caldern, Vladimir Arturo. CC121955Maltez Hernndez, Diana Abigail MH120437Lara Sosa, Alejandro Jess LS120399 Morales Pineda, Christian Alexander MP121117
AsignaturaEstadstica I
Fecha de Entrega.Ciudadela Don Bosco, 4 de noviembre del 2013.
1. DEFINICION DE LOS CONCEPTOS DE REGRESION Y CORRELACION Regresin:Laregresin estadsticaoregresin a la mediaes la tendencia de una medicin extrema a presentarse ms cercana a la media en una segunda medicin. La regresin se utiliza para predecir una medida basndonos en el conocimiento de otra. Correlacin: Enprobabilidadyestadstica, lacorrelacinindica la fuerza y la direccin de unarelacin linealyproporcionalidadentre dosvariables estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad
2. LINEA DE REGRESION O RECTA DE MINIMOS CUADRADOSSe llama lnea de mejor ajuste y se define como la lnea que hace mnima la suma de los cuadrados de las desviaciones respecto a ella de todos los puntos que corresponden a la informacin recogida.La recta de los mnimos cuadrados que aproxima el conjunto de puntos (x1, y1), (x2, y2), (x3, y3),., (xn, yn) tomando en cuenta a Y como variable dependiente tiene por ecuacinY=ax+b (ecuacin pendiente-ordenada al origen) A esta ecuacin suele llamarse recta de regresin de Y sobre X, y se usa para estimar los valores de Y para valores dados de X.El trabajo consiste en encontrar las constantes a y b las cuales se llaman coeficientes de regresin. Estos coeficientes de regresin se obtienen mediante las ecuaciones llamadas ecuaciones normales las cuales se obtienen as: Sea y=ax+b Luego las ecuaciones normales son: y=ax+nb (1)xy=ax2 + bx (2) Las constantes quedan fijadas al resolver simultneamente las ecuaciones anteriormente encontradas, es decir, al resolver el anterior sistema de ecuaciones. Que se llaman las ecuaciones normales para la recta de mnimos cuadrados.3. Dos ejemplos de aplicacin de la recta de mnimos cuadrados.1) Los costos de las jornadas de trabajo en una empresa constructora en medio ao se presentan a continuacin. Cules sern los costos en una jornada de trabajo de 40 horas?MESHORAS (X)COSTO (Y)
ENERO10.00400
FEBRERO12.50500
MARZO17.50500
ABRIL20.00600
MAYO50.001,500
JUNIO30.00900
TOTAL140.004,400
Solucin: MESHORAS (X)COSTO (Y)(X)(Y)X2
ENERO10.004004000100
FEBRERO12.505006250156
MARZO17.505008750306
ABRIL20.0060012000400
MAYO50.001,500750002,500
JUNIO30.0090027000900
TOTAL140.004,400133,0004,363
Luego sustituyendo en las ecuaciones normales, resulta:1.
2.
Por tanto; a= 27.667 y b= 87.747 Entonces Con esta ecuacin de mnimos cuadrados se pueden predecir los costos totales aproximados de acuerdo a las horas laboradas.Los costos en una jornada de trabajo de 40 horas son: R/ 2) Los siguientes dados relacionan la cantidad diaria de accidentes de trnsito en las rutas de acceso de un centro comercial de San Salvador con la cantidad de gente que llega diariamente al centro comercial.-Si las visitas fueran fueran de 4 miles de personas. Cuntos accidentes de trnsito se esperan?XY
Visitas diarias al centro comercial (en miles)Cantidad de accidentes automovilsticos diarios
23
34
2.53
3.16
Solucin:XYXYX2
2364
34129
2.537.56.25
3.1618.69.61
Total: 10.51644.128.86
Luego sustituyendo en las ecuaciones normales, resulta:1.
2. Por tanto a= 2.2077 y b= -1.8506Entonces con la ecuacin de recta de mnimos cuadrados
Para X= 4 (miles de visitas)
R/ Se esperan aproximadamente 7 accidentes de transito
4. ESCRIBE TRES TIPOS DE CURVAS REDUCIBLES A LA FORMA LINEA. FUNCIN EXPONENCIAL, POTENCIAL Y LOGARTMICA
El problema de ajustar un modelo potencial, de la forma Y=AX+ b y uno Exponencial Y=AB^ X se reduce al de la funcin lineal, con solo tomar logaritmos. Modelo potencial: Si tomamos logaritmos en la expresin de la funcin potencial, obtendremos: Log Y = log A +b log X Como vemos es la ecuacin de una recta: Y=a+bX, donde ahora a = log A. De modo que el problema es sencillo, basta con transformar Y en log Y y X en log X y ajustar una recta a los valores transformados. El parmetro b del modelo potencial coincide con el coeficiente de regresin de la recta ajustada a los datos transformados, y A lo obtenemos mediante el antilog(a). Modelo exponencial: Tomando logaritmos en la expresin de la funcin exponencial, obtendremos: logY = logA + logB X Tambin se trata de la ecuacin de una recta Y=a+bX, pero ahora ajustndola a logY y a X; de modo que, para obtener el parmetro A del modelo exponencial, basta con hacer antilog(a), y el parmetro B se obtiene tomando antilog (b). Modelo logartmico: La curva logartmica Y = a + b logX es tambin una recta, pero en lugar de estar referida a las variables originales X e Y, est referida a logX y a Y. Hemos visto, cmo, a pesar de ser inicialmente modelos mucho ms complejos que el de una recta, estos tres ltimos se reducen al modelo lineal sin ms que transformar adecuadamente los datos de partida.Ejemplo:Las cifras siguientes sondatossobre el porcentaje de llantas radiales producidas por cierto fabricante que an pueden usarse despus de recorrer cierto nmero de millas:Miles de Millas recorridas (X)1251525303540
Porcentaje til (Y)9995855530242015
a) Ajustar los datos a una curva exponencial usando el mtodo de mnimos cuadrados
Se llena la siguiente tabla:
XYLog YX^2 X log Y
199199611996
295197843955
5851929259647
1555174022526105
2530147762536928
3024138090041406
35201301122545536
40151176160047044
X= 153logY=1297759X^2= 4605XlogY=21261769
Por otra parte se tiene que
Entonces sustituimos para encontrar log y log asi:1297759= (8) log+ log (153)21261769= log (153) + log (4605)
Utilizando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos que: Log = 2.02749722 = Log = -0.02119205= 0.9523749198Por otra parte se sabe que: Log Y= Log +X Log Y= Entonces Log Y= 2.02749722 0.02119205X
5. RESUELVA UN EJEMPLO DE APLICACIN DE LA PARABOLA DE MINIMOS CUADRADOS La siguiente tablamuestralapoblacinde un pas en los aos 1960-2010 en intervalos de 5 aos. Ajustar los datos a una parbola de mnimos cuadrados
Ao19601965197019751980198519901995200020052010
Poblacin (millones)4.525.186.257.428.169.1210.9211.6212.6813.1213.97
a) Ajustar los datos a una parbola de mnimos cuadradosb) Estimar la poblacin para los aos 2015 y 2020
SOLUCIONES:
a) Ajustar los datos a una parbola de mnimos cuadrados
Realizamos la siguiente tablaAO XYXYX^2 X^3 X^4(X^2)Y
1960-54.52-22.625-125625113
1965-45.18-20.7216-6425682.88
1970-36.25-39.479-278156.25
1975-27.42-14.844-81629.68
1980-18.16-8.161-118.16
198509.1200000
1990110.9210.9211110.92
1995211.6223.24481646.48
2000312.6838.0492781114.12
2005413.1252.481664256209.92
2010513.9769.8525125625349.25
=0102.96109.46110019581020.66
Con estos datos y por medio de las ecuaciones que formamos podemos realizar la parbola de mnimos cuadrados as:
Formando las ecuaciones:
Encontrando las constantes a, b y c 102.96= a(11)+ b(0) + c(110)109.46= a (0) + b(110) +c(0)1020.66=a(110)+ b(0)+c(1958)Usando una herramienta para resolver el sistema de ecuaciones as como en clase obtenemos las constantes a, b y c que tiene el siguiente valor: a= 9.4641 b=0.9950 c=-0.010Con el valor de estas constantes, podemos armar nuestra ecuacin de parbola de mnimos cuadrados as:
b) Estimar la poblacin para los aos 2015 y 2020
Para el ao de 2015 se tiene un X=6, entonces la poblacin es:
Para el ao 2020 le corresponde un X=7, entonces la poblacin es:
6. DEFINA LOS SIGUIENTES CONCEPTOSVariacin total.Vase la siguiente grafica que representa el diagrama de la variacin total.
En la grafica se ha trazado, entre los puntos (x,y) que constituyen el diagrama de dispersin, la lnea terica de la ecuacin de regresin y la lnea que representa la media aritmticade Y. Si levantamos una perpendicular desde un valor cualquiera de X, por ejemplo en X1, la desviacin total de Y con respecto a su media, queda dividida en dos variaciones: variacin no explicada y la variacin explicada es decir:Variacin total = variacin no explicada + variacin explicada.
Variacin explicada: Es la variacin en con respecto a su media, y se le llama variacin explicada.
Variacin no explicada:Se refiere a otros factores que pueden influir en el comportamiento de la variable dependiente; por ejemplo, en el caso de probar un abono qumico en la fertilizacin de una determinada parcela cultivada de caf, donde X son las distintas aplicaciones de abono y Y la produccin; las variaciones en la produccin Y tambin pueden deberse a otras variables como el tipo de suelo, el clima, etc. Entonces, como estas variables no entran en el anlisis del comportamiento de la produccin, a (Y-)2 se le llama variacin no explicada.
El coeficiente de correlacin, expresado en funcin de estas variaciones es:
Coeficiente de determinacin r2Al cuadrado de r se le llama coeficiente de determinacin o sea:
El coeficiente r2 expresa la proporcin de la varianza de Y asociada con la varianza de Xi.
Coeficiente de correlacin rYa hemos dicho anteriormente, que la correlacin mide la intensidad o fuerza con que estn relacionadas las variables, y ser medida por el coeficiente r de relacin.Tipos de correlacin:Atendiendo a la relacin de las variables:a) Correlacin directa o positiva: cuando por aumentos en la variable independiente ocurren tambin aumentos en la variable dependiente; o, si disminuye la variable independiente, ocurren disminuciones en la variable dependiente.
b) Correlacin inversa o negativa: cuando por aumentos en la variable independiente ocurren disminuciones en la variable dependiente; o, si disminuye la variable independiente, ocurren aumentos en la variable dependiente.El coeficiente r de correlacin toma valores entre 0 y 1 para la positiva; y para la correlacin inversa o negativa el valor de r oscilara entre 0 y -1.Un valor de r=1 r=-1 se interpreta diciendo que existe correlacin perfecta entre las variables. En forma positiva o negativa respectivamente. Un valor de r=0, significa que no existe ninguna relacin entre las variables; por ejemplo si quisiramos relacionar las variables inteligencia y estatura; es obvio que el valor dar sera cero, o un valor acercndose a cero. De lo dicho anteriormente se concluye que entre ms se acerca el valor de ra 1 ms asociacin existe entre las variables, y entre ms se acerque a cero menos relacin hay entre las variablesBibliografa
http://www.monografias.com/trabajos16/metodos-lineales/metodos-lineales.shtml
Estadstica: Elementos de estadstica descriptiva y probabilidad, Gildaberto Bonilla, 2da edicin San Salvador, El Salvador UCA Editores, 1993 (impresin de 2012).
Estadstica Elemental, Robert Johnson, Grupo editorial Iberoamrica 1990, Impreso en Mxico, D.F. Enero, 1991.
Estadstica para ciencias e ingeniera, John B Kennedy and Adam M. Neville, segunda edicin, 1982, HARLA, S.A de C.V
top related