trabajo hipotesis

Click here to load reader

Post on 22-Jul-2015

3.656 views

Category:

Documents

1 download

Embed Size (px)

TRANSCRIPT

ESTADISTICA INFERENCIAL

ESTADISTICA INFERENCIALHIPTESIS PARA LA MEDIA DE DOS POBLACIONES

Introduccin:Hiptesis: enunciado acerca de una poblacin elaborada con el propsito de ponerse a prueba.Prueba de hiptesis: procedimiento basado en la evidencia muestral y en la teora de probabilidad que se emplea para determinar si la hiptesis es un enunciado razonable y no debe rechazarse o si no es razonable y debe ser rechazado.

En el proceso de toma de decisiones, en muchos casos, es necesario determinar cundo los parmetros de dos poblaciones son similares o diferentes.En esta investigacin se da a conocer el procedimiento para probar si dos medias poblacionales son iguales con base la informacin que se tiene de dos muestras de stas; o bien, que la diferencia entre ambas medias mustrales es tan grande que se puede concluir que las medias poblacionales no son iguales. Tambin se muestran las formulas y ejemplos para poder resolver y entender cmo realizar hiptesis para la media de dos poblaciones.

HIPOTESIS PARA LA MEDIA DE DOS POBLACIONESLa prueba de hiptesis sirve para estimar parmetros de poblaciones y probar (contrastar) si una afirmacin se ve aprobada o desaprobada ante la evidencia de la muestra utilizando la distribucin t de studet (t).La distribucin t tiene las siguientes propiedades:Es continua, tiene forma de campana y es simtrica respecto al cero como la distribucin z.Existe una familia de distribuciones t que comparten una media de cero pero con desviaciones estndar diferentes.la distribucin t est ms dispersa y es ms plana en el centro que la distribucin z, pero se acerca a ella cuando el tamao de la muestra crece.

Los pasos para la prueba de una hiptesis son los siguientes:

La metodologa que se utiliza para comprobar si una diferencia observada entre dos medias mustrales se puede atribuir a la causalidad, se basa en los siguientes fundamentos tericos: Si X1 y X2 son las medias de dos muestras aleatorias e independientes, grandes de tamao n1 y n2, la distribucin muestral del estadstico X1-X2 se aproxima a una normal que tiene como media 1 2 y como desviacin estndar (X1-X2) (tambin conocido como error estndar). Entonces: (X1-X2) = (21 / n1 ) + (22 / n2) Usualmente 1 y 2 son desconocidas pero para muestras superiores a 30 podemos utilizar las desviaciones muestrales S1y S2 como estimadores de 1 y 2 y probar la H0 en el estadstico Z= (X1-X2) / (S21 / n1 ) + (S22 / n2)Supongamos que los parmetros para dos poblaciones son:

Para muestras grandes el estadstico de prueba es:Cuando 1 y 2 no se conocen pero el tamao de muestra n1 y n2 es mayor o igual que 30, el estadstico de prueba es

Cuando 1 y 2 no se conocen pero el tamao de muestra n1 y n2 es menor que 30, el estadstico de prueba es:

Juegos de Hiptesis y reglas de decisin para pruebas de dos medias mustrales cuando Z es el Estadistico.

Juego de Hiptesis y Reglas de decisin para pruebas de dos medias muestrales cuando t es el Estadistico.

Grficamente podemos representar la zona de aceptacin y rechazo en la distribucin t

si t < -t t > t si t < -t t > tSe rechaza H0 Se rechaza H0 Se rechaza H0 Supuestos y Restricciones:Para comparar dos medias poblacionales se requieren tres supuestos:*las poblaciones deben tener una distribucin normal o normal aproximada*las poblaciones deben ser independientes*las variancias de las poblaciones deben ser igualesConsideracionesUna diferencia entre medias se considera real, confiable, verdadera o significativa cuando existe una alta probabilidad de que tal diferencia no es producto del azar o accidental.

Cuando la diferencia que se observa entre dos medias puede ser fcilmente atribuida al error estndar, es decir a los procesos de seleccin aleatoria o al azar, se dice que dicha diferencia no es significativa. El nivel o grado de probabilidad requerido para que la diferencia entre las medias sea considerada como significativa, es determinado de manera arbitraria por el investigador. El debe establecer qu porcentaje del total de posibles diferencias observadas entre las medias puede ser atribuido al azar. Importante, las muestras independientes son aquellas constituidas por sujetos que no estn relacionados o pareados entre s. De manera que el desempeo de un individuo en un grupo no afecta el desempeo de ninguno de los del otro grupo.

Prueba de significancia de una cola:Una prueba es de una cola cuando la hiptesis alterna, H1, establece una direccin, como:H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.H1 : el ingreso medio de las mujeres es mayor que el de los hombres.Distribucin de muestreo para el valor estadstico z, prueba de una cola, nivel de significancia de .05

Prueba de significancia para dos colas:Una prueba es de dos colas cuando no se establece una direccin especfica de la hiptesis alterna H1, como:H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. Distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de significancia de 0.05

TABLA DE LA DISTRIBUCION t StudentLa tabla da reas 1 y valores , donde, , y donde T tiene distribucin t-Student con r grados de libertad..

1

r0.750.800.850.900.950.9750.990.995

11.0001.3761.9633.0786.31412.70631.82163.657

20.8161.0611.3861.8862.9204.3036.9659.925

30.7650.9781.2501.6382.3533.1824.5415.841

40.7410.9411.1901.5332.1322.7763.7474.604

50.7270.9201.1561.4762.0152.5713.3654.032

60.7180.9061.1341.4401.9432.4473.1433.707

70.7110.8961.1191.4151.8952.3652.9983.499

80.7060.8891.1081.3971.8602.3062.8963.355

90.7030.8831.1001.3831.8332.2622.8213.250

100.7000.8791.0931.3721.8122.2282.7643.169

110.6970.8761.0881.3631.7962.2012.7183.106

120.6950.8731.0831.3561.7822.1792.6813.055

130.6940.8701.0791.3501.7712.1602.6503.012

140.6920.8681.0761.3451.7612.1452.6242.977

150.6910.8661.0741.3411.7532.1312.6022.947

160.6900.8651.0711.3371.7462.1202.5832.921

170.6890.8631.0691.3331.7402.1102.5672.898

180.6880.8621.0671.3301.7342.1012.5522.878

190.6880.8611.0661.3281.7292.0932.5392.861

200.6870.8601.0641.3251.7252.0862.5282.845

210.6860.8591.0631.3231.7212.0802.5182.831

220.6860.8581.0611.3211.7172.0742.5082.819

230.6850.8581.0601.3191.7142.0692.5002.807

240.6850.8571.0591.3181.7112.0642.4922.797

250.6840.8561.0581.3161.7082.0602.4852.787

260.6840.8561.0581.3151.7062.0562.4792.779

270.6840.8551.0571.3141.7032.0522.4732.771

280.6830.8551.0561.3131.7012.0482.4672.763

290.6830.8541.0551.3111.6992.0452.4622.756

300.6830.8541.0551.3101.6972.0422.4572.750

400.6810.8511.0501.3031.6842.0212.4232.704

600.6790.8481.0461.2961.6712.0002.3902.660

1200.6770.8451.0411.2891.6581.9802.3582.617

0.6740.8421.0361.2821.6451.9602.3262.576

TABLA Z.- DISTRIBUCION NORMAL

Probabilidades acumulativas de la distribucin de probabilidad normal (reas bajo la curva desde - infinito hasta z)

Ejemplos:Ejemplo 1:Se realiz un estudio para comparar los aos promedio de servicio de quienes se retiraron en 1979 con los que se retiraron el ao anterior en Delong Manufacturing Co. Con un nivel de significancia de .01 podemos concluir que los trabajadores que se retiraron el ao pasado trabajaron ms aos segn la siguiente muestra? Nota: sea poblacin #1= ao anterior.

Paso 1:

Paso 2: Rechace H0 si z > 2.33Paso 3:

Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el ao anterior tenan ms aos de servicio.

Ejemplo 2:Un estudio EPA reciente compara la economa de combustible en carretera de los automviles nacionales e importados. Una muestra de 15 autos nacionales revel una media de 33.7 mpg con desviacin estndar de 2.4 mpg. Una muestra de 12 autos importados indic una media de 35.7 mpg con desviacin estndar de 3.9. Para .05 de nivel de significancia, puede EPA concluir que el consumo de las mpg para los autos importados es mayor? (Asocie el subndice 1 con los autos nacionales.)Paso 1:

Paso 2: H0 se rechaza si t 15.1 se rechaza Ho.Clculo:

Decisin y Justificacin:Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.Con la decisin anterior se procede a comparar las medias:Ensayo de HiptesisHo; CT-ST=0H1; CT-ST >0

Los grados de libertad son (5+4-2) = 7Regla de decisin:Si tR 1.895 No se Rechaza HoSi tR > 1.895 se rechaza HoClculos:

por lo tanto sp = 1.848

Como 0.6332 es menor que 1.895, no se rechaza Ho, y se concluye con un nivel de significancia del 0.05 que no existe suficiente evidencia para decir que el suero detiene la leucemia.

Ejemplo 4:18 plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrgeno (N) y al resto una de nitrgeno y fsforo (NP). Se midi el rendimiento en Kg. por planta; los resultados obtenidos fueron:_ N: X = 28 kg S = 9_NP: X = 21 kg S = 7Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con los dos tipos de fertilizante. (a = 0,01). H0 ) m N = m NP m N -m NP = 0H1 ) m N m NPSuponiendo que las variancias poblacionales son iguales, de las cuales SN y SNP son estimaciones, se calcula la varianza. Si el supuesto no fuera vlido debera verificarse primeramente la homogeneidad de variancia a travs del test F, en particular si las muestras de las poblaciones no son iguales.Donde

El valor tabulado de t, para 16 grados de li