trabajo hipotesis

15
ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES Mtra. A Elsa Retureta Álvarez Página 1 Introducción: Hipótesis: enunciado acerca de una población elaborada con el propósito de ponerse a prueba. Prueba de hipótesis: procedimiento basado en la evidencia muestral y en la teoría de probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no debe rechazarse o si no es razonable y debe ser rechazado. En el proceso de toma de decisiones, en muchos casos, es necesario determinar cuándo los parámetros de dos poblaciones son similares o diferentes. En esta investigación se da a conocer el procedimiento para probar si dos medias poblacionales son iguales con base la información que se tiene de dos muestras de éstas; o bien, que la diferencia entre ambas medias muéstrales es tan grande que se puede concluir que las medias poblacionales no son iguales. También se muestran las formulas y ejemplos para poder resolver y entender cómo realizar hipótesis para la media de dos poblaciones.

Upload: hoteles1

Post on 22-Jul-2015

3.674 views

Category:

Documents


1 download

TRANSCRIPT

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 1

Introducción:

Hipótesis: enunciado acerca de una población elaborada con el propósito de

ponerse a prueba.

Prueba de hipótesis: procedimiento basado en la evidencia muestral y en la teoría

de probabilidad que se emplea para determinar si la hipótesis es un enunciado

razonable y no debe rechazarse o si no es razonable y debe ser rechazado.

En el proceso de toma de decisiones, en muchos casos, es necesario determinar

cuándo los parámetros de dos poblaciones son similares o diferentes.

En esta investigación se da a conocer el procedimiento para probar si dos medias

poblacionales son iguales con base la información que se tiene de dos muestras

de éstas; o bien, que la diferencia entre ambas medias muéstrales es tan grande

que se puede concluir que las medias poblacionales no son iguales. También se

muestran las formulas y ejemplos para poder resolver y entender cómo realizar

hipótesis para la media de dos poblaciones.

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 2

HIPOTESIS PARA LA MEDIA DE DOS POBLACIONES

La prueba de hipótesis sirve para estimar parámetros de poblaciones y probar

(contrastar) si una afirmación se ve aprobada o desaprobada ante la evidencia de

la muestra utilizando la distribución “t de studet (t)”.

La distribución t tiene las siguientes propiedades:

Es continua, tiene forma de campana y es simétrica respecto al cero como la

distribución z.

Existe una familia de distribuciones t que comparten una media de cero pero con

desviaciones estándar diferentes.

la distribución t está más dispersa y es más plana en el centro que la distribución

z, pero se acerca a ella cuando el tamaño de la muestra crece.

Los pasos para la prueba de una hipótesis son los siguientes:

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 3

La metodología que se utiliza para comprobar si una diferencia observada entre dos medias muéstrales se puede atribuir a la causalidad, se basa en los siguientes fundamentos teóricos:

o Si X1 y X2 son las medias de dos muestras aleatorias e independientes, grandes de tamaño n1 y n2,

o la distribución muestral del estadístico X1-X2 se aproxima a una normal que tiene como media μ1 – μ2 y como desviación estándar α (X1-X2) (también conocido como error estándar). Entonces:

α (X1-X2) = √ (α21 / n1 ) + (α22 / n2)

o Usualmente α1 y α2 son desconocidas pero para muestras superiores a 30 podemos utilizar las desviaciones muestrales S1y S2 como estimadores de α1 y α2 y probar la H0 en el estadístico Z= (X1-X2) / √ (S21 / n1 ) + (S22 / n2)

Supongamos que los parámetros para dos poblaciones son:

Para muestras grandes el estadístico de prueba es:

Cuando σ1 y σ2 no se conocen pero el tamaño de muestra n1 y n2 es mayor o

igual que 30, el estadístico de prueba es

Cuando σ1 y σ2 no se conocen pero el tamaño de muestra n1 y n2 es menor que

30, el estadístico de prueba es:

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 4

Juegos de Hipótesis y reglas de decisión para pruebas de dos medias muéstrales cuando Z es el Estadistico.

Juego de Hipótesis y Reglas de decisión para pruebas de dos medias muestrales cuando t es el Estadistico.

Gráficamente podemos representar la zona de aceptación y rechazo en la

distribución t

si t< -t t> t si t < -t ót > t

Se rechaza H0 Se rechaza H0 Se rechaza H0

Supuestos y Restricciones:

Para comparar dos medias poblacionales se requieren tres supuestos:

*las poblaciones deben tener una distribución normal o normal aproximada

*las poblaciones deben ser independientes

*las variancias de las poblaciones deben ser iguales

Consideraciones

Una diferencia entre medias se considera real, confiable, verdadera o significativa

cuando existe una alta probabilidad de que tal diferencia no es producto del azar o

accidental.

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 5

Cuando la diferencia que se observa entre dos medias puede ser fácilmente

atribuida al error estándar, es decir a los procesos de selección aleatoria o al azar,

se dice que dicha diferencia no es significativa.

El nivel o grado de probabilidad requerido para que la diferencia entre las medias

sea considerada como significativa, es determinado de manera arbitraria por el

investigador. El debe establecer qué porcentaje del total de posibles diferencias

observadas entre las medias puede ser atribuido al azar.

Importante, las muestras independientes son aquellas constituidas por sujetos que

no están relacionados o pareados entre sí. De manera que el desempeño de un

individuo en un grupo no afecta el desempeño de ninguno de los del otro grupo.

Prueba de significancia de una cola:

Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección, como: H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres. Distribución de muestreo para el valor estadístico z, prueba de una cola, nivel de significancia de .05

Prueba de significancia para dos colas:

Una prueba es de dos colas cuando no se establece una dirección específica de la

hipótesis alterna H1, como:

H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres.

H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres. Distribución de muestreo para el valor estadístico z, prueba de dos colas, nivel de significancia de 0.05

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 6

TABLA DE LA DISTRIBUCION tStudent

La tabla da áreas 1 y valores , donde, , y donde T tiene

distribución t-Student con r grados de libertad..

1

r 0.75 0.80 0.85 0.90 0.95 0.975 0.99 0.995

1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657

2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925

3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841

4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604

5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032

6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707

7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499

8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355

9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250

10 0.700 0.879 1.093 1.372 1.812 2.228 2.764 3.169

11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106

12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055

rtc ,1 1][ cTP

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 7

13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012

14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977

15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947

16 0.690 0.865 1.071 1.337 1.746 2.120 2.583 2.921

17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898

18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878

19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861

20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845

21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831

22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819

23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807

24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797

25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787

26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779

27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771

28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763

29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756

30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750

40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704

60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660

120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617

0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 8

TABLA Z.- DISTRIBUCION NORMAL Probabilidades acumulativas de la distribución de probabilidad normal (áreas bajo la curva desde - infinito hasta z)

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 9

Ejemplos:

Ejemplo 1:

Se realizó un estudio para comparar los años promedio de servicio de quienes se

retiraron en 1979 con los que se retiraron el año anterior en DelongManufacturing

Co. Con un nivel de significancia de .01 ¿podemos concluir que los trabajadores

que se retiraron el año pasado trabajaron más años según la siguiente muestra?

Nota: sea población #1= año anterior.

Paso 1:

Paso 2: Rechace H0 si z > 2.33

Paso 3:

Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el año anterior

tenían más años de servicio.

Ejemplo 2: Un estudio EPA reciente compara la economía de combustible en carretera de los automóviles nacionales e importados. Una muestra de 15 autos nacionales reveló una media de 33.7 mpg con desviación estándar de 2.4 mpg. Una muestra de 12 autos importados indicó una media de 35.7 mpg con desviación estándar de 3.9. Para .05 de nivel de significancia, ¿puede EPA concluir que el consumo de las mpg para los autos importados es mayor? (Asocie el subíndice 1 con los autos nacionales.) Paso 1:

Paso 2: H0 se rechaza si t<-1.708,gl=25

Paso 3: t=1.64

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 10

Paso 4: H0 no se rechaza. La evidencia muestral es insuficiente para asegurar

que el consumo de mpg es más alto en los autos importados.

Ejemplo 3:

Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve

ratones, todos con una etapa avanzada de la enfermedad. Cinco ratones reciben

el tratamiento y cuatro no. Los tiempos de sobrevivencia en años, a partir del

momento en que comienza el experimento son los siguientes:

Con Tratamiento 2.1 5.3 1.4 4.6 0.9

Sin Tratamiento 1.9 0.5 2.8 3.1

¿Se puede decir en el nivel de significancia del 0.05 que el suero es efectivo? Suponga que las dos poblaciones se distribuyen normalmente con varianzas iguales.

Solución:

Primero se probará el supuesto de varianzas iguales con un ensayo de hipótesis bilateral utilizando la distribución Fisher.

Datos:

Con tratamiento

s= 1.97

n = 5

Sin tratamiento

s = 1.1672

n = 4

Ensayo de hipótesis:

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 11

Estadístico de prueba:

La sugerencia que se hace es que el numerador sea el de valor mayor.

Entonces los grados de libertad uno será el tamaño de la muestra de la población

uno menos uno. 1= 5-1 = 4 y 2 = 4-1=3.

Regla de decisión:

Si 0.10 Fc 15.1 No se rechaza Ho,

Si la Fc< 0.10 ó si Fc> 15.1 se rechaza Ho.

Cálculo:

Decisión y Justificación:

Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un

= 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.

Con la decisión anterior se procede a comparar las medias:

Ensayo de Hipótesis

Ho; CT- ST=0

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 12

H1; CT- ST>0

Los grados de libertad son (5+4-2) = 7

Regla de decisión:

Si tR 1.895 No se Rechaza Ho

Si tR> 1.895 se rechaza Ho

Cálculos:

por lo tanto sp= 1.848

ÆComo 0.6332 es menor que 1.895, no se rechaza Ho, y se concluye con un nivel de

significancia del 0.05 que no existe suficiente evidencia para decir que el suero detiene la

leucemia.

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 13

Ejemplo 4:

18 plantas de una misma variedad de naranjos fueron tratadas con fertilizantes. A nueve de ellas se les aplico una cierta dosis de nitrógeno (N) y al resto una de nitrógeno y fósforo (NP). Se midió el rendimiento en Kg. por planta; los resultados obtenidos fueron:

_

N: X = 28 kg S² = 9

_

NP: X = 21 kg S² = 7

Interesa conocer si existen diferencias significativas entre los rendimientos de las plantas tratadas con los dos tipos de fertilizante. (a = 0,01).

H0 ) m N = m NP óm N -m NP = 0

H1 ) m N m NP

Suponiendo que las variancias poblacionales son iguales, de las cuales S²N y S²NP son estimaciones, se calcula la varianza. Si el supuesto no fuera válido debería verificarse primeramente la homogeneidad de variancia a través del test F, en particular si las muestras de las poblaciones no son iguales.

Donde

El valor tabulado de t, para 16 grados de libertad y nivel de significación del 1% es igual a ± 2,921. Como el valor de la estadística calculada supera al valor tabulado, se rechas H0 .

Conclusión existen diferencias estadísticamente significativas entre los tratamientos, siendo superior el promedio por planta de naranjo, de aquellas que reciben el tratamiento NP.

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 14

Ejemplo 5:

En un examen de Econometría aplicado a dos grupos con 34 alumnos arrojó los siguientes resultados: La calificación promedio para el primer grupo fue de 72 puntos y la varianza de 64 puntos. La calificación promedio para el segundo grupo fue de 74 puntos y la varianza de 64 puntos. Estos resultados se resumen en la tabla que aparece siguiente. ¿Se puede decir, que el segundo grupo tiene mejor aprovechamiento académico de Econometría, en comparación con el primer grupo, de acuerdo a los resultados de los promedios muéstrales? Pruebe la hipótesis con un nivel de significancia del 5%. Solución: Sea X1 primer grupo, sea X2 el segundo grupo y δ = o.

1.- Juego de Hipótesis

2.- Estadístico de Prueba:

3.- Nivel de significación: 5 %; Zc = -1.645, valor critico. 4.- Regla de decisión: Si Zc< - Za entonces rechace la Ho. 5.- Realizar Cálculos.

ESTADISTICA INFERENCIAL HIPÓTESIS PARA LA MEDIA DE DOS POBLACIONES

Mtra. A Elsa Retureta Álvarez Página 15

6.- Decisión: No rechazamos la hipótesis nula porque Zc es mayor que Za, lo que significa que el segundo grupo no tiene mejor promedio que el primero y que la diferencia que se da entre las medias muéstrales no es significativa

Fuente:

http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/guia_estadistica/modulo_10.htm

http://math.uprag.edu/clase2samplet.pdf

http://www.gestiopolis.com/recursos2/documentos/fulldocs/eco/tdmtyds.htm

http://www.fisicanet.com.ar/matematica/estadisticas/ap10_prueba_t.php

http://www.uoc.edu/in3/e-math/docs/CH_2Pob.pdf

http://www.itch.edu.mx/academic/industrial/estadistica1/cap03d.html

http://estadistica7inferencial.blogspot.com/2009/06/prueba-de-hipotesis-de-la-

diferencia-de.html