prueba de hipótesis muestras pequeñas

Post on 08-Feb-2017

479 Views

Category:

Education

6 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Prueba de hipótesis

Muestras pequeñas

Introducción

• Para emplear la distribución z es necesario conocer la desviación estándar de la población y tener una muestra grande (>30).

• Si no conoce la desviación estándar de la población y el número de observaciones de la muestra es menor que 30, entonces es posible utilizar la desviación estándar de la muestra como una estimación de la desviación estándar de la población; pero no es posible utilizar la distribución normal, el estadístico adecuado es t.

Características de una distribución t• William S. Gossett desarrolló la distribución t de Student.

1. Al igual que la distribución z, es una distribución continua. 2. Al igual que z, tiene forma de campana y es simétrica. 3. Al igual que z, no hay una distribución t, sino una “familia” de

distribuciones. Todas con la misma media (0); pero con distinta desviación estándar, de acuerdo al tamaño de la muestra.

4. La distribución t es más ancha y más plana que la distribución z. A medida que la muestra es más grande, se asemeja más a la distribución z.

Prueba para la media de la población

¿Población normal?

n => 30

Prueba no paramétrica Use z

¿Conoce la Desv. Est.?

Use t Use z

No

No No

Si

Si Si

Recuerde: ¿Cómo comprobar una hipótesis?

1.Plantear las hipótesis nula y alternativa(s). 2.Seleccionar un nivel de significancia. 3.Calcular el estadístico de prueba. 4.Formular la regla de decisión. 5.Tomar una decisión.

• El costo promedio de resolver una queja en la empresa es de $60.00.

• Se adoptaron medidas para reducir los costos. • Se analizaron los costos de 26 quejas y se calculó un

promedio de $57.00 y una desviación estándar de $10.00.

• Con un nivel de significancia de 0.01, ¿se puede concluir que las medidas adoptadas reducen los costos?

Paso 1: Establecer hipótesis nula y alternativa

H0: Promedio >= $60.00Ha: Promedio < $60.00

Paso 2: Seleccionar nivel de significancia• Siendo un problema de calidad, se selecciona 0.01 (la

tabla de distribución t, incluye también 0.005 y 0.0005.

Paso 3: Resuelva el estadístico de prueba• De acuerdo al diagrama en la dispositiva 4, se utiliza

el estadístico de prueba t. • Sustituyendo, t=-1.530

nst

Paso 4: Formar regla de decisión• Utilice la tabla: Distribución t para encontrar el valor

crítico. • En la columna del lado izquierdo de la tabla, encontrará

los grados de libertad (gl). Los grados de libertad son igual al número de observaciones en la muestra, menos el número de muestras (1).

• En segundo lugar, se debe determinar si se trata de una prueba de una o dos colas.

• En este caso., 2.485

Paso 5: Se toma una decisión• Como se trata de una prueba con una cola, y la

región de rechazo está en la cola izquierda, el valor crítico es negativo.

• La regla de decisión señala que se debe rechazar la H0, si t pasa el valor crítico de -2.485.

• Como -1.530 está a la derecha del valor crítico, no se rechaza la hipótesis nula.

Ejercicio para el estudiante• La vida promedio de una batería en un reloj digital es

de 305 días. Las duraciones de las baterías tienen una distribución normal.

• La batería se modificó y se tomó una muestra de 20 baterías. La vida promedio fue de 311 días con una desviación estándar de 12 días.

• A un nivel de significancia de .05, ¿La modificación incrementó la vida de la batería?

Valor p

• La mayoría de los paquetes de programas estadisticos es la salida del valor p.

• El valor p representa la probabilidad de encontrar un valor t tan extremo como el calculado, dado que la hipótesis nula es verdadera.

• Así, si la hipotesis nula fue rechazada, señala si ésta estubo cerca de ser rechazada, apenas fue rechazada y así sucesivamente.

• Si p es mayor que el nivel de significancia, no se rechaza la hipótesis nula.

Comparación de dos medias independientes

• Antes se respondía ¿Es probable que la muestra venga de una población

con la media propuesta?• En este caso, se responde a la pregunta:

¿Son las dos medias iguales?• O dicho de otra manera,

¿Pueden las dos medias de muestras provenir de poblaciones idénticas?

Suposiciones

1. Las poblaciones muestreadas tienen una distribucion normal.

2. Las dos muestras son independietes.3. Las desviaciones estandar de ambas poblaciones

son iguales.

Varianza combinada

2))(1())(1(

21

222

2112

nn

snsnsp

La prueba de medias para dos muestras pequeñas es igual a la prueba para dos muestras grandes, con excepción de un cálculo adicional:

Prueba de dos medias de muestras pequeñas

21

2

21

11nn

s

xxt

p

Ejemplo

• Una fábrica de podadoras desarrolló dos procesos para ensamblarlas.

• Cinco empleados emplearon el procedimiento A. • Seis empleados el procedimiento B. • A continuación, se presentan los tiempos de

ensamblaje en minutos. • Utilizando un nivel de significancia de 0.1, ¿Existe

alguna diferencia en el tiempo para ensamblarlas?

Procedimiento A Procedimiento B

2 3

4 7

9 5

3 8

2 4

3

Solución

• Suposiciones: a) Las observaciones son independientes entre sí. b) Ambas poblaciones son normales. c) Las dos poblaciones tienen desviaciones

estándar iguales.

Hipótesis nula y alternativa• H0: µ1 = µ2

• Ha: µ1 ≠ µ2

Nivel de significancia

• El nivel de significancia es 0.1. • Los grados de libertad son igual al número de

elementos muestreados, menos el número de muestras; en este caso, n1+n2 -2. (Entonces, gl=9)

• Como la hipótesis nula no tiene dirección, es un problema de dos colas. Buscamos el valor crítico para t en dos colas, y es 1.833 (-1.833).

Resolver el estadístico de prueba

• Primero, calcule la combinación de varianzas de las muestras.

• Sustituyendo, t= 0.662

21

2

21

11nn

s

xxt

p

Decisión

• No se rechaza la hipótesis nula (porque el estadístico de prueba t está dentro del área entre -1.833 y 1.833).

• Se concluye que no hay diferencia entre los tiempos medios para montar el motor sobre la estructura entre ambos métodos.

Ejercicio

• El supervisor de una fábrica de sillas de ruedas desea comparar el número de sillas de ruedas defectuosas producidas por el turno diurno con los del turno nocturno.

• Una muestra de la producción de seis turnos diurnos y ocho nocturnos mostró la siguiente información:

Turno diurno Turno nocturno

5 8

8 10

7 7

6 11

9 9

7 12

14

9

• En un nivel de significancia de 0.05 ¿existe alguna diferencia en el número medio de sillas defectuosas por turno?

• Estime el valor de p.

Prueba de hipótesis con muestras dependientes• Las muestras no sin independientes, sino que están

relacionadas o son dependientes. • Se conoce también como muestra en pares (paired

samples).• El interés recae sobre la distribución de las

diferencias en el valor calculado. En otras palabras, se está investigando si la media de la distribución de las diferencias entre los valores calculados es 0.

• Hay dos tipos de muestras dependientes: A. Antes y después de un tratamiento. B. Muestras en pares como las del ejemplo siguiente.

Prueba t de Student para muestras en pares

nsdtd

La desviación estándar de las diferencias

1

)( 22

nndd

sd

Ejemplo

• Se le pide a dos compañías valuadoras que calculen el valor de diez propiedades con los siguientes resultados

Propiedad Compañía 1 Compañía 2

1 135 128

2 110 105

3 131 119

4 142 140

5 105 98

6 130 123

7 131 127

8 110 115

9 125 122

10 149 145

Solución

• H0: µd = 0

• Ha: µd ≠ 0

Nivel de significancia

• Es un problema de dos colas. • Los grados de libertad son 9 (es sólo una muestra la

que evalúan dos grupos).• El resultado es 2.262 (-2.262).

Resolver el estadístico de prueba• Crear la distribución de

las diferencias. • Primero, resuelva la

desviación estándar de la distribución de las diferencias.

• Sustituyendo valores en la fórmula siguiente, el resultado es 3.305

nsdtd

Decisión

• Se rechaza la hipótesis nula. • La distribución de las diferencias no tiene una media

de 0. • La mayor diferencia está en la propiedad 3, quizá esta

sería un lugar adecuado para iniciar una revisión más detallada.

Valor p

• Buscando en la tabla de valores de la distribución t de Student, los valores más cercanos al resultado de t, en el apartado para dos colas, a la altura de 9 grados de libertad son 3.250 y 4.781; que corresponden a 0.01 y 0.001, respectivamente.

• Por lo tanto, el valor p es menor que 0.01 y mayor que 0.001.

• Existe una firme evidencia de que la Hipótesis nula es rechazada.

top related