Download - Pueba de hipótesis
Prueba de hipótesis
ÁREAS DE LA INFERENCIA ESTADÍSTICA
INFERENCIA ESTADÍSTICA
Estimación de parámetros
Prueba de hipótesis
Por punto
Por intervalos Calcular un valor que
corresponde a una característica de la población
De orden cuantitativo. Establece conclusiones sobre alguna afirmación o supuesto
(hipótesis)
Prueba de hipótesis
Rama de la inferencia estadística, denominada docimacia de hipótesis o contraste de hipótesis.
Una hipótesis estadística es un supuesto acerca de algún parámetro poblacional o sobre alguna situación existente en la población.
Existen dos tipos de hipótesis estadísticas:
H. Nula, Ho
H. Alterna, H1
Prueba de hipótesis
Una prueba de hipótesis es un procedimiento estadístico en el que a partir de una o más muestras aleatorias, tomamos la decisión de rechazar o no un supuesto (hipótesis) acerca de la población, asumiendo un riesgo (probabilidad de error) de equivocarnos al tomar la decisión.
Para el proceso de prueba de hipótesis es necesario que primero se considere de manera clara lo que se desea probar y expresarlo de modo verbal, luego en términos de medidas estadísticas de la variable bajo estudio.
Teach point
Tipos de hipótesis
Es la hipótesis que el procedimiento estadístico somete a prueba, se formula como supuesto de no diferencia o igualdad para el valor poblacional, o como un supuesto de no asociación de dos variables
Sirve para contrastar la hipótesis nula, usualmente se formula como un supuesto de diferencia. Es la hipótesis de trabajo y la que se espera sea apoyada por los datos de la muestra
1. Hipótesis nula
2. Hipótesis alterna
Se plantea esperando ser rechazada (que los datos de la muestra no la apoyen) y es la que se somete a contrastación
Tipos de hipótesis
El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es de 5%
Ho: P=0,05
El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es menor al 5% Ho: P<0,05
1. Hipótesis nula 2. Hipótesis alterna
El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es
210mg
Ho: μ= 210mg
El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es mayor
de 210mg
Ho: μ> 210mg
La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano JPH es igual a la de los niños preescolares del
distrito de El Tambo Ho: P1=P2
La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano
JPH es mayor a la de los niños preescolares del distrito de El Tambo
Ho: P1>P2
Procedimiento a seguir para la realización de una prueba de hipótesis
Defina con claridad los supuestos que se plantean en la investigación
Identifique el tipo de variable en estudio relacionada con las suposiciones
Identifique la o las poblaciones bajo estudio
Elija la prueba estadística apropiada para la prueba de hipótesis planteadas
Plantee las hipótesis nula y alterna
Calcule la estadística de la prueba con los datos obtenidos para este fin
Pre-determine el nivel de significancia para la región de rechazo
Tome la decisión comparando el nivel crítico (p) con el nivel de significancia (α)
Obtenga el nivel crítico para el resultado obtenido con la muestra
Al tomar la decisión respecto a la Ho, se puede correr el riesgo de cometer dos distintos tipos de error:
DECISIÓN
Planteamiento (situación poblacional)
Ho CIERTA Ho Falsa
Rechazar Ho Error tipo I
Probabilidad = α (ρ) «nivel de significación»
Decisión acertada
Probabilidad = (1-β) «potencia»
No rechazar Ho Decisión acertada
Probabilidad = (1-α) «nivel de confianza»
Error tipo II
Probabilidad = β
Ó
Ó
Las cuatro son probabilidades condicionales, así:
α = probabilidad de rechazar Ho, cuando Ho es cierta
1-α = probabilidad de no rechazar Ho, cuando Ho es cierta
β = probabilidad de no rechazar Ho, cuando Ho es falsa
1-β = probabilidad de rechazar Ho, cuando Ho es falsa
Ó
Alfa y Beta se relacionan de manera inversa: al decrecer una aumenta la otra. Habitualmente α está bajo nuestro control; pero β sólo está en forma indirecta mediante su relación inversa que tiene con α.
En investigaciones biomédicas el nivel de confianza más usado es 95%; es decir (1-α) = 0,95; luego el nivel de significancia más usado es 5% (α=0,05). De la misma forma la potencia más usada es 80% es decir (1- β) = 0,80, entonces β= 0,20.
Existe una igualdad empírica entre los valores de α y β, que ayuda a fijar el valor de β para un valor elegido de α:
β = 4α
Comparación de dos medias de poblaciones independientes y relacionadas
PRUEBA DE HIPÓTESIS
Diferencia (comparación) de dos medias de poblaciones independientes
PRUEBA DE HIPÓTESIS
Se contrastará alguna de las hipótesis que sigue:
Ho: μ1 = μ2 H1: μ1 ≠ μ2
bilateral
Ho: μ1 ≥ μ2 H1: μ1 < μ2
unilateral
Ho: μ1 ≤ μ2 H1: μ1 > μ2
unilateral
PRUEBA DE HIPÓTESIS
Diferencia (comparación) de dos medias de poblaciones independientes
EJEMPLO
Mediante un experimento se desea evaluar el efecto de las dietas A y B en la ganancia de peso, usando dos grupos de animales experimentales. El grupo 1 recibirá la dieta A (enriquecida) y el grupo 2 la dieta B (convencional). Los investigadores desean determinar si con la dieta A, los animales ganarán mayor peso que con la B. Después de 5 semanas de seguimiento se calculó el incremento de peso para cada animal. Los resultados fueron:
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
En vista que no se conocen las varianzas poblacionales se hará uso del contraste «t» . Para el buen uso del contraste los datos deben satisfacer los siguientes supuestos básicos: 1. Normalidad 2. Aleatoriedad 3. Homogeneidad de varianzas
Si los supuestos se cumplen entonces el procedimiento es:
T es la distribución de probabilidades para encontrar
el número de errores estándar
Diferencia (comparación) de dos medias de poblaciones independientes
a. Hipótesis
𝑡(𝑛1 + 𝑛2) − 2 =(𝑋1 − 𝑋2)
√(𝑆2𝑝𝑛1
+𝑆2𝑝𝑛2
)
b. Contraste estadístico
Ho: μ1 = μ2 H1: μ1 ≠ μ2
bilateral
Ho: μ1 ≥ μ2 H1: μ1 < μ2
unilateral
Ho: μ1 ≤ μ2 H1: μ1 > μ2
unilateral
Ho: μ1- μ2 ≤ 0 H1: μ1 - μ2 > 0
𝑆2𝑝 es la varianza ponderada Donde:
Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
𝑆2𝑝 =𝑛1 −1 𝑆2
1+ 𝑛2−1 𝑆2
2
𝑛1+𝑛2 −2
𝑆2𝑝 =12−1 62
1+ 12−1 3.82
22
𝑆2𝑝 = 25,22
Volviendo y reemplazando en la fórmula de contraste
Diferencia (comparación) de dos medias de poblaciones independientes
SOLUCIÓN
Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g
Grupo 2: muestra 12, media de las ganancias de peso: 21,2g con una desviación estándar de 3,8g
𝑡(𝑛1 + 𝑛2) − 2 =(𝑋1 − 𝑋2)
√(𝑆2𝑝𝑛1
+𝑆2𝑝𝑛2
)
Contraste estadístico
𝑡22 =(27,2 − 21,2)
√(25,2212
+25,2212
)= 2,927
Ubicamos este valor en la tabla T
Diferencia (comparación) de dos medias de poblaciones independientes
2,927 Ubicamos el valor dentro de la distribución T para determinar el valor de p
P, se halla entre los niveles de confianza de 0,995 y 0,9995
Se rechaza
Ho
No se rechaza
Ho
Diferencia (comparación) de dos medias de poblaciones independientes
c. Valor de p 0,0005 < p < 0,005 (nivel de significancia)
Decisión Siendo p<0,05 se rechaza la Ho. Conclusión La dieta A produjo mayor ganancia de peso que la dieta B, con p <0,05.
d. Decisión y conclusión
Diferencia (comparación) de dos medias de poblaciones relacionadas (pareadas)
PRUEBA DE HIPÓTESIS
Diferencia (comparación) de dos medias de poblaciones relacionadas
EJEMPLO
Se tienen los niveles de colesterol total de una muestra de ocho pacientes antes y después de participar en un programa dieta-ejercicio. ¿Puede concluirse que el programa tuvo efecto favorable?
Paciente Antes Después di
1 201 200 1
2 211 216 -5
3 205 200 5
4 220 193 27
5 208 204 4
6 217 196 21
7 216 186 30
8 215 175 40
Diferencia (comparación) de dos medias de poblaciones relacionadas
SOLUCIÓN
a. Planteamiento de Hipótesis
Se expresarán del siguiente modo:
Ho: μd ≤ 0 (después del programa los valores no disminuyen) H1: μd > 0 (después del programa los valores disminuyen) unilateral
Donde μd = Media poblacional de las diferencias
Diferencia (comparación) de dos medias de poblaciones relacionadas
𝑡(𝑛 − 1) =(𝑑)
𝑆𝑑/√𝑛)
b. Contraste estadístico
𝑑 media aritmética de las diferencias 𝑆𝑑 desviación estándar de las diferencias
Si la muestra es probabilística y las diferencias (di) tienen distribución normal
𝑡 7 =15,375
16,2387
8
= 2,678
Diferencia (comparación) de dos medias de poblaciones relacionadas
Hallando la desviación estándar de las diferencias , a partir de la varianza
𝑆2 = 𝑋𝑖2 −𝑛𝑋 2
𝑛−1
𝑆2 = 263,69
Volviendo y reemplazando en la fórmula de contraste
𝑆𝑑 = √𝑆2 = √263,69 = 16,2387
Diferencia (comparación) de dos medias de poblaciones relacionadas
2,678 Ubicamos el valor dentro de la distribución T para determinar el valor de p
P, se halla entre los niveles de confianza de 0,975 y 0,99
Se rechaza
Ho
No se rechaza
Ho
Diferencia (comparación) de dos medias de poblaciones relacionadas
c. Valor de p 0,010 < p < 0,025 (nivel de significancia)
Decisión Siendo p<0,05 se rechaza la Ho. Conclusión Se concluye que después del programa los niveles de colesterol son significativamente menores que los obtenidos antes, con p <0,025.
d. Decisión y conclusión
Práctica de prueba de hipótesis