Download - Pueba de hipótesis

Prueba de hipótesis

ÁREAS DE LA INFERENCIA ESTADÍSTICA

INFERENCIA ESTADÍSTICA

Estimación de parámetros


Por punto

Por intervalos Calcular un valor que

corresponde a una característica de la población

De orden cuantitativo. Establece conclusiones sobre alguna afirmación o supuesto

(hipótesis)


Rama de la inferencia estadística, denominada docimacia de hipótesis o contraste de hipótesis.

Una hipótesis estadística es un supuesto acerca de algún parámetro poblacional o sobre alguna situación existente en la población.

Existen dos tipos de hipótesis estadísticas:

H. Nula, Ho

H. Alterna, H1


Una prueba de hipótesis es un procedimiento estadístico en el que a partir de una o más muestras aleatorias, tomamos la decisión de rechazar o no un supuesto (hipótesis) acerca de la población, asumiendo un riesgo (probabilidad de error) de equivocarnos al tomar la decisión.

Para el proceso de prueba de hipótesis es necesario que primero se considere de manera clara lo que se desea probar y expresarlo de modo verbal, luego en términos de medidas estadísticas de la variable bajo estudio.

Teach point

Tipos de hipótesis

Es la hipótesis que el procedimiento estadístico somete a prueba, se formula como supuesto de no diferencia o igualdad para el valor poblacional, o como un supuesto de no asociación de dos variables

Sirve para contrastar la hipótesis nula, usualmente se formula como un supuesto de diferencia. Es la hipótesis de trabajo y la que se espera sea apoyada por los datos de la muestra

1. Hipótesis nula

2. Hipótesis alterna

Se plantea esperando ser rechazada (que los datos de la muestra no la apoyen) y es la que se somete a contrastación

Tipos de hipótesis

El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es de 5%

Ho: P=0,05

El porcentaje de pacientes que refiere efectos adversos al ingerir ciprofloxacina es menor al 5% Ho: P<0,05

1. Hipótesis nula 2. Hipótesis alterna

El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es

210mg

Ho: μ= 210mg

El nivel promedio de glicemia en pacientes con diabetes tipo II del distrito de Huancán es mayor

de 210mg

Ho: μ> 210mg

La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano JPH es igual a la de los niños preescolares del

distrito de El Tambo Ho: P1=P2

La prevalencia de parasitosis intestinal en los niños preescolares del asentamiento humano

JPH es mayor a la de los niños preescolares del distrito de El Tambo

Ho: P1>P2

Procedimiento a seguir para la realización de una prueba de hipótesis

Defina con claridad los supuestos que se plantean en la investigación

Identifique el tipo de variable en estudio relacionada con las suposiciones

Identifique la o las poblaciones bajo estudio

Elija la prueba estadística apropiada para la prueba de hipótesis planteadas

Plantee las hipótesis nula y alterna

Calcule la estadística de la prueba con los datos obtenidos para este fin

Pre-determine el nivel de significancia para la región de rechazo

Tome la decisión comparando el nivel crítico (p) con el nivel de significancia (α)

Obtenga el nivel crítico para el resultado obtenido con la muestra

Al tomar la decisión respecto a la Ho, se puede correr el riesgo de cometer dos distintos tipos de error:

DECISIÓN

Planteamiento (situación poblacional)

Ho CIERTA Ho Falsa

Rechazar Ho Error tipo I

Probabilidad = α (ρ) «nivel de significación»

Decisión acertada

Probabilidad = (1-β) «potencia»

No rechazar Ho Decisión acertada

Probabilidad = (1-α) «nivel de confianza»

Error tipo II

Probabilidad = β

Ó

Las cuatro son probabilidades condicionales, así:

α = probabilidad de rechazar Ho, cuando Ho es cierta

1-α = probabilidad de no rechazar Ho, cuando Ho es cierta

β = probabilidad de no rechazar Ho, cuando Ho es falsa

1-β = probabilidad de rechazar Ho, cuando Ho es falsa

Ó

Alfa y Beta se relacionan de manera inversa: al decrecer una aumenta la otra. Habitualmente α está bajo nuestro control; pero β sólo está en forma indirecta mediante su relación inversa que tiene con α.

En investigaciones biomédicas el nivel de confianza más usado es 95%; es decir (1-α) = 0,95; luego el nivel de significancia más usado es 5% (α=0,05). De la misma forma la potencia más usada es 80% es decir (1- β) = 0,80, entonces β= 0,20.

Existe una igualdad empírica entre los valores de α y β, que ayuda a fijar el valor de β para un valor elegido de α:

β = 4α

Comparación de dos medias de poblaciones independientes y relacionadas

PRUEBA DE HIPÓTESIS

Diferencia (comparación) de dos medias de poblaciones independientes


Se contrastará alguna de las hipótesis que sigue:

Ho: μ1 = μ2 H1: μ1 ≠ μ2

bilateral

Ho: μ1 ≥ μ2 H1: μ1 < μ2

unilateral

Ho: μ1 ≤ μ2 H1: μ1 > μ2

unilateral


EJEMPLO

Mediante un experimento se desea evaluar el efecto de las dietas A y B en la ganancia de peso, usando dos grupos de animales experimentales. El grupo 1 recibirá la dieta A (enriquecida) y el grupo 2 la dieta B (convencional). Los investigadores desean determinar si con la dieta A, los animales ganarán mayor peso que con la B. Después de 5 semanas de seguimiento se calculó el incremento de peso para cada animal. Los resultados fueron:

Grupo 1: muestra 12, media de las ganancias de peso: 27,2g con una desviación estándar de 6,0g



SOLUCIÓN

En vista que no se conocen las varianzas poblacionales se hará uso del contraste «t» . Para el buen uso del contraste los datos deben satisfacer los siguientes supuestos básicos: 1. Normalidad 2. Aleatoriedad 3. Homogeneidad de varianzas

Si los supuestos se cumplen entonces el procedimiento es:

T es la distribución de probabilidades para encontrar

el número de errores estándar


a. Hipótesis

𝑡(𝑛1 + 𝑛2) − 2 =(𝑋1 − 𝑋2)

√(𝑆2𝑝𝑛1

+𝑆2𝑝𝑛2

)

b. Contraste estadístico

Ho: μ1 = μ2 H1: μ1 ≠ μ2

bilateral

Ho: μ1 ≥ μ2 H1: μ1 < μ2

unilateral

Ho: μ1 ≤ μ2 H1: μ1 > μ2

unilateral

Ho: μ1- μ2 ≤ 0 H1: μ1 - μ2 > 0

𝑆2𝑝 es la varianza ponderada Donde:


SOLUCIÓN



𝑆2𝑝 =𝑛1 −1 𝑆2

1+ 𝑛2−1 𝑆2

2

𝑛1+𝑛2 −2

𝑆2𝑝 =12−1 62

1+ 12−1 3.82

22

𝑆2𝑝 = 25,22

Volviendo y reemplazando en la fórmula de contraste


SOLUCIÓN



𝑡(𝑛1 + 𝑛2) − 2 =(𝑋1 − 𝑋2)

√(𝑆2𝑝𝑛1

+𝑆2𝑝𝑛2

)

Contraste estadístico

𝑡22 =(27,2 − 21,2)

√(25,2212

+25,2212

)= 2,927

Ubicamos este valor en la tabla T


2,927 Ubicamos el valor dentro de la distribución T para determinar el valor de p

P, se halla entre los niveles de confianza de 0,995 y 0,9995

Se rechaza

Ho

No se rechaza

Ho


c. Valor de p 0,0005 < p < 0,005 (nivel de significancia)

Decisión Siendo p<0,05 se rechaza la Ho. Conclusión La dieta A produjo mayor ganancia de peso que la dieta B, con p <0,05.

d. Decisión y conclusión

Diferencia (comparación) de dos medias de poblaciones relacionadas (pareadas)


Diferencia (comparación) de dos medias de poblaciones relacionadas

EJEMPLO

Se tienen los niveles de colesterol total de una muestra de ocho pacientes antes y después de participar en un programa dieta-ejercicio. ¿Puede concluirse que el programa tuvo efecto favorable?

Paciente Antes Después di

1 201 200 1

2 211 216 -5

3 205 200 5

4 220 193 27

5 208 204 4

6 217 196 21

7 216 186 30

8 215 175 40


SOLUCIÓN

a. Planteamiento de Hipótesis

Se expresarán del siguiente modo:

Ho: μd ≤ 0 (después del programa los valores no disminuyen) H1: μd > 0 (después del programa los valores disminuyen) unilateral

Donde μd = Media poblacional de las diferencias


𝑡(𝑛 − 1) =(𝑑)

𝑆𝑑/√𝑛)

b. Contraste estadístico

𝑑 media aritmética de las diferencias 𝑆𝑑 desviación estándar de las diferencias

Si la muestra es probabilística y las diferencias (di) tienen distribución normal

𝑡 7 =15,375

16,2387

8

= 2,678


Hallando la desviación estándar de las diferencias , a partir de la varianza

𝑆2 = 𝑋𝑖2 −𝑛𝑋 2

𝑛−1

𝑆2 = 263,69

Volviendo y reemplazando en la fórmula de contraste

𝑆𝑑 = √𝑆2 = √263,69 = 16,2387


2,678 Ubicamos el valor dentro de la distribución T para determinar el valor de p

P, se halla entre los niveles de confianza de 0,975 y 0,99

Se rechaza

Ho

No se rechaza

Ho


c. Valor de p 0,010 < p < 0,025 (nivel de significancia)

Decisión Siendo p<0,05 se rechaza la Ho. Conclusión Se concluye que después del programa los niveles de colesterol son significativamente menores que los obtenidos antes, con p <0,025.

d. Decisión y conclusión

Práctica de prueba de hipótesis

Download - Pueba de hipótesis

Top Related