contraste de hipótesis
DESCRIPTION
El contraste de hipotesis es muy importante en el analisis inferenciasTRANSCRIPT
Contraste de hipótesis.
El hombre reconoce cotidianamente situaciones que le afectan, como la
perdida de cosechas, las enfermedades, las contingencias climáticas, etc.
tomar acciones para evitar i prevenir estos problemas requiere comprender
como funciona el sistema que los origina. En el proceso de compresión existe
una etapa de idealización que se llama técnicamente modelación, que tiene
por objeto identificar los elementos que son relevantes y plantear sus
relaciones. Si el modelo es correcto se tendrá una herramienta valiosa para
planificar acciones en el mundo.
Para que un modelo sea incorporado al patrimonio de la ciencia tiene antes
que mostrar que las predicciones que se deducen de él son aceptables.
Lo usual es realizar un experimento u observar el comportamiento del sistema
y comparar los resultados obtenidos en estos estudios con los que se deducen
del modelo. Si no hay diferencias significativas entre lo observado y lo
esperado, entonces de dirá que el modelo es correcto para esa situación o que
el modelo es provisoriamente aceptable.
El problema es definir que se entiende por diferencia significativa. No es simple
establecer un criterio para decir si la discrepancia entre lo que se observa y lo
que se espera es grande o pequeña.
La idea es entonces: dado un modelo no valido que se llama hipótesis científica
se debe seguir algún procedimiento para deducir alguna consecuencia, cuya
verificación o falta de verificación, sirva para establecer la veracidad de la
hipótesis científica. Si las consecuencias de la hipótesis científica se pueden
visualizar como propiedades estadísticas de una variable aleatoria, será
factible utilizar herramientas estadísticas para tomar una decisión sobre la
veracidad del modelo. Para ello se debe expresar una hipótesis estadística, que
consiste en una afirmación sobre uno o más parámetros de la distribución de la
variable aleatoria en cuestión. Es obvio que la hipótesis estadística debe ser
equivalente a la hipótesis científica postulada.
La prueba estadística o prueba de hipótesis se pueden examinar un conjunto
de datos muéstrales y a partir de ellos se calcula un estadístico cuya
distribución depende de la hipótesis planteada. Sobre la base de la distribución
especificada para el estadístico y de su valor observado en la muestra, se
decide el rechazo o no de la hipótesis estadística y en consecuencia de la
hipótesis científica.
Procedimientos de la prueba de Hipótesis.
Pasos a seguir en la prueba de hipótesis estadística.
a) Plantear las hipótesis nula y alternativa.
Para poder construir una prueba estadística se debe especificar una hipótesis
que se supone, provisoriamente como verdadera, llamada hipótesis nula y es
simbolizada con H0. Esta hipótesis especifica los valores de uno o varios
parámetros de la distribución de la variable aleatoria observada en el
experimento. Cuando la hipótesis nula se somete a prueba, el resultado es su
aceptación o rechazo. En este último caso se aceptara una hipótesis
especificada de antemano que se llama hipótesis alternativa que se simboliza
por H1 y que propone como posibles valores del o los parámetros en cuestión
al conjunto de valores complementarios al postulado bajo H0.
b) Planificar el experimento o el esquema muestral.
La forma en que se recolectan los datos o se diseña el experimento es motivo
de tratamiento particular por las técnicas de muestreo y el diseño de
experimentos. El objetivo de este paso es definir la forma en que los daros
serán obtenidos, incluyendo el numero total de observaciones en la muestra.
c) Selección de un estadístico para la prueba e identificación de su
distribución bajo H0.
El estadístico de la prueba es una función de la muestra. Se necesita una
función W de la muestra cuya distribución de la muestra sea conocida y quede
completamente especificada bajo H0, es decir que se puede calcular P (W ≤
w). La función W, a través de su distribución, servirá para asignar
probabilidades a los eventos que conduce a aceptar o rechazar la hipótesis
nula postulada. El evento que induce al rechazo se conoce como región o zona
de rechazo de H0, en tanto que el evento que conduce al no rechazo se llama
región o zona de aceptación de H0.
d) Establecer el nivel de significación de la prueba.
El nivel de significación se define como la máxima probabilidad de rechazar
H0 cuando esta es verdadera. Será denotado por la letra griega α.
El nivel de significación representa la máxima probabilidad de equivocarse en
el sentido de concluir que H0 es falsa cuando en realidad no lo es. Este error,
llamado error de tipo I.
Una vez que se han establecido H0 y H1 debe fijarse el nivel de significación.
En general se fija en 0.05 (5%) o en 0.01 (1%), que son niveles usualmente
aceptados, aunque no hay razón alguna para no seleccionar algún otro.
Es importante indicar que la probabilidad de cometer el error de tipo I se
establece antes de la realización de la prueba estadística. Esta observación
tiene el objetivo de que el investigador evalué cuál es la tasa de error de tipo I
que esta dispuesto a tolerar en base a criterios independientes de los
resultados muéstrales o experimentales.
e) Establecer los eventos que conducen al rechazo y no rechazo de la
hipótesis nula.
El siguiente paso consiste en establecer las regiones de no rechazo y de
rechazo de H0.
La región de rechazo de H0 es uno o mas de los intervalos de la recta real que
describen al evento que conducen al rechazo de H0 y cuya probabilidad,
cuando H0 es verdadera, es α.
La región de no rechazo de H0 es un intervalo de la recta real que describe al
evento que conduce al no rechazo de H0 con probabilidad 1 – α, cuando H0 es
cierta.
Región bilateral la zona de rechazo puede estar a la derecha y la izquierda de
la distribución del estadístico bajo H0. Depende de la prueba de hipótesis
alternativa. El tamaño de la región de rechazo esta determinado por el nivel de
significación de la prueba.
S
Fig. 1: Representación de la distribución del estadístico bajo H0 en una prueba unilateral derecha.
Fig. 2: Representación de la distribución del estadístico bajo H0 en una prueba unilateral izquierda.
Fig. 3: Representación de la distribución bajo H0 en una prueba bilateral.
Puntos críticos los valores de la recta real que separan la zona de no rechazo de la de rechazo.
f) Calcular el valor estadístico y determinar si esta dentro o fuera de la región de rechazo.Tiene por objetivo obtener daros experimentales que permitan evaluar el estadístico propuesto para la prueba, de acuerdo a la planificación realizada previamente.
g) Calcular el valor estadístico y determinar si esta dentro o fuera de la región de rechazo.Con los datos obtenidos se calculara W, cuya distribución bajo la hipótesis nula es conocida y para la cual se han fijado las regiones de no rechazo y rechazo.Si el valor calculado de W pertenece a la región de rechazo se concluye que la hipótesis nula debe desecharse. En caso contrario se concluye que no hay evidencia suficiente para rechazarla.
Es una secuencia formal que no siempre se respeta en la práctica de la investigación. Usualmente se tiene una hipótesis científica y se planifica una experiencia para probarlas y una vez obtenidos los datos trata de formalizar una hipótesis estadística.
Errores.
En la prueba de una hipótesis estadística pueden ocurrir dos errores:
Error de tipo I Error de tipo II
La posible ocurrencia de uno y otro error depende de la condición de verdadera o falsa de la hipótesis nula y de la decisión, basada en la muestra, de aceptarla o rechazarla.
Si se rechaza Ho, el Error tipo I se comete cuando Ho es verdadero. Si por el contrario se acepta Ho siendo esta falsa, entonces se cometerá el Error de tipo II.
Calculo de la probabilidad de cometer error de tipo II (ß).
Cuando la hipótesis nula no es verdadera, lo que interesa saber es cuál es la posibilidad de aceptar Ho cuando es falsa. Para conocer esa probabilidad se debe encontrar la probabilidad de la región de aceptación. Ejemplo p(-1.960≤w≤1.96I=52).
El investigador no determina la probabilidad de cometer el error tipo II, usualmente se prueba Ho fijando solamente pero el manejo del tamaño de la muestra o el número de repeticiones de un experimento es el elemento a modificar para controlar. La importancia relativa de los errores depende de los costos inherentes a cada tipo de error y estos costos servirán para pautas para fijar la probabilidad de cometerlos.
Las posibles decisiones y sus errores concernientes a la prueba de hipótesis se resumen en la tabla:
HIPOTESIS
Decisión Error ProbabilidadSi Ho cierta y:
Se rechaza Ho
No se rechaza Ho
Tipo INulo
1-
SI HO Falsa y :
Se rechaza Ho
No se rechaza Ho
NuloTipo II
1-
Efectos de las variaciones de la región de rechazo sobre.
La afirmación que ß según disminuye α es verdadera α para “n” fijo. Un valor único de α es deseable, pero tomarlo demasiado pequeño puede hacer ß tan grande que se tenga muy poca oportunidad de reconocer si la hipótesis nula es falsa.
Efecto de las variaciones del tamaño de la muestra sobre ß.
Cuando se mantiene la toma…la región de aceptación es mas pequeña para tamaños de muestras mayores con la siguiente disminución de ß valores de ß para la alternativa µ =52, con hipótesis nula µ=50, mostrando el efecto de cambiar α y n sobre la probabilidad del Error de tipo II.
Potencia de una prueba de hipótesis.
Esta probabilidad representa concluir que Ho es falso cuando efectivamente lo es. Potencia se calcula como π = 1-ß, donde ß es la probabilidad de cometer el Error de tipo II. Cuando mayor es la potencia mejor es la prueba es función de varios factores: a) el nivel de significado elegido, b) la varianza de la variable aleatoria y c) el tamaño de muestra el nivel de significación se ha fijo la varianza de la variable aleatoria es conocida, es posible controlar la potencia de la prueba manejando el tamaño muestral.
Curva de potencia
Fig. 4: Curva de la función de potencia para una prueba bilateral.
Relación entre estimación por intervalo de confianza y prueba de hipótesis.
Intervalos de confianza:
Se plantearon para estimar parámetros.
Prueba de hipótesis:
Tomar decisiones en relación a los valores postulados para ellos.
Se pueden utilizar alternativamente.