contraste de hipótesis

Contraste de hipótesis.

El hombre reconoce cotidianamente situaciones que le afectan, como la

perdida de cosechas, las enfermedades, las contingencias climáticas, etc.

tomar acciones para evitar i prevenir estos problemas requiere comprender

como funciona el sistema que los origina. En el proceso de compresión existe

una etapa de idealización que se llama técnicamente modelación, que tiene

por objeto identificar los elementos que son relevantes y plantear sus

relaciones. Si el modelo es correcto se tendrá una herramienta valiosa para

planificar acciones en el mundo.

Para que un modelo sea incorporado al patrimonio de la ciencia tiene antes

que mostrar que las predicciones que se deducen de él son aceptables.

Lo usual es realizar un experimento u observar el comportamiento del sistema

y comparar los resultados obtenidos en estos estudios con los que se deducen

del modelo. Si no hay diferencias significativas entre lo observado y lo

esperado, entonces de dirá que el modelo es correcto para esa situación o que

el modelo es provisoriamente aceptable.

El problema es definir que se entiende por diferencia significativa. No es simple

establecer un criterio para decir si la discrepancia entre lo que se observa y lo

que se espera es grande o pequeña.

La idea es entonces: dado un modelo no valido que se llama hipótesis científica

se debe seguir algún procedimiento para deducir alguna consecuencia, cuya

verificación o falta de verificación, sirva para establecer la veracidad de la

hipótesis científica. Si las consecuencias de la hipótesis científica se pueden

visualizar como propiedades estadísticas de una variable aleatoria, será

factible utilizar herramientas estadísticas para tomar una decisión sobre la

veracidad del modelo. Para ello se debe expresar una hipótesis estadística, que

consiste en una afirmación sobre uno o más parámetros de la distribución de la

variable aleatoria en cuestión. Es obvio que la hipótesis estadística debe ser

equivalente a la hipótesis científica postulada.

La prueba estadística o prueba de hipótesis se pueden examinar un conjunto

de datos muéstrales y a partir de ellos se calcula un estadístico cuya

distribución depende de la hipótesis planteada. Sobre la base de la distribución

especificada para el estadístico y de su valor observado en la muestra, se

decide el rechazo o no de la hipótesis estadística y en consecuencia de la

hipótesis científica.

Procedimientos de la prueba de Hipótesis.

Pasos a seguir en la prueba de hipótesis estadística.

a) Plantear las hipótesis nula y alternativa.

Para poder construir una prueba estadística se debe especificar una hipótesis

que se supone, provisoriamente como verdadera, llamada hipótesis nula y es

simbolizada con H0. Esta hipótesis especifica los valores de uno o varios

parámetros de la distribución de la variable aleatoria observada en el

experimento. Cuando la hipótesis nula se somete a prueba, el resultado es su

aceptación o rechazo. En este último caso se aceptara una hipótesis

especificada de antemano que se llama hipótesis alternativa que se simboliza

por H1 y que propone como posibles valores del o los parámetros en cuestión

al conjunto de valores complementarios al postulado bajo H0.

b) Planificar el experimento o el esquema muestral.

La forma en que se recolectan los datos o se diseña el experimento es motivo

de tratamiento particular por las técnicas de muestreo y el diseño de

experimentos. El objetivo de este paso es definir la forma en que los daros

serán obtenidos, incluyendo el numero total de observaciones en la muestra.

c) Selección de un estadístico para la prueba e identificación de su

distribución bajo H0.

El estadístico de la prueba es una función de la muestra. Se necesita una

función W de la muestra cuya distribución de la muestra sea conocida y quede

completamente especificada bajo H0, es decir que se puede calcular P (W ≤

w). La función W, a través de su distribución, servirá para asignar

probabilidades a los eventos que conduce a aceptar o rechazar la hipótesis

nula postulada. El evento que induce al rechazo se conoce como región o zona

de rechazo de H0, en tanto que el evento que conduce al no rechazo se llama

región o zona de aceptación de H0.

d) Establecer el nivel de significación de la prueba.

El nivel de significación se define como la máxima probabilidad de rechazar

H0 cuando esta es verdadera. Será denotado por la letra griega α.

El nivel de significación representa la máxima probabilidad de equivocarse en

el sentido de concluir que H0 es falsa cuando en realidad no lo es. Este error,

llamado error de tipo I.

Una vez que se han establecido H0 y H1 debe fijarse el nivel de significación.

En general se fija en 0.05 (5%) o en 0.01 (1%), que son niveles usualmente

aceptados, aunque no hay razón alguna para no seleccionar algún otro.

Es importante indicar que la probabilidad de cometer el error de tipo I se

establece antes de la realización de la prueba estadística. Esta observación

tiene el objetivo de que el investigador evalué cuál es la tasa de error de tipo I

que esta dispuesto a tolerar en base a criterios independientes de los

resultados muéstrales o experimentales.

e) Establecer los eventos que conducen al rechazo y no rechazo de la

hipótesis nula.

El siguiente paso consiste en establecer las regiones de no rechazo y de

rechazo de H0.

La región de rechazo de H0 es uno o mas de los intervalos de la recta real que

describen al evento que conducen al rechazo de H0 y cuya probabilidad,

cuando H0 es verdadera, es α.

La región de no rechazo de H0 es un intervalo de la recta real que describe al

evento que conduce al no rechazo de H0 con probabilidad 1 – α, cuando H0 es

cierta.

Región bilateral la zona de rechazo puede estar a la derecha y la izquierda de

la distribución del estadístico bajo H0. Depende de la prueba de hipótesis

alternativa. El tamaño de la región de rechazo esta determinado por el nivel de

significación de la prueba.

S

Fig. 1: Representación de la distribución del estadístico bajo H0 en una prueba unilateral derecha.

Fig. 2: Representación de la distribución del estadístico bajo H0 en una prueba unilateral izquierda.

Fig. 3: Representación de la distribución bajo H0 en una prueba bilateral.

Puntos críticos los valores de la recta real que separan la zona de no rechazo de la de rechazo.

f) Calcular el valor estadístico y determinar si esta dentro o fuera de la región de rechazo.Tiene por objetivo obtener daros experimentales que permitan evaluar el estadístico propuesto para la prueba, de acuerdo a la planificación realizada previamente.

g) Calcular el valor estadístico y determinar si esta dentro o fuera de la región de rechazo.Con los datos obtenidos se calculara W, cuya distribución bajo la hipótesis nula es conocida y para la cual se han fijado las regiones de no rechazo y rechazo.Si el valor calculado de W pertenece a la región de rechazo se concluye que la hipótesis nula debe desecharse. En caso contrario se concluye que no hay evidencia suficiente para rechazarla.

Es una secuencia formal que no siempre se respeta en la práctica de la investigación. Usualmente se tiene una hipótesis científica y se planifica una experiencia para probarlas y una vez obtenidos los datos trata de formalizar una hipótesis estadística.

Errores.

En la prueba de una hipótesis estadística pueden ocurrir dos errores:

Error de tipo I Error de tipo II

La posible ocurrencia de uno y otro error depende de la condición de verdadera o falsa de la hipótesis nula y de la decisión, basada en la muestra, de aceptarla o rechazarla.

Si se rechaza Ho, el Error tipo I se comete cuando Ho es verdadero. Si por el contrario se acepta Ho siendo esta falsa, entonces se cometerá el Error de tipo II.

Calculo de la probabilidad de cometer error de tipo II (ß).

Cuando la hipótesis nula no es verdadera, lo que interesa saber es cuál es la posibilidad de aceptar Ho cuando es falsa. Para conocer esa probabilidad se debe encontrar la probabilidad de la región de aceptación. Ejemplo p(-1.960≤w≤1.96I=52).

El investigador no determina la probabilidad de cometer el error tipo II, usualmente se prueba Ho fijando solamente pero el manejo del tamaño de la muestra o el número de repeticiones de un experimento es el elemento a modificar para controlar. La importancia relativa de los errores depende de los costos inherentes a cada tipo de error y estos costos servirán para pautas para fijar la probabilidad de cometerlos.

Las posibles decisiones y sus errores concernientes a la prueba de hipótesis se resumen en la tabla:

HIPOTESIS

Decisión Error ProbabilidadSi Ho cierta y:

Se rechaza Ho

No se rechaza Ho

Tipo INulo

1-

SI HO Falsa y :

Se rechaza Ho

No se rechaza Ho

NuloTipo II

1-

Efectos de las variaciones de la región de rechazo sobre.

La afirmación que ß según disminuye α es verdadera α para “n” fijo. Un valor único de α es deseable, pero tomarlo demasiado pequeño puede hacer ß tan grande que se tenga muy poca oportunidad de reconocer si la hipótesis nula es falsa.

Efecto de las variaciones del tamaño de la muestra sobre ß.

Cuando se mantiene la toma…la región de aceptación es mas pequeña para tamaños de muestras mayores con la siguiente disminución de ß valores de ß para la alternativa µ =52, con hipótesis nula µ=50, mostrando el efecto de cambiar α y n sobre la probabilidad del Error de tipo II.

Potencia de una prueba de hipótesis.

Esta probabilidad representa concluir que Ho es falso cuando efectivamente lo es. Potencia se calcula como π = 1-ß, donde ß es la probabilidad de cometer el Error de tipo II. Cuando mayor es la potencia mejor es la prueba es función de varios factores: a) el nivel de significado elegido, b) la varianza de la variable aleatoria y c) el tamaño de muestra el nivel de significación se ha fijo la varianza de la variable aleatoria es conocida, es posible controlar la potencia de la prueba manejando el tamaño muestral.

Curva de potencia

Fig. 4: Curva de la función de potencia para una prueba bilateral.

Relación entre estimación por intervalo de confianza y prueba de hipótesis.

Intervalos de confianza:

Se plantearon para estimar parámetros.

Prueba de hipótesis:

Tomar decisiones en relación a los valores postulados para ellos.

Se pueden utilizar alternativamente.

contraste de hipótesis

Documents