prueba de hipotesis

21

Click here to load reader

Upload: lennysnj

Post on 17-Nov-2014

1.702 views

Category:

Documents


3 download

DESCRIPTION

MUUESTRAB LOS PASOS ´PA

TRANSCRIPT

Page 1: Prueba de hipotesis

INFERENCIA ESTADISTICA.

La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar conclusiones de una población en estudio, a partir de la información que proporciona una muestra representativa de la misma. También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico.

CARACTERISTICAS DE LA INFERENCIA ESTADISTICA.

La muestra se obtiene por observación o experimentación. La necesidad de obtener un subconjunto reducido de la población es obvia si se tiene presente los costes económicos de la experimentación.

Toda inferencia inductiva exacta es imposible ya que se dispone de información de información parcial, sin embargo es posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de acuerdo con determinados principios.

Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias.

La medida de la incertidumbre se realiza en términos de probabilidad.

CONCEPTOS BÁSICOS EN EL CONTEXTO DE LA ESTADÍSTICA.

Población: Colección de individuos o elementos que representan el objeto de interés (seres vivos o inanimados).

Tamaño de la población: Cantidad de elementos que abarca la población. En casi todos los textos se representa con el símbolo “N”.

Muestra: Cualquier subconjunto de la población tomado para su estudio.

Muestreo: Procedimiento mediante el cual se extrae una muestra.

Tamaño de muestra: Cantidad de elementos contenidos en la muestra. En casi todos los textos se representa con el símbolo “n”.

Variable o característica: Es el signo o detalle que interesa caracterizar en la población.

Page 2: Prueba de hipotesis

El estudio de la Inferencia Estadística puede abordarse en dos apartados bien diferenciados.

1. De acuerdo con el conocimiento sobre la distribución en la población:

Inferencia Paramétrica:

Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc.....) pero se desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la distribución conocida.

Inferencia No Paramétrica:

Forma y parámetros desconocidos. Se realizan inferencias sobre características que no tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de Orden).

2. De acuerdo con la forma en que se estudian los parámetros:

Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas sobre posibles valores de los mismos.

Estimación puntual: Un único valor para cada parámetro. Estimación por intervalos: Intervalo de valores probables para el parámetro.

ESTIMACION POR INTERVALOS.

En el campo de la estadística, se denomina intervalo de confianza a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional.

La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución normal. Acosta, M (2.009)

Page 3: Prueba de hipotesis

Por otro lado, si se tiene una muestra aleatoria X1, X2, ... , Xn , de una población con función de densidad f(x;q) Un intervalo de confianza, de extremos L1 y L2, para el parámetro q de la población es “un par ordenado de funciones reales de las n medidas de la nuestra q = [L1(X1,K,X n );L1(X1,K,X n )]construidas de forma que la probabilidad de que los extremos contengan al verdadero valor del parámetro es un valor prefijado 1 - a.”

Al número 1 - a se le denomina “nivel de confianza”. El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%). La interpretación práctica es sencilla, por ejemplo si el nivel de confianza es del 95%, significa que en el 95% de las veces que repitiéramos el experimento, el intervalo de confianza calculado contendría al verdadero valor del parámetro y en el 5% restante el intervalo no contendría el verdadero valor.

Una vez que el intervalo de confianza ha sido particularizado para una muestra concreta, el intervalo obtenido contiene o no contiene al verdadero valor del parámetro, con probabilidad 1, por esa razón, cuando ya tenemos un valor concreto hablamos de confianza y no de probabilidad. Confiamos en que el intervalo que hemos calculado sea del 95% que contiene el verdadero valor.

Estimación por intervalos de confianza.

Una estimación por intervalos consiste en construir un intervalo alrededor de la estimación puntual de manera que se pueda garantizar que el parámetro estimado está dentro de dicho intervalo con una probabilidad escogida de antemano; a esa probabilidad, representada como 1-α, se le denomina nivel de confianza, y al intervalo construido se le llama entonces intervalo de confianza.

La construcción del intervalo de confianza se basa en encontrar el par de valores que delimiten este intervalo para un nivel de confianza prefijado, lo cual se basa en la distribución muestral del estimador. El intervalo es, por tanto, de extremos variables, ya que sus límites pueden cambiar según el resultado de la estimación puntual sobre la muestra. El nivel de confianza lo decide el investigador, o el estadístico; en la práctica, en estudios económicos y sociales, los niveles de confianza más usados suelen ser: 0.90, 0.95, 0.98, 0.99.

Al crearse el intervalo de confianza, si 1-α representa la probabilidad con que se quiere que el mismo contenga al parámetro, α representará la probabilidad de que el verdadero valor

Page 4: Prueba de hipotesis

del parámetro no esté en el intervalo, y los intervalos suelen construirse de forma tal que esta probabilidad α se reparta simétricamente, como se muestra gráficamente:

Utilizando el método habitual para la construcción de los intervalos –la repartición simétrica dela probabilidad α a ambos lados-, cuando la distribución muestral del estimador es a su vez simétrica –por ejemplo normal o t’Student- los límites del intervalo resultan también simétricos respecto a la estimación puntual tomada como partida, y a la distancia desde el centro del intervalo hasta cada límite, que simboliza con la letra d, se le denomina entonces error máximo admitido

Por otra parte, es fácil darse cuenta al examinar las expresiones para los intervalos de confianza que:

Mientras más grande es el tamaño de la muestra menor es el ancho del intervalo. Para niveles de confianza (1 - α) más grandes, mayor es el ancho del intervalo.

Ambos resultados son lógicos ya que un tamaño grande de la muestra disminuirá la varianza del estimador, y un nivel de confianza grande incrementará el valor del coeficiente de confianza, es decir, el estadístico de la distribución de probabilidad del estimador, lo quedará como resultado en cada caso un intervalo más amplio. Finalmente, una importante aplicación de las expresiones para los intervalos de confianza es el empleo de éstas para determinar el tamaño de muestra mínimo necesario para que el error en una estimación no sobrepase un valor decidido de antemano.

LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN

Page 5: Prueba de hipotesis

En la práctica hemos de tratar de que la longitud del intervalo de confianza sea lo más pequeña posible, es decir, que el error en la estimación sea lo mas pequeño posible.

Esto puede conseguirse modificando las distintas cantidades que aparecen en la fórmula: el nivel de confianza, a través del valor crítico, la variabilidad y el tamaño muestral.

-NIVEL DE CONFIANZA

La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el valor crítico de la distribución es mayor. Si consideramos un nivel de confianza del 100%,el intervalo de confianza será [-¥;+¥] que, evidentemente contiene al verdadero valor del parámetro pero no es de ninguna utilidad en la práctica. Si disminuimos el nivel de confianza también disminuye la longitud, sin embargo conviene mantenerlo en unos límites razonables que suelen ser del 95% o del 99% en la mayor parte de las aplicaciones.

-VARIANZA

La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimación será más precisa cuanto menor sea la variabilidad en la población, lo que significa que la población es más homogénea. En la práctica es posible obtener estimaciones más precisas, por ejemplo, restringiendo la población a conjuntos lo más homogéneos posible.

TAMAÑO MUESTRAL

La longitud del intervalo de confianza disminuye al aumentar el tamaño muestral, lo que significa que se obtienen estimaciones más precisas cuanto mayor sea el tamaño muestral. Debido a consideraciones prácticas de coste y tiempo, en general no es posible aumentar indefinidamente el tamaño muestral para obtener estimaciones más precisas, es por ello que en la práctica se selecciona el tamaño muestral necesario para obtener una determinada precisión, establecida a priori.

EJERCICIOS PARA CALCULAR EL INTERVALO DE CONFIANZA.

Ejemplo 1.

En una determinada localidad se obtuvo la siguiente muestra aleatoria, correspondiente a la cantidad de personas por núcleos familiares en 37 viviendas:

4 2 5 6 6 5 6 6 6 7 5 5 4 4 2 8 4 6 8

5 2 2 5 5 4 3 6 7 6 5 5 5 6 5 4 6 1

Se quiere una estimación por intervalos de la proporción de los núcleos familiares con 4 ó másintegrantes, para un nivel de confiabilidad del 90%.

Solución:

Page 6: Prueba de hipotesis

X: Núcleos familiares con 4 ó más integrantes.

Se tiene que:

pˆ = Xn/n = 31/37 = 0.84 Y: σpˆ = pq/n = 0.84 ⋅0.16 / 37 = 0.0036 = 0.060

Entonces: p = pˆ ± Z(1−α/2) pq / n = 0.84 ± 1.64(0.060) = 0.84 ± 0.0988

Por tanto el intervalo de confianza será: 0.7412 ≤ p ≤ 0.9388

Esto indica que el 90% de las veces el valor de la proporción muestral se encontrará entre 0.74

y 0.94

Ejemplo 2

En una muestra simple aleatoria de 64 piezas de un mismo tipo, extraídas de un almacén, se encontraron 13 piezas defectuosas. Dé una estimación por intervalo con un nivel de confianza del 95% para la proporción de piezas defectuosas en el almacén.

Solución:

n = 64 pˆ = 13/64 = 0.20

p = pˆ ± Z(1−α/2) pq / n = 0.20 ±1.96 0.20(0.8)/ 64 = 0.20 ± 1.96 0.0025 = 0.20 ± 1.96(0.05)

O sea: p = 0.20 ± 0.098

Por tanto, el intervalo será: 0.102 ≤ p ≤ 0.298, indicando que el 95% de las veces el verdadero valor de la proporción poblacional se encontrará entre 0.102 y 0.298.

PRUEBA DE HIPÓTESIS

Una prueba de hipótesis suele girar en torno al valor de uno o varios parámetros poblacionales–o al comportamiento de la distribución de la población–, sobre lo cual se tiene alguna suposición previa basada en evidencia empírica o teórica. Para verificar si la suposición es cierta o no se debe, entonces, tomar una muestra de la población y calcular sobre ella una estimación del parámetro o parámetros en cuestión; a partir de esas estimaciones, y teniendo en cuenta el comportamiento probabilístico de los estimadores usados, se puede llegar a una conclusión sobre la suposición o hipótesis de partida.

CARACTERÍSTICAS GENERALES DE UNA PRUEBA DE HIPÓTESIS:

Page 7: Prueba de hipotesis

Si el desarrollo de una prueba requiere del conocimiento de parámetros o características de la distribución de la población, se le clasifica como prueba paramétrica; si, por el contrario, estos datos no son requeridos, se hablará de una prueba no paramétrica

En el proceso de desarrollar una prueba de hipótesis a partir de una determinada suposición, se busca como traducir dicha suposición a términos de algún parámetro o estadígrafo, y se formula entonces lo que se llama hipótesis estadística.

En general, una hipótesis estadística siempre se subdivide en dos: una llamada hipótesis nula (Ho) y otra llamada hipótesis alternativa (H1).

Hipótesis nula (Ho): Es una hipótesis de diferencias nulas; lo que equivale a decir que es una Hipótesis que contiene una igualdad o algo similar.

Hipótesis alternativa (H1): Es la hipótesis que deberá ser aceptada si la nula se rechaza, y tiene asociado algún tipo de desigualdad estricta.

Al plantear el par de hipótesis nula y alternativa surge alguno de los tres casos siguientes:

Ho: θ = θo ( ó Ho: θ ≤ θo )

H1: θ > θo

O sea, se quiere verificar si el valor del parámetro ha aumentado, contraponiendo esto a que se mantiene igual, o incluso disminuyó.

Ho: θ = θo ( ó Ho: θ ≥ θo )

H1: θ < θo

O sea, se quiere verificar si el valor del parámetro ha disminuido, contraponiendo esto a que se mantiene igual, o incluso aumentó.

Ho: θ = θo

H1: θ ≠ θo

O sea, se quiere verificar si el valor del parámetro ha variado en algún sentido, contraponiendo esto a que se mantiene igual.

Comúnmente la hipótesis alternativa representa la hipótesis de investigación, lo que se desea verificar después de algún cambio en el sistema en estudio, y suele ser en muchos casos la que se formula primero; la hipótesis nula, por el contrario, se asocia a la situación

Page 8: Prueba de hipotesis

que existía hasta el momento del cambio, a lo ya conocido; por ello es esta última es la que recoge la igualdad, estricta o no.En muchos casos Ho se formula con la intención expresa de ser rechazada, ya que si Ho se rechaza ello implica que H1 se acepta.

La decisión estadística se basa en estimaciones efectuadas sobre la muestra aleatoria tomada, todo lo cual da lugar a los siguientes conceptos:

Estadístico o estadígrafo de prueba: Es el estimador (θˆ ), o alguna transformación de éste, que se utiliza para tomar una decisión respecto al comportamiento del parámetro en estudio.

Valor crítico (C o θc): Es un valor numérico que se calcula a partir del dato histórico conocido y de la distribución probabilística del estimador, para que el estadígrafo de prueba se compare con él y se pueda tomar una decisión. La necesidad del valor crítico puede entenderse por el hecho de que el estadígrafo de prueba, al ser el resultado de una estimación, no se debe comparar directamente con el dato histórico, sino que se debe dejar una especie de margen para los posibles errores de estimación.

Región crítica ó región de rechazo (W o Wc): Es el conjunto de valores del estadístico de prueba a partir de los cuales se rechaza la hipótesis nula. La distribución del estadístico de prueba se divide en dos partes la región de rechazo y la región de no rechazo o aceptación, estando separadas ambas regiones por el valor crítico. La ubicación de la región crítica respecto al dato histórico depende de la hipótesis alternativa, y puede ser unilateral (a la derecha o a la izquierda) o bilateral (a ambos lados), como se representa en los siguientes esquemas:

Caso del posible aumento:

Si θˆ> θc, se rechazaría H0, adoptándose H1; pero si θˆ ≤ θc, aunque sea θˆ > θ0, no hay evidencia de un aumento significativo.

Caso de posible reducción: Si θˆ < θc,

se rechazaría H0, adoptándose H1; pero si θˆ ≥ θc, aunque sea θˆ < θ0, no hay evidencia de una reducción significativa.

Caso de posible variación: Si θˆ < θc1 ó

θˆ> θc2, se rechazaría H0, adoptándose H1; pero si θc1 ≤θˆ ≤ θc2, aun si θˆ ≠ θ0,

no hay evidencia de variación significativa.

Page 9: Prueba de hipotesis

Planteamiento de la hipótesis estadística

La Hipótesis es la respuesta tentativa para la solución de la pregunta de investigación.

Al realizar inferencias estadísticas, se acostumbra adoptar un modelo de decisión. Este modelo consta de cuatro elementos:

Hipótesis nula (H0) Hipótesis alterna (H1) Nivel de significancia que ha de utilizarse en la prueba estadística Regla de decisión

Hipótesis para Problemas de Comparación

En la prueba de hipótesis se trabaja con dos hipótesis estadísticas que deben enunciarse explícitamente: la hipótesis que debe probarse o hipótesis nula que se establece con el propósito de ser rechazada, y la hipótesis alterna que es la conclusión a la que se espera llegar.

Con un nivel intervalar o de razón de la V. D. se comparan medias, la hipótesis nula plantea que lasdos medias son iguales:

H0: X 1 = X 2

y la hipótesis alterna plantea que las medias son diferentes:

H1: X 1 ≠ X 2

Otro planteamiento sería:

H0: X 1 – X 2 = 0

Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:

H0: Md1 = Md2

H1: Md1 Md2

Page 10: Prueba de hipotesis

O con proporciones o porcentajes (nivel nominal de la V. D.):

H0: P1 = P2

H1: P1 P2

Hipótesis para Problemas de Asociación

Cuando se tiene un problema de asociación la hipótesis nula niega la correlación:

H0: r = 0

La hipótesis alterna afirma que hay correlación:

H1: r 0

Construcción de hipótesis de acuerdo al nivel de medición

Las hipótesis estadísticas tienen que incluir la variable dependiente en primer lugar y la independiente en seguida. Para la redacción de dichas hipótesis se toma en cuenta el nivel de medición utilizado de las variables del estudio.

Para los problemas de comparación:

Nivel NOMINAL: Aquí se habla de proporciones y / o categorías.

¿Cómo es la relación entre fumar o no y morir por cáncer pulmonar?

H0: La proporción de sujetos que mueren por cáncer pulmonar es igual entre fumadores y no fumadores.

H1: La proporción de sujetos que mueren por cáncer pulmonar es diferente entre fumadores y no

Fumadores.

Nivel ORDINAL: Aquí se habla de jerarquías y / o niveles.

¿Cómo es el nivel de creatividad entre los niños de comunidades rurales, urbanas e indígenas?

H0: El nivel de creatividad es igual entre niños de comunidades rurales, urbanas e indígenas.

H1: El nivel de creatividad es diferente entre niños de comunidades rurales, urbanas e indígenas.

Nivel INTERVALAR: Se comparan las medias y también se habla de niveles.

Page 11: Prueba de hipotesis

Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia sus compañeros de trabajo. Para ello se conformaron tres grupos, bajo estrés, estrés regular y alto estrés, con 7 profesionistas cada uno, a quienes se les evaluó su nivel de irritabilidad preguntándoles en una escala de 0 a 10 que indique: “cotidianamente ¿qué tan irritable se muestra con sus compañeros de trabajo?”

H0: El nivel de irritabilidad hacia los compañeros de trabajo es igual entre los tres grupos de estrés.

H1: El nivel de irritabilidad hacia los compañeros de trabajo es diferente entre los tres grupos de estrés.

Para el caso de los problemas de asociación se identifica la relación entre las variables, y el concepto de asociación o relación se debe incluir en las hipótesis.

¿Qué relación hay entre la edad en años de los sujetos y su inteligencia?

H0: No hay asociación lineal entre la edad y la inteligencia.

H1: Hay asociación lineal entre la edad y la inteligencia.

NOTA: La hipótesis alterna no se acepta ni se rechaza, es la hipótesis nula la que se somete a prueba.

Los planteamientos anteriores se refieren a pruebas de dos colas, que son problemas en los que no es posible anticipar la dirección de las diferencias, es decir, no se sabe cuál grupo es el que tendrá el nivel o la proporción de casos mayor, o cual es el sentido de la relación entre variables.

Sin embargo, pueden existir hipótesis alternas en las que se puede anticipar cual grupo presenta una desviación mayor o menor con respecto al otro. Este tipo se refiere a problemas de una cola o dirección.

En estos casos, con un nivel intervalar o de razón de la V. D., la hipótesis nula plantea que las dos medias son iguales:

H0: X 1 = X 2

y la hipótesis alterna plantea que un grupo tiene una media mayor o menor que otro u otros:

H1: X 1 > X 2

H1: X 1 < X 2

Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:

Page 12: Prueba de hipotesis

H0: Md1 = Md2

H1: Md1 > Md2

ó H1: Md1 < Md2

O con proporciones o porcentajes (nivel nominal de la V. D.):

H0: P1 = P2

H1: P1 > P2

ó H1: P1 < P2

Para esta guía se presentarán únicamente planteamientos para hipótesis de dos colas.

¿Cuál es el sentido del nivel de significancia o la probabilidad?

La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la imposibilidad de ocurrencia y 1 la certeza de que ocurra el fenómeno. Al lanzar al aire una moneda no cargada, la probabilidad de que salga “águila” es de 0.5 y la probabilidad de que la moneda caiga en “sol” también es de 0.5. Con un dado, la probabilidad de obtener cualquiera de sus lados al lanzarlo es de 1/6=0.1667. La suma de probabilidades siempre es de 1.

Aplicando el concepto de la probabilidad a la distribución muestral, el área de ésta corresponde a la probabilidad total (p = 1), y consecuentemente, cualquier área (porcentaje bajo la curva) comprendida entre dos puntos de la distribución corresponderá a la probabilidad de la distribución al convertirla a proporciones (por ejemplo 25% = 0.25).

Para probar hipótesis inferenciales utilizando la media, el investigador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución poblacional. Si es baja, el investigador dudará de generalizar a la población. Si es alta el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de significancia o nivel . El nivel es la probabilidad de equivocarse al probar las hipótesis estadísticas.

El nivel de significancia de 0.05, implica que el investigador tiene un 95% de seguridad para generalizar sin equivocarse y sólo 5% en contra. Este es el más utilizado en investigación en Psicología, aunque se pueden utilizar niveles más bajos (0.01 o 0.001) cuando se requiere un mayor grado de certeza.

Decisión estadística

La decisión e interpretación de un análisis estadístico se basa en la aceptación o rechazo de la hipótesis nula, están estrechamente relacionados con la curva normal y las puntuaciones

Page 13: Prueba de hipotesis

z, una vez elegida la prueba estadística adecuada al nivel de medición y haber redactado la hipótesis nula, se debe establecer un nivel de significancia o de certeza para rechazar esta última sin cometer el error llamado del tipo I o , que se refiere a rechazar la hipótesis nula siendo verdadera. En psicología normalmente se establece el nivel de significancia de 0.05 que, como se mencionó anteriormente, representa un 95% de certeza de generalizar los resultados sin equivocarse. En este sentido, la decisión estadística es una decisión probabilística. Si se desea mayor certeza, se debe utilizar otro nivel de significancia, como puede ser a 0.01 que proporciona una certeza de 99% para generalizar los resultados sin error, o a 0.001 que equivale al 99.9%.

Existe otro tipo de error el tipo II o , que al contrario del error I se refiere a aceptar la hipótesis nula siendo falsa, en términos de decisión estadística es más grave cometer el error tipo I, ya que afirmaríamos que hay diferencias entre los grupos cuando esto no es verdad. Es una situación a la que es fácil llegar pues normalmente se espera que la intervención que se haga sea la causa de las diferencias entre grupos.

Al representar el nivel de significancia bajo la curva normal se tienen un área de aceptación de la hipótesis nula y una zona de rechazo, para una hipótesis de colas se reparte la significancia entre los dos extremos de la curva y para la de una cola se considera sólo el extremo positivo o negativo dependiendo de cuál es el grupo que se espera que tenga un nivel o proporción mayor.

Al traducir las áreas a probabilidad, se tiene que hay un 0.05 de posibilidad para equivocarse al rechazar la hipótesis nula. Entre menor sea el área de rechazo se tendrá más certeza para generalizar los resultados a la población.

Para una prueba de dos colas, en términos de puntajes z, a 1.96 desviaciones estándar se tiene el 95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o 0.05 de significancia () en la zona de rechazo, en 2.58 desviaciones el 99% ( = 0.01) y en de 3.90 desviaciones el 99.9% ( = 0.001)

Para una prueba de una cola, a 1.64 desviaciones estándar en sentido negativo o positivo, se tiene el95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o 0.05 designificancia () en la zona de rechazo, en 2.32 desviaciones el 99% ( = 0.01) y en 3.70desviaciones el 99.9% ( = 0.001)

Para conocer si el valor de una prueba estadística permite rechazar la hipótesis nula, se tiene queentre mayor sea este valor se entra más a la zona de rechazo de la hipótesis nula, sin embargo, para lamayoría de las pruebas se debe considerar además en la decisión a los grados de libertad, el númerode casos o se compara la probabilidad directamente.

Zona de Aceptación al

95% para una prueba dedos colas

Page 14: Prueba de hipotesis

2.5 % 2.5 %

Zona de rechazo (5%)

Zona de Aceptación al 95%

para una prueba de una cola

en sentido positivo

5 %

5 %

Zona de rechazo (5%)

Zona de Aceptación al 95% para una prueba de una cola en sentido negativo

Grados de libertad

Son la libertad de variaciones que puede tener una variable, suponiendo que se tuvieran 4 puntuaciones cuya media es igual a 10 al tener los valores de las tres primeras, la última estará determinada por las primeras, por ejemplo: 7, 12, 15, la última puntuación necesariamente es 6. La cantidad de comparaciones independientes se determina a partir de los grados de libertad, que normalmente se calcula teniendo el tamaño de la muestra menos uno (gl = n – 1). Sin embargo los grados de libertad se obtienen de manera diferente para cada prueba, por lo que se debe estar atento a cada uno de los procedimientos.

Reglas de decisión

El valor de las pruebas estadísticas se debe comparar con uno obtenido, con relación al nivel de significancia y los grados de libertad, de una tabla de valores críticos. La regla de decisión en estos casos es: el valor de la prueba debe ser mayor o igual al de la tabla para rechazar la hipótesis nula. Esta regla puede cambiar, por lo que es necesario revisar la regla de decisión especifica de cada procedimiento.

Los paquetes estadísticos presentan los valores de cada prueba junto con algunos datos necesarios para el cálculo de ésta (medias o porcentajes, el número de casos, los grados de libertad, etc.) y el nivel de significancia o probabilidad, éste representa la posición del valor del estadístico en el área de rechazo, o aceptación, de la hipótesis nula.

Como regla de decisión, observando los resultados del paquete estadístico, a un nivel de significancia establecido en 0.05: Si la probabilidad o nivel de significancia es menor o igual a 0.05 se rechaza la hipótesis nula.

Page 15: Prueba de hipotesis