prueba de hipótesis subtítulo. una de las aplicaciones de la estadística es extraer inferencias...

Prueba de HipótesisSubtítulo

Una de las aplicaciones de la estadística es extraer inferencias en poblaciones a partir del estudio de muestras. Este proceso recibe el nombre de Estadística Inferencial y sus estudios pretenden deducir (inferir) propiedades o características de una población a partir de una muestra representativa.

La estadística inferencial

La estadística inferencial y la prueba de hipótesis

Para realizar el proceso inferencial se suele partir de hipótesis, es decir, de unas suposiciones cuya validez cabe confirmar o rechazar.

es una técnica estadística que se sigue para decidir si rechazamos o no una hipótesis estadística con base en la información de una muestra.

Hipótesis estadística

Prueba de hipótesis

“Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar

lo que es verdad, deberemos buscar lo que es más probable.”

Descartes, en su Discurso del Método

PASO 1Formaliza las hipótesis:

Hipótesis nula Vs. Hipótesis alternativa

PASO 2Elige el test adecuado:

Paramétrico Vs. No paramétrico

PASO 3Determinar si la prueba de significancia tendrá

dos direcciones o una sola

PASO 4Especifica el nivel de significación

PASO 5Calcula el valor del test

La probabilidad teórica de obtener las diferencias observadas es menor o igual que el nivel de significación?

Aceptar la hipótesis nula: las diferencias observadas se deben simplemente a errores de muestreo

Rechaza la hipótesis nula: las diferencias entre los grupos son significativas

SINO

Paso 1Formaliza las hipótesis:

Hipótesis nula Vs. Hipótesis alternativa

Formaliza las hipótesis:Hipótesis nula Vs. Hipótesis alternativa

Hipótesis

Hipótesis Nula

indica que NO hay diferencias significativas entre dos medias

muestrales y afirma que la diferencia entre dos medias muestrales es

debida al azar, a la suerte, al error de muestreo

Hipótesis de Investigación

asume que SI hay diferencias significativas entre dos medias

muestrales y que esa diferencia se debe al empleo de un método

(medicamento, tratamiento,etc.) que es más efectivo que otro

En estadística, un resultado se denomina estadísticamente significativo cuando no es probable que haya sido debido al azar.

Un contraste de hipótesis estadístico se plantea como una decisión entre dos hipótesis.

El propósito del experimento es decidir si la prueba tiende

a apoyar o a refutar la Hipótesis Nula.

Veamos un ejemplo

Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al Reggaeton.

Experimento: De la población venezolana seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará Reggaeton. Después de realizar el test, se calculan las medias en cada uno de los dos grupos.

El efecto "Mozart vs. Reggaeton” :

Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado Reggaeton

Supongamos que la media del CI del grupo de Mozart fue 110, mientras que la media del grupo de Reggaeton fue de 102 . Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos?. Para tomar tal decisión necesitaremos plantear DOS hipótesis:

Hipótesis:

Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la media de ambos grupos es la misma. (Es decir, que no hay un efecto de la música sobre el CI.)

H0: μ1 = μ2

Hipótesis de Investigación. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media de ambos grupos es diferente. (Es decir, que hay un efecto de la música sobre el CI.)

H1: μ1 ≠ μ2

La pregunta del investigador entonces es:…se acepta o no se acepta la hipótesis nula

Hay cuatro posibilidades:

La hipótesis nula es cierta y el investigador concluye que lo es…una decisión correcta

La hipótesis nula es falsa y el investigador concluye que lo es…una decision correcta

La hipótesis nula es cierta pero el investigador concluye que es falsa…una decision incorrecta

La hipótesis nula es falsa pero el investigador concluye que es cierta…una decision incorrecta

TIPOS DE ERROR

Aceptar Ho DecisiónCorrecta

Error Tipo IIAceptar la Hipótesis

Nula cuando ha debido rechazarse))

(β)

Rechazar Ho

Error Tipo I (α)

Un falso positivo. Rechazar la Ho (H. Nula) cuando ha

debido Aceptarse

Decisión Correcta

Verdadera Falsa

Deci

siones

Ho: El sujeto es inocenteHi: el sujeto es culpable

Obviamente interesa minimizar ambos errores, aunque en Estadística se da prioridad al error de tipo I, es decir se intenta evitar los falsos positivos, ya que es mejor dejar libre a un culpable que condenar a un inocente.

Reducir ambos errores a cero es imposible y, además, al disminuir uno se aumenta el otro, por lo que hay que elegir bien el test empleado para llegar al mejor balance posible entre el error de tipo I y el error de tipo II.

La única manera de disminuir ambos es aumentar el tamaño de muestra.

PASO 2

Elige el test adecuado:

Paramétrico Vs. No paramétrico

Pruebas paramétricas y NO paramétricas

para contrastar la veracidad o falsedad de las hipótesis enunciadas aplicamos unas pruebas estadísticas que se clasifican en pruebas paramétricas y pruebas no paramétricas.

Pruebas paramétricas

Son las mas potentes

Requiere que se cumplan una serie

de supuestos paramétricos

Pruebas NO paramétricas

Son las mas potentes

Son más flexibles porque NO Requiere que se cumplan una serie de supuestos

paramétricos

Cuál elegir?

Las pruebas paramétricas son más potentes que las NO paramétricasQué es la potencia

es la probabilidad de que la hipótesis nula sea rechazada cuando la hipótesis alternativa es verdadera (es decir, la probabilidad de NO cometer un error del tipo II)

Las pruebas paramétricas tienen menos posibilidades de cometer un error tipo II.

Potencia Error Tipo II

1.0 Si hay un efecto será detectado

0.8 Si hay un efecto será detectado el 80% de las veces



0.0 Si hay un efecto nunca será detectado

Con respecto a la potencia

http://es.wikipedia.org/wiki/Errores_de_tipo_I_y_de_tipo_II

Por ejemplo, la U de Mann-Whitney tiene una potencia relativa del 95% con respecto a la prueba paramétrica t de Student (significa que con una muestra de 100 sujetos, se consigue la misma potencia con la U de Mann-Whitney que con 95 sujetos para la t de Student).

U de Mann-Whitney t de Student

100 sujetos 95 sujetos

Igual potencia

la potencia de un test estadístico aumenta cuando lo hace el tamaño de la muestra; de esta forma, para conseguir la misma potencia que tiene un prueba paramétrica con una No paramétrica, necesitaremos aumentar el tamaño de la muestra

Con respecto a los supuestos paramétricos

Supuestos que subyacen a la utilización de

pruebas paramétricas

Normalidad

La VD debe ser medida en una

escala de intervalo o razón

Homocedasticidad o igualdad de varianza

Una muestra igual o superior a los 30

sujetos

Descripción

Normalidad

La población al estar constituida por un número grande de casos tiende a tener una distribución normal. Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal

La VD debe ser medida en una escala de intervalo o razón

Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.

En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .

Homocedasticidad o igualdad de varianza

Las varianzas de la variable dependiente en los grupos que se comparan deben ser aproximadamente iguales. Existen varias pruebas que permiten comprobar la igualdad de varianzas, una de las más conocidas es la prueba de Levene

Una muestra igual o superior a los 30 sujetos

Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

Criterio paramétrico: Normalidad

distribución normal o distribución de Gauss o es la distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales.

La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos.

La población de cualquier fenómeno, al estar constituida por un número grande de casos tiende a tener una distribución normal.

Una observación es NORMAL cuando su comportamiento es Frecuente de acuerdo con un modelo matemático teórico que diferencia lo Frecuente de lo Raro

Como las pruebas paramétricas estiman los parámetros de la población a partir de muestras estadísticas, se parte del supuesto que estas muestras también tienen una distribución normal a partir de la cual se hará una estimación adecuada

Sin embargo, algunos autores han señalado que en ocasiones en el campo de las ciencias sociales puede resultar poco frecuente encontrar variables que se ajusten a este tipo de comportamiento.

Debido a esto es preciso comprobar si la distribución de nuestro estudio sigue esta estructura teórica. Una de las pruebas más usada para verificarlo es la prueba de Kolmogorov Smirnov

Criterio paramétrico: La VD debe ser medida en una escala de intervalo o razón

Los métodos estadísticos paramétricos requieren del empleo de datos medidos en una escala de intervalo o de razón.

En estos niveles de medición tienen sentido las operaciones aritméticas como el análisis de medias, desviación estándar y varianzas .

razón

intervalo

ordinal

Nominal

Pruebas paramétricas

Pruebas NO paramétricas

Mas cuantitativas

Mas cualitativas

Criterio paramétrico: Homocedasticidad

La homocedasticidad o igualdad de la varianza, significa que todos los grupos a analizar poseen la misma varianza

El dibujo de caja y bigote nos muestra “la media” en la línea central, el limite inferior es el Q1 y el límite superior es el Q3 y de esta forma se abarca el 95% de los casos

Cuando compramos 2 grupos y proyectamos la línea media de un grupo sobre el otro y esta proyección cae dentro de la caja, concluimos que los dos grupos son iguales. Pero si la proyección de la línea media de un grupo sobre el otro cae fuera de la caja, entonces los grupos son diferentes.

Por supuesto estos grupos tienen que tener una distribución normal. Las cajas tienen que tener las cajas del mismo tamaño (la misma varianza)

Si las varianzas son distintas (aunque se mantenga la simetría para el grupo comparativo) , ya no podemos usar el principio de proyectar la línea media de un grupo hacia otro para observar si cae dentro o fuera de la caja y así decidir si son iguales o distintos, puesto que ya las proyecciones NO son equivalentes

Para poder comparar grupos, la variabilidad tiene que ser equivalente

Criterio paramétrico: N > 30

Dado que las pruebas paramétricas realizan estimación de parámetros de la población a partir de muestras estadísticas, es lógico pensar que cuanto más grande sea la muestra, más exacta será la estimación; en cambio, cuanto más pequeña, más distorsionada será la media de las muestras por los valores raros extremos.

Tipo de prueba a elegir depende de

Número de muestras

una dos Más de dos

Cumplimiento deSupuestos

Paramétricos

SI

Use prueba paramétrica

NO

Use prueba NO

paramétrica

Número de muestrass

Pruebas estadísticas que se aplican

Pruebas Paramétricas

Pruebas No Paramétricas

Una muestra Prueba t de Student

para una muestra

nominal X2

ordinalZ de Kolmogorov-Smirnov

Dos muestras

Indep.

T de Student para muestras independientes

nominal Fisher

ordinalMediana y U de Mann Whitney

Relac.

T de Student para muestras relacionadas

Nominal Mc Nemar

ordinal Signos y Wilcoxon

Más de dos muestras

Indep. ANOVA

1 VI: ANOVA de 1 factor Nominal Chi Cuadrado

2 VI: ANOVA factorial Ordinal kruskal Wallis

Relac.

ANOVA de una via (intragrupos)

nominal Q de Cochran

ordinal

Friedman

PASO 3

Determinar si la prueba de significancia tendrá dos direcciones o una sola

• Si la hipótesis alternativa se formula simplemente como “la hipótesis nula no es cierta”, el contraste es bilateral o de dos colas.

• Por el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o de una sola cola

Contraste de dos colas

- /2= 0.025

área de rechazo de Ho

Área de no

rechazo de Ho

Z

t

F

x2

Estadísticos de prueba

Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis de investigación :

H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.H1 : el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.

prueba de dos colas, nivel de significancia de 0.05

/2= 0.025


Contraste de una cola

prueba de una cola, nivel de significancia de .05

= 0.05


Z

t

F

x2

Significación

Estadísticos de prueba

Area de no rechazo de

Ho

Una prueba es de una cola cuando la hipótesis de investigación establece una dirección, como:

H0 : el ingreso medio de las mujeres es igual al ingreso medio de los hombres. H1 : el ingreso medio de las mujeres es mayor que el de los hombres.

Paso 4Especifica el nivel de significación

El nivel de significación de un test es un concepto estadístico asociado a la verificación de una hipótesis. En pocas palabras, se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula (H0) cuando ésta es verdadera.

Esta probabilidad (denotada como α) se suele especificar antes de tomar la muestra, de manera que los resultados obtenidos no influyan en la decisión

Probabilidad del 95%

1-α = 0.95 α = 0.05


1-α = 0.90 α = 0.10


1-α = 0.99 α = 0.01

Los valores más comunes de significancia son de 0.05, 0.01, 0.001, estos valores dependen de la rigurosidad que establezca el investigador para su análisis.

Cuando se define un a: 0.05 se está diciendo que se está dispuesto a cometer el error tipo I como máximo el 5% de las veces; o sea que de cada 100 veces que a partir de los datos se concluya a favor de la hipótesis alterna, se tolera equivocarse como máximo, en cinco de esas 100 veces.

La decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es inferior al nivel de significación, entonces la hipótesis nula es rechazada. Cuanto mayor sea la p (p > 0,05) más fuerte y segura será la evidencia a favor de la hipótesis nula (igualdad).

p < 0.05 A≠B p ≥ 0.05 A = B

Se rechaza la hipótesis nula Se acepta la hipótesis nula

No parece que el azar pueda explicarlo todo

No se puede descartar que el azar lo explique todo

Hay diferencias estadísticamente significativas

NO hay diferencias estadísticamente significativas

Existen evidencias a favor de la Hipótesis de investigación

No existen evidencias a favor de la Hipótesis de investigación

Paso 5Calcular el valor del test

Este paso se hará en cada una de las presentaciones al comparar la media de un grupo, de dos grupos y de más de dos grupos

prueba de hipótesis subtítulo. una de las aplicaciones de la estadística es extraer inferencias...

Documents