pruebas estadisticas no parametricas. pruebas tradicionales necesitan la especificación de una...

29
PRUEBAS ESTADISTICAS NO PARAMETRICAS

Upload: irene-lozano-san-segundo

Post on 24-Jan-2016

301 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

PRUEBAS ESTADISTICAS

NO PARAMETRICAS

Page 2: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Pruebas tradicionales Necesitan la especificación de una

distribución Son métodos robustos para las

distribuciones supuestas Tienen problemas con muestras de

pequeño tamaño Aplicación limitada a variables

cuantitativas.

Page 3: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Problemas de las escalas no numéricas No se puede definir cantidades. A lo más puede definirse un orden entre

las categorías Esto significa que se establece un RANGO

entre las observaciones. Para estos casos se han desarrollado

metodos inferenciales que no requieren definición de la forma de la distribución.

Page 4: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Comparación de pruebas paramétricas y no paramétricas.

Aplicación Prueba paramétrica

Prueba no paramétrica

Eficiencia de la prueba no paramétrica en relación a param.

Dos muestras dependientes (datos pareados

Prueba t o prueba z Prueba del signoPrueba de rangos con signos de Wilcoxon

0.63 

0.95

Dos muestras independientes

Prueba t o prueba z Prueba de suma de rangos de Mann Whitney

0.95

Varias muestras independientes

Análisis de varianza Prueba de Kruskal Wallis

0.95

Correlación Correlación lineal Prueba de correlación de rangos

0.91

Page 5: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Ejemplo: Se utilizan 4 diferentes suturas en

heridas experimentales en caballos y se mide, entre otras variables, el grado de reacción tisular en el periodo post operatorio (en una escala de 0 a 5 puntos).

Page 6: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Ejemplo: grado de reacción tisular frente a diferentes materiales de sutura.

caballo lino nylon caprolactam polipropileno1 4 2 3 32 3 3 3 33 4 3 3 34 3 4 3 45 4 3 4 36 4 3 2 27 4 3 3 48 3 2 2 2

Material de sutura (tratamiento)

Page 7: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Análisis de rangos: Las pruebas no paramétricas equivalentes

al análisis de varianza y prueba de t se basan en los rangos de las observaciones en lugar de las observaciones mismas.

Esta metodología utiliza información acerca de los tamaños relativos de las observaciones, sin asumir nada acerca de la naturaleza específica de la población desde donde se obtuvieron los datos.

Page 8: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

¿Cómo elegir entre métodos paramétricos y no paramétricos?

El análisis de varianza es una metodología paramétrica debido a que se basa en las estimaciones de los parámetros de dos o más poblaciones.

Cuando los supuestos de los métodos paramétricos se sostienen, estas pruebas son las más poderosas.

Page 9: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

¿Cómo elegir entre métodos paramétricos y no paramétricos?

Cuando la población desde la cual fueron tomados los datos no tiene distribución normal (o no es compatible con otros supuestos como por ejemplo la igualdad de varianza entre los grupos de tratamiento), la media y la desviación estándar ya no son confiables como descriptores de la población y los métodos paramétricos dejan de ser confiables.

Page 10: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

¿Cómo elegir entre métodos paramétricos y no paramétricos?

En la práctica se pueden utilizar métodos no paramético cada vez que el tamaño de las muestras es pequeño y por lo tanto no hay garantía de que los estimadores tengan distribución normal.

Page 11: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Pruebas no paramétricas para compararar muestras poblaciones sobre la base de muestras independientes

Prueba de Mann-Whitney Se basa en la combinación de los

conjuntos de las n1 y n2 observaciones. Cuando todas las observaciones están

juntas se asigna un rango a cada una de las observaciones ordenadas, que comienza en 1 y termina en n1+n2

Page 12: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Procedimiento Se obtiene la suma de los rangos asociados con

las observaciones de una de las dos muestras. (escogida en forma arbitraria si son del mismo tamaño, en caso contrario se hace con la muestra más pequeña).

Esta suma es igual a R1

El estadístico está dado por:

111

21 2

)1(R

nnnnU

Page 13: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Ejemplo: Se sospecha que una empresa lleva a

cabo una política de discriminación, con respecto al sexo, en los sueldos de sus empleados. Se seleccionaron 12 empleados masculinos y 12 femeninos de entre los que tienen responsabilidades y experiencias similares en el trabajo; sus salarios anuales en miles de dólares son los siguientes:

Page 14: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Mujeres 22.5 19.8 20.6 24.7 23.2 19.2 18.7 20.9 21.6 23.5 20.7 21.6 Hombres 21.9 21.6 22.4 24.0 24.1 23.4 21.2 23.9 20.5 24.5 22.3 23.6

¿Existe alguna razón para creer que estas muestras aleatorias provienen de poblaciones con diferentes distribuciones? (alfa=0.05).

Se combinan los salarios de las dos muestras para formar un solo conjunto de 24 salarios anuales. Luego se ordenan y se les asigna un rango de la siguiente manera:Sexo M M M H M M M H H M M H 18.7 19.2 19.8 20.5 20.6 20.7 20.9 21.2 21.6 21.6 21.6 21.9 Rango 1 2 3 4 5 6 7 8 9 10 11 12 Sexo H H M M H M H H H H H M 22.3 22.4 22.5 23.2 23.4 23.5 23.6 23.9 24.0 24.1 24.5 24.7 Rango 13 14 15 16 17 18 19 20 21 22 23 24

Page 15: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Para obtener la suma de los rangos se seleccionará la muestra de mujeres. De esta forma la suma de los rangos es:

1+2+3+5+6+7+10+11+15+16+18+24=118

1041182)13(12

)12)(12( U

2

)1( ss nnTU

2)1( ss nn

UT

ns=tamaño de la muestra menor 1822

)113(12104 T

Page 16: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

2 3 4 5 6 7 8 9 10 11 12 13 14 154 105 6 11 176 7 12 18 267 7 13 20 27 368 3 8 14 21 29 38 499 3 8 15 22 31 40 51 63

10 3 9 15 23 32 42 53 65 7811 4 9 16 24 34 44 55 68 81 9612 4 10 17 26 35 46 58 71 85 99 11513 4 10 18 27 37 48 60 73 88 103 119 13714 4 11 19 28 38 50 63 76 91 106 123 141 16015 4 11 20 29 40 52 65 79 94 110 127 145 164 18516 4 12 21 31 42 54 67 82 97 114 131 150 16917 5 12 21 32 43 56 70 84 100 117 135 15418 5 13 22 33 45 58 72 87 103 121 13919 5 13 23 34 46 60 74 90 107 12420 5 14 24 35 48 62 77 93 11021 6 14 25 37 50 64 79 9522 7 15 26 38 51 66 8223 6 15 27 39 53 6824 6 16 28 40 5525 6 16 28 4226 7 17 2927 7 1728 7

n1

n2

Valores críticospara la prueba deMann Whitney (T)- dos colas- alfa=0.05

Valores menoreso iguales a losde la tablaimplican rechazode la Hipótesisnula

Page 17: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Aproximación normal:

Cuando los valores de n1+n2 son mayores que 30

)5.0(

T

z

2)1( BSS nnn

12)1( BSBS nnnn

Page 18: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Resultado de la aproximación normal y conclusión

Los datos no proporcionan evidencia suficiente paraconcluir que la empresa paga sueldos diferentes ahombres y mujeres (P0.05)

1502)25(12 32.17

1225144

82.132.17

)5.0150182(

z

Page 19: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo (Wilcoxon) Se utiliza cuando las muestras no

son independientes (equivalente a la prueba de t de student para muestras emparejadas.

La idea básica consiste en determinar la frecuencia con la cual el valor de un miembro del par es superior al valor del otro miembro del par.

Page 20: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo Por ejemplo, si se tienen dos grupos

simbolizados por A y B, cada vez que el valor de A es superior al valor de B, se asigna un valor positivo y cuando el valor de A es inferior al valor de B se asigna un valor negativo.

Page 21: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo Cuando la hipótesis nula es

verdadera, deberá haber una similar cantidad o proporción de valores positivos y negativos.

Es decir, si la H0 es verdadera, la probabilidad de valores positivos es 0.5

Page 22: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo La estadística para la prueba del

signo, denotada por S, es el número de signos + para los n pares.

Dado que bajo H0 cada par constituye un ensayo independiente con una probabilidad para el signo positivo + de 0.5, la estadística S tiene una distribución binomial con p= 0.5.

Page 23: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo Para valores grandes de n puede

utilizarse la aproximación normal de la distribución binomial.

Cuando ocurren empates al aplicar la prueba del signo, el procedimiento que se recomienda seguir es el de ignorarlos y emplear la prueba sólo para aquellos pares en los que no ocurren empates.

Page 24: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Prueba del signo Ejemplo: Se seleccionaron al azar 10

parejas de recién casados y se les preguntó por separado, tanto al marido como a la esposa, cuántos hijos deseaban tener. Se obtuvieron los siguientes datos.

Page 25: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Pareja 1 2 3 4 5 6 7 8 9 10 Esposa (X) 3 2 1 0 0 1 2 2 2 0 Esposo (Y) 2 3 2 2 0 2 1 3 1 2

Mediante el empleo de la prueba del signo, ¿existe alguna razón para creer que las esposas desean menos hijos que sus esposos? Supóngase un tamaño máximo del error tipo I de 0.05.

Page 26: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Nótese que deberá rechazarse H0 si el número de signos + es muy pequeño. Al restar las respuestas de cada esposo de la de su esposa, y notando que las respuestas de cinco de las parejas son las mismas, se obtienen el siguiente arreglo de signos + y -.

Page 27: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Pareja 1 2 3 4 5 6 7 8 9 10 Signo + - - - - - + - + -

Signos positivos= 3

Page 28: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Tabla de valores críticos para la prueba del signo:

1 * *2 * *3 * *4 * *5 * *6 * 07 * 08 0 09 0 110 0 111 0 112 1 213 1 214 1 215 2 316 2 317 2 418 3 419 3 420 3 521 4 522 4 523 4 624 5 6

  VALOR DE ALFAn 0.01 0.05

25 5 7

2

25.0

n

nx

z

La hipótesis nula se rechaza si el número de vecesque se repite el signo menos frecuente (x) esMENOR O IGUAL que el valor de la tabla.

Cuando el tamaño de los grupos es superiora 25 se utiliza la distribución normal:

Page 29: PRUEBAS ESTADISTICAS NO PARAMETRICAS. Pruebas tradicionales Necesitan la especificación de una distribución Son métodos robustos para las distribuciones

Conclusión: Los datos proporcionan evidencia

suficiente para concluir que las esposas desean tener un mayor número de hijos que los esposos (P<0.05).