pruebas estadisticas no parametricas. pruebas tradicionales necesitan la especificación de una...

PRUEBAS ESTADISTICAS

NO PARAMETRICAS

Pruebas tradicionales Necesitan la especificación de una

distribución Son métodos robustos para las

distribuciones supuestas Tienen problemas con muestras de

pequeño tamaño Aplicación limitada a variables

cuantitativas.

Problemas de las escalas no numéricas No se puede definir cantidades. A lo más puede definirse un orden entre

las categorías Esto significa que se establece un RANGO

entre las observaciones. Para estos casos se han desarrollado

metodos inferenciales que no requieren definición de la forma de la distribución.

Comparación de pruebas paramétricas y no paramétricas.

Aplicación Prueba paramétrica

Prueba no paramétrica

Eficiencia de la prueba no paramétrica en relación a param.

Dos muestras dependientes (datos pareados

Prueba t o prueba z Prueba del signoPrueba de rangos con signos de Wilcoxon

0.63

0.95

Dos muestras independientes

Prueba t o prueba z Prueba de suma de rangos de Mann Whitney

0.95

Varias muestras independientes

Análisis de varianza Prueba de Kruskal Wallis

0.95

Correlación Correlación lineal Prueba de correlación de rangos

0.91

Ejemplo: Se utilizan 4 diferentes suturas en

heridas experimentales en caballos y se mide, entre otras variables, el grado de reacción tisular en el periodo post operatorio (en una escala de 0 a 5 puntos).

Ejemplo: grado de reacción tisular frente a diferentes materiales de sutura.

caballo lino nylon caprolactam polipropileno1 4 2 3 32 3 3 3 33 4 3 3 34 3 4 3 45 4 3 4 36 4 3 2 27 4 3 3 48 3 2 2 2

Material de sutura (tratamiento)

Análisis de rangos: Las pruebas no paramétricas equivalentes

al análisis de varianza y prueba de t se basan en los rangos de las observaciones en lugar de las observaciones mismas.

Esta metodología utiliza información acerca de los tamaños relativos de las observaciones, sin asumir nada acerca de la naturaleza específica de la población desde donde se obtuvieron los datos.

¿Cómo elegir entre métodos paramétricos y no paramétricos?

El análisis de varianza es una metodología paramétrica debido a que se basa en las estimaciones de los parámetros de dos o más poblaciones.

Cuando los supuestos de los métodos paramétricos se sostienen, estas pruebas son las más poderosas.


Cuando la población desde la cual fueron tomados los datos no tiene distribución normal (o no es compatible con otros supuestos como por ejemplo la igualdad de varianza entre los grupos de tratamiento), la media y la desviación estándar ya no son confiables como descriptores de la población y los métodos paramétricos dejan de ser confiables.


En la práctica se pueden utilizar métodos no paramético cada vez que el tamaño de las muestras es pequeño y por lo tanto no hay garantía de que los estimadores tengan distribución normal.

Pruebas no paramétricas para compararar muestras poblaciones sobre la base de muestras independientes

Prueba de Mann-Whitney Se basa en la combinación de los

conjuntos de las n1 y n2 observaciones. Cuando todas las observaciones están

juntas se asigna un rango a cada una de las observaciones ordenadas, que comienza en 1 y termina en n1+n2

Procedimiento Se obtiene la suma de los rangos asociados con

las observaciones de una de las dos muestras. (escogida en forma arbitraria si son del mismo tamaño, en caso contrario se hace con la muestra más pequeña).

Esta suma es igual a R1

El estadístico está dado por:

111

21 2

)1(R

nnnnU

Ejemplo: Se sospecha que una empresa lleva a

cabo una política de discriminación, con respecto al sexo, en los sueldos de sus empleados. Se seleccionaron 12 empleados masculinos y 12 femeninos de entre los que tienen responsabilidades y experiencias similares en el trabajo; sus salarios anuales en miles de dólares son los siguientes:

Mujeres 22.5 19.8 20.6 24.7 23.2 19.2 18.7 20.9 21.6 23.5 20.7 21.6 Hombres 21.9 21.6 22.4 24.0 24.1 23.4 21.2 23.9 20.5 24.5 22.3 23.6

¿Existe alguna razón para creer que estas muestras aleatorias provienen de poblaciones con diferentes distribuciones? (alfa=0.05).

Se combinan los salarios de las dos muestras para formar un solo conjunto de 24 salarios anuales. Luego se ordenan y se les asigna un rango de la siguiente manera:Sexo M M M H M M M H H M M H 18.7 19.2 19.8 20.5 20.6 20.7 20.9 21.2 21.6 21.6 21.6 21.9 Rango 1 2 3 4 5 6 7 8 9 10 11 12 Sexo H H M M H M H H H H H M 22.3 22.4 22.5 23.2 23.4 23.5 23.6 23.9 24.0 24.1 24.5 24.7 Rango 13 14 15 16 17 18 19 20 21 22 23 24

Para obtener la suma de los rangos se seleccionará la muestra de mujeres. De esta forma la suma de los rangos es:

1+2+3+5+6+7+10+11+15+16+18+24=118

1041182)13(12

)12)(12( U

2

)1( ss nnTU

2)1( ss nn

UT

ns=tamaño de la muestra menor 1822

)113(12104 T

2 3 4 5 6 7 8 9 10 11 12 13 14 154 105 6 11 176 7 12 18 267 7 13 20 27 368 3 8 14 21 29 38 499 3 8 15 22 31 40 51 63

10 3 9 15 23 32 42 53 65 7811 4 9 16 24 34 44 55 68 81 9612 4 10 17 26 35 46 58 71 85 99 11513 4 10 18 27 37 48 60 73 88 103 119 13714 4 11 19 28 38 50 63 76 91 106 123 141 16015 4 11 20 29 40 52 65 79 94 110 127 145 164 18516 4 12 21 31 42 54 67 82 97 114 131 150 16917 5 12 21 32 43 56 70 84 100 117 135 15418 5 13 22 33 45 58 72 87 103 121 13919 5 13 23 34 46 60 74 90 107 12420 5 14 24 35 48 62 77 93 11021 6 14 25 37 50 64 79 9522 7 15 26 38 51 66 8223 6 15 27 39 53 6824 6 16 28 40 5525 6 16 28 4226 7 17 2927 7 1728 7

n1

n2

Valores críticospara la prueba deMann Whitney (T)- dos colas- alfa=0.05

Valores menoreso iguales a losde la tablaimplican rechazode la Hipótesisnula

Aproximación normal:

Cuando los valores de n1+n2 son mayores que 30

)5.0(

T

z

2)1( BSS nnn

12)1( BSBS nnnn

Resultado de la aproximación normal y conclusión

Los datos no proporcionan evidencia suficiente paraconcluir que la empresa paga sueldos diferentes ahombres y mujeres (P0.05)

1502)25(12 32.17

1225144

82.132.17

)5.0150182(

z

Prueba del signo (Wilcoxon) Se utiliza cuando las muestras no

son independientes (equivalente a la prueba de t de student para muestras emparejadas.

La idea básica consiste en determinar la frecuencia con la cual el valor de un miembro del par es superior al valor del otro miembro del par.

Prueba del signo Por ejemplo, si se tienen dos grupos

simbolizados por A y B, cada vez que el valor de A es superior al valor de B, se asigna un valor positivo y cuando el valor de A es inferior al valor de B se asigna un valor negativo.

Prueba del signo Cuando la hipótesis nula es

verdadera, deberá haber una similar cantidad o proporción de valores positivos y negativos.

Es decir, si la H0 es verdadera, la probabilidad de valores positivos es 0.5

Prueba del signo La estadística para la prueba del

signo, denotada por S, es el número de signos + para los n pares.

Dado que bajo H0 cada par constituye un ensayo independiente con una probabilidad para el signo positivo + de 0.5, la estadística S tiene una distribución binomial con p= 0.5.

Prueba del signo Para valores grandes de n puede

utilizarse la aproximación normal de la distribución binomial.

Cuando ocurren empates al aplicar la prueba del signo, el procedimiento que se recomienda seguir es el de ignorarlos y emplear la prueba sólo para aquellos pares en los que no ocurren empates.

Prueba del signo Ejemplo: Se seleccionaron al azar 10

parejas de recién casados y se les preguntó por separado, tanto al marido como a la esposa, cuántos hijos deseaban tener. Se obtuvieron los siguientes datos.

Pareja 1 2 3 4 5 6 7 8 9 10 Esposa (X) 3 2 1 0 0 1 2 2 2 0 Esposo (Y) 2 3 2 2 0 2 1 3 1 2

Mediante el empleo de la prueba del signo, ¿existe alguna razón para creer que las esposas desean menos hijos que sus esposos? Supóngase un tamaño máximo del error tipo I de 0.05.

Nótese que deberá rechazarse H0 si el número de signos + es muy pequeño. Al restar las respuestas de cada esposo de la de su esposa, y notando que las respuestas de cinco de las parejas son las mismas, se obtienen el siguiente arreglo de signos + y -.

Pareja 1 2 3 4 5 6 7 8 9 10 Signo + - - - - - + - + -

Signos positivos= 3

Tabla de valores críticos para la prueba del signo:

1 * *2 * *3 * *4 * *5 * *6 * 07 * 08 0 09 0 110 0 111 0 112 1 213 1 214 1 215 2 316 2 317 2 418 3 419 3 420 3 521 4 522 4 523 4 624 5 6

VALOR DE ALFAn 0.01 0.05

25 5 7

2

25.0

n

nx

z

La hipótesis nula se rechaza si el número de vecesque se repite el signo menos frecuente (x) esMENOR O IGUAL que el valor de la tabla.

Cuando el tamaño de los grupos es superiora 25 se utiliza la distribución normal:

Conclusión: Los datos proporcionan evidencia

suficiente para concluir que las esposas desean tener un mayor número de hijos que los esposos (P<0.05).

pruebas estadisticas no parametricas. pruebas tradicionales necesitan la especificación de una...

Documents