pruebas no paramÉtricas
TRANSCRIPT
PRUEBAS NO PARAMÉTRICAS
Módulo IV
ÍNDICE
MÓDULO IV: PRUEBAS NO PARAMÉTRICAS Pág.
I. PRUEBA SIGNO - RANGO DE WILCOXON……………………… 3
II. PRUEBA DE MANN WHITNEY…………………………………….. 6
III. PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE
DOS GRUPOS INDEPENDIENTES………………………………. 8
IV. COEFICIENTE DE CORRELACIÓN DE SPEARMAN………….. 9
3
MÓDULO IV
PRUEBAS NO PARAMÉTRICAS
Las pruebas de significación estadística pueden clasificarse en:
Paramétricas: Contrastan hipótesis sobre parámetros. Ejemplos: Pruebas t, z y
ANOVA.
No paramétricas: Contrastan hipótesis que no son afirmaciones sobre parámetros y no
dependen de la forma de la distribución poblacional; por este hecho, se denominan
también pruebas de distribución libre. Ejemplos: Prueba signo rango de Wilcoxon,
prueba suma de rangos de Wilcoxon, prueba 2 de Mc Nemar, etc.
A continuación desarrollaremos dos pruebas no paramétricas muy utilizadas:
I. PRUEBA SIGNO - RANGO DE WILCOXON
Se usa para:
1. Comparar dos muestras relacionadas; es decir, para analizar datos obtenidos
mediante el diseño antes-después (cuando cada sujeto sirve como su propio control) o
el diseño pareado (cuando el investigador selecciona pares de sujetos y uno de cada
par, en forma aleatoria, es asignado a uno de dos tratamientos). Pueden existir
además otras formas de obtener dos muestras relacionadas.
2. Cuando la variable es:
a) Cuantitativa medida en escala ordinal.
b) Cuantitativa medida en escala de intervalo o de razón, pero las diferencias (di) de
los pares de datos no se distribuyen normalmente. En este caso, se usa en lugar
de la prueba t de Student para dos muestras relacionadas o “t pareada”.
Ejemplo:
Los datos corresponden a una muestra de 8 pacientes varones de 45 a 55 años de edad.
Son lecturas de colesterol total tomadas tras 12 horas de ayuno y repetida una hora
4
después de comer. ¿Hubo un incremento significativo de los niveles de colesterol después
de la comida?
Solución:
a) Hipótesis
H0: No hubo incremento significativo de colesterol total después de la comida.
H1: Hubo incremento significativo de colesterol total después de la comida.
b) Cálculo del contraste T:
T = 33,5 (ó T = 2,5)
c) Cálculo de zT
Con:
T
TT
TT
σ
μTz:Luego
24
1)1)(2nn(nσ
4
1)n(nμ
En este caso n = 8 (ya que no hubo ninguna di= 0)
17,214,7
185,33:
14,724
)17)(9(818
4
)9(8
T
TT
zLuego
Paciente Ayuno Después di
(D-A)
Rango
|di|
de rangos
+ -
1 180 185 5 1 1
2 210 225 15 4 4
3 195 215 20 5 5
4 220 245 25 6 6
5 210 200 -10 2,5 2,5
6 190 220 30 7 7
7 225 235 10 2,5 2,5
8 215 250 35 8 8
33,5 2,5
5
d) Valor de p:
p = 1 – 0,9850
p = 0,015
e) Decisión y Conclusión:
Decisión: Siendo p = 0,015 (< 0,05), se rechaza H0.
Conclusión: Hubo incremento, estadísticamente significativo, de los valores de colesterol
después de la comida (p = 0,015).
6
II. PRUEBA DE MANN WHITNEY
Se usa para:
1. Comparar dos poblaciones independientes.
2. Cuando la variable es:
a) Cuantitativa medida en escala ordinal.
b) Cuantitativa medida en escala de intervalo o de razón, pero la variable en una o
en las dos poblaciones no tiene distribución normal. En este caso, se usa en lugar
de la prueba t Student para dos muestras independientes.
Ejemplo:
Se tomó una muestra de 10 universitarias y otra de 10 universitarios para determinar si las
mujeres tenían actitud más positiva que los varones frente a la Iglesia católica. Los
puntajes en un cuestionario de actitudes fueron:( mayor puntaje, actitud más positiva).
¿La población de universitarias, tiene actitud más positiva que los universitarios frente a la
Iglesia católica?
Solución:
a) Hipótesis:
H0: mediana de puntajes de las mujeres mediana de varones.
H1: mediana de puntajes de las mujeres > mediana de varones.
Mujeres R1 Varones R2
25 17 20 11
28 20 15 4
26 18 16 5
20 11 12 2
18 7 19 8,5
24 16 23 15
22 14 11 1
20 11 13 3
21 13 17 6
19 8,5 27 19
n1 =10 135,5 n2 =10 74,5
7
En otros términos:
H0: Las mujeres no tienen actitudes más positivas que los varones frente a la Iglesia
Católica.
H1: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia
Católica.
b) Suma de rangos (W)
W = suma de rangos.
W = 74,5
c) Cálculo de zW
31,223,13
1055,74
:
23,1312
)1(
1052
)21(10
2
)1(
2121
1
211
W
W
WW
W
W
z
WzLuego
nnnn
menortamañon
nnn
d) Valor de p
Siendo la prueba unilateral:
p = 0,0104
e) Decisión y Conclusión:
Decisión: Siendo p = 0,0104 ( < 0,05), se rechaza la hipótesis nula.
Conclusión: Las mujeres tienen actitudes más positivas que los varones frente a la Iglesia
Católica (p = 0,0104).
8
III. PRUEBA DE KRUSKAL-WALLIS PARA COMPARAR MÁS DE DOS GRUPOS
INDEPENDIENTES
La prueba de Kruskal-Wallis, es una alternativa a la prueba F del análisis de varianza para
diseños de clasificación simple. En este caso se comparan varios grupos pero usando la
mediana de cada uno de ellos, en lugar de las medias. Ho: La mediana de las k
poblaciones consideradas son iguales y Ha: Al menos una de las poblaciones tiene
mediana distinta a las otras.
Donde, n es el total de datos.
Si hay empates en los datos entonces, se aplica la siguiente modificación a H.
Se puede mostrar que si los tamaños de cada grupo son mayores que 5 entonces, H se
distribuye como una Ji-Cuadrado con, k-1 grados de libertad. Luego, la hipótesis nula se
rechaza si H > Ji-Cuadrado con, k-1.
9
IV. COEFICIENTE DE CORRELACIÓN DE SPEARMAN
El coeficiente de correlación muestral puede verse seriamente afectado por las
observaciones extremas. Además, los contrastes basados en recurren para su validez al
supuesto de la normalidad. Puede obtenerse una medida de la correlación en la que no
influyen seriamente los val ores extremos y en la que pueden basarse contrastes validos
de distribuciones poblacionales muy generales utilizando los puestos en ordenaciones. El
contraste resultante será en ese caso no param6trico.
Este coeficiente es el equivalente no paramétrico del Coeficiente de correlación que vimos
anteriormente, al que también se le llama Coeficiente de Pearson. Al igual que el
coeficiente de correlación, el Coeficiente de Spearman puede tomar valores entre -1.0 y
1.0, un valor de -1.0 indica una correlación negativa perfecta y un valor de 1.0 indica una
correlación positiva perfecta.
Pasos para calcular el Coeficiente de Spearman
1. Definir la hipótesis nula, por ejem. “No hay relación entre los dos juegos de datos”.
2. Calcular el rango (Rank) para ambos juegos de datos del mayor al menor verificando
empates.
3. Substraer los rangos para obtener la diferencia d.
4. Elevar la diferencia d al cuadrado.
5. Sumar los valores de d al cuadrado para obtener Σd2.
6. Usarla fórmula:
Donde n es el número de rangos.
Ejemplo:
En un estudio de la relación entre la edad y los resultados del electroencefalograma /EEG),
se recopilaron datos en 20 personas con edades entre 20 y 60 años. La Tabla No 3
muestra las edades y un valor de rendimiento del EEG particular para cada una de esas 20
10
personas. Los investigadores pretenden saber si es posible concluir que este rendimiento
del EEG particular tiene relación inversa con la edad a un nivel de significancia α=0.05.
Solución:
1. Formulación de hipótesis:
Prueba unilateral izquierda
Ho: El rendimiento del EEG y la edad son mutuamente independientes.
H1: Existe una tendencia del rendimiento del EEG a disminuir con la edad.
2. Nivel de significancia: α=0.05
3. Estadística de prueba:
11
4. Establecimiento de los criterios de decisión.
La hipótesis nula Ho se rechaza en la prueba unilateral izquierda en el nivel de
significación α=0.05 si rs es menor que rs* para α=0.05 y n=20.
En la tabla P observamos que para α=0.05 y n=20, - rs* =- 0.3789
5. Cálculos:
Pasos para calcular el valor de rs:
a) Clasificar por jerarquía los valores de X desde 1 hasta 20. Clasificar por jerarquía
los valores de Y desde 1 hasta 20
b) Calcular di, para cada pareja de observaciones, restando la jerarquía de Yi de la
jerarquía de Xi. Ver Tabla No 4.
c) Elevar al cuadrado cada di y calcular, la suma de los valores elevados al cuadrado.
12
Se calcula el valor de:
6. Decisión:
Como r2 = - 0.76 0.3789, se rechaza Ho. Lo que quiere decir que las Variables se
encuentran inversamente relacionadas.
13
14