Download - 27_estadistica No Parametrica II
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
1
ESTADÍSTICA NO PARAMÉTRICA
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
2
ÍNDICE
1.- INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA
2.- PRUEBA DE LA MEDIANA
3.- PRUEBA KUSKAL-WALLIS
4.- Q DE COCHRAN
5.- F DE FRIEDMAN
6.- CONCORDANCIA DE KENDALL
7.- ¿Y EN EXCEL?
BIBLIOGRAFÍA
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
3
1.- INTRODUCCIÓN A LA ESTADÍSTICA NO PARAMÉTRICA
La Estadística no paramétrica es una rama de la Estadística que estudia las
pruebas y modelos estadísticos cuya distribución subyacente no se ajusta a los
llamados criterios paramétricos. Su distribución no puede ser definida a priori,
pues son los datos observados los que la determinan. La utilización de estos
métodos se hace recomendable cuando no se puede asumir que los datos se
ajusten a una distribución normal o cuando el nivel de medida empleado no
sea, como mínimo, de intervalo. Las principales pruebas no paramétricas son
las siguientes:
• Prueba de chi-cuadrado. Mide la discrepancia entre una distribución
observada y otra teórica (bondad de ajuste), indicando en qué medida
las diferencias existentes entre ambas, de haberlas, se deben al azar.
También se utiliza para probar la independencia de dos muestras entre
sí, mediante la presentación de los datos en tablas de contingencia.
• Prueba binomial. Analiza variables dicotómicas y compara las
frecuencias observadas en cada categoría con las que cabría esperar
según una distribución binomial de parámetro especificado en la
hipótesis nula. El nivel de significación crítico de esta prueba indica la
probabilidad de obtener una discrepancia igual o superior a la observada
a partir de la muestra si la distribución es la postulada por la hipótesis
nula.
• Prueba de Anderson-Darling. Este test determina si los datos vienen
de una distribución específica.
• Prueba de Cochran. Permite efectuar un test estadístico para
comprobar si existe una diferencia significativa entre tests realizados. • Prueba de Cohen kappa. Test que evalúa las concordancias y
discordancias intra e interobservador respecto a una variable nominal
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
4
• Prueba de Fisher. Prueba de significación estadística utilizada para
comparar proporciones en tablas de contingencia.
• Prueba de Friedman. Consiste en ordenar los datos por filas o bloques,
reemplazándolos por su respectivo orden. Al ordenarlos, debemos
considerar la existencia de datos idénticos.
• Prueba de Kendall. Es usada para comprobar el grado de coincidencia
de las valoraciones realizadas por lo expertos.
• Prueba de Kolmogorov-Smirnov. Se utiliza para determinar la bondad
de ajuste de dos distribuciones de probabilidad entre sí.
• Prueba de Kruskal-Wallis. Sirve para testar si un grupo de datos
proviene de la misma población. Intuitivamente, es idéntico al ANOVA
con los datos reemplazados por categorías.
• Prueba de Kuiper
• Prueba de Mann-Whitney o prueba de Wilcoxon. Se aplica a dos
muestras independientes, cuyos datos han sido medidos al menos en
una escala de nivel ordinal. La prueba calcula el llamado estadístico U,
cuya distribución para muestras con más de 20 observaciones se
aproxima bastante bien a la distribución normal.
• Prueba de McNemar. Se utiliza para decidir si puede o no aceptarse
que determinado ''tratamiento'' induce un cambio en la respuesta
dicotómica o dicotomizada de los elementos sometidos al mismo, y es
aplicable a los diseños del tipo ''antes-después'' en los que cada
elemento actúa como su propio control.
• Prueba de la mediana. Se trata de un caso especial de la prueba de
chi-cuadrado, pues se basa en esta última. Su objetivo es comparar las
medianas de dos muestras y determinar si pertenecen a la misma
población o no.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
5
• Prueba de Siegel-Tukey: Consiste en determinar una mínima diferencia
significativa tal que toda diferencia entre dos medias que sea superior a
ese valor se declara significativa. • Coeficiente de correlación de Spearman. Mide la asociación o
interdependencia entre dos variables discretas. Para calcular ρ, los
datos son ordenados y reemplazados por su respectivo orden.
• Tablas de contingencia: Se emplean para registrar y analizar la
relación entre dos o más variables, habitualmente de naturaleza
cualitativa -nominales u ordinales.
• Prueba de Wald-Wolfowitz: Las prueba de rachas es una prueba no
paramétrica, capaz de manejar variables cuantitativas y cualitativas de
tipo dicotómico.
La utilidad de esta prueba, abarca diferentes campos de la actividad
humana y puede servir desde para probar la aleatoriedad: de las
encuestas aplicadas por los entrevistadores, de las fallas de la
maquinaria en la producción, de las cantidades compradas o vendidas,
de las faltas de los empleados, hasta para controlar la calidad de la
producción.
• Prueba de los signos de Wilcoxon. Compara la media de dos
muestras relacionadas para determinar si existen diferencias entre ellas.
La prueba de Wilcoxon se aplica al caso de las distribuciones continuas
simétricas, bajo estas suposiciones, la media es igual a la mediana y el
procedimiento puede emplearse en probar la hipótesis nula que U=Uo.
De forma general, en todas ellas se parte de la base de que algunos
contrastes de hipótesis dependen del supuesto de normalidad, muchos de
estos contrastes siguen siendo aproximadamente válidos cuando se aplican a
muestras muy grandes, incluso si la distribución de la población no es normal.
Sin embargo, muchas veces se da también el caso de que, en aplicaciones
prácticas, dicho supuesto de normalidad no sea sostenible. Lo deseable
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
6
entonces será buscar la inferencia en contrastes que sean válidos bajo un
amplio rango de distribuciones de la población. Tales contrastes se denominan
no paramétricos.
Los contrastes no paramétricos son generalmente, válidos cualquiera que
sea la distribución de la población. Es decir, dichos contrastes pueden ser
desarrollados de manera que tengan el nivel de significación requerido, sin
importar la distribución de los miembros de la población.
La mayor parte de las técnicas estudiadas hacen suposiciones sobre la
composición de los datos de la población. Las suposiciones comunes son que
la población sigue una distribución normal, que varias poblaciones tienen
varianzas iguales y que los datos se miden en una escala de intervalos o en
una escala de razón. Este tema presentará un grupo de técnicas llamadas no
paramétricas que son útiles cuando estas suposiciones no se cumplen.
Como se ha indicado anteriormente existen otras muchas pruebas
estadísticas diseñadas para situaciones en las que no se cumplen las
suposiciones críticas o que involucran datos cuantitativos o categóricos. Se
presentarán aquí unas cuantas de las pruebas no paramétricas que mas se
usan.
¿Qué ocurre con las pruebas no paramétricas frente a las que si lo son?
Las pruebas no paramétricas no necesitan suposiciones respecto a la
composición de los datos poblacionales. Las pruebas no paramétricas son de
uso común:
1.- Cuando no se cumplen las suposiciones requeridas por otras técnicas
usadas, por lo general llamadas pruebas paramétricas.
2.- Cuando es necesario usar un tamaño de muestra pequeño y no es posible
verificar que se cumplan ciertas suposiciones clave.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
7
3.- Cuando se necesita convertir datos cualitativos a información útil para la
toma de decisiones.
Existen muchos casos en los que se recogen datos medidos en una
escala nominal u ordinal. Muchas aplicaciones de negocios involucran
opiniones o sentimientos y esos datos se usan de manera cualitativa.
Las pruebas no paramétricas tienen varias ventajas sobre las pruebas
paramétricas:
1.- Por lo general, son fáciles de usar y entender.
2.- Eliminan la necesidad de suposiciones restrictivas de las pruebas
paramétricas.
3.- Se pueden usar con muestras pequeñas.
4.- Se pueden usar con datos cualitativos.
También las pruebas no paramétricas tienen desventajas:
1.- A veces, ignoran, desperdician o pierden información.
2.- No son tan eficientes como las paramétricas.
3.- Llevan a una mayor probabilidad de no rechazar una hipótesis nula falsa
(incurriendo en un error).
Las pruebas no paramétricas son pruebas estadísticas que no hacen
suposiciones sobre la constitución de los datos de la población.
Por lo general, las pruebas paramétricas son mas poderosas que las
pruebas no paramétricas y deben usarse siempre que sea posible. Es
importante observar, que aunque las pruebas no paramétricas no hacen
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
8
suposiciones sobre la distribución de la población que se muestrea, muchas
veces se apoyan en distribuciones muestrales como la normal o la ji cuadrada.
En estas técnicas, solamente se necesitan conocimientos elementales
de matemáticas, pues los métodos son relativamente más sencillos que en las
pruebas paramétricas. En estas pruebas, también se tienen supuestos, pero
son pocos y no tienen que ver con la naturaleza de la distribución de la
población, por lo que a estas técnicas también se les conoce como de libre
distribución.
Una limitación que tienen es que no son aplicables a casos en los que se
desean manejar muchas variables al mismo tiempo, para estos casos, sí se
requeriría una prueba paramétrica; lo que sí se requiere y en general es el
supuesto que se debe cumplir en la mayoría de las pruebas no paramétricas
para confiar en ellas, es que la muestra haya sido seleccionada en forma
probabilística.
Además del problema de los supuestos, algunos experimentos o
estudios que se deseen realizar producen respuestas que no es posible evaluar
con la escala que tiene más ventajas, por ejemplo, cuando los datos solamente
se encuentran en una escala ordinal como cuando se evalúan las habilidades
de los vendedores de semillas o productos fitosanitarios, o el atractivo de cinco
variedades de plantas de melón, o la preferencia por sopas de cinco marcas
diferentes. En general aspectos como la habilidad o preferencias de un
producto o alimento, solamente los podemos ordenar; resultados de este tipo
se presentan frecuentemente en estudios de mercado y en otros del campo de
las ciencias sociales.
Seguidamente se analizan varias de las pruebas o métodos estadísticos
no paramétricos como Prueba de la mediana, Prueba Kuskal-Wallis, Prueba de
Friedman, Concordancia de Kendall, de estas pruebas se mencionarán sus
principales características y aplicaciones, además de la prueba paramétrica a
la que podrían sustituir en caso necesario, así como los supuestos en los que
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
9
se basa la prueba, que como se podrá ver, son menos rigurosos que para las
pruebas paramétricas.
2.- PRUEBA DE LA MEDIANA
La prueba de la mediana es una prueba no paramétrica que podemos
considerar un caso especial de la prueba de chi-cuadrado, pues se basa en
esta última. Su objetivo es comparar las medianas de dos muestras y
determinar si pertenecen a la misma población o no.
Para ello, se calcula la mediana de todos los datos conjuntamente.
Después, se divide cada muestra en dos subgrupos: uno para aquellos datos
que se sitúen por encima de la mediana y otro para los que se sitúen por
debajo. La prueba de chi-cuadrado, descrita seguidamente determinará si las
frecuencias observadas en cada grupo difieren de las esperadas con respecto
a una distribución de frecuencias que combine ambas muestras.
Esta prueba de chi-cuadrado (pronunciado "ji-cuadrado") es
considerada también como una prueba no paramétrica que mide la
discrepancia entre una distribución observada y otra teórica (bondad de ajuste),
indicando en qué medida las diferencias existentes entre ambas, de haberlas,
se deben al azar. También se utiliza para probar la independencia de dos
muestras entre sí, mediante la presentación de los datos en tablas de
contingencia.
La fórmula que da el estadístico es la siguiente:
∑ ⎥⎦⎤
⎢⎣⎡
⎟⎠⎞⎜
⎝⎛ −=χ
Los grados de libertad vienen dados por:
gl= (r-1)(k-1). Donde r es el número de filas y k el de columnas.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
10
• Criterio de decisión:
Se acepta H0 cuando ( )( )−−< χχ . En caso contrario se
rechaza.
Donde t representa el valor proporcionado por las tablas, según el nivel de
significación elegido.
Cuanto más se aproxima a cero el valor de chi-cuadrado, más ajustadas están
ambas distribuciones.
Esta prueba de la mediana está especialmente indicada cuando los datos sean
extremos o estén sesgados.
Ejemplo:
En los experimentos de Mendel con guisantes, observó 315 lisos y
amarillos, 108 lisos y verdes, 101 rugosos y amarillos y 32 rugosos y verdes.
De acuerdo con su teoría, estos números deberían presentarse en la
proporción 9:3:3:1. ¿Hay alguna evidencia que permita dudar de su teoría al
nivel de significación del 0.01?
Solución:
Ensayo de Hipótesis:
Ho; La teoría de Mendel es acertada.
H1; La teoría de Mendel no es correcta.
El número total de guisantes es 315+108+101+32=556. Puesto que los
números esperados están el la proporción 9:3:3:1 (9+3+3+1=16), se esperaría:
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
11
lisos y amarillos
lisos y verdes
rugosos y amarillos
rugosos y verdes
Grados de libertad = k-1-m = 4-1-0 = 3
No se tuvo que calcular ningún parámetro para obtener las frecuencias
esperadas.
Regla de decisión:
Si X2R 11.3 no se rechaza Ho.
Si X2R >11.3 se rechaza Ho.
Cálculos:
Justificación y decisión:
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
12
Como 0.470 es menor que 11.3 no se rechaza Ho y se concluye con un nivel
de significación de 0.01 que la teoría de Mendel es correcta.
Como el valor de 0.470 está cercano a cero, se procede a hacer un ensayo
unilateral izquierdo:
Ensayo de Hipótesis:
Ho; La teoría de Mendel es acertada.
H1; La teoría de Mendel es muy acertada.
Regla de decisión:
Si X2R 0.115 no se rechaza Ho.
Si X2R < 0.115 se rechaza Ho.
Como el valor de 0.470 no es menor a 0.115 se concluye que el experimento o
la teoría de Mendel solo es buena.
3.- PRUEBA KUSKAL-WALLIS
En estadística, el test de Kruskal-Wallis (de William Kruskal y W. Allen
Wallis) es un estadístico no paramétrico para testar si un grupo de datos
proviene de la misma población. Intuitivamente, es idéntico al ANOVA con los
datos reemplazados por categorías. Es una extensión del test de la U de Mann-
Whitney para 3 o más grupos.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
13
Ya que es un test no paramétrico, el test de Kruskal-Wallis no asume
normalidad en los datos, en oposición al tradicional ANOVA. Si asume bajo la
hipótesis nula que los datos vienen de la misma distribución. Una forma común
en que se viola este supuesto es con datos heterocedásticos.
Método
1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al
menor un rango de 1, al segundo un 2, y así hasta el n-ésimo. Si existen
datos que se repiten, se asigna el rango promedio a cada uno de ellos
(si existen cuatro datos idénticos que ocupan los rangos 11, 12, 13 y 14,
se les asigna un rango de 12,5 a los cuatro).
2. El estadístico está dado por:
, donde:
• ng es el número de observaciones en el grupo g
• rij es el rango (entre todas las observaciones) de la
observación j en el grupo i
• N es el número total de observaciones entre todos los grupos
• , • es el promedio de rij.
Nótese que el denominador de la expresión para K es
exactamente . Luego
.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
14
3. Se puede realizar una corrección para los valores repetidos dividiendo K
por , donde G es el número de grupos de diferentes
rangos repetidos, y ti es el número de observaciones repetidas dentro
del grupo i que tiene observaciones repetidas para un determinado valor.
Esta corrección hace cambiar a K muy poco a menor que existan un
gran número de observaciones repetidas.
4. Finalmente, el p-value es aproximado por . Si algún ni
es pequeño ( < 5) la distribución de K puede ser distinta de la chi-
cuadrado.
Ejemplo:
Se tienen los siguientes datos experimentales, correspondientes a 22 plántulas
de tomate de los que se ha recogido información de dos variables: una variable
explicativa Exp nominal y otra variable respuesta Rta cuantitativa. Los datos se
presentan de forma que en las filas hay varios individuos para facilitar la
lectura:
Rta Exp Rta Exp Rta Exp Rta Exp 15 1 28 2 16 2 25 3
15 1 28 2 16 2 35 3
25 1 28 2 25 2
25 1 35 2 28 2
25 1 43 2
33 1 13 3
43 1 15 3
15 2 25 3
Calcular la prueba de Kruskal-Wallis de comparación de medianas para los
datos anteriores.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
15
Cálculo de los rangos para cada observación Para cada observación se le asigna el rango según el orden que ocupa la
observación en el conjunto total de los datos, asignando el rango medio en
caso de empates:
Rta Exp Rango (Rta) Rta Exp Rango (Rta) 15 1 3.5 28 2 15.5
15 1 3.5 28 2 15.5
25 1 10.5 28 2 15.5
25 1 10.5 35 2 19.5
25 1 10.5 43 2 21.5
33 1 18 13 3 1.0
43 1 21.5 15 3 3.5
15 2 3.5 25 3 10.5
16 2 6.5 25 3 10.5
16 2 6.5 35 3 19.5
25 2 10.5
28 2 15.5
Cálculo de la suma de rangos Rm Para cada grupo m = 1,…,r, siendo r el número de grupos, se define Rm como
la suma de rangos de cada grupo m, que para los datos del ejemplo resultan
ser:
R 1 = ∑ rangos= 3,5+3,5 +10,5 +10,5 +10,5 +18 +21,5 =78.00 grupo1
R 2 = ∑ rangos = 3,5+6,5 +6,5 +10,5 +15,5 +15,5 +15,5 +15,5 +19,5 +21,5 =130.00 grupo2
R 3 = ∑ rangos = 1+ 3,5+10,5 +10,5 +19,5 =45.00 grupo3
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
16
Cálculo del valor medio de los rangos E[Rm] y de los rangos medios R m
E [ ] ( ) 2/1+= nnR mm
y el rango medio R m como:
mmm nRR /=
Para los datos del ejemplo resultan ser:
[ ] ( ) ( ) 50,802/122*72/111 =+=+= nnRE
[ ] ( ) ( ) 50,1152/122*102/122 =+=+= nnRE
[ ] ( ) ( ) 50,572/122*52/133 =+=+= nnRE
14,11/ 111 == nRR =2R 00,13/ 22 =nR
00,9/ 333 == nRR
Estadístico de contraste H’
El estadístico de contraste H’ se calcula como:
( ) ( ) [ ][ ] ( )⎥⎥⎦
⎤
⎢⎢⎣
⎡⎥⎦
⎤⎢⎣
⎡−−−
⎥⎥⎦
⎤
⎢⎢⎣
⎡−+= ∑∑
==
nnddRRERnnnHk
jjj
r
mmmm
3
1
32
1/1//11/12'
siendo dj el número de empates en j = 1,…,k siendo k el número de valores
distintos de la variable respuesta, que para los datos del ejemplo resulta ser:
( ) ( ) ( ) ( ) ( ) ( ) ( ) 348222244662244 333333
1
3 =−+−+−+−+−+−=−∑=
k
jjj dd
con lo que:
( ) ( ) ( ) ( )[ ] ( )( )[ ][ ] 3398,12222/3481/5,57455/111513010/15,80787/123*22/12' 3222 =−−−+−+−=H
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
17
que sigue una distribución Chi-Cuadrado con r –1 = 2 grados de libertad, que
tiene asociada un p-valor de 0.5118
4.- PRUEBA Q DE COCHRAN
Prueba o Test de la Q de Cochran permite efectuar un test estadístico
para ver si existe una diferencia significativa entre tests realizados.
Se trata de un contraste de H0 de que varias variables dicotómicas
relacionadas tienen igual media. Las variables se miden en el mismo
individuo o en individuos relacionados. Es una extensión de la prueba de
McNemar para k muestras.
El estadístico Q se calcula con:
( ) ( )[ ] [ ]−−−=
Este estadístico tiene aproximadamente una distribución Chi-cuadrado
con n – 1 grados de libertad.
Cuando se tiene el caso de N individuos de un palmeral, a cada una de
los cuales se le efectuó un tratamiento con n materias activas diferentes
para la erradicación del picudo (n > 1), se tiene el caso de mediciones
repetidas en la misma planta. Esto es un total de n valores apareados para
cada palmera. Los resultados de cada test se pueden expresar como sano
o enfermo, (+) o (-) etc. Lo mismo ocurre cuando n ingenieros agrónomos
opinan sobre N variedades de una misma especie. Suponiendo que la
magnitud plaga del picudo es X, entonces el valor Xij corresponde la
palmera i tratada con la materia activa j. Los resultados obtenidos se
pueden expresar como se hace en la Tabla siguiente:
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
18
Tabla: N palmeras tratadas con n materias activas Palmeras Mat
activa 1 Mat activa 2
… Mat active j
… Mat activa n
Total
1 X11 X12 … X1j … X1n T1 2 X21 X22 … X2j … X2n T2 3 X31 X32 … X3j … X3n T3. … … … … … … … … i Xi1 Xi2 … Xij … Xin Ti. … … … … … … … … N XN1 XN2 … XNj … XNn TN. Total T.1 T.2 … T.j … T.n T
Donde como convención se adopta X = 0 cuando es (+) y X = 1 cuando
es (-) entonces los valores observados son una serie de ceros y unos.
Definiendo las sumatorias:
∑=
= : El total de la columna j. ∑ ∑= =
= El total de todas las
observaciones
∑=
= : El total de la fila i.
( )∑=
= : La suma de los cuadrados de las filas.
( )∑=
= :La suma de los cuadrados de las columnas.
Entonces se puede efectuar un test estadístico para ver si existe una
diferencia significativa entre los distintos tratamientos fitosanitarios llamado: La
prueba Q de Cochran. El estadístico Q que se calcula con:
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
19
( ) ( ) ( )[ ][ ] [ ]−−−= , como ya
hemos dicho, que tiene aproximadamente una distribución Chi-cuadrado
con n –1 grados de libertad.
Ejemplo:
Se han examinado 12 palmeras a las que se les aplicado tres materias activas
diferentes para el tratamiento del picudo rojo.
Si los resultados se informan como (+) y (-) detectar si hay diferencias
significativas entre las tres tratamientos fitosanitarios empleados. Usando la
convención de 1 para los (+) y 0 para los (-) resultó:
Palmera Mat. activa 1 Mat. activa 2 Mat activa 3 Total 1 1 1 0 2 2 0 0 0 0 3 1 1 1 3 4 1 0 1 2 5 1 1 1 3 6 0 0 1 1 7 1 1 1 3 8 0 0 0 0 9 1 1 0 2 10 0 0 1 1 11 0 1 0 1 12 1 0 1 2 Total 7 6 7 20
== ∑ ∑= =
( )∑=
=++==
( ) =++== ∑=
( ) ( )[ ] [ ]−−=
=<= χ
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
20
La conclusión es que no se han encontrado diferencias significativas entre los
tres métodos.
5.- F DE FRIEDMAN
La prueba de Friedman es el equivalente a la prueba ANOVA para dos
factores en la versión no paramétrica. El método consiste en ordenar los datos
por filas o bloques, reemplazándolos por su respectivo orden. Al ordenarlos,
debemos considerar la existencia de datos idénticos.
Método
Sea una tabla de datos, donde m son las filas (bloques) y n las
columnas (tratamientos). Una vez calculado el orden de cada dato en su
bloque, reemplazamos la tabla original con otra donde el valor rij es
el orden de xij en cada bloque i.
1. Cálculo de las varianzas intra e inter grupo:
• ,
•
•
•
2. El estadístico viene dado por .
3. El criterio de decisión es .
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
21
Ejemplo:
Se conduce un estudio de campo con fresas (Fragaria x ananassa) para
determinar la eficacia de seis herbicidas en el control de malezas gramíneas.
Las gramíneas fueron contadas dentro de cada tratamiento y examinadas con
ANAVA. Las medias de los tratamientos fueron separadas utilizando la prueba
de diferencia mínima significativa (DMS) de Fisher al 5% de significancia
(tomado de Gilreath et al., 2003).
ANAVA Prueba de Friedman ANAVA
Número de
gramíneas
Número de
gramíneas
Número
de frutos
Herbicidas
Medias
Herbicidas
Medianas
Herbicidas
Medias
1 90.7 a* 1 40 a 4 776.7 a
6 39.5 b 6 17 b 3 763.5 a
5 30.3 b 5 16 b 5 689.0 b
2 28.5 b 2 14 b 6 661.8 b
4 10.5 b 4 4 c 2 651.6 b
3 5.10 b 3 3 c 1 545.5 c
*Valores seguidos por la misma letra no difieren al 5% de significancia según
DMS.
Claramente, los datos de rendimiento expresados en número de frutos
cosechados lucen razonables. Los tratamientos que recibieron los herbicidas 3
y 4 tuvieron los mayores rendimientos, seguidos por los herbicidas 2, 5 y 6. Sin
embargo, los resultados del ANAVA para los conteos de malezas gramíneas no
ofrecen mucha información que concuerde con los datos de rendimiento.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
22
¿Cómo se puede explicar que 39.5 gramíneas en promedio sean
estadísticamente igual a 5.1? La respuesta yace en la gran variabilidad inicial
que existía en la distribución de las gramíneas en el campo bajo estudio, la cual
violaba los supuestos de normalidad y de homogeneidad de varianza, como lo
expresan las pruebas de Shapiro-Wilk (p<0.0001) para normalidad y de Bartlett
para homogeneidad de varianzas (p=0.0023). Cuando los mismos datos de
enmalezamiento fueron sometidos a la prueba de Friedman, los resultados
indicaron que los tratamientos con menos malezas gramíneas fueron los de
mayor rendimiento.
Este ejemplo, además compara el uso de métodos paramétricos y no
paraméticos.
6.- CONCORDANCIA DE KENDALL
Análisis de la concordancia en la valoración de aspectos (coeficiente de Kendall).
Después de obtener una proposición final en la consulta a los expertos
agrónomos necesitamos demostrar su confiabilidad, debemos probar el nivel
de acuerdo entre los expertos para otorgar mayor autenticidad a nuestro
estudio, es preciso comprobar el grado de coincidencia de las valoraciones
realizadas por lo expertos.
Podemos utilizar entonces el Coeficiente de Concordancia de Kendall,
que constituye un estadígrafo muy útil en estudios de confiabilidad entre
expertos de una materia, en este caso agronómica, al determinar la asociación
entre distintas variables. Es una medida de coincidencia entre ordenaciones
que pueden ser objetos o individuos. En este caso el coeficiente concordancia
(W) será un índice de la divergencia del acuerdo efectivo entre los expertos
mostrado en los datos del máximo acuerdo posible (perfecto).
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
23
Para la aplicación del Coeficiente de Concordancia de Kendall (W), se
construye una tabla Aspectos a evaluar / Expertos donde se asientan en una
tabla los rangos de valoración (en términos numéricos, 1 a 5) asignados a cada
aspecto evaluado contra cada uno de los expertos, siempre tomando los datos
a partir de la tabla que se uso en el método Delphi, o sea, la tabla de Aspectos
/ Rangos de Valoración donde se encuentran los criterios de los expertos y los
rangos de valoración.
Aspectos a Evaluar
Experto 1 Experto 2 Experto 3 … Ultimo Experto
1 2 3
A partir de aquí se sigue la metodología establecida:
• Determinación de la suma de los valores numéricos asignados a cada
aspecto a evaluar, según la apreciación del experto (Rj)
• Determinación del valor medio de las Rj, dada por la sumatoria de los Rj
entre N, total de aspectos a evaluar.
• Determinación de la desviación media, dada por la diferencia entre cada Rj y
el valor de la media.
• Determinación de la suma de los cuadrados de las desviaciones medias, S.
• Determinación del cuadrado del número total de expertos, K.
• Determinación del cubo del número total de aspectos a evaluar, N.
• Determinación de la diferencia entre el cubo de N y N y su multiplicación por
el cuadrado de K.
• Determinación del estadígrafo que responde a la siguiente expresión:
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
24
En la prueba estadística Coeficiente de Concordancia de Kendall (W), el
coeficiente W ofrece el valor que posibilita decidir el nivel de concordancia
entre los expertos. El valor de W oscila entre 0 y 1. El valor de 1 significa una
concordancia de acuerdos total y el valor de 0 un desacuerdo total. Obviamente
la tendencia a 1 es lo deseado pudiéndose realizar nuevas rondas si en la
primera no es alcanzada significación en la concordancia.
Conclusiones.
Podemos concluir que el método de expertos agronómicos, su procesamiento a
través del método Delphi y la verificación de concordancia a través del
estadígrafo de correlación de Kendall, tiene una serie de ventajas y
desventajas dentro de los métodos básicos de análisis cualitativos.
Ventajas:
• Se basa en la suposición de que varios expertos pueden llegar a un mejor
pronóstico que una sola persona.
• No existe secreto y se fomenta la comunicación porque a veces los
pronósticos y validaciones tienen influencia de factores sociales y pueden no
reflejar un consenso.
• Como pronóstico visionario es una profecía que usa ideas y juicio personales,
intuitivos, vinculados entre sí.
Desventajas:
• Se ha criticado por su poca seguridad, demasiada sensibilidad de los
resultados a la ambigüedad de las preguntas.
• Dificultad para establecer el grado de experiencia de los miembros del panel,
la imposibilidad de que tome en cuenta lo inesperado y por los grandes
retrasos entre las repeticiones del proceso.
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
25
• Los métodos cualitativos confían principalmente en el juicio de los expertos y
tienden a ser menos precisos que los métodos cuantitativos.
A pesar de estas limitaciones y teniendo en cuenta sus cualidades positivas, su
uso actual en las organizaciones e investigaciones sugiere que con frecuencia
su potencial excede a sus limitaciones.
Así mismo el procesamiento a través de un sistema automatizado, siempre
garantiza la calidad de nuestra investigación.
Tal como hemos descrito el método a seguir es el siguiente: se crean todas las
combinaciones de puntos posibles [(xi, yi), (xj, yj)] tal que i ≠ j y se definen c =
número de parejas concordantes (xi>xj y yi>yj) o (xi<xj y yi<yj) d = número
de parejas discordantes (xi>xj y yi<yj) o (xi<xj y yi>yj) ey=número de ligas
en y, con xi≠xj ex=número de ligas en x, con yi≠yj, aplicando el siguiente
estadístico:
( ) ( )( )( )++++−≡τ
El coeficiente de Kendall se define tal que −1 ≤ τ ≤ 1 donde ±1 indica
correlación perfecta, y 0 indica no correlación.
La significancia de no asociación viene dada por una distribución normal:
( ) ( )∞−
−∫−= π
( ) ( )( )−+= τ
7.- ¿Y EN EXCEL?
COMO SE HACE EN EXCEL.xls
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
26
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
27
BIBLIOGRAFÍA
• Bioestadística: Métodos y aplicaciones
• Presentación en Power Point.- Análisis Multivariable.- Itziar Aretxaga
• Estadística no paramétrica - Wikipedia, la enciclopedia libre
• Contraste de Kruskall-Wallis
• Estadística No-Paramétrica
• Tesauro SPINES :: estadística no parametrica
• Estadística no paramétrica
• http://www.bioestadistica.freeservers.com/tema14.pdf
• http://spines.r020.com.ar/index.php?tema=2345&/distribuciones estadísticas
• Tutorial estadística no paramétrica gratis - emagister.com
• Estadística Aplicada Facultad de Agronomía USAC
• http://www.medmayor.cl/odontologia/quinto/bioestadistica/estadisticanoparametrica.doc
• Estadística multivariante y no ... - Búsqueda de libros de Google
• Estadística para administración y ... - Búsqueda de libros de Google
• Estadística matemática con aplicaciones - Búsqueda de libros de Google
• http://www.redbio.org/portal/encuentros/enc_2001/minicursos/pdf/MC-01/GOIANIA-REDBIO3-CROSSA.pdf
• Estadística No Paramétrica
• http://www.uclm.es/profesorado/mdsalvador/58109/teoria/anova_un_factor-lectura.pdf
• http://gcrec.ifas.ufl.edu/WeedScience/Documents/Fumigant Studies/Estad no param02.doc
• Diseño de experimentos. Clase 20
• Anova un factor y Kruskal-Wallis
• Curso: Estadística I
DISEÑO DE EXPERIMENTOS: ESTADÍSTICA NO PARAMÉTRICA
AUTOR: Irene Guillén Luna
Curso 2007/08
28
BIBLIOGRAFÍA
• Yahoo! GeoCities
• Pruebas para k muestras dependientes
• http://patoral.umayor.cl/favicon.ico
• Proporción poblacional
• Glosario
• http://www.azprensa.com/favicon.ico