lección 2 normalidad
DESCRIPTION
NORMALIDADTRANSCRIPT
Lección 2: Prueba de homogeneidad del error puro
Para validar el supuesto de homogeneidad del error puro se realiza de manera
gráfica un diagrama de dispersión entre los residuales (eje Y) y las respuestas
estimadas . Si se observa algún patrón indica que posiblemente no se
cumple el supuesto de homogeneidad del error puro. Para realizar la prueba de
manera formal se de plantear la hipótesis
si no se rechaza, se comparan las medias mediante la prueba ; si se
rechaza se intentar transformar los datos o aplicar la prueba no paramétrica
como la Kruskal-Wallis. Existen diversos procedimientos para probar la anterior
hipótesis, algunos de estos se estudiaran a continuación
Prueba F-Max de Hartley
Para ejecutar esta prueba se requiere que todas las observaciones en cada
tengan el mismo tamaño, es decir, . Fué propuesta
por Hartley (1940 - 1950). La prueba se basa en la estadística:
Si la hipótesis nula es cierta la distribución muestral de la estadística
(asumiendo independencia de las muestras aleatorias tomadas de las
poblaciones normales) es con grados de libertad en el numerador
y grados de libertad en el denominador. Si el diseño es
desbalanceado, es decir los tamaños de muestras no son iguales entonces se
puede obtener una prueba ``liberal'' (probabilidad de error tipo I es mayor de
) haciendo .
Los valores de la estadística de prueba se tabularon por Hartley (ver pág 453,
Milliken and Johnson o pág 979, winer). Los parámetros para esta distribución
son , el número de valores de y , los grados de libertad. Se
rechaza si
Prueba de Cochran
Esta prueba utiliza la estadística:
Los parámetros de la distribución muestral de éste estadístico
son número de valores de y , los grados de libertad para cada
varianza en cada grupo de . Los percentiles del y de la distribución
del estadístico son dados en la tabla D8 pág 980 (Winer). Se rechaza
si
En muchas situaciones encontradas en la práctica la prueba de Cochran y
Hartley conducen a las mismas decisiones; pero, ya que la prueba de Cochran
utiliza más información, es generalmente algo más sensible que la prueba de
Hartley. Cuando el número de observaciones en cada no sea igual pero
relativamente cercano, el mayor de los puede usarse en lugar de para
determinar los grados de libertad requeridos en las tablas.
NOTA: para propósitos de detectar grandes desviaciones del supuesto de
homogeneidad de varianza en muchos casos prácticos es recomendable las
pruebas de Hartley y Cochran.
Prueba de Bartlett
La prueba de Bartlett es quizá la técnica ampliamente usada para
probar homogeneidad de varianza. En esta prueba los en cada valor de no
necesitan ser iguales; sin embargo se recomienda que los no sean menores
que y muchos de los deben ser mayores de , La estadística de prueba es
donde
Cuando la hipótesis nula es cierta; es decir las varianzas de todos los grupos de
la son iguales, la estadística de prueba tiene distribución
aproximadamente con grados de libertad; cuando el muestreo se
realiza en poblaciones normales.
Existe evidencia de que las pruebas de Hartley, Cochran y Bartlett son sensibles
a la violación del supuesto de normalidad.
Prueba de Levene
Esta prueba fué propuesta po Levene (1960). Esta prueba es robusta al
supuesto de normalidad. Para su ejecución se debe reemplazar cada valor
observando por y luego ejecutar el análisis de varianza a una
vía. Se rechaza si la prueba es significante.
Recomendaciones
Conover, Johnson, en Johnson (1981) realizaron un estudio de pruebas de
varianza como las dadas anteriormente. Basados sobre sus resultados, se hace
la siguiente recomendación (Milliken pag 22).
1. Si hay confianza de que la variable (en este caso error) esta cercana a una distribución normal, entonces usar prueba de Bartlet o Hartley. Si los tamaños de muestra son muy desiguales usar la prueba de Bartlet; en otro caso, la prueba de Hartley.
2. Si los datos no son normales y se tiene una gran cantidad de datos, use la prueba de levene. Esta prueba es muy robusta a la normalidad pero no muy potente para muestras de tamaño pequeño.
3. A todas las demás situaciones, usar Levene la cual es tan buena como Bartlet y Hartley cuando los datos se distribuyen normal y es muy superior a ellas para distribuciones de datos no normales. Si los datos tienden a ser muy sesgados, la prueba de Levene puede ser
mejorada reemplazando por donde es la mediana del
grupo. Así , y un análisis de varianza des hecho sobre los .