lección 2 normalidad

4
Lección 2: Prueba de homogeneidad del error puro Para validar el supuesto de homogeneidad del error puro se realiza de manera gráfica un diagrama de dispersión entre los residuales (eje Y) y las respuestas estimadas . Si se observa algún patrón indica que posiblemente no se cumple el supuesto de homogeneidad del error puro. Para realizar la prueba de manera formal se de plantear la hipótesis si no se rechaza, se comparan las medias mediante la prueba ; si se rechaza se intentar transformar los datos o aplicar la prueba no paramétrica como la Kruskal-Wallis. Existen diversos procedimientos para probar la anterior hipótesis, algunos de estos se estudiaran a continuación Prueba F-Max de Hartley Para ejecutar esta prueba se requiere que todas las observaciones en cada tengan el mismo tamaño, es decir, . Fué propuesta por Hartley (1940 - 1950). La prueba se basa en la estadística: Si la hipótesis nula es cierta la distribución muestral de la estadística (asumiendo independencia de las muestras aleatorias tomadas de las poblaciones normales) es con grados de libertad en el numerador y grados de libertad en el denominador. Si el diseño es desbalanceado, es decir los tamaños de muestras no son iguales entonces se puede obtener una prueba ``liberal'' (probabilidad de error tipo I es mayor de ) haciendo . Los valores de la estadística de prueba se tabularon por Hartley (ver pág 453, Milliken and Johnson o pág 979, winer). Los

Upload: david-arechaga

Post on 09-Dec-2015

218 views

Category:

Documents


0 download

DESCRIPTION

NORMALIDAD

TRANSCRIPT

Page 1: Lección 2 Normalidad

Lección 2: Prueba de homogeneidad del error puro

Para validar el supuesto de homogeneidad del error puro se realiza de manera

gráfica un diagrama de dispersión entre los residuales (eje Y) y las respuestas

estimadas  . Si se observa algún patrón indica que posiblemente no se

cumple el supuesto de homogeneidad del error puro. Para realizar la prueba de

manera formal se de plantear la hipótesis

si   no se rechaza, se comparan las medias mediante la prueba  ; si se

rechaza se intentar transformar los datos o aplicar la prueba no paramétrica

como la Kruskal-Wallis. Existen diversos procedimientos para probar la anterior

hipótesis, algunos de estos se estudiaran a continuación

Prueba F-Max de Hartley

Para ejecutar esta prueba se requiere que todas las observaciones en cada   

tengan el mismo tamaño, es decir,  . Fué propuesta

por Hartley (1940 - 1950). La prueba se basa en la estadística:

Si la hipótesis nula es cierta la distribución muestral de la estadística   

(asumiendo independencia de las muestras aleatorias tomadas de las

poblaciones normales) es   con   grados de libertad en el numerador

y   grados de libertad en el denominador. Si el diseño es

desbalanceado, es decir los tamaños de muestras no son iguales entonces se

puede obtener una prueba ``liberal'' (probabilidad de error tipo I es mayor de 

) haciendo  .

Los valores de la estadística de prueba se tabularon por Hartley (ver pág 453,

Milliken and Johnson o pág 979, winer). Los parámetros para esta distribución

son  , el número de valores de   y  , los grados de libertad. Se

rechaza   si 

Prueba de Cochran

Esta prueba utiliza la estadística:

Page 2: Lección 2 Normalidad

 Los parámetros de la distribución muestral de éste estadístico

son   número de valores de  y  , los grados de libertad para cada

varianza en cada grupo de  . Los percentiles del   y   de la distribución

del estadístico   son dados en la tabla D8 pág 980 (Winer). Se rechaza   

si 

En muchas situaciones encontradas en la práctica la prueba de Cochran y

Hartley conducen a las mismas decisiones; pero, ya que la prueba de Cochran

utiliza más información, es generalmente algo más sensible que la prueba de

Hartley. Cuando el número de observaciones en cada   no sea igual pero

relativamente cercano, el mayor de los   puede usarse en lugar de   para

determinar los grados de libertad requeridos en las tablas.

NOTA: para propósitos de detectar grandes desviaciones del supuesto de

homogeneidad de varianza en muchos casos prácticos es recomendable las

pruebas de Hartley y Cochran.

Prueba de Bartlett

La prueba de Bartlett   es quizá la técnica ampliamente usada para

probar homogeneidad de varianza. En esta prueba los   en cada valor de  no

necesitan ser iguales; sin embargo se recomienda que los   no sean menores

que   y muchos de los   deben ser mayores de  , La estadística de prueba es

donde

Page 3: Lección 2 Normalidad

Cuando la hipótesis nula es cierta; es decir las varianzas de todos los grupos de

la   son iguales, la estadística de prueba tiene distribución

aproximadamente   con   grados de libertad; cuando el muestreo se

realiza en poblaciones normales.

Existe evidencia de que las pruebas de Hartley, Cochran y Bartlett son sensibles

a la violación del supuesto de normalidad.

Prueba de Levene

Esta prueba fué propuesta po Levene (1960). Esta prueba es robusta al

supuesto de normalidad. Para su ejecución se debe reemplazar cada valor

observando   por   y luego ejecutar el análisis de varianza a una

vía. Se rechaza   si la prueba es significante.

Recomendaciones

Conover, Johnson, en Johnson (1981) realizaron un estudio de pruebas de

varianza como las dadas anteriormente. Basados sobre sus resultados, se hace

la siguiente recomendación (Milliken pag 22).

1. Si hay confianza de que la variable (en este caso error) esta cercana a una distribución normal, entonces usar prueba de Bartlet o Hartley. Si los tamaños de muestra son muy desiguales usar la prueba de Bartlet; en otro caso, la prueba de Hartley.

2. Si los datos no son normales y se tiene una gran cantidad de datos, use la prueba de levene. Esta prueba es muy robusta a la normalidad pero no muy potente para muestras de tamaño pequeño.

3. A todas las demás situaciones, usar Levene la cual es tan buena como Bartlet y Hartley cuando los datos se distribuyen normal y es muy superior a ellas para distribuciones de datos no normales. Si los datos tienden a ser muy sesgados, la prueba de Levene puede ser

mejorada reemplazando   por  donde   es la mediana del   

grupo. Así  , y un análisis de varianza des hecho sobre los  .