analisis de covariancia-2015
DESCRIPTION
Desarrollo del análisis de covariancia.TRANSCRIPT
ANALISIS DE COVARIANCIA
ANALISIS DE COVARIANCIA (ANCOVA)
En una técnica estadística que combinan dos análisis de variancia, el de un diseño experimental y el del análisis de regresión.
El ANCOVA al igual que los experimentos factoriales se conducen en un diseño experimental.
Es utilizado en casos en los cuales el experimentador sospecha que la variable respuesta de un diseño experimental (Y) tiene una relación de dependencia funcional lineal respecto a una (X) o más variables concomitantes (X1, X2, ..., Xm)
Ejemplo: ANCOVA EN DCA
Tres dietas A, B y C fueron comparadas en relación con sus efectos sobre el nivel de colesterol en la sangre de mujeres. La edad (X) fue empleada como un factor de control debido a su diferente asociación con el nivel de colesterol (Y). El nivel de colesterol en la sangre (mg. /100ml) fue determinado en cada persona para un período específico de tiempo. (Considere las repeticiones como bloques)
Repetición Dieta A Dieta B Dieta C
XA XB XA XB XA XB
1 40 190 41 201 41 202
2 47 205 30 187 32 192
3 28 178 58 226 57 215
4 51 215 48 222 49 202
5 50 202 57 220 36 197
MODELO ADITIVO LINEAL EN UN DCA
Donde: Donde:
Yij valor o rendimiento observado en el i-ésimo tratamiento, j-ésima repetición
efecto de la media general
Τi efecto del i-ésimo tratamiento
Β coeficiente de regresión lineal de Y sobre X
Xij valor de la variable independiente en el i-ésimo tratamiento, j-ésima repeticiónX.. media de la variable independiente
Εij efecto del error experimental en el i-ésimo tratamiento, j-ésima repetición
_
YIJ = + τi + β (XIJ – X..) + εij i = 1, 2, …, t ; J = 1, 2, …, ri
SUPUESTOS DEL MODELO
Además de los supuestos de un DCA se deben cumplir los siguientes:
Los valores de X son fijos, medidos sin error, y no son afectados por los tratamientos.
Las variables X e Y deben tener variancias homogéneas entre los tratamientos.
La regresión de Y sobre X debe ser lineal.
CUADRO DE ANCOVA EN DCA
2XY
E YYXX
ESC E
E
( 1)( 1) 1ESC
t b 2XY
T E YYXX
SSC S
S
T E ESC SC 1
T E ESC SC
t
Fuentes de Variación
GL SCX SPXY SCY SC aj. GL aj. CM aj.
Trat. t – 1 TXX TXY TYY
Error r. - t EXX EXY EYY r. – t - 1
Trat. + Error
r. - 1 SXX SXY SYY r. – 2
Diferencias para probar medias de tratamientos ajustadas
t – 1
Ejemplo: ANCOVA en DCA
Con la finalidad de estudiar el contenido de ácido ascórbico en cuatro variedades de habas, se consideró conveniente utilizar un DCA. Por experiencias previas se conoce que el contenido de ácido ascórbico disminuye con la madurez de las habas. Como no todas las variedades tenían la misma madurez en el momento de la cosecha el experimentador registró el porcentaje de materia seca en 100 grs de habas acabadas de cosechar como un índice de madurez. Los resultados obtenidos fueron:
Observación (j) Variedades de habas (i)
1
2
3
4
X Y X Y X Y X Y
1 34.0 93.0 21.0 150.0 51.2 33.3 30.4 106.6
2 38.9 80.8 20.0 160.1 39.3 47.4 29.2 111.4
3 35.4 88.1 20.5 155.2 39.8 51.5 31.7 99.0
4 34.5 90.1 52.0 27.2 28.3 113.8
5 56.2 20.6
Totales 142.8 352.0 61.5 465.3 238.5 180.0 119.6 430.8
Promedios 35.7 88.0 20.5 155.1 47.7 36.0 29.9 107.7
SUMA DE CUADRADOS Y PRODUCTOSTotalSC(X) = X2
ij – X2 ../r. = (34.02 + 38.92 + … + 28.32) – 562.42 /16 = 1800.5
SP(XY) = XijYij – X..Y../r. = (34.0x93.0 +… + 28.3x113.8) – 562.4x1428.1/16 = -7089.845
SC(Y) = Y2ij – Y2../r. = (93.02 + 80.82 + … + 113.82) – 1428.12 /16 = 29506.519
TratamientosTxx = X2
i. /ri – X2 ../r. = (142.82/4 + 61.52/3 + … + 119.62/4) – 562.42 /16 = 1542.84
Txy = Xi.Yi./ri – X..Y../r. = (142.8x352.0/4 +…. + 119.6x430.8/4) – 562.4x1428.1/16
= - 6625.745Tyy = Y2
i./ri – Y2../r. = (352.02/4 + 465.32/3 + … + 430.82/4) – 1428.12 /16 = 28554.339
Error ExperimentalExx = SC(X) – Txx = 1800.5 – 1542.84 = 257.66
Exy = SP(XY) – Txy = - 7089.845 – (- 6625.745) = - 464.1
Eyy = SC(Y) – Tyy = 29506.519 – 28554.339 = 952.18
CUADRO DE ANCOVA EN DCA
Fuentes de Variación
GL SCX SPXY SCY SC aj. GL aj. CM aj.
Tratamientos
3 1542.84-
7089.845
28554.339
Error 12 257.66-
6625.745
952.180 116.238 11 10.5671
Trat. + Error
15 1800.50 - 464.10029506.51
91588.77
314
Diferencias para probar medias de tratamientos ajustadas:
1472.535
3490.845
0
INTERPRETACION DE RESULTADOS
El primer lugar se evalúa los resultados de la prueba de hipótesis correspondiente a la regresión, Y = F(X).
Si la regresión es significativa, entonces, se justifica el control de la variable concomitante X en el modelo y por lo tanto, los efectos de los tratamientos deberán ser ajustados por el efecto de la regresión existente.
De no resultar significativo la regresión, los efectos de los tratamientos deberán ser evaluados a partir de un ANVA de un diseño experimental simple donde no se considere el efecto de la variable concomitante X.
PRUEBA DE HIPOTESIS DE LA REGRESION
Hipótesis
H0: 1 = 0
H1: 1 0
Estadístico de Prueba
Fc = (-464.12)/257.66 / 10.5671 = 79.108
Regla de Decisión La hipótesis nula se rechaza con un nivel de significación si el Fc resulta
mayor que el valor de tabla
2
aj.
XY
XX
EE
FcCME
(1, aj.)GLEF
1 , (trat. aj.), (Error aj.)GL GLF
PRUEBA DE HIPOTESIS DE TRATAMIENTOS
Hipótesis: H0: 1 = 2 = 3 = 4 H1: Algún i es diferente de los demás
Estadístico de Prueba:
Fc = 490.8450 / 10.5671 = 46.45
Regla de Decisión: La hipótesis nula se rechaza con un nivel de significación si el Fc resulta
mayor que el valor de tabla
CM(Trat aj.)
CM(Error aj.)Fc ( trat. aj.), (Error aj.)GL GLF
1 , (trat. aj.), (Error aj.)GL GLF
PRUEBAS DE COMPARACION
Para aplicar las pruebas de comparación de medias de tratamientos se debe trabajar con las medias de los tratamientos ajustadas por la regresión.
En primer lugar, se debe calcular el coeficiente de regresión estimado.
ˆ XY
XX
E
E
b = - 464.1 / 257.65 = - 1.8012
En segundo lugar las medias de los tratamientos se ajustan por efecto de la regresión
aj.ˆ ( )i i iY Y X X
Las desviaciones estándar para las pruebas son:
Prueba t, DLS
Tukey
Dunnet aj. aj.
2( )1 1 aj.
i j
i j
Y Yi j XX
X Xs CME
r r E
aj. aj.
2( ) aj. 1 1
2i j
i j
Y Yi j XX
X XCMEs
r r E
aj. aj.
2( )1 1 aj.
T i
T iY Y
T i XX
X Xs CME
r r E
MODELO ADITIVO LINEAL EN UN DBCA
Donde: Donde: ti ,...,1
( )ij i j ij ijY X X e bj ,...,1
Yij valor o rendimiento observado en el i-ésimo tratamiento, j-ésimo boque.
efecto de la media general.
τi efecto del i-ésimo tratamiento.
j efecto del j-ésimo bloque
Β coeficiente de regresión lineal de Y sobre X
Xij valor de la variable independiente en el i-ésimo tratamiento, j-ésimo bloque X.. media de la variable independiente
Εij efecto del error experimental en el i-ésimo tratamiento, j-ésimo bloque
SUPUESTOS DEL MODELO
Además de los supuestos de un DBCA se deben cumplir los siguientes:
Los valores de X son fijos, medidos sin error, y no son afectados por los tratamientos.
Las variables X y Y deben tener variancias homogéneas entre los tratamientos.
La regresión de Y sobre X debe ser lineal.
CUADRO DE ANCOVA EN DBCA
2XY
E YYXX
ESC E
E
( 1)( 1) 1ESC
t b
2XY
T E YYXX
SSC S
S
T E ESC SC 1
T E ESC SC
t
Fuentes de Variación
GL SCX SPXY SCY SC aj. GL aj. CM aj.
Bloques b – 1 BXX BXY BYY
Trat. t – 1 TXX TXY TYY
Error (t–1)(b–1) EXX EXY EYY (t-1)(b-1)-1
Trat. + Error
b(t – 1) SXX SXY SYY
Diferencias para probar medias de tratamientos ajustadas
t – 1
Ejemplo: ANCOVA EN DBCAEjemplo: ANCOVA EN DBCA
T1 T2 T3 T4 T5 Total
Bloq. X Y X Y X Y X Y X Y X Y
I 20.4 24.6 27.2 32.6 26.8 31.7 22.4 29.1 21.8 27.0118.
6145.
0
II 19.6 23.4 32.0 36.6 26.5 30.7 23.2 28.9 24.3 30.5125.
6150.
1
III 25.1 30.3 33.0 37.7 26.8 30.4 28.6 35.2 30.3 36.4143.
8170.
0
IV 18.1 21.8 26.8 31.0 28.6 33.8 24.4 30.2 29.3 35.0127.
2151.
8
Total
83.2100.
1119.
0137.
9108.
7126.
698.6
123.4
105.7
128.9
515.2
616.9
SUMA DE CUADRADOS Y PRODUCTOSTotalSC(X) = X2
ij – X2 ../ tb = (20.42 + 19.62 + … + 29.32) – 515.22 / 5x4 = 309.79
SP(XY) = XijYij – X..Y.. /tb = (20.4x24.6 +19.6x23.4 + … + 29.3x35.0) – 515.2x616.9 / 5x4 = 325.67
SC(Y) = Y2ij – Y2.. / tb = (24.62 + 23.42 + … + 35.02) – 616.92 / 5x4 = 358.67
BloquesBxx = X2.j / t – X2 ../ tb = (118.62 + 125.62 + … + 127.22) - 515.22 / 5x4 = 68.37
Bxy = X.j Y.j / t – X..Y.. /tb = (118.6x145.0 + …. + 127.2x151.8) - 515.2x616.9 / 5x4 = 69.56
Byy = Y2.j / t – Y2.. / tb = (145.02 + 150.12 + …. + 151.82) - 616.92 / 5x4 = 71.37
TratamientosTxx = X2
i. / b – X2 ../ tb = (83.22 + 119.02 + … + 105.72) - 515.22 / 5x4 = 176.79
Txy = Xi. Yi. / b – X..Y.. /tb = (83.2x100.1 + …. + 105.7x128.9) - 515.2x616.9 / 5x4 = 181.61
Tyy = Y2i. / b – Y2.. / tb = (100.12 + 137.92 + … + 128.92) / 4 - 616.92 / 5x4 = 198.41
Error ExperimentalExx = SC(X) – Bxx – Txx = 309.67 – 68.37– 176.79 = 64.63
Exy = SP(XY) – Bxy – Txy = 325.67 – 69.56 – 181.61 = 74.50
Eyy = SC(Y) – Byy – Tyy = 358.67 – 71.37 – 198.41 = 88.89
CUADRO DE ANCOVA EN DBCA
Fuentes de Variación
GL SCX SPXY SCY SC aj. GL aj. CM aj.
Bloques 3 68.37 69.56 71.37
Tratamientos
4 176.79 181.61 198.41
Error 12 64.63 74.50 88.89 3.0175 11 0.2743
Trat. + Error
16 241.42 256.11 287.30 15.6146
Diferencias para probar medias de tratamientos ajustadas:
12.5971 4 3.1493
En segundo lugar las medias de los tratamientos se ajustan por la regresión
aj.ˆ ( )i i iY Y X X
Las desviaciones estándar para las pruebas son:
Prueba t, DLS
Tukey
Dunnet aj. aj.
2( )1 1 aj.
i j
i j
Y Yi j XX
X Xs CME
r r E
aj. aj.
2( ) aj. 1 1
2i j
i j
Y Yi j XX
X XCMEs
r r E
aj. aj.
2( )1 1 aj.
T i
T iY Y
T i XX
X Xs CME
r r E
Ejemplo: Prueba de Tukey
H0: i aj. = j aj. i j = 1, 2, ... 5, con i j
H1: i aj. j aj.
74.50ˆ 1.152764.63
XY
XX
E
E
1 20.8X 2 29.75X 3 27.175X 4 24.65X 5 26.425X 25.76X
1 25.025Y 2 34.475Y 3 31.65Y 4 30.85Y 5 32.225Y
1 aj. 30.74Y 2 aj. 29.88Y 3 aj. 30.02Y 4 aj. 32.13Y 5 aj. 31.46Y
El valor de tabla con = 5%, p = 5 tratamientos y 11 grados de libertad para el error ajustado es AES(T) = 4.57
donde b = 4 para todos los tratamientos, CME aj. = 0.2743 y EXX = 64.63
ALS(T) = AES(T)
2( ). 1 1
2i j
i j XX
X XCMEaj
r r E
aj. aj.i jY Y Tratamientos comparados
Sd ALS(T) Significancia
1 y 2 0.867 0.488 2.232 n.s.
1 y 3 0.724 0.393 1.798 n.s.
1 y 4 1.387 0.316 1.445 n.s.
1 y 5 0.716 0.368 1.684 n.s.
2 y 3 0.143 0.287 1.314 n.s.
2 y 4 2.254 0.352 1.608 *
2 y 5 1.583 0.303 1.386 *
3 y 4 2.111 0.287 1.310 *
3 y 5 1.440 0.264 1.207 *
4 y 5 0.671 0.274 1.254 n.s.
Ejemplo:
En un estudio para evaluar los efectos de cuatro tipos de abono sobre el rendimiento de caña de azúcar, se realizó un experimento en el cual se usaron 4 bloques, obteniéndose los siguientes resultados:
Y = % de azúcar por caña X = % de fibra por caña
F.V. G.L. x2 xy x2 G.L.’ S.C.’ C.M.’
TotalBloque
sAbonosError
31.0 -30.9 40.010.0 - 9.0 14.015.0 -16.5 21.0 6.0 - 5.4 5.0
a) Efectúe la prueba de medias ajustadas de abonos, para = 0.05b) Encuentre e interprete el valor del coeficiente de regresión estimadoc) Hallar las medias ajustadas de abonos, suponiendo que los promedios para abonos son: Promedio (y) : 18 12 20 10 Promedio (x) : 16 18 10 12
BIBLIOGRAFÍA
Box, G.E.P.; Hunter, W.G. & Hunter, J.S. Estadística para Investigadores. Introducción al diseño de experimentos, análisis de datos y construcción de modelos. Ed. Reverté, Barcelona. 1989.
Eyzaguirre Pérez, Raul. Guía de Métodos Estadísticos para la Investigación I. Dpto. de Estadística e Informática. UNA La Molina. 2004
Kuehl, R. Diseño de Experimentos. Principios estadísticos para el diseño y análisis de investigaciones. Thomson Editores. México. 2000
Montgomery, C. Diseño y Análisis de Experimentos. Grupo Editorial Iberoamerica. 2002.2da Edición
Vicente, Lina & Otros. Diseño de Experimentos. Soluciones con SAS y SPSS. Pearson. Prentice Hall. 2005.