Download - Bloques y Otros Vf
Bloques
• Definición:
– Bloque: Un “grupo” de unidades experimentales que se sabe antes
del experimento a ser similares en alguna manera y se espera que
influya en la variable de respuesta.
• Bloques se escogen para:
– Maximizar variación bloque a bloque.
– Minimizar variación entre unidades experimentales dentro de cada
bloque.
• Objetivo:
– Separar la variabilidad de bloque a bloque del error experimental con
el fin de lograr una comparación mas sensitiva de los promedios de
los tratamientos.
2
El Principio de Bloques
• Bloquear es una técnica para tratar con factores perturbadores.
• Un factor perturbador es aquel que probablemente tenga algún efecto en la respuesta, pero no es de interés al experimentador. Sin embargo, la variabilidad que transmite a la respuesta necesita ser minimizada.
• Típicos factores perturbadores incluyen lotes (batches) de materia prima, operadores, partes de equipos de prueba, tiempo (turnos, días, etc.), unidades experimentales diferentes.
• Muchos experimentos industriales involucran bloques (o deberían).
• No bloquear es una falla común en diseñar un experimento
(¿consecuencias?).
3
El Principio de Bloques
• Si la variable perturbadora es conocida y controlable, usamos
bloques.
• Si el factor perturbador es conocido y no controlable, se puede
usar el análisis de covarianza para remover el efecto del factor
perturbador del análisis.
• Si el factor perturbador es desconocido y no controlable (se
desconoce esa variable), se espera que la aleatorización
balancee su impacto en todo el experimento.
• Algunas veces, varias fuentes de variabilidad son combinadas en
un bloque, de modo que el bloque llega a ser una variable
agregada.
4
Experimentos con Bloques Aleatorizados (cont)
• Diferencias en un experimento con bloques aleatorizados
– Unidades experimentales clasificadas en “bloques” .
– Para cada bloque, la variable de respuesta es recolectada para todos los
tratamientos.
– Métodos de análisis remueven efectos observados de bloques antes de
probar la igualdad de medias.
• Ejemplos de factores de bloques comunes:
– Personas, grupo socio-económico, grupo de edad, genero, región
geográfica.
– Cliente, producto, suplidor.
– Centro de distribución, bodega, numero de la semana.
5
• Bloquear es una técnica para hacer una comparación mas precisa en la
presencia de variabilidad.
• Ejemplos de bloques: Lotes de fabricas, lotes de ensambles, lotes de
material, equipos, operarios, días, etc.
Bloquear
– Unidades que pertenecen al
mismo bloque son mas
similares que las unidades de
bloques diferentes.
– Comparar tratamientos o
procesos dentro de cada
bloque.
Block 1 Block 2 Block 3
Process 2
Process 1
6
Procedimientos de Aleatorización
• Asigne aleatoriamente las unidades experimentales dentro
de un bloque a los k tratamientos.
• Dentro de cada bloque, aleatorice el orden en el cual los
tratamientos son administrados.
• Si es posible, aleatorice el orden en el cual los bloques son
corridos (no es esencial como la aleatorización dentro de
los bloques).
7
Ejemplo Motocicleta: Bloquear
• Diseño 3: Combinación de Factores
– Incluir múltiples conductores, motocicletas y rutas.
– Considerar cada viaje de motocicleta como un bloque.
– Aleatoriamente asignar una llanta de cada tipo a la llanta
delantera y trasera de cada motocicleta.
– Rotar las llantas en la mitad de cada viaje.
• ¿Cuál es el beneficio del diseño de bloques?
A
A
A
A
A
B
B
B
B
B
8
Ejemplo Motocicleta: Bloques
¿Puede usted detectar en este
grafico cual material es mejor?
Graficar los datos en una manera diferente.
¿Puede usted determinar cuál material es mejor ahora?
¿Qué hace mas fácil ver la diferencia?
9
Extensión del ANOVA a los Diseños de Bloques
Completamente Aleatorizados (DBCA)
• Suponga que hay a tratamientos (niveles de factor) y b
bloques.
• Un modelo estadístico (modelo de efectos) para el
DBCA es:
1,2,...,
1,2,...,ij i j ij
i ay
j b
10
Análisis de Experimentos con Bloques
Aleatorizados
• ANOVA de dos vías es usada para:
– Particionar al suma total de cuadrados en tres componentes :
SSTotal = SSTratamientos + SSBloques + SSError
– Probar H0 vs. H1 usando la prueba F
Error
ErrorError
Treatment
TreatmentTreatment
Error
Treatment
df
SSMS
df
SSMS
MS
MSF
;
;
11
SSTotalbk-1Total
MSE= SSE /(b-1)(k-1)SSE(b-1)(k-1)Error
p (>Fcalc)MSTrt /MSEMSTrt=SSTrt / k-1 SSTrt
k-1Treatments
MSBlk=SSBlk / b-1SSBlkb-1Blocks
P-valueF-stat
(Fcalc)
Mean SquareSum of SquaresdfSource
SSTotalbk-1Total
MSE= SSE /(b-1)(k-1)SSE(b-1)(k-1)Error
p (>Fcalc)MSTrt /MSEMSTrt=SSTrt / k-1 SSTrt
k-1Treatments
MSBlk=SSBlk / b-1SSBlkb-1Blocks
P-valueF-stat
(Fcalc)
Mean SquareSum of SquaresdfSource
Análisis de Experimentos con Bloques Aleatorizados(cont)
Tabla ANOVA Dos Vías
Source df Sum of
Squares
Mean Squares F-Stat
(Fcalc)
P-value
Treatments K - 1 SSBetween MSBetween = SSWithin / K - 1 MSBetween /
MSWithin
P (>FCalc)
Error nTotal - K SSWithin MSWithin = SSWithin / nTotal - 1
Total nTotal - 1 SSTotal SSTotal / nTotal - 1
Nueva fila correspondiente a la nueva variable
Tabla ANOVA Una Vía
12
Extensión del ANOVA a los DBCA
• Particionamiento de ANOVA de la variabilidad total:
2
.. . .. . ..
1 1 1 1
2
. . ..
2 2
. .. . ..
1 1
2
. . ..
1 1
( ) [( ) ( )
( )]
( ) ( )
( )
a b a b
ij i j
i j i j
ij i j
a b
i j
i j
a b
ij i j
i j
T Treatments Blocks E
y y y y y y
y y y y
b y y a y y
y y y y
SS SS SS SS
13
Extensión de ANOVA a los DBCA
• Los grados de libertad para las sumas de cuadrado en
son las siguientes:
• Por tanto, las razones de suma de cuadrados a sus grados de
libertad resulta en cuadrados medios y la razón del cuadrado
medio de tratamientos con el error medio cuadrado es un
estadístico F que puede ser usado para probar la hipótesis de
igualdad de medias de tratamientos.
T Treatments Blocks ESS SS SS SS
1 1 1 ( 1)( 1)ab a b a b
14
Otros aspectos del Diseño de Bloques
• El DBCA utiliza un modelo aditivo – no hay interacción entre tratamientos y bloques.
• Tratamientos y/o bloques como efectos aleatorios.
• Valores faltantes.
• ¿Cuáles son las consecuencias de no bloquear si no lo hiciéramos?
• Tamaño de muestra en DBCA. El procedimiento de la COpuede ser usado para determinar el número de bloques a correr.
15
16
Hipótesis Estadística
• Si queremos probar la hipótesis:
H0: 1 = 2 = = k
vs.
H1: no todas las k son iguales
Experimentos con Bloques Aleatorizados
Meta del Diseño
– Determinar si hay diferencias significativas entre las medias de los
k tratamientos .
– Misma meta como las pruebas de medias de k muestras
independientes.
– Específicamente, las hipótesis a probar:
Means Test
H0: 1 = 2 = = k
vs.
H1: no todas las k
son iguales
17
18
Análisis de Varianza (ANOVA)
ANOVA particiona la variabilidad total, o suma de cuadrados (SS), en fuentes diferentes
Variación debido a
Tratamientos SStrt
Variación debido a
muestreo aleatorio SSe
Variación Total SSTotal
= + ?+Variación debido
a Bloques SSblk
20
Prueba F
• Test Estadístico
• Cuando H0 es verdadera, el estadístico F sigue una
distribución F con k-1 y (b-1)(k-1) grados de libertad
Si H0 es verdadera, entonces todas las
observaciones se comportan como una muestra
aleatoria de una sola población, de modo que el F
calculado debe estar cercano a 1.
Treatment
Error
MSF
MS
21
Criterio de Decisión F-test
Calcular Valor P
Rechazar Ho
Concluir no todas las i’s son
iguales
Se falla rechazar Ho
Concluir H0: 1=2=…=k
P-value > aP-value < a
Práctica
A continuación se muestra parte del ANOVA
para un diseño en bloques, que tiene tres
tratamientos y cinco bloques con una sola
repetición por tratamiento-bloque.
Ejemplo Desgaste de Llantas
23
Considere el problema de determinar si diferentes tipos de material
para hacer llantas presentan diferentes cantidades de pérdida de
espesor después de 32,000 km de manejo. Un gerente de una
compañía desea considerar cuatro diferentes materiales para hacer
llantas y tomar una decisión sobre cuál material podría mostrar la
cantidad mínima de desgaste después del periodo de manejo. Los
materiales a considerar son A, B, C, y D. Aunque las condiciones de
manejo podrían simularse en un laboratorio, él desea probar estos
cuatro materiales bajo condiciones actuales de manejo.
24
Ejemplo Desgaste de Llantas
• Un fabricante de llantas desea comparar los cuatro materiales
diferentes para hacer las llantas.
– Material A: Estándar
– Material B: Mas barato
– Material C: Competidor 1
– Material D: Competidor 2
• A ellos les gustaría cambiar al material B pero quieren estar seguros
que este material no es inferior al material estándar o al de los
competidores.
• La variable de respuesta es Yij es la diferencia en espesor en
milésimas (0.001 mm) y el único factor de interés es marca, o sea j
dónde j = 1, 2 , 3, 4
25
Ejemplo Desgaste de Llantas
• 4 carros representando diferentes marcas, modelos y
tamaños están disponibles.
• ¿Cómo se debe diseñar este experimento?
26
Diseño de Bloques Aleatorizados
• Incluir una llanta de cada uno de los 4 tipos de
materiales en cada carro.
• Aleatorice la asignación del tipo de material a la posición
de la llanta en cada carro.
• Maneje los carros por el numero especificado de km,
luego medir el desgaste en cada llanta.
• ¿Cuáles son los bloques?
La meta del diseño aleatorizado de bloques es separar la
variabilidad de bloque a bloque cuando se comparan
tratamientos al comparar tratamientos dentro de cada
bloque.
27
Ejemplo Desgaste de Llantas: Datos
¿Son las diferencias debido al tipo de
material o solo por variación aleatoria?
28
Lo que no se debe hacer
• ¿Se puede identificar cuales materiales son diferentes?
• ¿Qué es lo que hace difícil detectar cualquier diferencia, si existe?
DCBA
17
16
15
14
13
12
11
10
9
8
Tipo Material
De
sg
aste
29
Hipótesis Estadística
• Se quiere probar la hipótesis:
H0: 1 = 2 = = k
vs.
H1: no todas las i son iguales
La media verdadera de
desgaste es la misma para
los materiales A, B, C y D
No todos los materiales
tienen la misma media
verdadera de desgaste.
30
Lo que si se debe hacer
• ¿Se puede detectar ahora si los materiales son
consistentemente diferentes de cada uno?
• ¿Porqué las diferencias son mas fáciles de ver en este
grafico?
Graficar tratamientos dentro de cada bloque.
4,03,53,02,52,01,51,0
17
16
15
14
13
12
11
10
9
8
Carro
Y (
De
sga
ste
)
A
B
C
D
MARCA
Ejemplo Desgaste de Llantas
Two-way ANOVA: Y versus CARRO. MARCA
Source DF SS MS F P
CARRO 3 38,6875 12,8958 10,04 0,003
MARCA 3 30,6875 10,2292 7,96 0,007
Error 9 11,5625 1,2847
Total 15 80,9375
S = 1,133 R-Sq = 85,71% R-Sq(adj) = 76,19%
Rechazar Ho.
Existen diferencias significativas
entre tratamientos.
Al menos algún material es
diferente.
Se pueden realizar comparaciones
múltiples.
31
Ejemplo Desgaste de Llantas
• Método Tukey
DCBA
14,5
14,0
13,5
13,0
12,5
12,0
11,5
11,0
MARCA
De
sg
asteTukey Simultaneous Tests
Response Variable Y
All Pairwise Comparisons among Levels of
MARCA
MARCA = A subtracted from:
Difference SE of Adjusted
MARCA of Means Difference T-Value P-Value
B -2,000 0,8015 -2,495 0,1274
C -3,500 0,8015 -4,367 0,0080
D -3,250 0,8015 -4,055 0,0125
MARCA = B subtracted from:
Difference SE of Adjusted
MARCA of Means Difference T-Value P-Value
C -1,500 0,8015 -1,872 0,3041
D -1,250 0,8015 -1,560 0,4452
MARCA = C subtracted from:
Difference SE of Adjusted
MARCA of Means Difference T-Value P-Value
D 0,2500 0,8015 0,3119 0,9888
32
C D B A
Material A es significativamente
peor que el Material C y D.
Materiales C y D presentan los valores
menores de desgaste. Son equivalentes.
Adecuación del Modelo
210-1-2
99
90
50
10
1
Residual
Pe
rce
nt
N 16
AD 0,352
P-Value 0,423
161412108
1
0
-1
-2
Fitted Value
Re
sid
ua
l
1,00,50,0-0,5-1,0-1,5-2,0
4
3
2
1
0
Residual
Fre
qu
en
cy
16151413121110987654321
1
0
-1
-2
Observation Order
Re
sid
ua
l
Normal Probability Plot Versus Fits
Histogram Versus Order
Residual Plots for Y
D
C
B
A
181614121086420
MA
RC
A
95% Bonferroni Confidence Intervals for StDevs
Test Statistic 1,45
P-Value 0,694
Test Statistic 0,16
P-Value 0,923
Bartlett's Test
Levene's Test
Prueba de Homogeneidad de Varianzas
Se cumplen las suposiciones del modelo.
33
Ejemplo Desgaste de Llantas
• Diseño de Cuadrados Latinos:
CARRO
Posición I II III IV
1 C (12) D (11) A (13) B (8)
2 B (14) C (12) D (11) A (13)
3 A (17) B (14) C (10) D (9)
4 D (13) A (14) B (13) C (9)
34
• Modelo Estadístico:
Yijk = + i + j + k + ijk
35
Resumen de Experimentos con Bloques Completamente
Aleatorizados
• Especificar las hipótesis experimentales y los riesgos del error:
H0 : 1 = 2 = … = k vs. H1: No todas las ’s son iguales.
• Determine el numero bloques para el numero de tratamientos y el
cambio a detectar.
• Conduzca el experimento.
• Grafique los datos, revise diferencias y valores atípicos.
• Si hay diferencias significativas entre las medias, utilice un
procedimiento de comparaciones múltiples para determinar cuales
medias son diferentes.
• Revise adecuación del modelo: normalidad de residuos,
independencia y homogeneidad de varianzas.
El Diseño de Cuadrados Latinos
• Estos diseños son usados para controlar simultáneamente (o eliminar) dos fuentes de variabilidad perturbadora.
• Una suposición significativa es que los tres factores (tratamientos, factores perturbadores) no interactúan.
• Si esta suposición es violada, los Cuadrados Latinos no
producirán resultados válidos
36
El problema de la carga propulsora – Un
diseño de Cuadrados Latinos
• Este es un diseño de cuadrados latinos de 5 x 5
37
Análisis Estadístico del Diseño de
Cuadrados Latinos
• El modelo estadístico (efectos) es:
• El análisis estadístico (ANOVA) es muy parecido al análisis para los DBCA.
1,2,...,
1,2,...,
1,2,...,
ijk i j k ijk
i p
y j p
k p
38