diseño factorial
TRANSCRIPT
Diseños ExperimentalesDiseños Experimentales
Prof. Enit Huamán Cotrina
EXPERIMENTAR VS. ANALIZAR DATOS EXISTENTES
¿Es realmente necesario ¿Es realmente necesario
hacer experimentos?hacer experimentos?
¿¿No se podría llegar a las No se podría llegar a las mismas conclusiones mismas conclusiones
analizando analizando convenientemente los convenientemente los
datos disponibles?datos disponibles?
Prof. Enit Huamán Cotrina
INTRODUCCIÓN AL DISEÑO EXPERIMENTAL
Un experimento diseñado es una prueba o serie de pruebas en las cuales se
inducen cambios deliberados en las
variables de entrada de un proceso o sistema, de manera que sea posible
observar e identificar las causas de los cambios en
la respuesta de salida.
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
PRINCIPIOS BÁSICOS
Cualquier problema experimental involucra dos aspectos: El diseño del experimento y El diseño del experimento y el análisis estadístico de los el análisis estadístico de los
datosdatos. Estos dos temas están estrechamente ligados , ya que el método de análisis depende del diseño empleado
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
Riesgos de analizar datos cuya recogida no fue planificada
Datos inconsistentesDatos inconsistentes.
Por cambios debidos al tiempo, envejecimiento, reparaciones, etc. Esto provoca que los datos recogidos no sean consistentes lo que obviamente traerá confusiones en la interpretación.
Prof. Enit Huamán Cotrina
Variables altamente correlacionadas.Variables altamente correlacionadas.
Cuando dos variables del proceso están correlacionadas, se pueden producir dos tipos diferentes de situación engañosa al analizar datos recogidos durante las operaciones habituales.
1. Confusión de los efectos.
2. Relación no causal. Variable oculta.
Prof. Enit Huamán Cotrina
VariableVariable11
VariableVariable22
Variable3Variable3
Relación no Relación no causalcausal
VariableVariable11VariableVariable22
Variable3Variable3
ConfusiónConfusión
Prof. Enit Huamán Cotrina
EXPERIMENTO DE UN SOLO FACTOR
Supongamos que el experimentador cuenta con los resultados de k muestras aleatorias independientes, cada una de tamaño n, de k diferentes poblaciones (esto es, datos relativos a k tratamientos, k grupos, k métodos de producción, etc.) y le interesa probar la hipótesis de que las medias de esas k poblaciones son todas iguales.
Prof. Enit Huamán Cotrina
Diseño completamente aleatorizado
Un diseño completamente aleatorizado para comparar k medias de tratamientos es uno en el que los tratamientos se asignan aleatoriamente a las unidades experimentales, o en que se extraen muestras aleatorias independientes de cada una de las k poblaciones.
Prof. Enit Huamán Cotrina
Tratam. Muestra
Tratam.1 Tratam.2 . . . Tratam.k Total
1 2 3 . . . ni
y11 y12 y13 . . .
1n1y
y21 y22 y23 . . .
2n1y
. . .
. . .
. . .
. . .
. . .
. . .
. . .
yk1 yk2 yk3 . . .
kn1y
y.1 y.2 y.3 . . .
n1y
Total y1. y2. . . . yk. y..
EXPERIMENTO DE UN SOLO FACTOR
Prof. Enit Huamán Cotrina
EXPERIMENTO DE UN SOLO FACTOR
Modelo linealModelo lineal
donde:
yij : La j- ésima observación en la i-ésima muestra : Parámetro de la media poblacional.i : Efecto del i-ésimo tratamiento.
ij : Error aleatorio asociado a la observación yij, donde ij ~ N(0,2)
n ..., 2, 1, j ;k .., . 2, 1, i paray ijiij
Prof. Enit Huamán Cotrina
Tabla del análisis de varianzaFuente de variación
Grados de libertad Suma de cuadrados Cuadrado medio Fc
Tratamientos k – 1
n
y
n
yk
i i
i2
1
2
SC(Tr) 1
SC(Tr)CM(Tr)
k
Error n. – k SC(Tr)SCTSCE kn
SCECME
Total
n. – 1
n
yy
k
i
n
jij
2
1 1
2SCT
CME
)Tr(CM
Prof. Enit Huamán Cotrina
Ejemplo. Las cifras siguientes representan el número de errores cometidos, en cinco días consecutivos de trabajo, por cuatro técnicos de un laboratorio fotográfico:
Prueba con un nivel de significancia si las diferencias entre las cuatro muestras pueden atribuirse al azar.
DíaTécnico
ITécnico
IITécnico
IIITécnico
IV1 6 14 10 152 14 16 12 123 10 15 7 144 8 14 15 105 11 15 11 13
Suma 49 74 55 64
Prof. Enit Huamán Cotrina
Utilizando el MSExcel
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
Origen de las variaciones
Suma de cuadr.
Grados de libertad
Promedio de los
cuadradosF
Probabilidad
Entre grupos 71.4 3 23.8 4.3077 0.0208Dentro de los grupos
88.4 16 5.525
Total 159.8 19
ANÁLISIS DE VARIANZA
Prof. Enit Huamán Cotrina
Número de errores por técnico
11
12.814.8
9.8
02468
10121416
Técnico I Técnico II Técnico III Técnico IV
N°e
rror
es
Prof. Enit Huamán Cotrina
Estimación de los parámetros del modelo
Para el modelo
Los estimadores de la media global y de los efectos de los tratamientos está dado por:
ijiijy
k,...,2,1iyyˆ
..yˆ
...ii
Prof. Enit Huamán Cotrina
Intervalos de confianza
La media del tratamiento i-ésimo es:
Un intervalo de confianza de (1-)x100%
para la media del tratamiento i-ésimo es:
ii
k
CMEty
k
CMEty )]1n(k,2/[.ii)]1n(k,2/[.i
Prof. Enit Huamán Cotrina
Intervalos de confianza
Un intervalo de confianza de (1-)x100%
para la diferencia en las medias de dos
tratamientos cualesquiera, por ejemplo, i -
j, será:
k
CME2tyy)(LC )]1n(k,2/[.j.iji
Prof. Enit Huamán Cotrina
Ej.:Utilizando los datos del número de errores cometidos, las estimaciones de la media global y de los efectos de los tratamientos son:
7.01.128.12yyˆ
1.11.120.11yyˆ
7.21.128.14yyˆ
3.21.128.9yyˆ
1.1220
242ˆ
...44
...33
...22
...11
Prof. Enit Huamán Cotrina
Un intervalo de confianza de 95% para la media del tratamiento 1.
Un intervalo de confianza de 95% para la diferencia de las medias de los tratamientos 1 y 2, es:
03.1257.75
525.5120.28.9
5
525.5120.28.9
1
1
85.115.85
)525.5(2120.2)8.148.9(
5
)525.5(2120.2)8.148.9(
21
1
Prof. Enit Huamán Cotrina
Comparaciones de rango múltiple de Duncan
La prueba compara el rango de cualquier conjunto de p medias con un apropiado rango de mínima significación, Rp, dado por
Aquí Sx es una estimación de y se calcula
con la siguiente forma:
El valor de rp depende de del nivel deseado de significación y del número de grados de libertad correspondiente al CME
pXp r.SR
n/X
n
CMESx
Prof. Enit Huamán Cotrina
EjemploEjemplo. Los siguientes datos corresponden a las mediciones de los pesos de recubrimiento de estaño de discos por cuatro laboratorios diferentes.
Laboratorio A Laboratorio B Laboratorio C Laboratorio D
0.250.330.220.300.270.280.320.240.310.260.200.28
0.180.280.210.230.250.200.270.190.240.220.290.16
0.190.250.270.240.180.260.280.240.250.200.210.19
0.230.300.280.280.240.340.200.180.240.280.220.21
Media0.272 0.227 0.230 0.250
Prof. Enit Huamán Cotrina
Tabla de ANOVA
FV GL SS CM Fc Ft
Labor.Error
344
0.01560.0728
0.00520.0017
3.133 2.82
Total 47 0.0884
Prof. Enit Huamán Cotrina
Sol1. Ordenar los promedios de menor a mayor.
Lab.Lab. BB CC DD AA
Media.Media. 0.2270.227 0.2300.230 0.2500.2500.2720.272
2. Calcule3. Seleccione rp
3. Seleccione Rp
0119.0Sx
PP 22 33 44
rprp 2.852.85 3.003.00 3.093.09
PP 22 33 44
RpRp 0.0340.034 0.0360.036 0.0370.037
Prof. Enit Huamán Cotrina
4 medias.0.272-0.227=0.045>0.037 *3 medias.CDA: 0.272-0.23=0.042>0.036 *BCD:0.25-0.227=0.023<0.036 N.S2 medias.BC. 0.23-0.227=0.003<0.034 NSDC:0.25-0.23=0.02<0.034 NSAD: 0.272-0.25=0.022<0.034 NS
Prof. Enit Huamán Cotrina
RESUMENRESUMEN
B C D A
0.227 0.23 0.25 0.272
Prof. Enit Huamán Cotrina
Verificación de la adecuación del modelo
Supuestos
El modelo describe adecuadamente las observaciones.
Los errores tienen distribución normal e independiente con media cero y con varianza constante 2.
ijiijy
Examen de residuales
Prof. Enit Huamán Cotrina
Residuales
.i
...i..
iij
ijijij
y
)yy(y
ˆˆy
donde
yye
Prof. Enit Huamán Cotrina
Supuesto de Normalidad
Gráficos.HistogramaGráfico de probabilidad normal (PP)
Pruebas de hipótesisKolmogorov-SmirnovJi Cuadrado
Prof. Enit Huamán Cotrina
Varianzas constantes
GráficosResiduales vs. Valores ajustados (identificar patrones)
PruebasPrueba de Levene modificada (ANOVA)
¡Problema serio si el modelo es de efectos aleatorios!
Prof. Enit Huamán Cotrina
10 11 12 13 14 15
-4
-3
-2
-1
0
1
2
3
4
5
Fitted Value
Res
idua
lResiduals Versus the Fitted Values
(response is errores)
Prof. Enit Huamán Cotrina
ANALISIS DE DATOS BLOQUEADOS
Se supone que el experimentador tiene a su disposición mediciones relativas a “a” tratamientos distribuidos sobre “b” bloques. En primer término, consideraremos el caso en que hay exactamente una observación de cada tratamiento en cada bloque.
Prof. Enit Huamán Cotrina
Bloques T1 T2 T3 ... Ti ... Ta
B1 y11 y21 y31 ... yi1 ... ya1
. . . . ... . ... . .
. . . . ... . ... . .
. . . . ... . ... . .
. . . . ... . ... .
Totales ... ...
Bb y1b y2b y3b ... yib ... Yab
... yij ... yajBj Y1j y2j y3j
B3 y13 y23 y33 ... yi3 ... ya3
TratamientosTotales
B2 y12 y22 y32 ... yi2 ... ya2
1.y
2.y
3.y
jy.
by.
.1y .2y .3y .iy .ay ..y
Prof. Enit Huamán Cotrina
El modelo
donde:
yij :es la observación relativa al i-ésimo tratamiento del j-ésimo bloque.
: es la gran media
i : es el efecto del i-ésimo tratamiento.
j: es el efecto del j-ésimo bloque.
ij: es el error aleatorio correspondiente a la observación yij
ijjiijy
bjai ,...,2,1 ; ,...,2,1 para
Prof. Enit Huamán Cotrina
Dos restricciones
0
y0
b
1jj
a
1ii
Prof. Enit Huamán Cotrina
Sumas de cuadrados
SSB)Tr(SSSSTSSE
ab
y
a
ySSB
ab
y
b
y)Tr(SS
ab
yySST
2..
b
1j
2j.
2..
a
1i
2.i
a
1i
2..
b
1j
2ij
Prof. Enit Huamán Cotrina
Fuente de
variac.Grados de libertad
Suma de cuadrad.
Cuadrado
medio F
Tratam. a - 1 SS(Tr) CM(Tr) CM(Tr)/CME
Bloques b - 1 SSB CMB CMB/CME
Error (a - 1)(b - 1) SSE CME
Total ab - 1 SST
TABLA DE ANOVA
Prof. Enit Huamán Cotrina
EjemploSe han tomado muestras de aguas subterráneas de cinco diferentes zonas de depósito de aguas tóxicas por cada una de tres laboratorios: la EPA, la compañía propietaria de los lugares de depósito y un asesor independiente dedicados a asuntos de ingeniería. Cada muestra fue analizada buscando detectar la presencia de cierto contaminante por todos los métodos de laboratorio que la agencia que recolectó la muestra suele emplear. Se consideraron los siguientes resultados:
Prof. Enit Huamán Cotrina
A B C D E
Lab. 1 23.8 7.6 15.4 30.6 4.2
Lab. 2 19.2 6.8 13.2 22.5 3.9
Lab. 3 20.9 5.9 14.0 27.1 3.0
Lugar
¿Existe alguna razón para creer que las agencias no son, en sus mediciones, consistentes entre sí? ¿Difiere una zona de depósito con respecto a cualquier otra en su nivel de contaminación?
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
Prof. Enit Huamán Cotrina
Origen de las
variaciones
Suma de cuadrados
Grados de
libertad
Promedio de los
cuadradosF Probab.
Filas 26.572 2 13.286 4.840 0.042
Columnas 1117.263 4 279.316 101.748 0.000
Error 21.961 8 2.745
Total 1165.796 14
ANÁLISIS DE VARIANZA
Prof. Enit Huamán Cotrina
EXPERIMENTOS FACTORIALES
Definiciones.Definiciones.Usualmente en los experimentos se desea estudiar el efecto de dos o más factores.Por diseño factorial se entiende que en cada ensayo o réplica completa del experimento se investigan todas las combinaciones posibles de los niveles de los factores.
Prof. Enit Huamán Cotrina
Por ejemplo. Factor A: “a” nivelesFactor A: “a” niveles Factor B: “b” nivelesFactor B: “b” niveles
Entonces cada réplica puede contener todas la abab combinaciones de los tratamientos.
Prof. Enit Huamán Cotrina
MODELOS
Modelo de efectos fijos
Modelo de efectos
aleatorios
Modelo mixto
Prof. Enit Huamán Cotrina
Efectos fijos
Cuando el investigador sólo está interesado en estudiar ciertos niveles de los factores ciertos niveles de los factores involucrados y por lo tanto la involucrados y por lo tanto la selección no es aleatoriaselección no es aleatoria. Los resultados sólo serán útiles para los niveles considerados en el estudio.
Prof. Enit Huamán Cotrina
Efectos aleatorios
Cuando el investigador está interesado en un gran número de posibles niveles, y no es posible estudiarlos todos, la mejor manera de estudiarlos, es seleccionar seleccionar aleatoriamente una cantidad de niveles de la aleatoriamente una cantidad de niveles de la población de niveles de cada factor en estudiopoblación de niveles de cada factor en estudio. Los resultados podrán generalizarse para toda población de niveles.
Prof. Enit Huamán Cotrina
Efectos mixtos
Cuando los niveles de algunos de los algunos de los factores son elegidos aleatoriamente y factores son elegidos aleatoriamente y mientras que otros niveles de los otros mientras que otros niveles de los otros factores, también considerados en el factores, también considerados en el estudio, son fijados por el investigadorestudio, son fijados por el investigador.
Prof. Enit Huamán Cotrina
Efecto de un factor o efecto Efecto de un factor o efecto principalprincipal
Es el cambio en la respuesta media producido Es el cambio en la respuesta media producido por un cambio en el nivel del factor.por un cambio en el nivel del factor.Por ejmplo. Consideremos el diseño factorial 22. Es decir el diseño tiene dos factores y cada factor tiene dos niveles: bajo (-) y alto(+)
Prof. Enit Huamán Cotrina
-(Bajo)
+(Alto)
-(Bajo)
+(Alto)
40
20
30 52
Factor Factor AA
Fact
or
BFa
ctor
BExperimento factorial de dos factores con la respuesta (y) indicada en los vértices
Factor AFactor A-- ++
B-
B-
B+
B+
Resp
ues
Resp
ues
tata
Prof. Enit Huamán Cotrina
Cálculo del Efecto Principal A
Cuando el factor A se incrementa del nivel bajo al alto se produce un incremento de la respuesta promedio de 21 unidades.
212
3020
2
5240A
Prof. Enit Huamán Cotrina
Cálculo del Efecto Principal B
Cuando el factor B se incrementa del nivel bajo al alto se produce un incremento de la respuesta promedio de 11 unidades.
112
4020
2
5230B
Prof. Enit Huamán Cotrina
-(Bajo)
+(Alto)
-(Bajo)
+(Alto)
50
20
40 12
Factor Factor AA
Fact
or
BFa
ctor
B
Experimento factorial de dos factores con interacción
Factor AFactor A-- ++
B-
B-
B+
B+
Resp
ues
Resp
ues
tata
Prof. Enit Huamán Cotrina
Con el nivel bajo del factor B (o B-), el efecto de A es:
Con el nivel alto del factor B (o B+), el efecto de A es:
El efecto de A depende de los niveles de B, por lo tanto existe una interacción entre A y B.
302050A
284012A
292
)3028(AB
Prof. Enit Huamán Cotrina
DISEÑO FACTORIAL DE DOS FACTORES
En la práctica se suele trabajar con diseños de dos factores, A y B, donde cada factor tiene dos o más niveles.
Hay “a” niveles del factor A y “b” niveles del factor B y cada una de las “n” réplicas del experimento contiene ab combinaciones de los tratamientos
Prof. Enit Huamán Cotrina
EjemploEjemplo. Un ingeniero está diseñando una batería que se usará en un dispositivo el cuál se someterá a variaciones de temperatura extrema. El único parámetro de diseño que puede seleccionar en este punto es el material de la placa o ánodo de la batería y tiene tres elecciones posibles. Cuando el dispositivo esté fabricado y se envíe al campo, el ingeniero no tendrá control sobre las temperaturas extremas en las que operará el dispositivo, pero sabe por experiencia que la temperatura probablemente afectará la vida efectiva de la batería.
Prof. Enit Huamán Cotrina
El ingeniero decide probar probar los tres
materiales de la placa con tres niveles de
temeparatura, 15, 70 y 125°F, ya que estos
niveles de temperatura son consistentes con
el medio ambiente donde se usará finalmente
el producto. Se prueban cuatro baterías con
cada combinación del material de la placa y la
temperatura, y las 36 pruebas se corren de
manera aleatoria. La tabla siguiente muestra
los resultados obtenidos.
Prof. Enit Huamán Cotrina
Datos de la vida (en horas) de las baterías
130 155 34 40 20 70
74 180 80 75 82 58
150 188 136 122 25 70
159 126 106 115 58 45
138 110 174 120 96 104
168 160 150 139 82 60
15 °F 70 °F 125 °F
TemperaturaTipo
de
M1
M2
M3
Prof. Enit Huamán Cotrina
¿Qué efectos tienen el tipo de material y la temperatura sobre la
vida de la batería?
¿Qué efectos tienen el tipo de material y la temperatura sobre la
vida de la batería?
Prof. Enit Huamán Cotrina
Modelo de los efectosLas observaciones de un experimento factorial pueden describirse con el siguiente modelo.
n,...,2,1k
b,...,2,1j
a,...,2,1i
:donde
)(y ijkijjiijk
Prof. Enit Huamán Cotrina
Donde es el efecto promedio global, i es el efecto del nivel i-ésimo del factor A de las filas, j es el efecto del nivel j-ésimo del factor B de las columnas, ()ij es el efecto de la interacción entre i y j, y ijk es un componente del error aleatorio. Se supone que los errores tienen distribución normal con media cero y varianza constanteAmbos factores son fijos.Los efectos de los tratamientos se definen como las desviaciones de la media global, por lo que:
0)()(00b
1jij
a
1iij
b
1jj
a
1ii
Prof. Enit Huamán Cotrina
Pruebas de Hipótesis
0unmenosal:H
0...:H
i1
a210
0unmenosal:H
0...:H
i1
a210
0)(unmenosal:H
j,i0)(:H
ij1
ij0
Efecto de los tratamientos de las filas
Efecto de los tratamientos de las columnas
Efecto de la interacción fila columna
0unmenosal:H
0...:H
j1
b210
Prof. Enit Huamán Cotrina
Análisis estadístico del modelo con efectos fijos
Algunas notaciones
abny
yn
yy
yyyy
an
yy
bny
y
yyyy
......
..ij..ij
a
1i
b
1j
n
1kijk...
n
1kijk..ij
.j..j.
..i..i
a
1i
n
1kijk.j.
b
1j
n
1kijk..i
Prof. Enit Huamán Cotrina
Suma de cuadrados total corregida
a
1i
b
1j
n
k
2.ij
a
1i
b
1j
2
b
1j
2a
1i
2
2
a
1i
b
1j
n
k
.ij
a
1i
b
1j
n
k
2
)yy(
)yyyy(n
)yy(an)yy(bn
)yy(
)yyyy(
)yy()yy(
)yy(
ijk
....j...i.ij
....j......i
ijk
....j...i.ij
....j......i
...ijk
Prof. Enit Huamán Cotrina
La suma de cuadrados anterior puede simbolizarse de la siguiente forma
SSESSABSSBSSASST
Suma de Suma de cuadrados cuadrados debida a debida a las filaslas filas
Suma de Suma de cuadradocuadrado
s totals total
Suma de Suma de cuadrados cuadrados
debida a las debida a las columnascolumnas
Suma de Suma de cuadrados cuadrados debida a la debida a la
interacción A interacción A y By B
Suma de Suma de cuadrados cuadrados debida al debida al
errorerror
Prof. Enit Huamán Cotrina
Fórmulas prácticas para el cálculo de la suma de cuadrados
abny
yan1
SSB
abny
ybn1
SSA
abny
ySST
2...
b
1j
2
2...
a
1i
2
a
1i
b
1j
n
1k
2...2
.j.
..i
ijk
Prof. Enit Huamán Cotrina
La suma de cuadrados de la interacción se obtiene de la siguiente forma:
SSBSSASSSSAB
abny
yn1
SS
subtotales
2...
a
1i
b
1j
2.ijsubtotales
Y la suma de cuadrados del error se obtiene por diferencia.
subtotalesSSSST
SSBSSASSABSSTSSE
Prof. Enit Huamán Cotrina
Cuadrado medioCuadrado medio
Los valores esperados de los cuadrados medios son:
1b
an
1bSSB
E)MSB(E
1a
bn
1aSSA
E)MSA(E
a
1i
2j
2
a
1i
2i
2
Prof. Enit Huamán Cotrina
Cuadrado medioCuadrado medio
Los valores esperados de los cuadrados medios son:
2
a
1i
2ij
2
)1n(abSSE
E)MSE(E
)1b)(1a(
)(n
)1b)(1a(SSAB
E)MSAB(E
Prof. Enit Huamán Cotrina
Respuesta promedio para cada combinación de los tratamientos
Gráfica tipo de material-temperatura
0.0
25.0
50.0
75.0
100.0
125.0
150.0
175.0
15 °F 70 °F 125 °F
Temperatura
Vid
a p
rom
ed
io
M1
M2
M3
Prof. Enit Huamán Cotrina
Tabla de ANOVA para la vida de la Tabla de ANOVA para la vida de la bateríabatería
F.V gl SS MS Fc valor p
Material 2 10683.72 5341.86 7.911 0.0020
Temperatura 2 39118.72 19559.36 28.968 0.0000
Interacc ión 4 9613.78 2403.44 3.560 0.0186
Error 27 18230.75 675.21
Total 35 77646.97
¡La interacción ¡La interacción es es
significativa!significativa!
Prof. Enit Huamán Cotrina
Como la interacción es significativa, las comparaciones entre las medias de uno de los factores (por ej. A) pueden ser empañadas por la interacción AB. Una manera útil es fijar el factor B en un nivel específico y aplicar alguna prueba de comparación (ej. Tukey) a las medias del factor A con ese nivel.