alea to rios
DESCRIPTION
MatemáticasTRANSCRIPT
Metodos de Diseno y Analisis deExperimentos
Patricia Isabel Romero Mares
Departamento de Probabilidad y EstadısticaIIMAS UNAM
abril 2013
1 / 37
Experimentos con factores aleatorios
2 / 37
Introduccion
Hasta ahora hemos supuesto que los factores de unexperimento son factores fijos, esto es, los niveles de losfactores usados en el experimento son los niveles especıficosde interes. Esto implica que las inferencias estadısticas que sehagan sobre estos factores estan limitadas a estos nivelesespecıficos estudiados.
En algunas situaciones experimentales, los niveles de un factorse seleccionan al azar de una poblacion grande de posiblesniveles, y el investigador quiere tener conclusiones acerca detoda la poblacion de niveles, no solamente de los usados en elexperimento.
En esta situacion se dice que el factor es aleatorio.
3 / 37
IntroduccionPara el caso de un solo factor, el modelo estadıstico lineal es:
yij = µ + τi + εij
i = 1, . . . ,a j = 1, . . . ,n
donde µ es la media general, τi son los efectos aleatorios delfactor, εij es el error aleatorio. Se supone que τi y εij sonindependientes y que se distribuyen:
εij ∼ N(0,σ2)
τi ∼ N(0,σ2τ )
La varianza de cualquier observacion es:
V(yij) = σ2τ +σ
2
σ2τ y σ2 se llaman componentes de varianza y el modelo se
llama modelo de efectos aleatorios o de componentes devarianza.
4 / 37
Introduccion
Ahora lo que nos interesa es probar hipotesis acerca de lacomponente de varianza σ2
τ .
H0 : σ2τ = 0 ⇒ tratamientos iguales
H1 : σ2τ > 0 ⇒ variabilidad entre tratamientos
Se tiene que SSEσ2 ∼ χ2
N−a donde N = na, y bajo la hipotesis nulaSStrat
σ2 ∼ χ2a−1, entonces, bajo H0:
Fc =SStrat/a−1SSE/N−a
=CMtrat
CME∼ Fa−1,N−a
5 / 37
Tabla de ANOVA
F.V. g.l. SS CM Fc E(CM)
Factor A a−1 SSA CMA CMA/CME σ2 +nσ2τ
Error N− t SSE CME σ2
Total N−1 SStot
Bajo H0, CMA = CME = σ2.
Si H0 no es cierta, CMA > CME, por lo tanto rechazamos H0para valores grandes de Fc, es decir, rechazamos H0 siFc > Fα
a−1,N−a.
6 / 37
Componentes de varianza
Interesa estimar los componentes de varianza (σ2τ ,σ
2) en elmodelo.
Existen varios procedimientos, el que veremos se llamametodo de analisis de varianza o de momentos, ya que usala informacion de la tabla de ANOVA.
El metodo consiste en igualar la esperanza de cuadradosmedios a sus valores observados.
CMtrat = σ2 +nσ
2τ
CME = σ2
por lo tantoσ
2 = CME
σ2τ =
CMtrat−CMEn
7 / 37
Componentes de varianza
El metodo de analisis de varianza para estimar loscomponentes de varianza es relativamente sencillo y buenocuando se tienen experimentos balanceados.
A veces este metodo de estimar las componentes de varianzada estimaciones negativas.
Algunos autores dicen que es evidencia de que la componentees cero, aunque otros dicen que puede ser evidencia de que elmodelo es incorrecto.
Un metodo mas reciente y que tiene buenos resultados es elde maxima verosimilitud restringida, REML (este es el metodorecomendado en JMP).
8 / 37
Ejemplo
Una fabrica textil produce un tipo de tela en un numero grandede telares. Se desea obtener una tela de resistencia uniforme.
El ingeniero a cargo sospecha que ademas de la variacionusual en resistencia de muestras de tela del mismo telar, puedehaber variaciones en resistencia entre diferentes telares.
Para investigar esto, selecciona al azar 4 telares y hace 4determinaciones de resistencia en la tela producida por cadatelar. El experimento se corre en orden aleatorio.
Telar Resistencia1 98, 97, 99, 962 91, 90, 93, 923 96, 95, 97, 954 95, 96, 99, 98
ej12-1.jmp9 / 37
Ejemplo
F.V. g.l. SS CM F E(CM)
Telar 3 89.19 29.73 15.68** σ2 +4σ2T
Error 12 22.75 1.89 σ2
Total 15 111.94
Componente Componente de varianza % del totalestimado
Telar 6.96 78.59Error 1.89 21.41Total 8.85 100.00
La mayor parte de la variabilidad se debe a diferencias entretelares. Si el ingeniero logra disminuir la variabilidad entretelares la produccion de telas serıa mas homogenea.
10 / 37
Diseno factorial con dos factores aleatoriosSuponga que se tienen los factores A y B y que ambos tienenun numero grande de niveles que son de interes.Seleccionamos aleatoriamente a niveles de A y b niveles de By arreglamos estos niveles en un diseno factorial. Si elexperimento se replica n veces, entonces el modelo lineal es:
yijk = µ + τi +βj +(τβ )ij + εijk
i = 1, . . . ,a j = 1, . . . ,b k = 1, . . . ,n
donde τi, βj, (τβ )ij, εijk son variables aleatorias independientes.
Tambien suponemos que:
τi ∼ N(0,σ2τ )
βj ∼ N(0,σ2β)
(τβ )ij ∼ N(0,σ2τβ)
εijk ∼ N(0,σ2)
11 / 37
Diseno factorial con dos factores aleatorios
Por lo tanto, la varianza de cualquier observacion es:
V(yijk) = σ2τ +σ
2β+σ
2τβ
+σ2
Nos interesa probar las hipotesis:
H01 : σ2τ = 0
H02 : σ2β
= 0
H03 : σ2τβ
= 0
Las sumas de cuadrados se calculan igual que con efectosfijos.
12 / 37
Diseno factorial con dos factores aleatorios
Para formar las estadısticas de prueba, debemos examinar laesperanza de cuadrados medios.
Se puede demostrar que:
E(CMA) = σ2 +nσ
2τβ
+bnσ2τ
E(CMB) = σ2 +nσ
2τβ
+anσ2β
E(CMAB) = σ2 +nσ
2τβ
E(CME) = σ2
13 / 37
Diseno factorial con dos factores aleatorios
Las estadısticas F para probar las hipotesis anteriores secalculan de la siguiente manera:
H01 : σ2τβ
= 0 ⇒ Fc =CMAB
CME
H02 : σ2τ = 0 ⇒ Fc =
CMA
CMAB
H03 : σ2β= 0 ⇒ Fc =
CMB
CMAB
14 / 37
Diseno factorial con dos factores aleatorios
Los componentes de varianza se pueden estimar por elmetodo de analisis de varianza, igualando los cuadradosmedios observados a sus respectivos valores esperados yresolviendo las ecuaciones, quedando:
σ2 = CME
σ2τβ
=CMAB−CME
n
σ2β
=CMB−CMAB
an
σ2τ =
CMA−CMAB
bn
15 / 37
Ejemplo con dos factores aleatorios
(Ejemplo 7.1 Kuehl) Evaluacion del funcionamiento demaquinas con componentes de varianza.
Se esta desarrollando un nuevo espectrofotometro para uso enlaboratorios clınicos. Se quiere evaluar el funcionamiento delas maquinas de la lınea de produccion.
Pregunta de investigacion:Un componente crıtico del funcionamiento de un instrumentoes la consistencia de las mediciones de un dıa a otro entre lasmaquinas. Se quiere saber si la variabilidad de las medicionesentre las maquinas operadas durante varios dıas estan dentrode los estandares aceptables para aplicaciones clınicas.
Estructura de tratamientos:Se construye un diseno factorial con “maquinas” y “dıas” comofactores. Seran probadas 4 maquinas en 4 diferentes dıas enun arreglo 4×4.
16 / 37
Ejemplo con dos factores aleatorios
Diseno experimental:Se seleccionan aleatoriamente 4 maquinas. Se preparan cadadıa 8 replicaciones de muestras de suero en sangre con elmismo lote de reactivos. Dos muestras de suero se asignanaleatoriamente a cada una de las cuatro maquinas en cadauno de los 4 dıas para un diseno completamente al azar condos repeticiones de cada tratamiento. El mismo tecnicoprepara las muestras de suero y opera las maquinas durantetodo el experimento. Se miden los niveles de trigliceridos(mg/dl) en las muestras de suero.
17 / 37
Ejemplo con dos factores aleatorios
MaquinaDıa 1 2 3 41 142.3,144.0 148.6, 146.9 142.9, 147.4 133.8, 133.22 134.9, 146.3 145.2, 146.3 125.9, 127.6 108.9, 107.53 148.6, 156.5 148.6, 153.1 135.5, 138.9 132.1, 149.74 152.0, 151.4 149.7, 152.0 142.9, 142.3 141.7, 141.2
Las maquinas son un factor aleatorio porque representan unamuestra aleatoria de una poblacion potencial de maquinas aconstruir, y los dıas son una muestra aleatoria de unapoblacion de dıas en los cuales se usaran las maquinas. Elarreglo factorial permite la evaluacion de la interaccion entremaquinas y dıas. La consistencia del funcionamiento de lasmaquinas se evidencıa por la ausencia de interaccion.
ej7 1 kuehl.jmp18 / 37
Ejemplo con dos factores aleatorios
F.V. g.l. SS CM Fc E(CM)
Dıa 3 1334.46 444.82 5.09* σ2 +2σ2dm +8σ2
dMaquina 3 1647.28 549.09 6.29* σ2 +2σ2
dm +8σ2m
Interaccion 9 786.04 87.34 4.88** σ2 +2σ2dm
Error 16 286.33 17.90 σ2
σ2 = CME = 17.90
σ2dm =
CMdm−CMEn
= 34.72
σ2m =
CMm−CMdm
na= 57.72
σ2d =
CMd−CMdm
nb= 44.69
19 / 37
Ejemplo con dos factores aleatorios
Componente Estimador % del totalDıa 44.69 28.825Maquina 57.72 37.23Dıa x Maquina 34.72 22.398Error 17.90 11.544Total 155.02 100
La varianza estimada de una observacion es:
σ2y = σ
2 + σ2d + σ
2m + σ
2dm = 155.02
20 / 37
Ejemplo con dos factores aleatorios
Interpretacion:
Cada uno de los componentes de varianza contribuyesignificativamente a la variacion de las mediciones.
El componente del error σ2 = 17.9 representa la variacion en lapreparacion de las muestra de suero en sangre.
El componente de maquinas σ2m = 57.7, es la variacion en el
funcionamiento de las maquinas.
El componente de dıas σ2d = 44.7, es la variabilidad asociada
con un nuevo inicio utilizando nuevos reactivos para el analisisde las muestras y otras fuentes de variabilidad que puedenasociarse a las diferencias operacionales entre los dıas.
21 / 37
Ejemplo con dos factores aleatorios
El componente de la interaccion σ2dm = 34.7 implica que el
funcionamiento de las maquinas no varıa consistentementecon los cambios de operacion de los dıas. Una posibleexplicacion es que exista una inconsistencia en la calibracionde las maquinas a lo largo de los dıas.
El investigador, basado en su experiencia, debe ser capaz dedecidir si alguna de las fuentes de variabilidad anterioresexcede un nivel aceptable y corregir, si es necesario, cualquierdeficiencia en las maquinas o en las condiciones de operacion
22 / 37
Tres factores aleatorios
F.V. g.l. E(CM)
A a−1 σ2 + rσ2abc + rcσ2
ab + rbσ2ac + rbcσ2
aB b−1 σ2 + rσ2
abc + rcσ2ab + raσ2
bc + racσ2b
C c−1 σ2 + rσ2abc + rbσ2
ac + raσ2bc + rabσ2
cAB (a−1)(b−1) σ2 + rσ2
abc + rcσ2ab
AC (a−1)(c−1) σ2 + rσ2abc + rbσ2
acBC (b−1)(c−1) σ2 + rσ2
abc + raσ2bc
ABC (a−1)(b−1)(c−1) σ2 + rσ2abc
Error abc(r−1) σ2
23 / 37
Tres factores aleatorios
Las estadısticas F se construyen de la siguiente manera:
ABC :CMABC
CME
AB :CMAB
CMABC
AC :CMAC
CMABC
BC :CMBC
CMABC
24 / 37
Tres factores aleatorios
Para probar los tres efectos principales (A,B y C) es necesarioconstruir un cuadrado medio para el denominador de laspruebas F.Existen pruebas F aproximadas utilizando el procedimiento deSatterthwaite, donde se calcula una combinacion lineal de loscuadrados medios y sus correspondientes grados de libertad.
Dada una funcion lineal M, donde
M = a1(CM1)+a2(CM2)+ . . .+ak(CMk)
y CM1,CM2, . . . ,CMk son cuadrados medios con gl ν1,ν2, . . . ,νkrespectivamente, los grados de libertad para M sonaproximadamente
ν =M2
∑ki=1
(ai(CMi))2
νi
25 / 37
Tres factores aleatorios
Para probar la hipotesis H0 : σ2A = 0 se puede construir la
combinacion lineal
M = CMAB +CMAC−CMABC
entonces la prueba queda como:
CMA
M
Calculando los grados de libertad para el denominador con elprocedimiento de Satterthwaite.
26 / 37
Tres factores aleatorios
Es posible construir un Cuadrado Medio negativo cuando en lacombinacion lineal algunos de los cuadrados medios tienencoeficientes negativos.
Para salvar esta dificultad, otra aproximacion para probar lahipotesis H0 : σ2
A = 0 es hacer
M1 = CMA +CMABC
M2 = CMAB +CMAC
con gl calculados con el procedimiento deSatterthwaite,entonces la prueba queda como:
M1
M2.
Lo mismo se harıa para los otros efectos principales (B y C).
27 / 37
Efectos anidados
28 / 37
Efectos anidados
En algunos experimentos factoriales los niveles de un factor(digamos, B) son similares pero no identicos para diferentesniveles de otro factor (A).
Este arreglo se llama diseno anidado o jerarquico y se diceque B esta anidado en A.
Generalmente los factores que estan anidados son aleatorios.
Por ejemplo, una companıa compra su materia prima a tresdiferentes proveedores. La companıa desea determinar si lapureza de la materia prima es la misma en cada proveedor.
Se seleccionan cuatro lotes de materia prima de cadaproveedor y se tomaran tres determinaciones de pureza encada lote.
29 / 37
Ejemplo
30 / 37
Ejemplo
Este es un diseno anidado de 2 etapas, con lote anidado enproveedor, y observacion anidada en lote.
Por que no son dos factores cruzados? Porque el lote 1deberıa referirse a una caracterıstica particular del mismo lote,equivalentemente para los otros lotes.
En el ejemplo, los lotes de cada proveedor son unicos para elproveedor particular.
Esto es, el lote 1 del proveedor 1 no tiene nada que ver con ellote 1 de los otros proveedores, es solamente una etiqueta.
31 / 37
Efectos anidados
El modelo estadıstico para los disenos anidados de dos etapases:
yijk = µ + τi +βj(i)+ εk(ij)
i = 1, . . . ,a j = 1, . . . ,b k = 1, . . . ,n
a niveles del factor Ab niveles del factor B anidados en cada nivel del factor An repeticiones
Es conveniente pensar en las repeticiones como que estananidadas en la combinacion de niveles de A y B.
Este es un diseno anidado balanceado, ya que hay igualnumero de niveles de B dentro de cada nivel de A e igualnumero de repeticiones.
Ya que todos los niveles de B no aparecen con todos losniveles de A entonces no puede haber interaccion entre A y B.
32 / 37
Efectos anidados
F.V. g.l. SS CMA a−1 SSA CMA
B(A) a(b−1) SSB(A) CMB(A)Error ab(n−1) SSE CMETotal abn−1 SSTot
SSA =1bn
a
∑i=1
y2i..−
y2...
abn
SSB(A) =1n
a
∑i=1
b
∑j=1
y2ij.−
1bn
a
∑i=1
y2i..
SSE =a
∑i=1
b
∑j=1
n
∑k=1
y2ijk−
1n
a
∑i=1
b
∑j=1
y2ij.
SSTot =a
∑i=1
b
∑j=1
n
∑k=1
y2ijk−
y2...
abn
33 / 37
Efectos anidados
A fijo A fijo A aleatorioE(CM) B fijo B aleatorio B aleatorio
E(CMA) σ2 +bnθ 2A σ2 +nσ2
B +bnθ 2A σ2 +nσ2
B +bnσ2A
E(CMB(A)) σ2 +nθ 2B σ2 +nσ2
B σ2 +nσ2B
E(CME) σ2 σ2 σ2
34 / 37
Ejemplo
Proveedor1 2 3
Lote 1 2 3 4 1 2 3 4 1 2 3 41 -2 -2 1 1 0 -1 0 2 -2 1 3-1 -3 0 4 -2 4 0 3 4 0 -1 20 -4 1 0 -3 2 -2 2 0 2 2 1
Los lotes se toman al azar de cada proveedor.Proveedor es fijo y lote aleatorio.
anidado.jmp
35 / 37
Ejemplo
F.V. g.l. SS CM E(CM) FProveedor 2 15.06 7.53 σ2 +3σ2
B +12θ 2A 0.97
Lote(Proveedor) 9 69.92 7.77 σ2 +3σ2B 2.94*
Error 24 63.33 2.64 σ2
Total 35 148.31
No hay efecto significativo del proveedor en la pureza delmaterial.La pureza de los lotes de materia prima del mismo proveedordifieren significativamente, por lo tanto, hay que trabajar con losproveedores para que reduzcan su variabilidad de lote a lote.Las estimaciones de los componentes de varianza son:
Componente Estimacion % del totalLote(proveedor) 1.7099 39.32
Error 2.6389 60.68Total 4.3488 100.00
36 / 37
Ejemplo
Que pasa si ignoramos que hay diferentes lotes yconsideramos las 12 observaciones de cada proveedor comorepeticiones?
F.V. g.l. SS CM F p-valueProveedor 2 15.06 7.53 1.864 0.171Error 33 133.25 4.038Total 35 148.31
No hay diferencia en proveedores.
Sin embargo, en este analisis estamos ignorando que cada 3observaciones tienen en comun que provienen de un mismolote donde hay diferencias (segun el analisis anterior).
37 / 37