alea to rios

37
etodos de Dise ˜ no y An ´ alisis de Experimentos Patricia Isabel Romero Mares Departamento de Probabilidad y Estad´ ıstica IIMAS UNAM abril 2013 1 / 37

Upload: luiseduardo44

Post on 18-Jan-2016

216 views

Category:

Documents


0 download

DESCRIPTION

Matemáticas

TRANSCRIPT

Page 1: Alea to Rios

Metodos de Diseno y Analisis deExperimentos

Patricia Isabel Romero Mares

Departamento de Probabilidad y EstadısticaIIMAS UNAM

abril 2013

1 / 37

Page 2: Alea to Rios

Experimentos con factores aleatorios

2 / 37

Page 3: Alea to Rios

Introduccion

Hasta ahora hemos supuesto que los factores de unexperimento son factores fijos, esto es, los niveles de losfactores usados en el experimento son los niveles especıficosde interes. Esto implica que las inferencias estadısticas que sehagan sobre estos factores estan limitadas a estos nivelesespecıficos estudiados.

En algunas situaciones experimentales, los niveles de un factorse seleccionan al azar de una poblacion grande de posiblesniveles, y el investigador quiere tener conclusiones acerca detoda la poblacion de niveles, no solamente de los usados en elexperimento.

En esta situacion se dice que el factor es aleatorio.

3 / 37

Page 4: Alea to Rios

IntroduccionPara el caso de un solo factor, el modelo estadıstico lineal es:

yij = µ + τi + εij

i = 1, . . . ,a j = 1, . . . ,n

donde µ es la media general, τi son los efectos aleatorios delfactor, εij es el error aleatorio. Se supone que τi y εij sonindependientes y que se distribuyen:

εij ∼ N(0,σ2)

τi ∼ N(0,σ2τ )

La varianza de cualquier observacion es:

V(yij) = σ2τ +σ

2

σ2τ y σ2 se llaman componentes de varianza y el modelo se

llama modelo de efectos aleatorios o de componentes devarianza.

4 / 37

Page 5: Alea to Rios

Introduccion

Ahora lo que nos interesa es probar hipotesis acerca de lacomponente de varianza σ2

τ .

H0 : σ2τ = 0 ⇒ tratamientos iguales

H1 : σ2τ > 0 ⇒ variabilidad entre tratamientos

Se tiene que SSEσ2 ∼ χ2

N−a donde N = na, y bajo la hipotesis nulaSStrat

σ2 ∼ χ2a−1, entonces, bajo H0:

Fc =SStrat/a−1SSE/N−a

=CMtrat

CME∼ Fa−1,N−a

5 / 37

Page 6: Alea to Rios

Tabla de ANOVA

F.V. g.l. SS CM Fc E(CM)

Factor A a−1 SSA CMA CMA/CME σ2 +nσ2τ

Error N− t SSE CME σ2

Total N−1 SStot

Bajo H0, CMA = CME = σ2.

Si H0 no es cierta, CMA > CME, por lo tanto rechazamos H0para valores grandes de Fc, es decir, rechazamos H0 siFc > Fα

a−1,N−a.

6 / 37

Page 7: Alea to Rios

Componentes de varianza

Interesa estimar los componentes de varianza (σ2τ ,σ

2) en elmodelo.

Existen varios procedimientos, el que veremos se llamametodo de analisis de varianza o de momentos, ya que usala informacion de la tabla de ANOVA.

El metodo consiste en igualar la esperanza de cuadradosmedios a sus valores observados.

CMtrat = σ2 +nσ

CME = σ2

por lo tantoσ

2 = CME

σ2τ =

CMtrat−CMEn

7 / 37

Page 8: Alea to Rios

Componentes de varianza

El metodo de analisis de varianza para estimar loscomponentes de varianza es relativamente sencillo y buenocuando se tienen experimentos balanceados.

A veces este metodo de estimar las componentes de varianzada estimaciones negativas.

Algunos autores dicen que es evidencia de que la componentees cero, aunque otros dicen que puede ser evidencia de que elmodelo es incorrecto.

Un metodo mas reciente y que tiene buenos resultados es elde maxima verosimilitud restringida, REML (este es el metodorecomendado en JMP).

8 / 37

Page 9: Alea to Rios

Ejemplo

Una fabrica textil produce un tipo de tela en un numero grandede telares. Se desea obtener una tela de resistencia uniforme.

El ingeniero a cargo sospecha que ademas de la variacionusual en resistencia de muestras de tela del mismo telar, puedehaber variaciones en resistencia entre diferentes telares.

Para investigar esto, selecciona al azar 4 telares y hace 4determinaciones de resistencia en la tela producida por cadatelar. El experimento se corre en orden aleatorio.

Telar Resistencia1 98, 97, 99, 962 91, 90, 93, 923 96, 95, 97, 954 95, 96, 99, 98

ej12-1.jmp9 / 37

Page 10: Alea to Rios

Ejemplo

F.V. g.l. SS CM F E(CM)

Telar 3 89.19 29.73 15.68** σ2 +4σ2T

Error 12 22.75 1.89 σ2

Total 15 111.94

Componente Componente de varianza % del totalestimado

Telar 6.96 78.59Error 1.89 21.41Total 8.85 100.00

La mayor parte de la variabilidad se debe a diferencias entretelares. Si el ingeniero logra disminuir la variabilidad entretelares la produccion de telas serıa mas homogenea.

10 / 37

Page 11: Alea to Rios

Diseno factorial con dos factores aleatoriosSuponga que se tienen los factores A y B y que ambos tienenun numero grande de niveles que son de interes.Seleccionamos aleatoriamente a niveles de A y b niveles de By arreglamos estos niveles en un diseno factorial. Si elexperimento se replica n veces, entonces el modelo lineal es:

yijk = µ + τi +βj +(τβ )ij + εijk

i = 1, . . . ,a j = 1, . . . ,b k = 1, . . . ,n

donde τi, βj, (τβ )ij, εijk son variables aleatorias independientes.

Tambien suponemos que:

τi ∼ N(0,σ2τ )

βj ∼ N(0,σ2β)

(τβ )ij ∼ N(0,σ2τβ)

εijk ∼ N(0,σ2)

11 / 37

Page 12: Alea to Rios

Diseno factorial con dos factores aleatorios

Por lo tanto, la varianza de cualquier observacion es:

V(yijk) = σ2τ +σ

2β+σ

2τβ

+σ2

Nos interesa probar las hipotesis:

H01 : σ2τ = 0

H02 : σ2β

= 0

H03 : σ2τβ

= 0

Las sumas de cuadrados se calculan igual que con efectosfijos.

12 / 37

Page 13: Alea to Rios

Diseno factorial con dos factores aleatorios

Para formar las estadısticas de prueba, debemos examinar laesperanza de cuadrados medios.

Se puede demostrar que:

E(CMA) = σ2 +nσ

2τβ

+bnσ2τ

E(CMB) = σ2 +nσ

2τβ

+anσ2β

E(CMAB) = σ2 +nσ

2τβ

E(CME) = σ2

13 / 37

Page 14: Alea to Rios

Diseno factorial con dos factores aleatorios

Las estadısticas F para probar las hipotesis anteriores secalculan de la siguiente manera:

H01 : σ2τβ

= 0 ⇒ Fc =CMAB

CME

H02 : σ2τ = 0 ⇒ Fc =

CMA

CMAB

H03 : σ2β= 0 ⇒ Fc =

CMB

CMAB

14 / 37

Page 15: Alea to Rios

Diseno factorial con dos factores aleatorios

Los componentes de varianza se pueden estimar por elmetodo de analisis de varianza, igualando los cuadradosmedios observados a sus respectivos valores esperados yresolviendo las ecuaciones, quedando:

σ2 = CME

σ2τβ

=CMAB−CME

n

σ2β

=CMB−CMAB

an

σ2τ =

CMA−CMAB

bn

15 / 37

Page 16: Alea to Rios

Ejemplo con dos factores aleatorios

(Ejemplo 7.1 Kuehl) Evaluacion del funcionamiento demaquinas con componentes de varianza.

Se esta desarrollando un nuevo espectrofotometro para uso enlaboratorios clınicos. Se quiere evaluar el funcionamiento delas maquinas de la lınea de produccion.

Pregunta de investigacion:Un componente crıtico del funcionamiento de un instrumentoes la consistencia de las mediciones de un dıa a otro entre lasmaquinas. Se quiere saber si la variabilidad de las medicionesentre las maquinas operadas durante varios dıas estan dentrode los estandares aceptables para aplicaciones clınicas.

Estructura de tratamientos:Se construye un diseno factorial con “maquinas” y “dıas” comofactores. Seran probadas 4 maquinas en 4 diferentes dıas enun arreglo 4×4.

16 / 37

Page 17: Alea to Rios

Ejemplo con dos factores aleatorios

Diseno experimental:Se seleccionan aleatoriamente 4 maquinas. Se preparan cadadıa 8 replicaciones de muestras de suero en sangre con elmismo lote de reactivos. Dos muestras de suero se asignanaleatoriamente a cada una de las cuatro maquinas en cadauno de los 4 dıas para un diseno completamente al azar condos repeticiones de cada tratamiento. El mismo tecnicoprepara las muestras de suero y opera las maquinas durantetodo el experimento. Se miden los niveles de trigliceridos(mg/dl) en las muestras de suero.

17 / 37

Page 18: Alea to Rios

Ejemplo con dos factores aleatorios

MaquinaDıa 1 2 3 41 142.3,144.0 148.6, 146.9 142.9, 147.4 133.8, 133.22 134.9, 146.3 145.2, 146.3 125.9, 127.6 108.9, 107.53 148.6, 156.5 148.6, 153.1 135.5, 138.9 132.1, 149.74 152.0, 151.4 149.7, 152.0 142.9, 142.3 141.7, 141.2

Las maquinas son un factor aleatorio porque representan unamuestra aleatoria de una poblacion potencial de maquinas aconstruir, y los dıas son una muestra aleatoria de unapoblacion de dıas en los cuales se usaran las maquinas. Elarreglo factorial permite la evaluacion de la interaccion entremaquinas y dıas. La consistencia del funcionamiento de lasmaquinas se evidencıa por la ausencia de interaccion.

ej7 1 kuehl.jmp18 / 37

Page 19: Alea to Rios

Ejemplo con dos factores aleatorios

F.V. g.l. SS CM Fc E(CM)

Dıa 3 1334.46 444.82 5.09* σ2 +2σ2dm +8σ2

dMaquina 3 1647.28 549.09 6.29* σ2 +2σ2

dm +8σ2m

Interaccion 9 786.04 87.34 4.88** σ2 +2σ2dm

Error 16 286.33 17.90 σ2

σ2 = CME = 17.90

σ2dm =

CMdm−CMEn

= 34.72

σ2m =

CMm−CMdm

na= 57.72

σ2d =

CMd−CMdm

nb= 44.69

19 / 37

Page 20: Alea to Rios

Ejemplo con dos factores aleatorios

Componente Estimador % del totalDıa 44.69 28.825Maquina 57.72 37.23Dıa x Maquina 34.72 22.398Error 17.90 11.544Total 155.02 100

La varianza estimada de una observacion es:

σ2y = σ

2 + σ2d + σ

2m + σ

2dm = 155.02

20 / 37

Page 21: Alea to Rios

Ejemplo con dos factores aleatorios

Interpretacion:

Cada uno de los componentes de varianza contribuyesignificativamente a la variacion de las mediciones.

El componente del error σ2 = 17.9 representa la variacion en lapreparacion de las muestra de suero en sangre.

El componente de maquinas σ2m = 57.7, es la variacion en el

funcionamiento de las maquinas.

El componente de dıas σ2d = 44.7, es la variabilidad asociada

con un nuevo inicio utilizando nuevos reactivos para el analisisde las muestras y otras fuentes de variabilidad que puedenasociarse a las diferencias operacionales entre los dıas.

21 / 37

Page 22: Alea to Rios

Ejemplo con dos factores aleatorios

El componente de la interaccion σ2dm = 34.7 implica que el

funcionamiento de las maquinas no varıa consistentementecon los cambios de operacion de los dıas. Una posibleexplicacion es que exista una inconsistencia en la calibracionde las maquinas a lo largo de los dıas.

El investigador, basado en su experiencia, debe ser capaz dedecidir si alguna de las fuentes de variabilidad anterioresexcede un nivel aceptable y corregir, si es necesario, cualquierdeficiencia en las maquinas o en las condiciones de operacion

22 / 37

Page 23: Alea to Rios

Tres factores aleatorios

F.V. g.l. E(CM)

A a−1 σ2 + rσ2abc + rcσ2

ab + rbσ2ac + rbcσ2

aB b−1 σ2 + rσ2

abc + rcσ2ab + raσ2

bc + racσ2b

C c−1 σ2 + rσ2abc + rbσ2

ac + raσ2bc + rabσ2

cAB (a−1)(b−1) σ2 + rσ2

abc + rcσ2ab

AC (a−1)(c−1) σ2 + rσ2abc + rbσ2

acBC (b−1)(c−1) σ2 + rσ2

abc + raσ2bc

ABC (a−1)(b−1)(c−1) σ2 + rσ2abc

Error abc(r−1) σ2

23 / 37

Page 24: Alea to Rios

Tres factores aleatorios

Las estadısticas F se construyen de la siguiente manera:

ABC :CMABC

CME

AB :CMAB

CMABC

AC :CMAC

CMABC

BC :CMBC

CMABC

24 / 37

Page 25: Alea to Rios

Tres factores aleatorios

Para probar los tres efectos principales (A,B y C) es necesarioconstruir un cuadrado medio para el denominador de laspruebas F.Existen pruebas F aproximadas utilizando el procedimiento deSatterthwaite, donde se calcula una combinacion lineal de loscuadrados medios y sus correspondientes grados de libertad.

Dada una funcion lineal M, donde

M = a1(CM1)+a2(CM2)+ . . .+ak(CMk)

y CM1,CM2, . . . ,CMk son cuadrados medios con gl ν1,ν2, . . . ,νkrespectivamente, los grados de libertad para M sonaproximadamente

ν =M2

∑ki=1

(ai(CMi))2

νi

25 / 37

Page 26: Alea to Rios

Tres factores aleatorios

Para probar la hipotesis H0 : σ2A = 0 se puede construir la

combinacion lineal

M = CMAB +CMAC−CMABC

entonces la prueba queda como:

CMA

M

Calculando los grados de libertad para el denominador con elprocedimiento de Satterthwaite.

26 / 37

Page 27: Alea to Rios

Tres factores aleatorios

Es posible construir un Cuadrado Medio negativo cuando en lacombinacion lineal algunos de los cuadrados medios tienencoeficientes negativos.

Para salvar esta dificultad, otra aproximacion para probar lahipotesis H0 : σ2

A = 0 es hacer

M1 = CMA +CMABC

M2 = CMAB +CMAC

con gl calculados con el procedimiento deSatterthwaite,entonces la prueba queda como:

M1

M2.

Lo mismo se harıa para los otros efectos principales (B y C).

27 / 37

Page 28: Alea to Rios

Efectos anidados

28 / 37

Page 29: Alea to Rios

Efectos anidados

En algunos experimentos factoriales los niveles de un factor(digamos, B) son similares pero no identicos para diferentesniveles de otro factor (A).

Este arreglo se llama diseno anidado o jerarquico y se diceque B esta anidado en A.

Generalmente los factores que estan anidados son aleatorios.

Por ejemplo, una companıa compra su materia prima a tresdiferentes proveedores. La companıa desea determinar si lapureza de la materia prima es la misma en cada proveedor.

Se seleccionan cuatro lotes de materia prima de cadaproveedor y se tomaran tres determinaciones de pureza encada lote.

29 / 37

Page 30: Alea to Rios

Ejemplo

30 / 37

Page 31: Alea to Rios

Ejemplo

Este es un diseno anidado de 2 etapas, con lote anidado enproveedor, y observacion anidada en lote.

Por que no son dos factores cruzados? Porque el lote 1deberıa referirse a una caracterıstica particular del mismo lote,equivalentemente para los otros lotes.

En el ejemplo, los lotes de cada proveedor son unicos para elproveedor particular.

Esto es, el lote 1 del proveedor 1 no tiene nada que ver con ellote 1 de los otros proveedores, es solamente una etiqueta.

31 / 37

Page 32: Alea to Rios

Efectos anidados

El modelo estadıstico para los disenos anidados de dos etapases:

yijk = µ + τi +βj(i)+ εk(ij)

i = 1, . . . ,a j = 1, . . . ,b k = 1, . . . ,n

a niveles del factor Ab niveles del factor B anidados en cada nivel del factor An repeticiones

Es conveniente pensar en las repeticiones como que estananidadas en la combinacion de niveles de A y B.

Este es un diseno anidado balanceado, ya que hay igualnumero de niveles de B dentro de cada nivel de A e igualnumero de repeticiones.

Ya que todos los niveles de B no aparecen con todos losniveles de A entonces no puede haber interaccion entre A y B.

32 / 37

Page 33: Alea to Rios

Efectos anidados

F.V. g.l. SS CMA a−1 SSA CMA

B(A) a(b−1) SSB(A) CMB(A)Error ab(n−1) SSE CMETotal abn−1 SSTot

SSA =1bn

a

∑i=1

y2i..−

y2...

abn

SSB(A) =1n

a

∑i=1

b

∑j=1

y2ij.−

1bn

a

∑i=1

y2i..

SSE =a

∑i=1

b

∑j=1

n

∑k=1

y2ijk−

1n

a

∑i=1

b

∑j=1

y2ij.

SSTot =a

∑i=1

b

∑j=1

n

∑k=1

y2ijk−

y2...

abn

33 / 37

Page 34: Alea to Rios

Efectos anidados

A fijo A fijo A aleatorioE(CM) B fijo B aleatorio B aleatorio

E(CMA) σ2 +bnθ 2A σ2 +nσ2

B +bnθ 2A σ2 +nσ2

B +bnσ2A

E(CMB(A)) σ2 +nθ 2B σ2 +nσ2

B σ2 +nσ2B

E(CME) σ2 σ2 σ2

34 / 37

Page 35: Alea to Rios

Ejemplo

Proveedor1 2 3

Lote 1 2 3 4 1 2 3 4 1 2 3 41 -2 -2 1 1 0 -1 0 2 -2 1 3-1 -3 0 4 -2 4 0 3 4 0 -1 20 -4 1 0 -3 2 -2 2 0 2 2 1

Los lotes se toman al azar de cada proveedor.Proveedor es fijo y lote aleatorio.

anidado.jmp

35 / 37

Page 36: Alea to Rios

Ejemplo

F.V. g.l. SS CM E(CM) FProveedor 2 15.06 7.53 σ2 +3σ2

B +12θ 2A 0.97

Lote(Proveedor) 9 69.92 7.77 σ2 +3σ2B 2.94*

Error 24 63.33 2.64 σ2

Total 35 148.31

No hay efecto significativo del proveedor en la pureza delmaterial.La pureza de los lotes de materia prima del mismo proveedordifieren significativamente, por lo tanto, hay que trabajar con losproveedores para que reduzcan su variabilidad de lote a lote.Las estimaciones de los componentes de varianza son:

Componente Estimacion % del totalLote(proveedor) 1.7099 39.32

Error 2.6389 60.68Total 4.3488 100.00

36 / 37

Page 37: Alea to Rios

Ejemplo

Que pasa si ignoramos que hay diferentes lotes yconsideramos las 12 observaciones de cada proveedor comorepeticiones?

F.V. g.l. SS CM F p-valueProveedor 2 15.06 7.53 1.864 0.171Error 33 133.25 4.038Total 35 148.31

No hay diferencia en proveedores.

Sin embargo, en este analisis estamos ignorando que cada 3observaciones tienen en comun que provienen de un mismolote donde hay diferencias (segun el analisis anterior).

37 / 37