diseÑo experimental y optimizaciÓn de sistemas … · diseÑo experimental y optimizaciÓn de...
Post on 16-Oct-2018
266 Views
Preview:
TRANSCRIPT
DISEÑO EXPERIMENTAL Y
OPTIMIZACIÓN DE SISTEMAS
CON MÚLTIPLES RESPUESTAS
Parte 3: Metodología de la superficie de
respuesta (RSM)
Héctor GoicoecheaE-mail: hgoico@fbcb.unl.edu.ar
http://www.fbcb.unl.edu.ar/laboratorios/ladaq/
Conocer el funcionamiento de un sistema o
proceso.
Encontrar las condiciones óptimas de
funcionamiento.
Mejoras en costo, tiempo, eficiencia,
productividad y /o calidad.
Metodología de la superficie de
respuesta (MSR)
Desarrollo teórico y primeras aplicaciones (década
1990)o Box y Draper (1987)
o Cornell (1991)
o Montgomery y Myers (1996)
oAraujo y Brereton (1996)
Aplicaciones en expansión
(softwares comerciales)o Procesos de fabricación industrial
oQuímica
oFarmacéutica
oBiotecnologica
JMP-IN
MINITAB
STATISTICA
STATGRAPHICS
UNSCRUMBLER
R - MATLAB
DESIGN-EXPERToAlimenticiaoMetalúrgicaoElectrónica
Originada por el trabajo de Box y Wilson (1951)Box, G. E. P., Wilson, K. G. (1951),“On the experimental attainment of
optimum conditions”, Journal of the Royal Statistical Society, B 13, 1-45
Metodología de la superficie de
respuesta (MSR)
),( 21 xxfy
RESPUESTA
Analizar el
comportamiento de
una
x1 x2
Conjunto de técnicas
matemáticas y estadísticas
MODELOConstruir un
Datos experimentalesniveles
OPTIMIZARDISEÑO DE
EXPERIMENTOS
Metodología de la superficie de
respuesta (MSR)
Encontrar el
ÓPTIMO
Representación gráfica del modelo
),( 21 xxfy
Metodología de la superficie de
respuesta (MSR)
Graficas de contorno y superficie de respuestaP
rod
ucc
ión
de
alm
end
ras
Respuesta en el
espacio
tridimensional
para la
producción de
almendras en
función de los
fertilizantes
utilizados
Gráficos de la MSR
Pro
du
cció
n d
e alm
end
ras
Cada línea de
contorno está
formada por
todas las
combinaciones
de los factores
que producen
una misma
respuesta
Gráficos de la MSR
Graficas de contorno y superficie de respuesta
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
Gráfica de contorno
Gráficos de la MSR
Gráfica de contornos
Superficie de respuesta
Líneas de isorespuesta
Óptimo de la respuesta
Niveles óptimos de las variables
Gráficos de la MSR
Producción
Surfactante
Factores significativos
1 Temperatura 20- 60 ºC
2 Tiempo de incubación 24-48 hs
¡Optimizar el rendimiento!
Rangos
Experimentos exploratorios
Selección de factores
Buscando las mejores condiciones…Experimento parecido a lo que vimos en la competencia
organizada por el rey
T (°C) Tpo Hs) R (g/L)
20 24 20.6
24 24 26.1
28 24 32.0
32 24 36.3
36 24 39.2
40 24 42.0
44 24 42.9
48 24 43.8
52 24 42.5
56 24 41.2
Variaciones de temperatura
Condiciones óptimas de
temperatura
T= 48° R= 43.8 g/L
Temperatura (ºC)
Ren
dim
iento
Grafica de respuesta univariada
Valor óptimo de
temperatura
Sección transversal de la
superficie de respuesta
Estrategia “OVAT”
Optimización univariada
T (°C) Tpo
(Hs)
R (g/L)
48 24 43.8
48 28 47.8
48 32 50.6
48 36 50.8
48 40 49.2
48 44 45.6
Variaciones de tiempo
R= 50.8 g/L
Condiciones óptimas de
tiempo a 48ºC
Tpo= 36 hsTiempo (horas)
Ren
dim
iento
Grafica de respuesta univariada
Valor óptimo de
tiempo
Estrategia “OVAT”
Sección transversal de
la superficie de
respuesta
Optimización univariada
Variaciones simultáneas de
tiempo y temperatura con un diseño
experimental estadístico
T (°C) Tpo
(Hs)
R (g/L)
20 24 20.6
20 36 44.9
20 48 51.0
35 24 39.9
35 36 54.9
35 48 52.1
50 24 43.0
50 36 49.1
50 48 37.0
Predicción del óptimo por modelado:
Rendimiento = 56.2 g/LT= 34°, Tiempo= 40 hs
Ren
dim
iento
Valor óptimo de
tiempo y temperatura
Grafica de superficie
de respuesta
9 experimentos
menor trabajo
Design-Expert® Software
RendimientoDesign Points55.1
20.6
X1 = A: TemperaturaX2 = B: Tiempo
20.00 27.50 35.00 42.50 50.00
24.00
30.00
36.00
42.00
48.00
Rendimiento
A: Temperatura
B: T
iem
po
26.6
32.5
38.4 44.3
44.3
50.2
54.6
56.1
mínimo
máximo
Design-Expert® Softw are
Area NAPRO
2.17954E+006
1.18672E+006
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 0.94
2.00 3.25 4.50 5.75 7.00
900.00
1000.00
1100.00
1200.00
1300.00Area NAPRO
1.25639E+006
1.25639E+006
1.5569E+006
1.5569E+006
1.85741E+006
1.85741E+006
2.15791E+006
2.45842E+006
1.62857E+006
1.62857E+006
1.72323E+006
1.72323E+006
1.41702E+006
1.41702E+006
Tiem
po (h
ora
s)
Grafica de contorno
Temperatura (ºC)
Design-Expert® Software
T (A)1.51
0.77
X1 = B: pHX2 = C: Temp
Actual FactorsA: Apareante = 15.00D: Acetato = 60.00
3.000
3.250
3.500
3.750
4.000
25.00
28.75
32.50
36.25
40.00
1.090
1.123
1.155
1.188
1.220
R
esp
ue
sta
X2 X1
Optimización univariadaSólo llegaría al óptimo si la relación es lineal sin
interacciones
X 1
X 3X 2
X 1 constante
X 1
X 2X 3
X 2 constante X 3 constante
),....,( 1 kxxfy
Una misma respuesta puede depender de más de dos
factores
Técnicas de optimización
¿Cuál es el óptimo?
MSR y optimización
Design-Expert® Softw are
Area SUL
513107
333539
X1 = B: Stirring rate
X2 = C: adición sal
Actual Factor
A: pH muestra = 7.00
900.00 1000.00 1100.00 1200.00 1300.00
0.18
0.63
1.09
1.55
2.00Area SUL
320153
369177
418200
467223
516246
10.965
15.847
9.732
7.921
5.396
Design-Expert® Softw are
Area CBZ
Design Points
205584
153080
X1 = A: pH muestra
X2 = B: Stirring rate
Actual Factor
C: adición sal = 1.66
1.00 2.75 4.50 6.25 8.00
800.00
950.00
1100.00
1250.00
1400.00
187103
190356
193610
196863
20011680.61
60.20
45.89
30.94
15.53
Design-Expert® Softw are
Area PIR
239736
163579
X1 = A: pH muestra
X2 = C: adición sal
Actual Factor
B: Stirring rate = 1116.22
2.00 3.25 4.50 5.75 7.00
0.18
0.63
1.09
1.55
2.00Area PIR
168276
183461
198646
213831
229016160.09
120.74
89.61
59.75
30.84
El comportamiento óptimo de un sistema puede depender
de más de una respuesta
Respuesta 1 Respuesta 3Respuesta 2
Técnicas de optimización de respuestas múltiples
¿Cuál es el óptimo global?
Creación de un Diseño de Experimentos
Ajuste de un Modelo
Utilización de una Técnica de Optimización
Explorar el modelo para obtener información sobre el óptimo
Requerimientos de la MSR
No se le puede exigir al diseño más información de la que puede brindar
• Para construir un modelo se necesitan como mínimo la misma cantidad de puntos
experimentales diferentes que coeficientes a estimar.
• Para evaluar la falta de ajuste se deben incluir repeticiones de un punto del diseño
22 121222110 xxxy
22 + pcentral
22 + pcentral +
paxiales
curvaturaxxxy 121222110
2
222
2
111121222110 xxxxxy
? o ¿ 2
222
2
111 xx
Diseños y modelos matemáticos para
la MSR
CONSTRUCCIÓN DE UN MODELO
Experimentos para optimizar la extracción de un alcaloide
pH(X1)
Temperatura(X2)
mg/g(y)
0 -1 43
-1 1 65
1 0 49
0 1 69
-1 -1 21
1 -1 43
1 1 62
-1 0 45
0 0 57
0 0 54
0 0 61
0 0 57
Lineal
y= 52.2 + 3.8 x1
+ 14.8 x2
Lineal con Interacción
y= 52.2 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
Cuadrático
y= 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
Construcción del Modelo
Modelo SC gl MC F0 p (Ft >F0) R2aj
LINEAL 0.70
Regresión 1408 2 704.2 13.6 0.001 significativa
Error Residual 465.3 9 51.7
FAj 440.6 6 73.4 8.9 0.039 significativa
INTERACCION 0.77
Regresión 1565 3 521.5 13.5 0.002 significativa
Error Residual 309.1 8 38.6
FAj 284.3 5 56.87 6.8 0.070 en el límite
CUADRATICO 0.95
Regresión 1826 5 365.2 46.0 <0.001 significativa
Error Residual 47.9 6 7.9
FAj 22.8 3 761 0.91 0.526 no significativa
Error Puro 24.8 3 8.2
Elegir Modelo: mayor F0 de regresiónmenor F0 de Falta Ajustemayor R2
aj
Evaluación del Modelo (ANOVA)
Pruebas de Hipótesis para los coeficientes del modelo
Modelo Cuadrático Completo
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
¿Todos los términos son significativos?
¿Todos son importantes?
¿Todos aportan información?
Las Hipótesis que hay que probar son:0 i 1 iH : 0 H : 0
i
0 0.05,k,n k 1
E
CMF F
CM
Significancia del Coeficiente:
i0 0.05,2,n k 1
E
ˆt t
CM
Evaluación de los Coeficientes
Modelo completo
Utilizar el modelo más simple que
describa el comportamiento del
sistema
MODELOCUADRÁTICO
SC gl MC F0 p (Ft >F0)
Regresión 1826 5 365.2 46.0 <0.001
x1 88.2 1 88.2 11.1 0.016
x2 1320 1 1320 166 <0.001
x1 x2 156 1 156 19.7 0.004
(x1)2 228 1 228 28.8 0.002
(x2)2 0.17 1 0.17 0.02 0.889
Residual 47.9 6 7.9
LOF 22.8 3 761 0.91 0.526
Error Puro 24.8 3 8.2
Variable no
significativa
Eliminar del
modelo
Evaluación del los Coeficientes
Principio de Parsimonia
Manual
Eliminación Backward
Modelo Completo Modelo Depurado
Adición Forward Modelo Reducido Modelo Depurado
Técnicas para depurar los Modelos
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
- 0.2 (x2)2
CATEGORÍA DE LOS MODELOS
Modelo Completo Modelo JerárquicoModelo Reducido
y = 56.9 + 3.8 x1
+ 14.8 x2
- 6.2 x1 x2
- 9.2 (x1)2
y = 38.9 + 13.3 x1
- 0.3 x2
+ 0.1 x1 x2
- 9.2 (x1)2
- 1.2 (x2)2
y = 38.9 + 13.3 x1
- 9.2 (x1)2
- 1.2 (x2)2
y = 38.9 + 13.3 x1
- 0.3 x2
- 9.2 (x1)2
- 1.2 (x2)2
Un Modelo es Jerárquico cuando contiene todos los términos más simples que
componen los términos de mayor orden que están en el modelo. Los modelos
jerárquicos tienen un comportamiento más estable que los no jerárquicos.
Se conserva el
término de primer
orden
Categoría de los Modelos
00
k
i ii
y x
MODELO LINEAL o de PRIMER ORDEN
coeficiente del modelo que afecta al factor i ïx
0 término constante
Design-Expert® Software
T (A)1.51
0.77
X1 = B: pHX2 = C: Temp
Actual FactorsA: Apareante = 15.00D: Acetato = 60.00
3.000
3.250
3.500
3.750
4.000
25.00
28.75
32.50
36.25
40.00
1.090
1.123
1.155
1.188
1.220
R
esp
ue
sta
X2 X1
Para dos factores este
modelo tiene 3 términos
Modelos matemáticos para la MSR
Puede verse como
X2 tiene igual
comportamiento
según X1 (líneas
paralelas)
00
k
i i ij i ji i j
y x x x
MODELO LINEAL CON
INTERACCIÓN
coeficiente de interacción entre el factor y el factor ij ï jx x
Para dos factores este
modelo tiene 4 términos
Design-Expert® Software
R (A)13.232
0.985
X1 = A: ApareanteX2 = D: Acetato
Actual FactorsB: pH = 3.500C: Temp = 32.50
12.00
16.50
21.00
25.50
30.00
20.00
52.50
85.00
117.5
150.0
0.0000
6.250
12.50
18.75
25.00
R
esp
ue
sta
X2 X1
Puede verse como
X2 tiene distinto
comportamiento
según X1
Modelos matemáticos para la MSR
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
MODELO CUADRATICO o de SEGUNDO
ORDEN
2 coeficiente que explica la curvatura del factor ii ix
Para dos factores este
modelo tiene 6 términos
Design-Expert® Software
Dureza5.56
2.09
X1 = A: % ManitolX2 = B: %Camphor
-1.00
-0.50
0.00
0.50
1.00
-1.00 -0.50
0.00 0.50
1.00
2
2.925
3.85
4.775
5.7
D
ure
za
A: % Manitol
B: %Camphor
Modelos matemáticos para la MSR
MODELO CÚBICO o de TERCER ORDEN
Para dos factores este
modelo tiene 10 términos
Design-Expert® Software
R382
1.33
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
-8
10.75
29.5
48.25
67
R
3
A: A B: B
1
2
22212
2
1112
3
2222
3
1111
2
222
2
111211222110
xxxx
xxxxxxxxy
Modelos matemáticos para la MSR
1 Definir los objetivos de la optimización.
2 Seleccionar los factores que resultan significativos.
Plantear adecuadamente el PROBLEMA a resolver y seleccionar la
RESPUESTA a evaluar.
3 Establecer la región de operabilidad.
Considerar las posibilidades instrumentales y la información sobre el
sistema.
4 Seleccionar un entorno experimental.Definir la región del espacio de los factores en donde vamos a planear los
experimentos.
Pasos de la MSR
6 Elaborar un modelo matemático.
Obtener la SUPERFICIE DE RESPUESTA y evaluar resultados.
7 Localizar el óptimo (punto o región) buscado para la
respuesta.
Utilizar herramientas gráficas y/o matemáticas para predecirlo.
8 Verificar experimentalmente.Confirmar el valor de la respuesta utilizando los niveles óptimos de los
factores.
5 Construir un diseño experimental de optimización.
Medir datos experimentales.
Repetir los pasos 4 , 5 y 6 si fuera necesario.
Pasos de la MSR
Si conocemos poco del sistema, el punto óptimo puede encontrarse fuera
del entorno experimental inicial
Región de operabilidad
Condiciones en donde el
proceso o equipo puede ser
operado
Entorno experimental
Limitado por los niveles
seleccionados para los factores
X1
X2
X3
El Entorno experimental debe moverse hacia la localización del óptimo
Región de operabilidad y entorno
experimental
Diseño experimental de optimización
Modelo probable
Conocimiento previo del
sistema
• Comportamiento esperado para la
respuesta
• Localización probable del óptimo
Primer orden Segundo orden
SI
NO
Determinación del óptimo
Aproximación al óptimo
Planificación de los experimentos
Diseño de optimización de
primer orden
Modelo de primer orden
Mover el entorno
experimental en el sentido
del óptimo
Lineal
No lineal
Establecer
condiciones óptimas
Aproximación al óptimo
Experimentar
Evaluar curvatura
Localización del óptimo
Diseño de optimización de
segundo orden
Modelo de segundo orden
Caracterizar la superficie
Experimentar
La Metodología de Superficie de Respuesta
puede tener una etapa secuencial
Aplicar experimentos que permitan moverse rápidamente a las
proximidades del óptimo buscado para la respuesta.
Diseños experimentales de primer orden
Técnica de
ESCALAMIENTO ASCENDENTE
(o descendente)
Esta técnica opera “paso a paso”, programando el paso siguiente en
función de los resultados del anterior.
En cada paso se estudia una región relativamente pequeña.
Modelos de primer orden
APROXIMACIÓN AL ÓPTIMO: cuando no
se conoce en que zona se encuentra el óptimo
SIMPLEX: Figura geométrica
con k + 1 vértices (k: nº de
factores)
Diseño SIMPLEX
factor 1
fact
or
2
factor 1
fact
or
2
factor 1
fact
or
2
FACTORIAL EN DOS NIVELES:
se estudian todas las
combinaciones de los factores en
+1 y -1
factor 1
fact
or
2
Diseño para superficie de respuesta de
primer orden
Diseño SIMPLEX
Paso 1
Simplex Inicial: experimentos 1, 2 y 3
La peor respuesta es la del experimento 3 Buscar un opuesto
Diseño SIMPLEX en escalamiento
ascendente
Paso 2
Segundo Simplex : experimentos 1, 2 y 4
La peor respuesta es la del experimento 2
Método de Escalamiento Ascendente sin ajustar
Modelo
DISEÑO SIMPLEX en ESCALAMIENTO ASCENDENTE
Buscar un opuesto
Paso 3
Tercer Simplex : experimentos 1, 4 y 5
La peor respuesta es la del experimento 1 Buscar un opuesto
Paso 5
Quinto Simplex : experimentos 5, 6 y 7
Sexto Simplex : experimentos 4, 6 y 8La mejor respuesta es la 6
Se recorre
secuencialmente una
trayectoria en sentido de
su máxima pendiente, es
decir, del mayor
incremento o decremento
de la respuesta
ascenso
descenso
00
k
i ii
y x
Superficie ajustada con un modelo de
primer orden
Normal de la
superficie de
respuesta
ajustada
Método de la máxima pendiente
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
Paso 1 Establecer el punto base, o punto de origen
Paso 2 Elaborar un diseño
2k (-1, +1)
o Punto central
(Xi = xj =…..Xk = 0) coincidente con el
punto de origen
o Réplicas en el punto central
Paso 3 Ajustar un modelo lineal, obtener la superficie de respuesta y
evaluar curvatura
J
I
Diseño Factorial en método de la
máxima pendiente
Paso 4 Se elige una de las variables como variable de apoyo y se establece
un tamaño de incremento o escalón para la misma.
1 jx
Paso 5 Calcular el
incremento para las otras
variables
jiki
xx
jj
ii
;,....2,1
ˆ
ˆ
j
iix
ˆ
ˆ
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
j
1 jx
ij
iix
ˆ
ˆ
kkjjii xxxy ˆ......ˆˆˆˆ0
Máxima Pendiente en el plano i x j
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
j
iPendiente
ˆ
ˆ
Paso 6 Convertir cada incremento a valores naturales para obtener un punto
experimental en el sentido de la máxima pendiente.
Paso 7 Continuar
experimentando en esta
dirección hasta no observar
más incrementos
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-1.000 -0.5000 0.0000 0.5000 1.000
-1.000
-0.5000
0.0000
0.5000
1.000
Respuesta
Factor 1
Fa
cto
r 2
54.04
55.58
Paso 8 Crear un nuevo Diseño 2k con replicas en el punto central que
debe coincidir con el último punto experimental de mejor respuesta.
Paso 9 Construir un
nuevo modelo de primer
orden y evaluar curvatura
Paso 10 Experimentar en el
sentido de máximo ascenso del
nuevo modelo hasta no obtener
más incrementos.
Repetir Paso 8 y Paso 9 hasta
encontrar curvatura
significativa, o la respuesta
óptimaRegión del ÓPTIMO
localizada
Optimización del rendimiento de una reacción de síntesis de un polímero
Primer entorno experimental: 30-40 minutos y 150-160ºC
Diseño factorial a dos nieles con cinco repeticiones del punto central
Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
30 150 -1 -1 39.3
30 160 -1 1 40.0
40 150 1 -1 40.9
40 160 1 1 41.5
35 155 0 0 40.3
35 155 0 0 40.5
35 155 0 0 40.7
35 155 0 0 40.2
35 155 0 0 40.6
Punto de base u origen: 35 min a155 ºC
DISEÑO FACTORIAL en MÉTODO DE MÁXIMA PENDIENTE
Modelo Ajustado
1 2ˆ 40.44 0.775 0.325 y x x
Pruebas de adecuación del modelo lineal
Modelo significativo
Falta de ajuste no significativa
Interacción no significativa
Curvatura no significativa
Trayectoria de Máximo Ascenso
o Pasa por el punto 40.44
o Tiene una pendiente =0.325/0.775
j
iPendiente
ˆ
ˆ
Selección de un incremento base para una de las variables
1 1 5min x
Selección del incremento de la otra variable en función de la máxima
pendiente en ascenso
2 1(0.325/ 0.775) 0.42 2º x x C
Incrementos Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
Origen 35 155 0 0 40.5
O+Δ 40 157 1.00 0.42 49.5
O+2Δ 45 159 2.00 0.84 59.8
O+3Δ 50 161 3.00 1.26 70.4
O+4Δ 55 163 4.00 1.68 80.9
O+5Δ 60 165 5.00 2.10 75.1
Experimentos con pendiente en ascenso
Se crea un nuevo diseño alrededor del punto (55, 163)
Variables Naturales Variables codificadas Respuesta
min ºC x1 X2 Rendimiento (%)
50 158 -1 -1 76.5
50 168 -1 1 77.0
60 158 1 -1 78.0
60 168 1 1 79.5
55 163 0 0 81.2
55 163 0 0 80.5
55 163 0 0 80.7
55 163 0 0 80.9
55 163 0 0 80.6
Modelo Lineal
Pruebas de adecuación del modelo lineal
Modelo no significativo
Falta de ajuste significativa
Interacción no significativa
Curvatura significativa
Modelo Cuadrático
Pruebas de adecuación del modelo cuadrático
Modelo significativo
Falta de ajuste no significativa
Interacción no significativa
Curvatura significativa
Proximidad del óptimo
Seleccionar entorno experimental
para diseño de segundo orden
Punto central de los factores que influyen usando modelo de
primer orden
Gradiente considerando ascenso (coeficiente positivo) o
descenso (coeficiente negativo)
Zona de máxima predicción (podría contener al óptimo)
Zona seleccionada para construir un modelo más complejo
1 Proporcionar una distribución razonable de puntos de datos
en el entorno experimental
N min= 1 + 2k + k (k-1)/2
2 Generar datos que permitan el ajuste de un modelo
matemático de segundo orden
Estudiar cada factor en al menos tres niveles análisis de
curvatura.
Tener una cantidad de puntos que permitan estimar todos
los términos del modelo cuadrático.
Diseños experimentales de segundo
orden
k = 3 (tres variables o factores)
x1
x2
x3
x1x2 x1x3 x2 x3
x1x2x3
x12 x2
2 x32
N min= 1 + 2k + k (k-1)/2 = 1 + 2.3 + 3 (3-1)/2 = 10
3 Posibilitar el estudio de la idoneidad del modelo y la
falta de ajuste.
Repeticiones del punto central o de otro punto (4-6).
N = N min + Co
4 Ser eficiente para el cumplir con el objetivo propuesto sin
requerir demasiados puntos experimentales.
6 Posibilitar la realización de experimentos en bloques:
5 Minimizar la varianza de los coeficientes de regresión
del modelo:
Ortogonalidad
Cuando es necesario bloquear el diseño, es importante
mantener la ortogonalidad de los bloques.
El punto central debe distribuirse por igual entre los bloques.
A B A x B
1 1 1
-1 1 -1
1 -1 -1
-1 -1 1
A con B:
[1x1]+[(-1)x1]+[1x(-1)]+(-1)x(-1) = 0
0.437
0.437
Error Estándar del Modelo
7 Proporcionar un error de predicción estable en el
entorno experimental:
Rotabilidad
8 Permitir la creación secuencial a partir de diseños de
primer orden
9 Posibilitar la obtención de diseños aumentados
2k3k
3k D-Optimal
Dos factores Tres factores
Punto central
• Se investigan todas las posibles combinaciones de los niveles de los
factores
• Número de experimentos (N= 3k )
• El número de experimentos crece rápidamente con el número de
factores
3 niveles por factor (-1, 0 , +1)
Diseño Factorial Completo a 3 niveles
Diseño cúbico, que responde al diseño factorial completo 2k
Punto central
Diseño estrella, a una distancia del centro.
•Compuesto por:
5 niveles por factor (-α, -1, 0, +1, +α)
• Número de experimentos
(N = 2k +2k + C0)
Diseño Central Compuesto
Puede generarse a partir de un diseño factorial de primer
orden anterior cuando se observa curvatura y quiere
estudiarse mejor esta región del espacio experimental
Diseño inicialAumento del Diseño
curvatura
Factorial en dos niveles Estrella
Bloque 2Bloque 1
2k + Co2k+ Co
•Centrado en las caras
•Circunscripto
o Rotable
o Esférico
o Práctico
Los puntos estrella o puntos axiales pueden tomar
distintas ubicaciones en el entorno experimental, a una
distancia α del centro del diseño
4factn
1
1
k
4 k
Entorno experimental
esférico
Puntos axiales posibles
experimentalmente
Cuasi-Rotables
5k
Diseño Central Compuesto centrado en las caras
α = 1.0 Se transforma en un
diseño de tres niveles
El entorno experimental es
más acotado
Es útil cuando en la práctica
no se pueden modificar
fácilmente los niveles de los
factores
Diseño Esférico Diseño Rotable Diseño Práctico
k Valor de alfa
2 1.414 1.414 1.189
3 1.732 1.682 1.316
4 2.000 2.000 1.414
5 2.236 2.378 1.495
Punto central
• Compuestos por la combinación de diseños factoriales a dos niveles
con diseños de bloques incompletos
• Número de experimentos (N = 2k (k−1) + c0 )
• Puede aplicarse para k ≥ 3
Tres factores
3 niveles por factor (-1, 0 , +1)
Diseño Box-Behnken
• El dominio experimental es muestreado de manera uniforme, los puntos
experimentales son equidistantes entre si.
• Los factores varían en diferente número de niveles cada uno. Para un diseño
de 3 factores el primero toma tres niveles, el segundo cinco y el tercero siete
x2
• Número de experimentos (N= k2+k+Co)
0 0.5-0.5 1.0-1.0
0
1.0
-1.0
x1
Matriz de Doherlet
Central compuesto (CC)
N = 2k +2k + C0
Factorial completo (FC)
N = 3k
2
3
4
5
6
7
Box-Behnken (BB)
N = 2k (k−1) + C0
más eficiente
Factores Coeficientes Puntos experimentales (N) Eficiencia (E)(modelo cuadrático) (1 punto central)
6
10
15
21
28
36
9
15
25
43
77
143
9
27
81
243
729
2187
-
13
25
41
49
57
0.67
0.67
0.60
0.49
0.36
0.25
-
0.77
0.60
0.51
0.57
0.63
BB CC FC BB CC FC
0.67
0.37
0.18
0.08
0.04
0.02
La Eficiencia de un diseño está dada por el cociente entre el
número de coeficientes estimados por el modelo y el numero
total de puntos experimentales
Eficiencia
Son diseños NO simétricos, logrados mediante
algoritmos computacionales cuyo fin es satisfacer
condiciones establecidas por el operador, tales
como:
Cantidad de puntos experimentales
Tipo de modelo a ajustar
Rangos de las variables
Regiones no posibles de ensayo
Diseños óptimos
1- Región experimental irregular.
2- Falta de ajuste de modelo cuadrático.
3- Necesidad de reducir la cantidad de puntos
experimentales.
• Se dividen en distintos tipos, nombrados por las letras del
alfabeto.
• El tipo de Diseño Óptimo se refiere a la propiedad o
criterio que se pondera en el diseño.
Diseños óptimos
Es un diseño basado en el criterio de proporcionar una
buena estimación de los parámetros de regresión para el
modelo seleccionado.
11 Puntos Experimentales distintos
Se pierde rotabilidad
Diseño D-optimal
Se crean ecuaciones para
restringir el área donde el
sistema genera combinaciones
no favorables
Región de alta presión
1.0 2.0
20.0
40.0
Flujo (mL/min)
%
Met
OH
Región
favorable
Se seleccionan puntos
experimentales con una
distribución óptima desde el
punto de vista estadístico.
Diseño D-optimal con restricciones
Puntos seleccionados
Determinante de
XTX máximo
Selección de puntos experimentales en
dominio asimétrico
Buena estimación de
coeficientes y error
de predicción más o
menos estable.
Error estándar en un diseño central compuesto al
que se quitaron dos puntos por no poder operarse
en esa región
Error estándar en un diseño central D-optimal con
restricciones para evitar esos dos puntos
“prohibidos”
Diseños experimentales de segundo orden
Análisis canónico
Candidato al óptimo
Modelo de segundo orden
Localización del punto estacionario
Análisis de cordillera
Buen ajuste y R2aj mayor a 70%
Para hacer las predicciones
Es el punto del espacio de los factores en el cual el plano
tangente a la superficie tiene pendiente igual a cero y es un
“candidato al óptimo”
Punto Estacionario
Punto de respuesta
máximaPunto de respuesta
mínima
Punto silla
Loma Valle Silla de montar
Cuando hay un punto silla la superficie sube o baja a partir
del punto estacionario dependiendo de la dirección en la que
nos movemos
Punto silla
0ˆ......ˆˆ21 kxyxyxy
2
00 1
k k
i i ii i ij i ji i i j
y x x x x
Paso 1 Ajustar un modelo de segundo orden con niveles
codificados
Paso 2 Verificar el tipo de superficie de respuesta obtenida
Análisis gráfico
Análisis canónico
Paso 3 Obtener el punto estacionario
Bxx bxTT
0ˆˆ y
En donde:
ˆ
ˆ
ˆ
b
x
1
2
k
1
2
k
x
x
x
β
β
β
kk
k
k
ˆsim
2ˆˆ
2ˆ...2ˆˆ
B 222
11211Es el vector que
contiene un valor
dado de los
factores
Es el vector
conteniendo los
coeficientes de
regresión de primer
orden
Es una matriz simétrica cuya
diagonal principal está formada
por los coeficientes de los
términos cuadráticos puros
La derivada de la función respecto al vector x igualada
a cero es:
02ˆ
Bx b
x
y
bBx -1
02
1-
de donde puede calcularse el punto estacionario:
La respuesta predicha para el punto estacionario estará
dada por:
0 o
1ˆy2
ox b
¿Qué tipo de punto estacionario
es?
¿Es el óptimo que buscamos?
2 2 2
0 1 1 2 2 k kˆ ˆy y w w ..... w
0y Valor de la respuesta predicho por el modelo en el
punto estacionario
iw Variables canónicas
i Autovalores de la matriz B
Forma canónica del modelo
Transformaciones de las variables
codificadas
Análisis canónico (uso de análisis de
componentes principales)
x1
x2
w2
w1
Punto estacionario
Origen del diseño
Ecuación canónica: rotación y traslación de los ejes
coordenados
Entorno experimental
Cordillera de la
Superficie
iPositivo para todas las i: Punto MÍNIMO VALLE
Negativo para toda i: Punto MÁXIMO LOMA
Ambos signos: Punto SILLA DE MONTAR
Formas clásicas
Punto estacionario dentro del entorno experimental
Caracterización de la Superficie
Otras formas
Punto estacionario fuera del entorno experimental
i
Positivo para todas las i: CRESTA DESCENDENTE
Negativo para toda i: CRESTA ASCENDENTE
Ambos signos: CORDILERA ESTACIONARIA
Caracterización de la Superficie
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50 0.13 0.75 1.38 2.00
-1.50
-1.13
-0.75
-0.38
0.00
R1
A: AB
: B
22.2
28.828.835.4
42
48.6
Design-Expert® Software
R155.1
20.6
X1 = A: AX2 = B: B
-0.50
0.13
0.75
1.38
2.00
-1.50
-1.13
-0.75
-0.38
0.00
0
14
28
42
56
R
1
A: A B: B
LOMA ASCENDENTE
¿Qué hacemos en este caso?
Seguimos experimentando en el sentido del óptimo, siempre que lo
permitan las condiciones de operación del sistema.
Proponemos un óptimo alternativo, en donde la respuesta es favorable y
las condiciones de operación son posibles
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00 -0.50 0.00 0.50 1.00
-1.50
-0.75
0.00
0.75
1.50
R1
A: AB
: B
2.42
2.42
3.94
3.94
5.45
5.45
6.97
6.97
8.48
8.48
Design-Expert® Software
R110
3
X1 = A: AX2 = B: B
-1.00
-0.50
0.00
0.50
1.00
-1.50
-0.75
0.00
0.75
1.50
0
2.5
5
7.5
10
R
1
A: A B: B
CORDILLERA ESTACIONARIA
¿Qué hacemos en este caso?
Podemos seleccionar el mejor punto desde el punto de vista operacional
que de una respuesta satisfactoria.
En este caso habrá muchas soluciones posibles al problema y podemos
decidir sobre la conveniencia del nivel de los factores
¿Qué hacemos cuando el punto estacionario no es el óptimo buscado?
Objetivo:
MAXIMIZAR la
respuesta
Punto estacionario
En este caso deberemos encontrar el mejor punto posible dentro del entorno
experimental.
Este punto se ubica en la cordillera de mayor crecimiento de la superficie y se
encuentra por el método conocido como “análisis de cordilleras”
Localización del óptimo:
Análisis de cordilleras
Construir esferas (círculos) concéntricos al centro del diseño
Objetivo:
MAXIMIZAR la
respuesta
Centro del diseño
Punto óptimo
en el entorno
experimental
Puntos
alternativos
Los softwares de optimización
emplean ecuaciones matemáticas
para resolver este tipo de situaciones
Cordillera del sistema
• El error de predicción de la respuesta es función del modelo
postulado, el diseño y ubicación del punto.
• Está dado por el producto del Leverage en ese punto de la
superficie, multiplicado por la varianza experimental.
expˆ VxLyV
• El intervalo de confianza para la respuesta predicha puede
calcularse a partir de su desviación estándar
yy stICˆ)05.0(ˆ
• Para estar seguros de haber encontrado un óptimo confiable para
nuestro sistema debemos tener en cuenta el error en la predicción.
Error de predicción
Design-Expert® Software
StdErr of Design1.5
0.5
X1 = A: AX2 = B: B
Actual FactorC: C = 0.00
-1.00
-0.50
0.00
0.50
1.00
-1.00
-0.50
0.00
0.50
1.00
0.000
0.250
0.500
0.750
1.000
S
tdE
rr o
f D
esi
gn
A: A B: B
Leverage: función del diseño y del modelo ajustado
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
Design-Expert® SoftwareR1
Color points by value ofR1:
795.8
1
Run Number
Le
vera
ge
Leverage vs. Run
0.00
0.25
0.50
0.75
1.00
1 3 5 7 9 11 13 15 17
DCC
Modelo Lineal Modelo Cuadrático
puntos centrales
puntos axiales
Error de predicción
Ejemplo:
Con las repeticiones se puede calcular la varianza
experimental:
Sexp = 0.57, Vexp = 0.32
El leverage en el punto de predicción es aproximadamente
L ~ 0.4
Vypred = L .Vexp = 0.13
sypred = 0.36
Ic = t(0.05, 19) . sypred = 1.73 x 0.36 = 0.62
Intervalo: 2.57 - 0.62 = 1.95 (calculado por DE: 1.73)
2.57 + 0.62 = 3.19 (calculado por DE: 3.42)
En los casos estudiados hasta ahora
(diseños experimentales para variables
independientes), cada variable podía
tomar cualquier valor dentro de su
rango, independientemente del valor
tomado por las otras variables.
En una mezcla tenemos la siguiente
restricción:
La suma de todos los componentes debe
ser igual a 1 (o 100%).
Es decir no pueden ser variados
independientemente, ya que al hacerlo
se puede pasar el porcentaje de 100.
1
1
0
0 S = 0
S = 1
S = 1
S = 2
S = 1
¿Cuando es necesario realizar diseños de mezclas?
Composición de azúcares (u otro nutriente) de un
medio de cultivo que exige que se cumpla cierto valor
de osmolaridad.
Mezcla de solventes en un proceso extractivo
(diferentes polaridades para diferentes compuestos a
extraer).
Composición de fases en cromatografía.
Diferentes ligandos de un comprimido farmacéutico.
Constituyentes de un alimento.
Otros.
Cuando los factores analizados son componentes
de una mezcla, sus niveles no son
independientes entres si.
El espacio experimental es una figura que tiene
tantos vértices como componentes, en un espacio
cuya dimensionalidad es igual al número de
componentes menos uno.
La respuesta es una función de las proporciones
de los componentes.
• Tres componentes (3)
• Espacio experimental: triángulo
(cada vértice corresponde a un
componente puro)
• Dimensionalidad: 2
0 x1
1
0
x2
1
X1+x2 = 1• Dos componentes (2)
• Espacio experimental:
segmento de recta (cada extremo
corresponde a 100 % un
componente)
•Dimensionalidad: 1
• Cuatro componentes (4)
• Espacio experimental:
pirámide (cada vértice
corresponde a un
componente)
•Dimensionalidad: 3
Modelo clásico para un sistema lineal de 2
componentes:
y = b0 + b1 x1 + b2 x2
y = X b + e = ypred + e
=
(XTX)-1XT y = (XTX)-1XTX b
b = (XTX)-1XT y b = [b0 ; b1 ; b2 ]
ypred = X (XTX)-1XT y ypred = H y (H es conocida como matriz “hat” por sombrero)
Xb = X(XTX)-1XT y
Pero XTX es singular en un diseño de
mezclas
ya que x1+ x2 = 1
y = b0 + b1 x1 + b2 x2 + e
Si (x1+ x2= 1), podemos hacer:
ypred = b0 (x1+ x2)+ b1 x1 + b2 x2 (la suma no se altera)
ypred = (b0 + b1) x1 + (b0 + b2) x2
ypred = b1* x1 + b2 * x2
Si x1 = 1, x2 = 0, entonces y = b1*
Si x2 = 1, x1 = 0, entonces y = b2*
Con sólo dos experimentos se pueden calcular fácilmente los
coeficientes del “modelo lineal para dos componentes”
Reemplazando x12 = x1 (1- x2 ) y x2
2 = x2 (1- x1 ), se llega a :
ypred = b1* x1 + b2 * x2 + b12* x1 x2
Modelo cuadrático para dos componentes
De manera similar se puede llegar a:
ypred = b1* x1 + b2 * x2 + b3 * x3 + b12* x1 x2 + b13* x1 x3 +
+ b23* x2 x3
Modelo cuadrático para tres componentes
ypred = b1* x1 + b2* x2 + b3* x3 + b12* x1 x2 + b13* x1 x3 +
+ b23* x2 x3 + + b123* x1 x2 x3
Modelo cúbico especial para tres componentes
Modelo cuadrático cásico:
Yi = o + 1 X1 + 2 X2 + 12 X1 X2 + 11 X12 + 22 X2
2 + i
q
i
q
kji
kjiijkjiijii xxxxxxy1
Modelo de Scheffé:
Henry Scheffé (1907-1977)
Ejemplo 1Formulación del un comprimido
en que se busca la mejor mezcla de los tres
ligandos (90.8% del total):
Alfa-lactosa monohidratada (X1), beta-lactosa anhidra
(X2) y almidón de arroz modificado (X3).
Respuestas: fuerza que hay que hacer para romper la
tableta (Y1), y la velocidad de disolución (Y2).
(R. Leardi / Analytica Chimica Acta 652 (2009) 161–172)
• Los coeficientes de los términos lineales
corresponden a la respuesta obtenida
con el componente puro.
Modelo obtenido para la primer respuesta:
• Los coeficientes de las interacciones dobles
indican el efecto sinérgico. En el ejemplo, si no
hubiera interacción, el valor debería ser el promedio de los
coeficientes para X1 y X2, es decir 72 [(31+113)/2]. Pero
es 120/4 (así se calcula el efecto en las interacciones
dobles, dividiendo por cuatro), es decir 30, o sea 42
unidades menos.
• Los coeficientes de las interacciones triples se
calculan dividiendo por 27
• En la figura puede verse que X2 tiene el mayor efecto sobre Y1 y
éste es positivo (pasa de 39 a 113).
• X1 tiene menor efecto, pero negativo (pasa de 70 a 31).
• X3 es el componente con menor efecto (pasa de 42 a 38).
• Observar que estos efectos no se corresponden con los
valores de los coeficientes!
Y1 = 39 (X2 = 0)
Y1 = 113
(X2 = 100%) Y1 = 70 (X1 = 0)
Y1 = 31
(X1 = 100%)
Y1 = 42 (X3 = 0)
Y1 = 38
(X3 = 100%)
Ejemplo 2
Formulación de un comprimido
en el cual hay 20% de droga y el resto
corresponde a una mezcla de 3
excipientes:
1- Lactosa
2- Avicel PH 101 (una celulosa microcristalina)
3- Hidroximetilpropilcelulosa (HMPC)
Comprehensive Chemometrics. Vol 1, página 431
Gráfica de trazas: “Trace”
Es una especie de silueta de la superficie de respuesta.
Representa el efecto de cambiar cada componente en una línea imaginaria a
partir de una mezcla referencia (el centroide)
Ejemplo: Formulación de un
detergente midiendo dos
respuestas: viscosidad y turbidez
Restricciones:
• 3% ≤ A (agua) ≤ 8%
•2% ≤ B (alcohol) ≤ 4%
•2% ≤ C (urea) ≤ 4%
A+B+C=9%
Tutorial DExpert
Pseudocomponentes
Efluente de la
industria lechera
Efluente de la
industria
cervecera
Efluente de la
industria
azucarera
Optimization of the Bacillus thuringiensis var. kurstaki HD-1 d-endotoxins production by using experimental mixture design
and artificial neural networks. GA Moreira, GA Micheloud, AJ Beccaria, HC Goicoechea, Biochem. Eng. J., 2007, 35, 48-55.
Ejemplo usando efluentes industriales para un medio de cultivo
Modelos mixtos:
Mezcla-Proceso y Mezcla Mezcla
x1
x2
x3 x1
x2
x3
x1
x2
x3
x1
x2
x3x1
x2
x3
z1
z2
x1
x2
x3
z1
z2
z3
z1
z2
z3
z1
z2
z3z1
z2
z3
y = f (x) x g (z)
y = (f1 x1 + f2 x2 + f3 x3) x (g1 z1 + g2 z2 + g3 z3)
y = (f1 x1 + f2 x2 + f3 x3) x g1 z1 + (f1 x1 + f2 x2 + f3 x3) x g2 z2 + (f1 x1
+ f2 x2 + f3 x3) x g3 z3
y = f1 x1 g1 z1 + f2 x2 g1 z1 + f3 x3 g1 z1 + f1 x1 g2 z2 + f2 x2 g2 z2 + f3
x3 g3 z3 + f1 x1 g3 z3 + f2 x2 g3 z3 + f3 x3 g3 z3
33
3
332
3
231
3
1
23
2
322
2
221
2
113
1
312
1
211
1
1
zxbzxbzxb
zxbzxbzxbzxbzxbzxby
Modelo lineal mixto de mezclas cruzadas
para tres componentes
Ejemplo de uso en CE: optimización en la
separación de picos combinando dos variables de
proceso (pH y voltaje) y tres de mezclas (3
diferentes sales para los buffers)
Determinación de fluoroquinolonas por CE-DAD en
aguas
Se evaluó la separación de los 4 quinolonas fluoradas bajo diferentes soluciones
reguladoras compuestas por 3 naturalezas distintas de iones: fosfato, borato y
citrato, todas de sodio.
Enoxacina: ENO
Ciprofloxacina: CPF
Ofloxacina: OFN
Enrofloxacina: ENF
M.R. Alcaráz, L. vera-Candioti, MJ Culzoni, H.C. Goicoechea. Anal.
Bioanal. Chem. 406 (2014) 2571-2580.
Se tiene como objetivo reducir tiempo de
análisis, pero asegurándose que no se toquen los
picos 2 y 4
Optimización de un medio de cultivo para la
producción de una proteína recombinante
C. Didier, M. Etcheverrigaray, R. Kratjie, H.C. Goicoechea, Chemom. Intell. Laborat. Syst. 86 (2007) 1
Modelo mixto
Commercial product
of high price
Developed product of
low price
Response Modelo F p Adj. R2 p-LOF
IVC QxQ 6.46 < 0.0001 0.722 0.307
qprot QxQ 8.39 < 0.0001 0.781 0.013
BA QxQ 11.04 < 0.0001 0.832 0.052
qlact QxQ 5.46 < 0.0001 0.679 0.233
qamo QxQ 2.85 0.0055 0.500 0.005
Modelo mixto
La MSR es una técnica sumamente
versátil que permite la utilización de
diferentes diseños experimentales y
herramientas estadísticas para resolver
problemas de optimización de sistemas.
Puede aplicarse a la optimización de una
única respuesta o a la optimización
simultanea de varias respuestas.
Conclusiones
El buen criterio del operador y el correcto
uso de la metodología son fundamentales para
arribar a conclusiones correctas.
Una vez obtenidas las condiciones óptimas de
operación del sistema, según el criterio
establecido, las mismas deben confirmarse
experimentalmente.
Conclusiones
top related