optimizaciÓn de la producciÓn de proteÍnas …

52
OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS RECOMBINANTES EN PICHIA PASTORIS BASADA EN UN MODELO IN SILICO. Daniel Martínez Barragán 24 de junio de 2014

Upload: others

Post on 25-Jun-2022

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

OPTIMIZACIÓN DE LA PRODUCCIÓN DEPROTEÍNAS RECOMBINANTES EN PICHIA

PASTORIS BASADA EN UN MODELO IN SILICO.

Daniel Martínez Barragán

24 de junio de 2014

Page 2: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Índice general

1 Introducción 41. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62. Objetivos específicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63. Descripción del trabajo desarrollado . . . . . . . . . . . . . . . . . . . . . . 7

2 Construcción del modelo 81. Definición del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82. Construcción del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.1. Selección de los experimentos. . . . . . . . . . . . . . . . . . . . . . 132.2. Formulación y desarrollo del problema. . . . . . . . . . . . . . . . . 162.3. Estimación paramétrica para múltiples experimentos. . . . . . . . . . 20

3 Optimización mono-objetivo 241. Adecuación del modelo para el problema de optimización . . . . . . . . . . . 242. Definición de la función de costo . . . . . . . . . . . . . . . . . . . . . . . . 273. Problema de optimización . . . . . . . . . . . . . . . . . . . . . . . . . . . 284. Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4 Optimización multi-objetivo 401. Definición general del problema Multi-Objetivo . . . . . . . . . . . . . . . . 412. Planteamiento del problema de optimización . . . . . . . . . . . . . . . . . . 413. Solución Computacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424. Validación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

5 Conclusiones 47

1

Page 3: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Índice de figuras

2.1 Modelo Monod Convencional . . . . . . . . . . . . . . . . . . . . . . . . . 122.2 Modelo propuesto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122.3 Biomasa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152.4 Proteina. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162.5 Validación Bio-Pro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

3.1 Variables de estado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313.2 Señales de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323.3 Trayectoria Inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333.4 Variables de control manipulables . . . . . . . . . . . . . . . . . . . . . . . 333.5 Variables de estado señal Óptima . . . . . . . . . . . . . . . . . . . . . . . . 343.6 VarControl señal Óptima . . . . . . . . . . . . . . . . . . . . . . . . . . . . 353.7 Resultados Experimentales . . . . . . . . . . . . . . . . . . . . . . . . . . . 373.8 Validación del experimento (Roja real, Azul experimental) . . . . . . . . . . 39

4.1 Filosofía Conjunto de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . 404.2 Frontera de Pareto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 434.3 Respuesta Óptima MultiObjetivo . . . . . . . . . . . . . . . . . . . . . . . 454.4 Validación experimento-Conjunto de Pareto . . . . . . . . . . . . . . . . . . 46

2

Page 4: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Índice de tablas

1.1 Variables del Biorreactor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.1 Variables usadas en el Bioproceso . . . . . . . . . . . . . . . . . . . . . . . 92.2 Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142.3 Matriz de pesos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192.4 Estimación de parámetros experimentos independientes . . . . . . . . . . . . 192.5 Costo computacional Mono-Experimento . . . . . . . . . . . . . . . . . . . 192.6 Valor de los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.7 Costo Computacional estiación Multi-Experimentos . . . . . . . . . . . . . 222.8 Error Múltiples-Experimentos . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.1 Relación µo2vs OT R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263.2 Relación µvs Metconsumido . . . . . . . . . . . . . . . . . . . . . . . . . . . 273.3 Costo computacional optimización Mono-Objetivo proteína . . . . . . . . . . 313.4 Costo computacional optimización Mono-Objetivo Biomasa . . . . . . . . . 353.5 Biomasa Proteína . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383.6 Error Comparación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

4.1 Costo computacional Multi-Objetivo . . . . . . . . . . . . . . . . . . . . . 44

3

Page 5: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Capítulo 1

Introducción

Desde queWatson y Crick descubrieron el modelo de ADN en 1953 su concepción y los estu-dios realizados desde entonces, han evolucionado hasta el punto de llegar a su manipulaciónpara desarrollar numerosas aplicaciones. Desde entonces el estudio del ADN y otras molécu-las se ha permitido entender el medio de transporte y portabilidad de la información genética.Desde comienzos del siglo pasado, se ha descubierto que algunas enfermedades ocurren de-bido a fallas metabólicas que bien pueden ser por deficiencia en una enzima, proteína ausenteo menos proteína con menor actividad en comparación a como debería ser normalmente; es-to se debe a mutaciones en los genes que codifican la síntesis de esas proteínas lo que haconllevado a nuevos desarrollos investigativos que se han enfocado en la terapia de reem-plazo enzimático, la cual consiste en la producción de proteínas recombinantes a partir demicroorganismos [7].El desarrollo y producción de estas proteínas con fines industriales o farmacéuticos, hoy endía es objeto de investigación a nivel mundial debido al menor costo económico y sosteni-bilidad ambiental respecto a medicamentos sintéticos. Por ejemplo, el tratamiento de reem-plazo enzimático en el síndrome Gaucher para una persona de aproximadamente 70kg es deUS200.000 por año [6], siendo esta cantidad monetaria bastante alta para un individuo conun nivel de vida promedio. Es por esto que se ha visto la necesidad de desarrollar nuevasestrategias para la producción de proteínas recombinantes y así poder darle la oportunidad ala población de acceder a tratamientos con mayor comodidad. Dentro de estas estrategias seencuentran métodos avanzados de control y optimización, basados en modelos matemáticosde sistemas de producción enzimáticos para obtener procesos eficientes y con bajos costos deoperación en comparación a los métodos tradicionales de producción [5] [13].La comunidad científica ha desarrollado una serie de investigaciones con diferentes micro-organismos evaluando así su comportamiento con el fin de poder deducir qué organismopresenta un mejor rendimiento para la producción de proteínas recombinantes y así poderofrecer un mejor tratamiento a cada enfermedad en específico. En un principio, se trabajócon microorganismos tales como [16] Escherichia Coli, Saccharomyces Cerevisiae y PichiaPastoris. En donde E.Coli y S.Cerevisiae, han venido presentando una buena producción, pe-ro con el inconveniente de que se han encontrado residuos poco orgánicos que hacen que la

4

Page 6: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 1. INTRODUCCIÓN 5

proteína no tenga las mejores condiciones higiénicas y salubres para el uso con fines terapéu-ticos. A diferencia, P. Pastoris presenta un alto nivel de pureza en la proteína desarrollada,además de una elevada tasa de producción respecto a los demás microorganismos.El comportamiento de P. Pastoris está directamente relacionado con factores externos, talescomo el medio en el que se encuentra el cultivo (recipiente, cultivo, Biorreactor), el sustratoque se le suministre (fuente de carbono), oxígeno disuelto, temperatura y pH. Además, seha observado en trabajos desarrollados previamente [5, 7], que en medios líquidos o sólidosla tasa de crecimiento es elevada y depende directamente de la fuente de carbono que sele suministre. Por ejemplo: el tiempo que tarda en duplicarse la biomasa con una fuente decarbono [10, 18] constituida por glucosa es aproximadamente 90 minutos, y para una fuenteconstituida por metanol, es de aproximadamente 6 horas.Es importante tener en cuenta que la productividad de P. Pastoris aumenta considerablementeen un ambiente controlado, es por eso que se recomienda tratar al cultivo dentro de un sistemacomo un Biorreactor, el cual permite regular y manipular variables tales como el pH queindica la acidez o la alcalinidad, donde a un nivel bajo, el riesgo de contaminación microbianaes menor pero con riesgo de proteólisis1 del producto.El crecimiento del microorganismo no se ve necesariamente afectado dentro de un rango depH entre 3 a 7, pero tiene un efecto significativo sobre las proteínas secretadas. Usualmente,el pH se controla por medio de hidróxido de amonio que a su vez es una fuente de nitrógeno.Generalmente se maneja una temperatura entre 26 y 30 ºC para mejorar la calidad del entornode la Biomasa [13].Como se menciona anteriormente, esta área de desarrollo de proteínas recombinante al sertan reciente, aun no tiene definida una metodología o estrategia puntual que garantice uncomportamiento óptimo de crecimiento de Biomasa y/o producción de Proteína a partir delmicroorganismo P.Pastoris. Es por eso que este tema de investigación al ser tan amplio, per-mite desarrollar investigaciones con aportes significativos.Entrando más a fondo en el comportamiento de P.Pastoris, se puede decir que el ciclo defermentación esta definido por dos fases donde básicamente cada fase varia según la fuentede carbono principal que se le suministre al cultivo: La primera, siendo la fuente de carbonoprincipal el glicerol, es conocida como fase de inducción o de crecimiento, la cual consiste enalcanzar una concentración de Biomasa establecida donde el tiempo que tarda en alcanzar estevalor esta sujeto básicamente a la tasa de inserción de glicerol al Biorreactor. Es importantetener en cuenta que la tasa de crecimiento depende de la cantidad inicial de glicerol y quela concentración a la que debe llegar la Biomasa va a influir en la segunda etapa ya quetrabajos previos dicen que a mayor concentración de Biomasa, la producción de proteínasera mas elevada pero que la tasa de producción esta directamente relacionada con la tasa decrecimiento. La segunda fase conocida como etapa de inducción o producción, consiste encambiar su fuente de carbono principal a Metanol el cual estimula al microorganismo a laproducción de Biomasa [7].

1degradación de proteínas por medio de enzimas específicas llamadas proteasas o por medio de digestiónintracelular

Page 7: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 1. INTRODUCCIÓN 6

El Instituto de Errores Innatos del Metabolismo IEIM y el departamento de ingeniería elec-trónica están estudiando nuevas alternativas para optimizar la producción de proteínas recom-binantes debido al elevado costo que implica desarrollar un proyecto de investigación basán-dose únicamente en métodos in situ, refiriéndose a este como el desarrollo de experimentosprácticos donde la única herramienta o método de optimización empleado es la experienciaque tiene el investigador que parte de datos históricos. El inconveniente con esta clase demétodos es el tiempo de uso por equipo, envejecimiento de los sensores y actuadores dandocabida a posibles errores en las mediciones; uso de material costoso no reutilizable como elmismo organismo, los reactivos que se deben administrar constantemente y la limitación deestrategias de optimización, ya que por este método no es posible determinar un óptimo glo-bal previo a la práctica, sino que por lo contrario es necesario e indispensable realizar pruebasdonde los datos históricos de los resultados son un punto de partida y de comparación para eldesarrollo de experimentos posteriores.En los últimos años se han venido desarrollando diferentes modelos in silico2 del metabo-lismo de P.Pastoris [1], sin embargo, estos no corresponden con los que se están trabajandoIEIM [2,3]. Es por eso que se ve la necesidad de modificar estos modelos adecuándolos paraque correspondan a los mutantes con los que se está trabajando. La validación se desarrollapor medio de simulaciones que permitan evaluar el comportamiento en un Biorreactor, quese pueda modelar bajo un sistema de ecuaciones diferenciales [9].

1. Objetivo general

Desarrollar una estrategia de control mono-objetivo y una estrategia multi-objetivo para unmodelo simulado de la producción de proteínas recombinantes en el microorganismo PichiaPastoris.

2. Objetivos específicos

• Seleccionar un modelo de flujo metabólico existente cuyo comportamiento se asemejeal comportamiento del microorganismo adquirido por el IEIM.

• Formular y resolver un problema de control óptimo en lazo abierto con función de costotipo Mayer para el modelo seleccionado anteriormente que maximice la concentraciónde biomasa Cx(t), respetando las restricciones estructurales del Biorreactor.

• Extender el problema de control óptimo en lazo abierto a un problema multi-objetivodonde se maximice la concentración de biomasa y la concentración de proteína.

• Comparar los resultados obtenidos de manera teórica con los datos históricos adquiri-dos por medio de métodos in situ.

2Estrategia de investigación fundamentada en mecanismos o modelos matemáticos.

Page 8: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 1. INTRODUCCIÓN 7

Variable oparámetro

Sigla Unidades Descripción

Volumen delBiorreactor

V l Capacidad máxima de Volumen

Porcentaje deMetanol

CMet % Cantidad de Metanol disuelto, enporcentaje

Porcentaje deoxígeno

Cod % Cantidad de Oxígeno disuelto, enporcentaje

Biomasa X gbio/lBio Cantidad de Biomasa por cada litro en elBiorreactor

Proteína P gpro/lBio Cantidad de Proteína por cada litro en elBiorreactor

Flujo de aire Fair 1/h Flujo de aire que ingresa al BiorreactorCoeficiente de

transferencia deoxígeno al medio

Kla l/h Cantidad de oxígeno que se transfiere almedio, en este caso a la solución del

BiorreactorFlujo de entrada

(Metanol)Fin l/h Cantidad de Metanol que ingresa a la

solución en cada hora

Tabla 1.1: Variables del Biorreactor

3. Descripción del trabajo desarrollado

Los grupos de investigación CEPIT de ingeniería electrónica y el IEIM de ciencias, tienencomo finalidad desarrollar un sistema automatizado que se encargue de optimizar la produc-ción de proteínas recombiantes a partir del microorganismo P.Pastoris con fines terapéuticos.Específicamente, para este trabajo se busca aportar por medio de simulaciones, una estrategiaóptima de cultivo.Para este proyecto, se desarrolla en primer lugar el planteamiento de un modelo matemáticoque represente el comportamiento del microorganismo, para esto se toma como referencia ypunto de partida los modelos desarrollados y mostrados en la bibliográfica investigada.Posteriormente a partir del modelo desarrollado, se plantean dos problemas de optimización,el primero corresponde a un problema Mono-Objetivo que busca maximizar el crecimiento deBiomasa X(t) o de proteína P(t). Mientras que el segundo corresponde a un problema Multi-Objetivo, en donde se busca optimizar el crecimiento de Biomasa y de Proteína simultánea-mente. La tabla 1.1 muestra una descripción de las variables y parámetros del Biorreactorlocalizado en el laboratorio del IEIM.Es importante aclarar y tener en cuenta que durante el desarrollo del trabajo las variables quetrabajen en tiempo continuo se denotaran con t y las que se estimen a partir de una muestraen el instante i se denota como ti.

Page 9: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Capítulo 2

Construcción del modelo

1. Definición del modelo

Para este proyecto, como primera medida se debe tener bien definido el modelo matemáticodel sistema a controlar. Para la formulación de este modelo se parte de [5] donde explicanla manera adecuada para modelar matemáticamente la estructura y comportamiento de unBiorreactor y microorganismo según sus características físicas y su finalidad. Según esto, laecuación de balance general para cualquier compuesto de entrada o salida es:

dCi(t)dt

= D(t)(CRi (t)−Ci(t))+Qi(t)+T Ri(t) (2.1)

La ecuación 2.1 corresponde al balance de la concentración para un componente determinadoi, donde C(t) es la notación vectorial correspondiente a la concentración del componente ien el Biorreactor R, D(t) es la tasa de dilución del flujo de entrada respecto al volumen dellíquido, Q(t) corresponde a la tasa de flujo volumétrico molar y T R es el vector correspon-diente a la tasa de transferencia de masa en el Biorreactor. Para este proyecto se trabaja conlas variables mostradas en la tabla 2.1.

8

Page 10: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 9

Sustancia Ecuación de balance

Volumen en elBiorreactor

V (t) = Fin(t)

Concentración deMetanol

dCMet(t)dt = Fin(t)

V (t) CMet(t)− CMet(t)V (t)

dV (t)dt −QMet(t)

Concentración deOxígeno disuelto

dCod(t)dt = Kla(Fair,Ω, t)−Qo(t)

Crecimiento deBiomasa

dX(t)dt =−X(t)

V (t)dV (t)

dt +Qx(t)

Producción deproteína

dP(t)dt =−P(t)

V (t)dV (t)

dt +Qp(t)

Factor decrecimiento de

Biomasa

QX(Cx,Cp,CMet ,Co) = µ(t)∗X(t)

Factor decrecimiento de

proteína

QP(Cx,Cp,CMet ,Co) = qpro(t) ·X(t)

Factor de consumode Metanol

QMet(Cx,Cp,CMet ,Co) = rMet(t) ·X(t)

Factor de consumode Oxígeno

Qo(Cx,Cp,CMet ,Co) = ro2(t) ·X

Tabla 2.1: Variables usadas en el Bioproceso

˙Cod(t) = Kla(t) · (C∗od−Cod(t))− ro2(t) ·X(t) (2.2)

˙V (t) = Fin(t) (2.3)

˙CMet(t) = Fin(t)− rMet(t) ·P(t) (2.4)

Fin(t) es el flujo de entrada de sustrato y Kla(t) es el coeficiente de transferencia de oxígenoque depende del flujo de aire de entrada y la agitación.Las funciones Qi corresponden a las tasas de crecimiento o consumo de cada una de lasvariable las cuales están relacionadas entre si.Partiendo de esta formulación, se debe definir el valor correspondiente a cada término mate-mático partiendo de los datos históricos obtenidos en las pruebas realizadas por el IEIM enel laboratorio. Actualmente no se posee la información suficiente para estimar los paráme-tros, es por eso que se debe encontrar un medio alterno en donde se contemple la estimación

Page 11: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 10

o aproximación de parámetros partiendo de los datos existentes, o seleccionar los valores apartir de la información investigada como [5, 12, 13, 16, 20].Las definiciones señaladas anteriormente son las más aplicadas para desarrollar un modelodel crecimiento de microorganismos en un Biorreactor con parámetros controlables y/o esti-mables. Además de estos parámetros, estas definiciones están conformadas por expresionesque se deberán determinar bien sea mediante datos obtenidos en la bibliografía o por mediode su deducción a partir de los datos obtenidos por el IEIM en laboratorio.

2. Construcción del modelo

Como primera medida, se analizan los modelos obtenidos en la literatura, los cuales sirven dereferencia para el desarrollo de un modelo propio que aproxime en lo posible, el comporta-miento del crecimiento de Biomasa y la producción de proteínas a partir del microorganismoP.Pastoris.Como base y punto de partida, se toma la definición del modelo Monod dada por (2.1), el cuales un sistema monotonamente creciente donde para cada variable de estado en el instante idebe ser menor al valor en el instante i+1 [5].Es importante aclarar que según el planteamiento de modelo de Monod, las señales de controldeberían ser el coeficiente de transferencia de oxígeno Kla(t) y el flujo de entrada de sustratoFin(t), pero para efectos de este trabajo las variables de control son, el porcentaje de oxígenodisuelto Cod(t) y el porcentaje de Metanol en el Biorreactor CMet(t), ya que estas variables aligual que las de estado, son medidas en el Biorreactor.La razón por la cual el Fin(t) y Kla(t) no son las señales de control, se debe a que el sistemade medición de flujo aun no se ha acoplado adecuadamente al Biorreactor, y por otra parte,la estimación del coeficiente de transferencia de oxígeno, se encuentra en desarrollo en untrabajo de pre-grado.Partiendo del análisis y las aclaraciones desarrolladas anteriormente las expresiones para elcrecimiento de Biomasa X(t) y la producción de proteína P(t) se definen como se muestra acontinuación.

˙X(t) = µ(t) ·X(t)−D ·X(t) (2.5)

˙P(t) = qpro(t) ·X(t)−D ·P(t) (2.6)

Las dos variables son términos dependientes de la dilución D la cual sera tomada como unvalor a estimar constante para este caso en específico debido a no existen medidas físicas deesta función por las limitantes en los sistemas para la adquisición de datos.La tasa de crecimiento µ(t) se puede expresar en términos de la tasa máxima de crecimientoµmax, concentración de sustrato CMet(t) y su constante de saturación kmet .Para este trabajo

Page 12: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 11

µ(t) = µmax ·CMet(t)

CMet(t)+ kMet(2.7)

Partiendo del sistema definido anteriormente y de la experiencia obtenida a partir de los expe-rimentos realizados en el laboratorio, se deduce que el sistema con el cual se esta trabajandodepende directamente la cantidad de oxigeno disuelta en el Biorreactor.Consecuentemente a este análisis planteado µ(t) se modifica de la siguiente manera para queel sistema dependa directamente del oxígeno.

µ(t) = µmax ·CMet(t)

CMet(t)+ kMet·

Cod(t)Cod(t)+ kod

(2.8)

La concentración de oxigeno corresponde al parámetro Cod(t) y su constante de saturaciónesta dada por kod(t) .A demas de esta modificación también se pudo observar que en los experimentos, la evoluciónde los parámetros a través del tiempo, no necesariamente se comporta como un sistema mono-tonamente creciente, por lo que se le debió adecuar un termino capaz de saturar al sistema enun limite superior y que a partir de ese limite el sistema puede llegar a tener comportamientosdecrecientes, lo cual es llamado por algunos autores como, ¨Limite de intoxicación¨ [3].Consecuente a este análisis µ se modificó de la siguiente manera.

µ(t) = µmax ·CMet(t)

d ∗C2Met(t)+CMet(t)+ kMet

·Cod(t)

Cod(t)+ kod(2.9)

Al definir el coeficiente de saturación µ(t) de la manera en la que se esta proponiendo, laconcentración de Biomasa tiende a disminuir luego de alcanzar un valor límite dado por laconstante de saturación µmax, a diferencia del modelo Monod donde tiende a crecer asintó-ticamente hasta un valor máximo µmax mostrado en la figura 2.1. en el modelo propuesto larapidez con la que el sistema llega a este punto de inflexión en donde pasa de tener un com-portamiento creciente a uno decreciente, esta dada por el parámetro d mostrado en la figura2.2. Esta propuesta es bastante novedosa e innovadora debido a que hasta ahora, no se handesarrollado trabajos con este planteamiento ni este comportamiento. Uno de los modelosmas aproximados se encontró en el trabajo [16] donde muestra que el comportamiento de laBiomasa decrece. Con la diferencia de que este modelo esta compuesto por varios subsiste-mas que se activan dependiendo de las condiciones en las que se encuentre el cultivo.Otro de los aportes que hace que este planteamiento sea exclusivo es las investigaciones quese han desarrollado que hasta ahora tienen definido de manera individual el coeficiente desaturación µ(t), o bien sea en función del Metanol o en función del oxígeno disuelto, pero node manera simultanea a como se esta proponiendo en esta investigación.Otra diferencia considerable a los trabajos desarrollados, es la forma en que se define latasa de producción de proteína qpro(t), planteada como una función cuadrática que dependeexclusivamente de la tasa de crecimiento µ(t) con el objetivo de relacionar la concentración

Page 13: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 12

mumax vs Met

mu

ma

x

Met

Figura 2.1: Modelo Monod Convencional

Met

mu

ma

x

mumax vs Met

Figura 2.2: Modelo propuesto

Page 14: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 13

de oxigeno disuelto, la cantidad de Metanol y la producción de proteína entre si (Ver ecuación2.10). Lo mas usual es encontrar que la tasa de producción de proteína se defina con unadinámica lineal y ademas no relacioné los términos ya mencionados [5].

qpro(t) = a+µ(t) ·b+ c ·µ2(t) (2.10)

Obteniendo como resultado al siguiente modelo:

µ(t) = µmax · CMet(t)d·C2

Met(t)+CMet(t)+kMet· Cod (t)

Cod (t)+kod

qpro(t) = a+µ(t) ·b+ c ·µ2(t)X(t) = µ(t) ·X(t)−D ·X(t)

P(t) = qpro(t) ·X(t)−D ·P(t)

(2.11)

Partiendo de este modelo y debido a que la concentración de Metanol CMet(t) y la concentra-ción de oxígeno disuelto Cod(t) son variables que se pueden estimar en el laboratorio, estasserán tomadas como entradas del sistema.

2.1. Selección de los experimentos.

Los investigadores del IEIM durante los últimos años han venido desarrollando experimentosmediante pruebas in situ, los cuales han presentado comportamientos no deseados en algunoscasos debido a la complejidad que implica trabajar con materiales, equipos e implementossensibles como con los que se trabaja en esta investigación.Cada uno de los experimentos consta de dos etapas, la primera es la etapa de crecimiento enla cual se estimula a que el microorganismo crezca hasta un valor determinado introducién-dole como fuente de carbono principal Glicerol. Usualmente la etapa de crecimiento llegahasta que el microorganismo alcanza una concentración de Biomasa de 60 a 80 [gbio/l]. En lasegunda etapa se induce al microorganismo a la producción de proteína cambiándole la fuen-te de carbono principal a Metanol. Las variables manipulabes son el flujo de oxígeno, el flujode Metanol y la agitación la cual se encarga de dispersar las variables de entrada alrededor detodo el volumen. Las variables medibles son el porcentaje de Metanol y de oxígeno disuelto.Cada una de estas variables es registrada cada minuto durante todo el proceso. Cada 8 horases extraída una muestra del Biorreactor a la cual se le estima por medio de procesos quími-cos, la Cantidad de Biomasa y de proteína para ese instante de tiempo. Cada experimentoes desarrollado bajo ciertas condiciones de cultivo como la concentración de Metanol y deoxígeno disuelto que pueden tomar valores entre 0− 5 [%] y 0− 100 [%] respectivamente.Cada uno de los experimentos es desarrollado con valores donde idealmente se espera quesean constantes pero en ocasiones los controladores que regulan estas variables no logranmantener las condiciones para cada una de estas variables 2.2.El IEIM ha desarrollado una serie de experimentos a diferentes condiciones con el fin derecopilar información suficiente para poder hacer un análisis adecuado del comportamiento

Page 15: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 14

Experimento %CMet %CodConvergencia

ValidoSP CMet SPCod

1 1.3 10 Si Si Si2 0.5 40 Si Si No3 0.5 25 No Si Si4 1.3 25 Si Si Si5 1.3 40 No si No6 2 40 Si Si No7 0.5 10 No Si Si8 2 10 No Si No9 2 10 Si Si No

Tabla 2.2: Experimentos

del microorganismo. Los experimentos que se han desarrollado son una combinación entrevalores medios, bajos y altos de las dos variables mencionadas (Ver tabla 2.2).A continuación se muestran los experimentos desarrollados por el instituto con una brevedescripción del porqué se teinen en cuenta o no, para el desarrollo de este trabajo de investi-gación.

1. Experimento 1: Presenta una dinámica adecuada con información suficiente

2. Experimento 2: A pesar de que este experimento tiene un comportamiento adecuado,este es rechazado debido a que la fase de inducción 1 dura muy poco tiempo en com-paración a los demás experimentos.

3. Experimento 3: Al discutir este experimento con el personal del IEIM, se da el infor-me de que para este caso, el controlador de flujo de Metanol no estaba funcionandoadecuadamente, pero a pesar de eso, el comportamiento de la Biomasa y la proteínapresentan una tasa de crecimiento aceptable. Es por eso que este experimento se tieneen cuenta para el desarrollo del trabajo.

4. Experimento 4: Presenta un comportamiento aceptable durante el tiempo que dura elexperimento.

5. Experimento 5: El sistema nunca converge al set point para el Cod(t) y se aproximaal set point de CMet(t). Debido a que presenta un decaimiento en la concentración deBiomasa este experimento no se tiene en cuenta para el desarrollo del proyecto.

1Nota: Es importante aclarar que a pesar de que se pasa de la fase de crecimiento a la de producción (Cambiode la fuente primaria de carbono de glicerol a Metanol), hay casos en los que a pesar de que se cambia de fase,el residuo remanente de glicerol es tal que el microorganismo P.Pastoris continua en la fase 1 hasta terminaresta fuente de carbono y así poder iniciar su fase de inducción al comenzar a consumir de Metanol.

Físicamente, se puede inferir que el microorganismo cambio de fase cuando su crecimiento cambia de unapendiente elevada a una mas baja [7].

Page 16: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 15

6. Experimento 6: Este experimento al igual que el anterior es rechazado ya que presentauna curva de decaimiento en la Biomasa .

7. Experimento 7: Tiene un comportamiento de convergencia para ambos set point ade-mas de un comportamiento adecuando durante las 120h.

8. Experimento 8: Se presenta un comportamiento aleatorio en Cod(t) sin convergencia alSet Point. Se puede ver un comportamiento similar al del experimento anterior dondese presenta una disminución en la Biomasa al igual que en la Proteína, por lo tanto esteexperimento también se descarta.

9. Experimento 8: Este experimento no tiene la suficiente duración en comparación a losdemás.

Las gráficas que muestran el comportamiento de las cuatro variables para cada experimentoestán adjuntas en los AnexoxSeleccionExperimentosIEIM. las figuras 2.3 y 2.4 muestran elcomportamiento de la Biomasa y de la producción de proteína para cada uno de los experi-mentos analizados.

0 20 40 60 80 10050

100

150

200

Tiempo

Bioma

sa

Biomasa vs Tiempo

10%OD−0.5%Met

10%OD − 2Met

10%OD−2Met

10%OD − 1,3%Met

25%OD − 0,5Met

25%OD − 1,3%Met

40%OD − 0,5%Met

40%OD − 1.3Met

40%OD − 2Met

Figura 2.3: Biomasa.

Page 17: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 16

0 20 40 60 80 1000

0.5

1

1.5

2

2.5

3

Tiempo

Protei

na

10%OD−0.5%Met10%OD − 2Met10%OD−2Met10%OD − 1,3%Met25%OD − 0,5Met25%OD − 1,3%Met40%OD − 0,5%Met40%OD − 1.3Met40%OD − 2Met

Figura 2.4: Proteina.

2.2. Formulación y desarrollo del problema.

Los parámetros a estimar son los mostrados en el cuadro 2. correspondientes a: las constantesde saturación kMet , kod los parámetros a,b,c,d y las constantes de dilución D1, D2, D3 y D4.Para este caso la dilución se toma como un parámetro constante debido a que actualmente nohay manera de estimar el volumen actual en el Biorreactor ni el flujo de Metanol.El problema de estimación de parámetros se trabaja como un problema de optimización endonde lo que se busca es encontrar el valor óptimo de la función de costo dada por la ecuación2.12 a partir de la minimización del error cuadrático medio LQS Least Squares term entre lasvariables de estado X(t) y P(t) y sus respectivos datos experimentales X(ti) y P(ti) para cadainstante de tiempo ti/iε [1, . . . ,N] donde N corresponde al instante final o tiempo de duraciónde cada experimento que usualmente es de 120 horas y i corresponde al instante en el que setoma la muestra experimentalmente. La muestra de las variables X(t) y P(t) son estimadascada 8 horas.La función de costo esta definida por:

Φ =12

N

∑i=0

((X(ti)− X(ti)

)2QX +

(P(ti)− P(ti)

)2QP

)(2.12)

Donde QX y QP son constantes que pesan a las variables de interés definidas en la función decosto. Su valor es dado según el conocimiento que se sobre la planta en donde un punto departida para determinar estos parámetros esta dado por el criterio de Bryson’s [17], que diceque:

Page 18: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 17

QiX = 1

(xiMax)

2

QiP = 1

(PiMax)

2(2.13)

Para que el resultado converja a una solución factible, es necesario definir tanto restriccionesde igualdad como las de desigualdad. Las de igualdad corresponden al modelo matemáticodel sistema mostrado en la ecuación 2.2 donde µ(t) y qpro(t) están definidas por los pará-metros a estimar y las señales de entrada CMet(t) y Cod(t) que son medidas en el laboratoriocada hora.Las restricciones de desigualdad corresponden al rango delimitado por el valor máximo ymínimo que puede tomar cada una de las variables de estado x(t) y de los parámetros p.Las restricciones de desigualdad para cada uno de los experimento seleccionados están dadaspor las limitaciones físicas y mecánicas que pueden tomar los parámetros.

amin ≤ a≤ amaxbmin ≤ b≤ bmaxcmin ≤ c≤ cmaxdmin ≤ d ≤ dmax

Dmin ≤ D≤ Dmaxµmin

max ≤ µmax ≤ µmaxmax

KminMet ≤ KMet ≤ KMet

Kminod ≤ Kod ≤ Kmax

od

Para resolver el problema de optimización es necesario definir las condiciones iniciales. Estasse muestran a continuación.Condición inicial de Biomasa.

X(0) = 60 [gbio/lBio]

Condiciones iniciales de Proteína.

P(0) = 0 [gpro/lBio]

En definitiva el problema de estimación de parámetros queda definido de la siguiente manera.

Page 19: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 18

mina,b,c,d,D,KMet ,Kod

Φ =12

N

∑i=0

((X(ti)− X(ti)

)2QX +

(P(ti)− P(ti)

)2QP

)

Sub ject to ∀tµ(t) = µmax · CMet(t)

d·C2Met(t)+CMet(t)+kMet

· Cod (t)Cod (t)+kod

qpro(t) = a+µ(t) ·b+ c ·µ2(t)...

˙X(t) = µ(t) ·X(t)−D ·X(t)P(t) = qpro(t) ·X(t)−D ·P(t) ∀t

amin ≤ a≤ amaxbmin ≤ b≤ bmaxcmin ≤ c≤ cmaxdmin ≤ d ≤ dmax

Dmin ≤ D≤ Dmaxµmin

max ≤ µmax ≤ µmaxKmin

Met ≤ KMet ≤ KMetKmin

od ≤ Kod ≤ Kmaxod

La herramienta ACADO es el software seleccionado para la implementación y resoluciónde todos los problemas relacionados con optimización, debido a su alta velocidad de com-pilación ya que fue desarrollado en el lenguaje de programación C; Por su compatibilidadcon Matlab y por la robustez que maneja en cuanto al desarrollo de problemas de optimiza-ción [3].La razón por la cual los límites superiores e inferiores de los parámetros varia según el expe-rimento, se debe a que el software toma como solución inicial el valor medio entre el límitesuperior y el inferior que puede tomar cada uno de los parámetros, implicando así que la so-lución del problema con cada uno de los experimentos, converja a un óptimo local diferenteen consecuencia a la no linealidad del sistema.Adicionalmente a lo mencionado, hay algunos parámetros de resolución que se deben es-pecificar o se pueden modificar para la resolución del problema, los parámetros usados sedescriben a continuación: Tolerancia KKT siendo esta una de las condiciones de parada parael algoritmo dada por ε < TOL donde ε es un valor iterativo para cada ciclo del algorit-mo [8]. El tipo de integrador o método de resolución de la ecuación diferencial utilizadoes INT_RK45 integrador Runge Kutta de orden 45. El tipo de discretización que se usa esmultiple Shooting el cual es un método de discretización recomendado para la resolución deproblemas de optimización acotados. Y por último se define el tamaño máximo que toma lospasos del integrador. Adicionalemente cabe aclarar que el software realiza la discretizaciónque para este caso y para todos los problemas de optimización que se muestran desde estemomento, se usa por defecto el método Multiple Shooting.despues de haber desarrollado un proceso iterativo para la estimación de los parámetros QX yQP a partir del criterio ya mencionado, se encuentra que el valor que deben tomar para cada

Page 20: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 19

Experimento QX QP

1 2.5e-5 0.22 6.9e-5 13 2.5e-5 0.14 4.4e-5 0.3

Tabla 2.3: Matriz de pesos

Parámetrosa b c d e D µmax KMet Kod

Exp1

1.2e-4 2.8e-3 8.6e-5 7.1e-013 7.3e-3 7.1e-3 2.5e+0 1.1e+0 9.8e-1

Exp2

2.2e-4 -5.7e-2 4.6e+0 1.2e-001 1.2e-2 3.7e-3 2.4e-13 0.0e+0 -4.4e-16

Exp3

2.6e-4 -4.5e-3 -8.8e-5 1.1e+000 1.2e-2 1.1e-15 2.5e+0 5.8e-001 1.0e+0

Exp4

1.2e-4 -7.8e-4 -7.4e-6 0.0e+0 5.6e-3 2.6e-13 2.4e+0 1.0e+0 9.8e-1

Var 5,0e-9 8.13e-4 5.4 0.2 1.1e-5 1.1e-5 1.56 0.24 0.24x 1.8e-4 -1.5e-2 1.1 0.3 9.4e-3 2.7e-3 1.87 0.7 0.7

Tabla 2.4: Estimación de parámetros experimentos independientes

uno de los experimentos son:Luego de haber definido los parámetros necesarios para que el algoritmo resuelva eficiente-mente el problema, se encuentran los siguientes resultados para las variables a, b ,c ,d ,D ,µmax ,kMety kod .La tabla 2.5 muestra el tiempo requerido para que el ordenador ejecute los calculos, y lacantidad de iteraciones necesarias para que el resultado convergiera a una solución óptimafactible.Partiendo de la tabla 2.4 se puede ver que en general la varianza que tiene cada parámetro, esconsiderable, lo que hace al proceso largo, tedioso y con un alto margen de error, conllevando

Experimento Tiempo decálculo ensegundos

# Iteraciones paraconvergencia

KKT

Valor función decosto

1 13.19 2 6.28e-132 13.04 2 1e-133 13.14 2 2.71e-134 20.6 2 6.9e-13

Tabla 2.5: Costo computacional Mono-Experimento

Page 21: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 20

a desarrollar una nueva alternativa de estimación.

2.3. Estimación paramétrica para múltiples experimentos.

Basándose en la formulación desarrollada, se puede ver claramente que el problema co-mo esta mostrado actualmente, esta diseñado exclusivamente para encontrar los parámetrosa, b, c, d, µmax, D j, KMet y Kod puntualmente para cada experimento, con el inconvenientede que el valor de cada parámetro podía variar o tener una diferencia significativa entre cadaexperimento, D se seguirá estimando para todos los experimentos j debido a que esta está enfunción de las condiciones de cultivo particulares, pero al no tener los medios físicos necesa-rios para caracterizarla, fue necesario definirla como una variable que puede tomar cualquiervalor entre DMin y DMax.Buscando una mejor alternativa que la implementada anteriormente, se desarrolla un métodoalternativo que estima un único valor para cada uno de los parámetros, partiendo de todos losexperimentos seleccionados, la formulación de esta alternativa se muestra a continuación.

mina,b,c,d,D j,KMet ,Kod

12

M

∑j=0

N

∑i=0

((X j(ti)− X j(ti)

)2QX j +

(Pj(ti)− Pj(ti)

)2QX j

)

Sub ject to

µ j(t) = µmax ·C j

Met(t)

d·(

C jMet(t)

)2+C j

Met(t)+kMet

·C j

od(t)

C jod(t)+kod

∀t, j = 1, . . . ,M

q jpro(ti) = a+µ j(ti)∗b+ c∗µ2

j (ti)...

X j(t) = µ j ∗X j(t)−D j ∗X j(t)Pj(t) = q j

pro ∗X j(t)−D j ∗Pj(t) ∀tamin ≤ a≤ amaxbmin ≤ b≤ bmaxcmin ≤ c≤ cmaxdmin ≤ d ≤ dmax

Dmin ≤ D j ≤ Dmax ∀t, j = 1, . . . ,Mµmin

max ≤ µmax ≤ µmaxmax

KMinMet ≤ KMet ≤ KMax

MetKMin

od ≤ Kod ≤ KMaxod

Con este método se plantea un problema expandido en donde se define una función objetivogeneralizada que minimiza simultáneamente el error cuadrático medio de las variables X j(t)y Pj(t) respecto a sus valores reales X j(ti) y Pj(t) correspondientes a cada experimentos j.De la misma manera, el modelo del sistema se expande a un conjunto de modelos j dado porel conjunto de expresiones X j, Pj, q j

pro(t) y µ j(t) con sus respectivas entradas C jod(t), C j

Met(t)y el conjunto de las restricciones para los a, b, c, d, µmax, D j, KMet y Kod y sus diluciones D j.

Page 22: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 21

Como cada experimento no tiene exactamente el mismo tiempo de desarrollo experimental,la cantidad de muestras difiere entre experimento y experimento. Es por eso que es necesarioestandarizar esta cantidad para todos los experimentos.Como primera medida se debe definir el tamaño del vector de tiempos el cual es de un tamañoestándar para todos los casos con un tiempo inicial de 0 m, y un tiempo final tN igual al tiempomáximo del experimento de menor duración y una cantidad de muestras igual de tamaño tN .Luego se interpola las señales Cod(t) y CMet(t) en el intervalo de tiempos y con la cantidad demuestras ya mencionadas, para que cada uno de los experimentos tenga el mismo tamaño tN .Para las variables X(t) y P(t) se realiza un proceso manual en el que se toma cada una de lasmuestras y se asigna en el tiempo que contenga el valor que le corresponde de las variablesCod(t) y CMet(t).Para la resolución del sistema, de nuevo se define el parámetros de la tolerancia KKT , eltipo de integrador para resolver las ecuaciones diferenciales, el método de discretización y eltamaño máximo que puede tomar el segmentos del integrador.De la misma manera que en el problema de estimación de parámetros mono-experimento, lasmatrices de pesos para cada uno de los errores correspondientes los valores mostrados en latabla 2.3.Luego de ejecutar el programa desarrollado, se obtienen los resultados que muestra la tabla2.6 .

Parámetro Valora 6.0e-5b 9.6e-3c -1.2e-3d 9.4e-2

D1 1.0e-2D2 4.5e-3D3 6.9e-18D4 3.5e-3

µmax 2.27e-2kMet 6.5e-1kod 9.5e-1

Tabla 2.6: Valor de los parámetros

La tabla 2.7 muestra el tiempo requerido para que el ordenador ejecute los calculos, y lacantidad de iteraciones necesarias para que el resultado convergiera a una solución óptimafactible.Dado que este es un problema de optimización no lineal resuelto con un método iterativo,es necesario validar los resultados obtenidos. Esto se realiza a partir de las herramientasComputacional que ofrece matlab.

Page 23: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 22

Tiempo decálculos

# Iteraciones paraconvergencia

KKT

Valor función decosto

197 1 3.14e-1

Tabla 2.7: Costo Computacional estiación Multi-Experimentos

Experimento1 Experimento2 Experimento 3 Experimento 4%ErrorX 6 6 12 8%ErrorP 9.2 43.9 18.5 11.7

Tabla 2.8: Error Múltiples-Experimentos

1. Para este caso, como lo que se busca es encontrar los valores correspondientes a lasvariables de estado X(t) y P(t), se toman como entradas del sistema el valor que tomaCod(t) y CMet(t) para cada uno de los 4 experimentos..

2. Como primera medida, se resuelve la ec. diferencial para cada instante i.

3. Posteriormente se definen las condiciones iniciales que corresponden a las mismas con-diciones del problema de estimación de parámetros.

4. De esta manera se especifican las condiciones de resolución del sistema para resolverlas ec.diferenciales, obteniendo los resultados mostrados en la tabla 2.8 y el comporta-miento de los resultados se muestra en 2.5.

A continuación se muestra el comportamiento de cada experimento con el modelo seleccio-nado.

Como se se ve en la figura 2.5 el comportamiento en los cuatro experimentos es muy aproxi-mado. en todas las figuras de Biomasa la tasa o pendiente de crecimiento es aproximadamentela misma convergiendo con un pequeño desfase al valor final. Es de resaltar el experimento3 de la figura 2.5 en donde se puede ver claramente ademas de la similitud en el comporta-miento durante todo el intervalo de tiempo, que en las ultimas horas aproximadamente de la70 a la 80, el sistema modelado presenta un decaimiento en la proteína así como el sistemareal lo que muestra el comportamiento que se esperaba diferenciandolo de modelos como elMonod en donde el sistema es puramente creciente con una asíntota dada por la tasa máximade crecimiento 2.1.Dada la complejidad que implica trabajar con organismos Biológicos, usualmente el margende error para que los resultados sean aceptables es alto, aunque a pesar de esto, es importanterecalcar que con el margen de error obtenido hasta ahora se puede afirmar que se tienenresultados bastante satisfactorios por encima de los rangos aceptables para una investigaciónde esta magnitud como lo muestran los artículos [5,8] en donde tienen errores hasta del 25%.

Page 24: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 2. CONSTRUCCIÓN DEL MODELO 23

0 20 40 60150

200

Biomasa Vs t

Tiempo

Bio

mas

a

Experimento1

0 20 40 600.511.522.5

Proteina Vs t

TiempoP

rote

ina

0 20 40 6080

100120

Biomasa Vs t

Tiempo

Bio

mas

a

Experimento2

0 20 40 600

0.51

Proteina Vs t

Tiempo

Pro

tein

a

0 20 40 60100150200

Biomasa Vs t

Tiempo

Bio

mas

a

Experimento3

0 20 40 600

2

Proteina Vs t

Tiempo

Pro

tein

a

0 20 40 60100

150Biomasa Vs t

Tiempo

Bio

mas

a

Experimento4

0 20 40 600.5

11.5

Proteina Vs t

Tiempo

Pro

tein

a

Figura 2.5: Validación Bio-Pro

Page 25: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Capítulo 3

Optimización mono-objetivo

A continuación se presenta el procedimiento realizado para desarrollar y solucionar el proble-ma de control óptimo mono-objetivo bien sea para maximizar la Biomasa del microorganismoP.Pastoris en el Biorreactor, o la producción de proteína a partir de este mismo.Al solucionar el problema de optimización lo que se busca es encontrar las señales de oxigenodisuelto y Metanol que maximizen la producción de proteína o el crecimiento de Biomasa.Como primera medida se describirá cómo fue planteado y adecuado el modelo del Biorreactorpara el problema de optimización, posteriormente se define la función de costo a maximizary por último se caracterizaran las restricciones a las que se encuentra sujeto el sistema y elproblema de optimización. Con esto finaliza la definición del problema mono-objetivo.Terminado el planteamiento del problema de optimización se describe como fue el procedi-miento realizado para el desarrollo Computacional y se analizan los resultados obtenidos enla simulación y en la validación experimental.

1. Adecuación del modelo para el problema de optimiza-ción

Es necesario refinar el modelo con el fin de obtener una mayor aproximación al sistema real.En un principio, las variables independientes Cod(t) y CMet(t) pasan a ser dependientes alexpresarlas en función de las entradas Kla(t), Fin(t) y un nuevo estado dado por el volumenV (t), con el fin de complementar el modelo ya que las variables Cod(t) y CMet(t), no sonmanipulables. Mientras que para este caso, las entradas mencionadas son las nuevas señalesde control permitiendo que se asemejen más a la realidad.Partiendo de (2.1), la dinámica de las variables Cod(t), CMet(t) y V (t) se pueden expresar dela siguiente manera.

˙Cod(t) = Kla(t) · (C∗od−Cod(t))− ro2(t) ·X(t) (3.1)

24

Page 26: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 25

V (t) = Fin(t) (3.2)

˙CMet(t) = Fin(t)− rMet(t) ·P(t) (3.3)

Donde Fin(t) y Kla(t) son las señales de control que se buscan encontrar para la optimizacióndel sistema. rMet(t) y ro2(t) son parámetros que corresponden a las tasas de consumo deMetanol y oxígeno respectivamente.Así como las ecuaciones diferenciales (2.5) y (2.6) están dadas en unidades de porcentaje, esnecesario expresar de la misma manera las ecuaciones (3.1) y (3.3).La concentración de oxígeno disuelto porcentual esta definida de la siguiente manera.

˙Cod(t)% =Cod(t)

C∗od

[go2/l]

[go2/l]·100

Donde Cod(t) corresponde al oxígeno actual en el Biorreactor y C∗odcorresponde al oxigenodisuelto máximo o de saturación del Biorreactor de esta forma se tiene un porcentaje deporcentaje de masa respecto a la saturación.Posteriormente se tiene que la variación del oxigeno disuelto dado por.

˙Cod(t) = Kla(t) · (C∗od−Cod(t))− ro2(t) ·X(t)

Con sus respectivas unidades.

[go2/l·h] = [1/h]∗ ([go2/l]− [go2/l])− [go2/gBio·h] · [gBio/l]

Que al dividir la anterior expresión por la concentración de oxigeno disuelto de saturación,se obtendrá esta expresión en términos de porcentaje.

100∗˙Cod(t)

C∗od= 100 ·

[Kla(t) ·

(C∗odC∗od−Cod(t)

C∗od

)− ro2(t)

C∗od·X(t)

]Donde rod(t) corresponde a una constante de transferencia de oxígeno que se estima a partirde [15] donde definen las rutas metabólicas del microorganismo P.Pastoris, que sirven paradeterminar la cantidad o la tasa en la que se produce determinado compuesto a partir de lareacción química de otros. Para este caso se determina la tasa de consumo de oxígeno ro2(t)a partir de diferentes tasas de crecimiento del microorganismo µ(t) [14] [19].A partir del valor máximo de µ(t), encontrado en la estimación de parámetros 2.6 se to-man valores intermedios para determinar la relación con el oxígeno consumido OT R. Estosresultados son mostrados en la tabla 3.1.

Page 27: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 26

µ [1/h] OT R [go2/gbio·h]

0 05.0e-3 -1.0e-21.0e-2 -2.0e-22.0e-2 -4.0e-2

2.27e-2 -4.5e-2

Tabla 3.1: Relación µo2vs OT R

La relación entre las µ(t) y OT R equivale a la tasa de consumo ro2(t) donde queda definidade la siguiente manera (ver tabla 3.2).

ro2(t) = 1,97 ·µ(t) [mlo2/gbio·h] (3.4)

Donde C∗od

equivale al producto de peso molar M = 32g/mol y el coeficiente de saturación deloxígenoOsat = 0,265e−3mol/l, dándonos como resultado.

C∗od = 8,48e−3 [mgr/l]

Finalmente la concentración de oxígeno disuelto en términos porcentuales queda definido dela siguiente manera.

˙Cod(t) = Kla(t) · (100%−%Cod(t))−2,3e4 ·µ(t) ·X(t) (3.5)

De manera análoga, se realiza el mismo procedimiento para definir la función de Metanol.Partiendo de 3.3 y que la fase de consumo de Metanol equivale a (ver tabla 3.2).

rMet(t) = 3,2 ·µ(t) [mlMet/gbio·h]

Donde.

˙CMet(t) =CMet(t)

V (t)·100

Se tiene que la concentración de Metanol disuelto en el Biorreactor en unidades volumétricas,equivale a.

˙CMet(t) = 100 · Fin(t)V (t)

−0,32 ·µ(t) ·X(t) (3.6)

Page 28: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 27

µ1/h Metconsumido [ml/gbio·h]

0 0.05.0e-3 -1.7e-21.0e-2 -3.2e-22.0e-2 -6.4e-22.27e-2 -7.2e-2

Tabla 3.2: Relación µvs Metconsumido

2. Definición de la función de costo

Partiendo de la función de costo dada por.

Φ [x(·),u(·), p] =12

N

∑i=0

L(x(ti),u(ti), p)+M(x(tN),u(tN), p)

Esta función tiene dos términos dados por una función L y otra M. La primera correspondea la optimización de la evolución de las variables de estado y las entradas en un intervalo detiempo t = 0 hasta un tiempo final N o en tiempo discreto que va desde un instante iniciali = 0 hasta el instante final i = N. El segundo término corresponde a la optimización de lasvariables de estado y entradas deseadas en un tiempo final tN o dado en tiempo discreto, enel instante final.Para el caso de nuestro sistema lo que importa es la maximización de las variables deseadasen el instante final N independientemente del comportamiento que tenga en el transiente, perosiempre cumpliendo las restricciones impuestas.Es por eso que el termino de interés de la expresión Φ estrictamente es el de Mayer M. Porlo tanto la expresión de la función de costo queda definida por:

Φ = M (X(tN))

Para este caso se analizan dos problemas de optimización por separado, el primero buscaoptimizar la producción de proteína P y la segunda la de Biomasa X con sus respectivasfunciones de costo Φ1y Φ2 donde.

Φ1 = X(tN) (3.7)

Φ2 = P(tN) (3.8)

Luego de haber definido cada función objetivo correspondiente a cada uno de los problemasde optimización, se definen las restricciones paramétricas, las cuales son las mismas paracada caso.

Page 29: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 28

• Dada la cantidad máxima de Biomasa que se puede albergar en el Biorreactor conrelación al volumen del medio y sustratos suministrados.

0 l ≤V (t)≤ 1,6 l

• El rango de Metanol según la cantidad de Biomasa, volumen del fluido y oxígenodisuelto está entre:

0%≤CMet(t)≤ 2%

• Según la el flujo de aire y la velocidad de agitación, el porcentaje de oxígeno disueltodebe estar entre:

0%≤Cod(t)≤ 100%

• Coeficiente de transferencia de oxigeno al medio

0 1/h≤ Kla(t)≤ 10001/h

• Entrada de Metanol

0 l/h≤ Fin(t)≤ 10 l/h

3. Problema de optimización

Luego de definir las funciones de costo Φk, se definen las restricciones de igualdad dadas porel modelo del sistema, y las restricciones de desigualdad están dadas por las desigualdadesmostradas anteriormente. Los problemas de optimización k quedan definidos de la siguientemanera.

Page 30: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 29

maxFin(t),Kla(t)

Φk(tN)

Subject to

˙V (t) = Fin(t) ∀tX(t) = µ(t) ·X(t)−D(t) ·X(t)

P(t) =(a+b ·µ(t)+ c ·µ2(t)

)·X(t)−D(t) ·P(t)

˙CMet(t) = Fin(t) · 100V (t) −0,1 · rMet(t) ·X(t)

˙Cod(t) = Kla(t) · (100−Cod(t))− (100 · ro2(t) ·X(t))

µ(t) = µmax · CMet(t)d·C2

Met(t)+CMet(t)+kMet· Cod (t)

Cod (t)+kod

...

D(t) = Fin(t)V (t)

rMet(t) = 3,17 ·µ(t)rod(t) =

1,970,008 ·µ(t)

0≤ Fin(t)≤ 100≤ kla(t)≤ 1000 ∀t0≤CMet(t)≤ 5 ∀t

0≤Cod(t)≤ 100 ∀tPara resolver el problema Computacional se deben especificar las condiciones iniciales enlas que el sistema se debería encontrar en el instante i = 0, es por eso que partiendo de losexperimentos desarrollados y a partir de la experiencia de los encargados de desarrollar loscultivos, se llegó a que las condiciones iniciales que debe tener el sistema para poder realizaruna buena comparación entre los resultados generados por el programa y los experimentosdesarrollados, deberían ser:

Cod(0) = 0 [%]

CMet(0) = 0 [%]

V (0) = 1600 [l]

X(0) = 60 [gbio/l]

P(0) = 0 [gpro/l]

Page 31: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 30

Luego de haber planteado el problema, se definen algunos parámetros requeridos por el algo-ritmo para resolver el problema de manera eficiente, explicados en la sección de estimaciónde parámetros.Tolerancia KKT = 1e−10, tipo de integrador RK23, tolerancia del integrador IT = 1e−10,y por último se especifica el número de intervalos en los que se quiere resolver el problema,entre mas pequeño sea el paso, el algoritmo resuelve mas problemas de optimización lo queimplica mayor costo Computacional.La cantidad de pasos indica los intervalos en los que se resolverá el problema para encontrarlas señales Kla(t) y Fin(t) que me maximicen la producción de proteína o el crecimiento deBiomasa.

4 t =tNn

(3.9)

Donde tN equivale al tiempo máximo de duración de un cultivo que como se ha mencionado,este es un valor de aproximadamente 120h, n equivale al número de paso y 4t al intervaloque representa el tiempo que dura cada uno de los pasos de integración.Luego de realizar varias pruebas con diferentes n se llegó a los siguientes resultados conside-rados como el resultado óptimo.Con una cantidad de pasos n = 240, equivalentes a resolver el problema de optimización cada4t = 30min, se resolvió el sistema para la optimización de Φ1 y se obtuvieron los siguientesresultados.La figura 3.1 muestra el comportamiento de las 5 variables de estado donde las dos primerasX(t) y P(t) corresponden a las variables de interés, que como se puede ver en la gráfica,ambas tienen un comportamiento creciente con un valor final luego de 120 [h] del 162,2 [%] y1,87 [%] respectivamente. Su volumen llega a un valor final de 2,6 [lBio]. La concentración deoxígeno disuelto Cod muestra un comportamiento en donde busca llegar lo mas rápido posiblea un valor de 90 [%], luego presenta una disminución en su concentración con una pendientebaja hasta llegar aproximadamente a un tiempo de 60 [[h]] con un valor aproximadamente del60 [%], posteriormente la concentración decae con una tasa elevada hasta llegar a un valordel 18,7 [%] a las 70 [h]. Finalmente la concentración de oxígeno disuelto aumenta con unatasa semilogarítmica no muy alta hasta llegar a un valor del 40,9% aproximadamente a las120 [h]. Por último, se puede ver que la concentración de Metanol aumenta lo mas rápidoposible al valor límite especificado en las restricciones de 2 [%] en 8,5 [h], en ese valor semantiene hasta llegar aproximadamente a 60 [h]. Desde ese instante cae a una tasa constantehasta llegar al 0,6 [%] en 88 [h], desde ese instante su concentración continua disminuyendopero a una tasa pequeña hasta llegar a 0,33 [%] en aproximadamente 120 [h].La gráfica 3.2 muestra el comportamiento de las variables de control Finy Kla respectivamen-te, donde la primera variable muestra un comportamiento constante del máximo flujo posibleen las horas 0−10 [h] y 55−120 [h]. En la hora 10 el sistema cae brutalmente para posterior-mente tener un crecimiento constante al valor máximo de flujo de entrada en la hora 55 [%]aproximadamente. La segunda variable de control Klamuestra que de las horas 0−55 [%] tie-ne un valor máximo de 1000 [1/h]y en las horas 55−120 [h] tiene un valor aproximadamente

Page 32: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 31

Cantidad de pasos Tiempo decálculos ensegundos

# Iteraciones paraconvergenciaKKT

Valor función decosto P

120-Cada Hora 170.6 82 138220-Cada 1/2 Hora 990.34 200 162

Tabla 3.3: Costo computacional optimización Mono-Objetivo proteína

de 500 [ml/h].la tabla 3.3 muestra el costo computacional y la cantidad de iteraciones requeridas para re-solver el problema de optimización, en donde a pesar de que la función objetivo converge almismo óptimo las señales Cod(t), CMet(t), Kla(t) y Fin(t), donde la respuesta de estas señalespara 220 son mas suaves respecto a la de 120 pasos.

0 50 10060

80

100

120

140

160

Biomasa Vs t

Tiempo

Bio

mas

a

0 50 1000

0.5

1

1.5

2Proteina Vs t

Tiempo

Pro

tein

a

0 50 1001600

1800

2000

2200

2400

2600

Volumen Vs t

Tiempo

Vol

umen

0 50 1000

20

40

60

80

Cod Vs t

Tiempo

Cod

0 50 1000

0.5

1

1.5

2

Met Vs t

Tiempo

Met

Figura 3.1: Variables de estado

Page 33: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 32

0 50 100

1

2

3

4

5

6

7

8

9

10

11Fin Vs t

Tiempo

Fin

0 50 100500

550

600

650

700

750

800

850

900

950

1000

1050Kla Vs t

Tiempo

KlaFigura 3.2: Señales de control

Para optimización de Φ2 se desarrolla un proceso similar al mostrado anteriormente con ladiferencia que se asignan diferentes valores a los parámetros del algoritmo, debido a que seésta resolviendo un problema diferente implicando así que las condiciones y trayectorias deresolución se vean afectadas. Esto se debe a la no linealidad del problema generando queel algoritmo tienda a converger a un óptimo local diferente al del problema de optimizaciónanterior.Las condiciones definidas para resolver el problema son, una tolerancia KKT = 1e− 10,tipo de integrador RK23, tolerancia del integrador IT = 1e− 6, y por último se especificael número de intervalos en los que se quiere resolver es de 120 equivalente a resolver elproblema cada 60m.Las gráficas 3.5 y 3.6 muestran el comportamiento de cada una de las variables tanto las deestado como las de control. Como se puede ver, las variables de interés X(t) y P(t) tienen uncomportamiento prácticamente igual al problema resulto anteriormente, con la diferencia deque el valor final es de 158 [gbio/l] y 1,8 [gpto/l] respectivamente. Las variables Cod(t), CMet(t),Fin(t) y Kla(t) aunque tengan pequeñas variaciones respecto a las señales encontradas previa-mente, se puede ver que las señales tienden al comportamiento de las señales estimadas enel problema anterior. Esta diferencia se da ya que este es un mínimo local de un problema dealta dimensión al ser 120 pasos de integración por 2 variables de decisión.

Page 34: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 33

0 50 10060

80

100

120

Biomasa Vs t

Tiempo

Bio

mas

a

0 50 1000

0.5

1

1.5Proteina Vs t

Tiempo

Pro

tein

a

0 50 1001600

1800

2000

2200

Volumen Vs t

Tiempo

Vol

umen

0 50 1000

20

40

60

80

Cod Vs t

Tiempo

Cod

0 50 1000

0.5

1

1.5

2Met Vs t

Tiempo

Met

Figura 3.3: Trayectoria Inicial

0 50 1000

1

2

3

4

5

6

7

8

9

10Fin Vs t

Tiempo

Fin

0 50 100

470

480

490

500

510

520

530

540

Kla Vs t

Tiempo

Kla

Figura 3.4: Variables de control manipulables

Otra alternativa eficiente para buscar una mejor respuesta que la encontrada consiste en un

Page 35: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 34

método que ofrece la herramienta que consiste en resolver el problema de optimización apartir de una respuesta conocida o en otras palabras, resolver el problema a partir de unarespuesta inicial.A partir del método mencionado, se busca mejorar los resultados encontrados. Para eso separte de la respuesta encontrada 3.3 y se le llama respuesta inicial, y se define dentro delalgoritmo como las condiciones de inicialización de las variables de estado. Nuevamente seejecuta el programa con la diferencia que ahora los pasos de integración son iguales a 240,equivalentes a desarrollar el problema cada 30min. Es importante aclarar que se realizó estamodificación ya que si se resuelve el problema con la misma cantidad de pasos que en elproblema inicial, lo mas seguro es que la solución tienda a converger a la misma respuestade las trayectoria inicial debido a que se esta resolviendo el problema con las mismas condi-ciones de iteración para los mismos puntos. Es por eso que se duplicó el tiempo de pasos deintegración a 240 para poder así aumentar el rango de búsqueda al doble y por lo tanto paradiferentes puntos a los definidos en el problema inicial.Los resultados se muestran en las gráficas 3.5 y 3.6 .

0 50 10060

80

100

120

140

160Biomasa Vs t

Tiempo

Bio

mas

a

0 50 1000

0.5

1

1.5

Proteina Vs t

Tiempo

Pro

tein

a

0 50 1001600

1800

2000

2200

2400

2600

Volumen Vs t

Tiempo

Vol

umen

0 50 1000

20

40

60

Cod Vs t

Tiempo

Cod

0 50 1000

0.5

1

1.5

2Met Vs t

Tiempo

Met

Figura 3.5: Variables de estado señal Óptima

Page 36: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 35

Cantidadde pasos

Tiempo decálculos ensegundos

# Iteraciones paraconvergencia

KKT

Valor función decosto X

Primerproblema

120-CadaHora

189.13 69 1.87

ProblemaInicializado

120-CadaHora

127.739 72 1.87

Tabla 3.4: Costo computacional optimización Mono-Objetivo Biomasa

0 50 1000

1

2

3

4

5

6

7

8

9

10Fin Vs t

Tiempo

Fin

0 50 100200

300

400

500

600

700

800

900

1000Kla Vs t

Tiempo

Kla

Figura 3.6: VarControl señal Óptima

la tabla 3.4 muestra el costo computacional y la cantidad de iteraciones requeridas para re-solver el problema de optimización.En un principio se espera que cada variable X(t) o P(t) tienda a mejorar según el criteriode optimización, bien sea maximizar el crecimiento de Biomasa o maximizar la producciónde proteína, pero por lo contrario se obtuvo la misma respuesta para ambos casos, dando piéa la hipótesis de que estas variables tienen una relación lineal entre si. Trabajos como [7]plantean hipótesis similares que reafirman la valides de la idea planteada. Este supuesto serádesarrollado mas adelante.

4. Validación

Partiendo de la respuesta (Ver gráfica 3.1), encontrada al resolver el problema de optimizaciónde proteína, se desarrolla un experimento (Cultivo) en donde se manipulan las señales Cod(t)y CMet(t) a partir de la agitación, el flujo de entrada de oxígeno y el flujo de Metanol paraemular lo mas aproximadamente posible al comportamiento encontrado en la simulación.

Page 37: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 36

Gracias a que la dinámica de las variables de este proceso tienen un comportamiento lento,es posible manipular manualmente a las variables Cod(t) y CMet(t) a partir de las variables decontrol ya mencionadas.A partir de la respuesta encontrada en la optimización de Proteína 3.1 y 3.2 se definen losrangos y los valores que deben tomar las variables Cod(t) y CMet(t) durante las respectivas120h que dura cada cultivo.Para una manipulación adecuada de las variables, se vio la necesidad de modificar un poco losresultados de la siguiente manera: Para la variable Cod lo que se busca es llegar lo mas rápidoposible a la máxima concentración e intentar mantenerla por la mayor cantidad de tiempo.Actualmente, debido a limitaciones mecánicas, no es posible mantener la concentración deoxígeno en valores tan elevados debido a que a mayor cantidad de oxígeno el microorganismotiende a consumir mas. En el momento en el que llega a una concentración del 20%, estase mantiene por un intervalo de tiempo corto para que posteriormente se aumente a unaconcentración aproximada del 40%. La razón por la cual se pasa de una concentración del20−40% en un menor tiempo al estimado en la simulación, se debe a que se busca compensarel intervalo en donde la concentración de oxígeno debía mantenerse lo mas alto posible porun intervalo de tiempo prolongado. Actualmente esto no es posible ya que no se ha definidouna estrategia para poder mantener el oxígeno en puntos altos durante tanto tiempo. Por estoes que se pasa de un porcentaje bajo a uno medio en un menor tiempo al estimado.La concentración de Metanol CMet(t) presenta un comportamiento mas aproximado al delas simulaciones en donde permanece a una concentración del 2% para comenzar a decaerprogresivamente desde la hora 60h hasta completar las 120h.Como se puede ver en la gráfica 3.7 el comportamiento de las variables manipuladas es comose definió.

Page 38: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 37

0 50 1000

20

40

60

80OD Vs t

Tiempo

Oxi

geno

Dis

uelto

0 50 1000

1

2

3

4

5Met Vs t

Tiempo

Met

anol

0 50 1000

100

200

300BiMasa Vs t

Tiempo

Bio

Mas

a

0 50 1000

1

2

3

4

P Vs t

Tiempo

Pro

tein

a

Figura 3.7: Resultados Experimentales

Como se puede ver en la gráfica 3.7 los resultados obtenidos con este experimento son po-sitivos en donde se parte de una Biomasa de 70 [gbio/lBio] y se llega a 278,4 [gbio/lBio], mientrasque para la proteína se parte de 0 [gpro/lBio] hasta un valor final de 4 [gpro/lBio].Con el fin de evaluar el rendimiento del proceso , se desarrolla la tabla 3.5 que muestra uncuadro con la cantidad de proteína y Biomasa en en el instante inicial t = 0h, el instantefinal t = 120h y el crecimiento en este intervalo de tiempo para los experimentos usadospara construir el modelo. El otro cuadro de esta tabla muestra estos mismos registros para elexperimento de validación. El experimento 3 no se tiene en cuenta debido a que este dura 20horas menos que los demás experimentos.En el experimento de validación se obtuvo un crecimiento de Biomasa de 2,5 veces mayorque el promedio de estos 3 experimentos y 2 veces mayor que el experimento que presentael mejor comportamiento. Para la producción de proteína se obtuvo 1,7 veces mayor que elpromedio de estos 3 experimentos y 1,3 veces mayor que el experimento que presenta elmejor comportamiento.Para poder realizar una mejor comparación entre el resultado experimental y el desarrolloteórico, se resuelve el conjunto de ecuaciones diferenciales que definen la estructura del sis-tema teniendo como entradas los valores correspondientes a las variables Cod(t) y CMet(t)obtenidas en el cultivo de validación. Luego de ajustar la dilución a un valor próximo a una

Page 39: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 38

Biomasa [gbio/lBio] Proteina [gbio/lBio]Valor inicial Valor final Diferencia Valor inicial Valor Final Diferencia

Experimento1

53 192 139 0 2 2

Experimento3

86 192.4 106.4 0 3 3

Experimento4

66 153.4 87.4 0.2 1.7 1.5

Promedio 110.9 2.23

ExperimentoValidación

72.3 278 .4 206.1 0.14 4 3.86

Tabla 3.5: Biomasa Proteína

de las diluciones encontradas con anterioridad igual a DValidacion = 0,4e− 3 2.6 se obtienecomo resultado la gráfica 3.8 en donde se puede ver la similitud entre la dinámica de lossistemas real y simulado.A pesar de que los valores finales no convergen al mismo punto, estos están bastante aproxi-mados en donde el modelo estimado llega a un valor final de 298,9 [gbio/lBio] y 3,56 [gpro/lBio]para sus variables X(t) y P(t) respectivamente.

ErrorX[%] ErrorP[%]11.33 17.4

Tabla 3.6: Error Comparación

Satisfactoriamente se puede afirmar que el margen de error que hay entre los sistemas es bajo,validando así la similitud entre el modelo y el sistema real (Ver tabla3.6).

Page 40: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 3. OPTIMIZACIÓN MONO-OBJETIVO 39

0 50 100 15050

100

150

200

250

300

Tiempo

Bio

mas

a

Biomasa vs Tiempo

0 50 100 1500

0.5

1

1.5

2

2.5

3

3.5

4

Tiempo

Pro

tein

a

Proteina vs Tiempo

Figura 3.8: Validación del experimento (Roja real, Azul experimental)

Page 41: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Capítulo 4

Optimización multi-objetivo

En este capítulo se muestra el planteamiento y desarrollo del problema de optimización delas variables X(t) y P(t) simultáneamente, con el fin de tener una estrategia adicional a lasdesarrolladas anteriormente para poder contrastar los resultados obtenidos, y a partir de estosconcluir la estrategia y señal de control que mejor se ajuste a los requerimientos y objeti-vos de esta investigación. Para solucionar este problema Multi-Objetivo se parte de la teoríadesarrollada por Vilfredo Federico Damaso Pareto para la resolución de problemas de opti-mización [4], donde explica que un punto x∗ es óptimo de Pareto si no existe un vector xque almenos mejore alguno de los objetivos definidos, sin empeorar otro. En otras palabrasel óptimo de Pareto x∗ es el conjunto de todos los vectores no dominados, conocido como elconjunto de no dominados o frontera de Pareto 4.1, Gráfica tomada de [?].

Figura 4.1: Filosofía Conjunto de Pareto

40

Page 42: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 41

1. Definición general del problema Multi-Objetivo

En primer lugar, se debe plantear una función de costo definida por Φm objetivos a optimizardados en función de sus variables de estado x(t), entradas del sistema u(t) y parámetros p.

minx(t),u(t),p

{Φ1 (x(t),u(t)) , . . . ,Φ j (x(t),u(t)) , . . . ,Φm (x(t),u(t))

}Donde Φ está definida como una función de Mayer al igual que en la sección anterior.Con sus respectivas restricciones

xmin < x(t)< xmax ∀tumin < u(t)< umax ∀t

pmin < p < pmaxx(t) = f (x(t),u(t), t, p) ∀t

Siendo estas, las mismas para cada una de las m funciones.

2. Planteamiento del problema de optimización

Así como en la sección anterior Φ se define estrictamente por el termino de Mayer. Por lotanto este termino en función de las variables X(t) y P(t) queda definido por.

Φ1 = X(tN)Φ2 = P(tN)

(4.1)

Las restricciones nuevamente corresponden al modelo del sistema y a los valores máximosy mínimos que pueden tomar las variables Fin(t),Kla(t),CMet(t),Cod(t) dados en la sección3.3.Finalmente el problema de optimización Multi-Objetivo queda definido de la siguiente ma-nera.

Page 43: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 42

maxFin(t),Kla(t)

{X(tN),P(tN)}

Sub ject to˙V (t) = Fin(t) ∀t

X(t) = µ(t) ·X(t)−D(t) ·X(t)P(t) =

(a+b ·µ(t)+ c ·µ2(t)

)·X(t)−D(t) ·P(t)

˙CMet(t) = Fin(t) · ( 100V (t) −0,31 ·µ(t) ·X(t))

˙Cod(t) = Kla(t) · (100−Cod(t))−24625 ·µ(t) ·X(t)D(t) = Fin(t)

V (t)

µ(t) = µmax · CMet(t)d·C2

Met(t)+CMet(t)+kMet· Cod (t)

Cod (t)+kod

...

0≤ Fin(t)≤ 100≤ kla(t)≤ 10000≤CMet(t)≤ 5

0≤Cod(t)≤ 100 ∀tLas condiciones iniciales para cada una de las variables de estado, tiene el mismo valordefinido en el problema Mono-Objetivo para poder comparar los resultados obtenidos conlos dos métodos

Cod(0) = 0 [%]

CMet(0) = 0 [%]

V (0) = 1600 [l]

X(0) = 60 [gbio/l]

P(0) = 0 [gpro/l]

3. Solución Computacional

El sistema usado tiene varias alternativas para resolver los problemas de optimización Multi-Objetivo [2], de donde se escoge la alternativa Normalized Normal Constraint (NNC). Estaconsiste en resolver cada problema de optimización por aparte, para este caso resuelve elproblema de optimización de proteína y luego el de Biomasa. Posteriormente se desarrolla

Page 44: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 43

una linea que pase por estos dos óptimos encontraros. Este segmento de recta es dividido enm−1 segmentos con m puntos. Finalmente se resuelven m problemas de optimización dondecada uno tiene como condición inicial al punto m de la recta. la solución a cada uno de estosproblemas generará un óptimo, que su conjunto conforman la frontera de Pareto [11]. Paraeste caso en específico se toman 40 puntos o problemas para conformar la frontera.La solución del problema a partir de este algoritmo da como resultado la frontera de Paretomostrada en la figura 4.2 donde se puede ver claramente que la relación costo-beneficio entrelos dos objetivos, es directamente proporcional lo que indica que al mejorar uno de los dos,mejora el otro consecuentemente. Este resultado es muy importante ya que permite confirmarque la hipótesis en donde se plantea que las variables de interés están directamente relaciona-das es verdadera, y por lo tanto en el caso de optimización de Biomasa como en el de proteínala soluciones convergen al mismo resultado.En la gráfica 4.2 se puede ver que el mejor resultado al que se puede llegar a partir delas condiciones especificadas y el modelo desarrollado es de X(0) = 162 [gbio/lBio] y P(0) =1,86 [gpro/lBio].

1.5 1.55 1.6 1.65 1.7 1.75 1.8 1.85 1.9135

140

145

150

155

160

165

Proteina

Bio

Mas

a

Pareto Front (Proteina vs Biomasa)

Figura 4.2: Frontera de Pareto

En el cuadro 4.1 muestra el tiempo requerido para que el ordenador ejecute los cálculos, yla cantidad de iteraciones necesarias para que el resultado converja a una solución óptima

Page 45: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 44

# del problemade optimización

# Iteraciones paraconvergenciaKKT

Valor función decostos

X P1 2 1.48 137.22 5 1.49 137.93 1 1.50 138.54 1 1.59 139.1...

......

...40 1 1.86 161.8

Tabla 4.1: Costo computacional Multi-Objetivo

factible para los 40 problemas resueltos. En este cuadro se puede ver como se va generandola frontera de Pareto y como va mejorando el rendimiento para X y P.Con las curvas de comportamiento mostradas en la gráfica 4.3, en donde se puede ver clara-mente que la dinámica de cada una de las variables de estado como de control es aproxima-damente la misma a la encontrada en el problema de optimización mono-objetivo para cadauno de los casos.Concluyendo así que existe una única respuesta para los tres casos y dado que el problemade interés para este proyecto es la maximización de Proteína, se puede decir que la respuestaencontrada corresponde al optimo global del sistema planteado.

4. Validación

En complemento a la validación de la sección 3 se realiza un análisis de los resultados obte-nidos respecto a las soluciones óptimas de Pareto.Como primera medida se resuelve el problema Multi-Objetivo variando la condición inicialde Biomasa a la condición con la que se realiza el cultivo dada por X(0) = 70 [gbio/lBio], Losresultados se muestran en la gráfica 4.4.La razón por la cual se esta resolviendo este problema Multi-Objetivo es estrictamente paraanalizar el porqué se esta limitando el crecimiento tanto de Biomasa como de Proteína almomento de solucionar el problema de optimización, siendo que al validar estos resultadoscon los obtenidos al resolver las ecuaciones diferenciales del modelo bajo las mismas condi-ciones, las curvas de tendencia para ambos sistemas tienden a tener un comportamiento muysimilar.Dado que al ajustar la dilución a un valor cercano a D3 (Ver tabla 2.6), la respuesta del modelose aproxima a los valores obtenidos en el experimento desarrollado. Se plantea la hipótesisde que la dilución definida en los problemas de optimización D(t) = Fin(t)

V (t) esta dando masalta respecto a lo que debería ser, conllevando a tener menor producción de proteína y menorcrecimiento de Biomasa.

Page 46: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 45

0 50 10060

80

100

120

140

160

Tiempo

Bio

mas

aBiomasa vs Tiempo

0 50 1000

0.5

1

1.5

Tiempo

Pro

tein

a

Proteina vs Tiempo

0 50 1001600

1800

2000

2200

2400

2600

Tiempo

Vol

umen

Volumen vs Tiempo

0 50 1000

20

40

60

Tiempo

Cod

Cod vs Tiempo

0 50 1000

0.5

1

1.5

2

Tiempo

Met

Met vs Tiempo

0 50 100

4

5

6

7

8

9

10

Tiempo

Fin

Fin vs Tiempo

0 50 100

490

500

510

520

530

540

550

560

570

580

590

Tiempo

Kla

Kla vs Tiempo

Figura 4.3: Respuesta Óptima MultiObjetivo

Page 47: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 4. OPTIMIZACIÓN MULTI-OBJETIVO 46

1.55 1.6 1.65 1.7 1.75 1.8 1.85 1.9 1.95 2145

150

155

160

165

170

175

Proteina

Bio

Mas

aPareto Front (Proteina vs Biomasa)

Figura 4.4: Validación experimento-Conjunto de Pareto

La gráfica 4.4 muestra que al cambiarle la condición inicial de Biomasa a 70 [gbio/lBio], sucrecimiento aumenta a 173 [gbio/lBio] y su proteína aumenta a 195 [gPro/lbio], lo que implica quela condición inicial de Biomasa repercute en la cantidad de crecimiento de Biomasa y enla producción de proteína, es por eso que a futuro, se puede tener a esta variable como unatercera variable a optimizar. Lo que implicaría resolver un problema que indique el valorinicial de X que maximice la producción de proteína en 120 [h].

Page 48: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Capítulo 5

Conclusiones

A partir de cuatro experimentos desarrollados por el IEIM se formuló un modelo teórico querepresentara el crecimiento de Biomasa y la producción de proteína lo mas aproximadamenteposible a la realidad. Este modelo se pudo validar al resolver y evaluar las ecuaciones diferen-ciales con los valores de Cod y CMet correspondientes a cada uno de los experimentos, comoparámetros de entrada. Esto con el fin de estimar su comportamiento de salida correspon-diente a las señales X y P. Estos resultados se compararon con los experimentales obteniendocomo resultado un margen de error bajo. Posteriormente se desarrollaron dos problemas deoptimización, uno en donde se buscaba maximizar el crecimiento de Biomasa y otro en don-de se busca maximizar la producción de proteína, obteniendo como resultado señales dentrode los rangos impuestos por las restricciones y con patrones de comportamientos muy apro-ximado a los comportamientos de las variables experimentales. Posteriormente se escogióla mejor respuesta y se valido en el laboratorio desarrollando un cultivo con condiciones lomas aproximadamente posible a las encontradas en la simulación. Debido a que las condi-ciones con las que se desarrolló el cultivo no fueron exactamente iguales a las estimadas enel proceso de optimización, lo que se hizo posteriormente fue resolver las ecuaciones dife-renciales del modelo, teniendo como entradas del sistema a los valores de las variables Cody CMet implementadas en el experimento. Se tiene la satisfacción de obtener como resultadouna dinámica aproximada entre la respuesta teórica y práctica con un margen de error bajo.Finalmente se planteó y desarrolló el problema de optimización Multi-Objetivo con el finde maximizar las variables de interés P y X simultáneamente obteniendo como resultado lafrontera de Pareto que representa al conjunto de puntos inmejorables por algún punto dentrode la región factible no contenido dentro la frontera de Pareto

Como resultados se puede destacar que no se seleccionó un modelo existente así como sehabía formulado, sino que por lo contrario se realizó todo un proceso de modelamiento y deestimación de parámetros con el fin de obtener un sistema único e innovador con alto gradode proximidad a la realidad. De este modelo hay que resaltar que a diferencia de otros, latasa de crecimiento µ es cuadrática en función de la concentración de Metanol y de oxígenodisuelto, implicando así una región de descenso o perdida en las variables X y P. Así como la

47

Page 49: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 5. CONCLUSIONES 48

tasa de crecimiento µ , también se definió a la tasa de producción de proteína qpro, como unaseñal cuadrática en función de µ con el objetivo de relacionar a la producción de proteína,la concentración de oxigeno disuelto, la cantidad de Metanol y la concentración de Biomasaentre si. Los trabajos similares a este, usualmente definen a estas dos tasas de crecimientocon una dinámica exclusivamente creciente e independiente de cada una de las variables yamencionadas ademas de que usualmente ninguna de estas dos depende del oxígeno disuelto.Adicionalmente es importante mencionar, que se desarrolló una estrategia de modelamientoversátil y eficiente en donde se pueden tener n experimentos corriendo simultáneamente enel algoritmo de estimación de parámetros para estimar los parámetros deseados a partir detodas esas curvas de comportamiento.Como objetivo extra se planteó validar en el laboratorio la mejor respuesta entre la optimi-zación de proteína y la de Biomasa, con el resultado de que ambas respuestas dieron aproxi-madamente lo mismo. Por lo que fue indiferente escoger cual de las dos respuestas se iba autilizar para desarrollar el cultivo. Se obtuvo como resultados una producción de proteína de2,5 veces mayor que el promedio de los experimentos y 2 veces mayor que el experimentocon más alta producción. Para el crecimiento de Biomasa se obtuvo 1,7 veces mayor queel promedio de los experimentos y 1,3 veces mayor que el experimento con mas alto cre-cimiento. Cabe resaltar que este grado de optimización se logró con el primer experimentodesarrollado luego de una investigación aproximada de 6 meses, a diferencia del método in-situ con el que se venia trabajando desde aproximadamente 2 años en donde se desarrollaronmas de 10 experimentos de los cuales solo 4 tenían comportamientos aceptables.Al obtener los resultados de la optimización Multi-Objetivo se llegó a un resultado interesanteel cual fue fundamental para identificar el porqué se obtuvo el mismo resultado al optimizarX y P en la sección 3. Esa razón fue fundamentada al encontrar la frontera de Pareto, dondese puede ver que el conjunto de puntos que conforma esta frontera tiene una relación linealdirectamente proporcional teniendo como punto óptimo aquel que maximiza tanto a la pro-teína como a la Biomasa de igual manera que la respuesta encontrada al resolver el problemaMono-Objetivo. A partir de esta conclusión es posible afirmar que se a llegado al óptimoglobal del problema.

Es posible mejorar este modelo de varias maneras, una de estas es tener mayor cantidad deexperimentos validos para la estimación de parámetros, con comportamientos adecuados ycon el tiempo de desarrollo usual de un cultivo dado por 120h esto se justifica en la sección2, donde fue necesario interpolar los experimentos para que estos se ajustaran al tiempo delexperimento con menor duración lo que pude implicar una menor resolución en el momentode resolver las ecuaciones diferenciales del sistema. Ademas de que al tener mayor cantidadde experimentos, será posible tener una mayor aproximación a la realidad.Como se puede ver al comparar la respuesta óptima seleccionada para el proceso de valida-ción (Ver gráficas 3.1 y 3.2), esta presenta un crecimiento de Biomasa y una producción deproteína, menor a la obtenida por el cultivo (Ver gráfica3.7 ), pero esta respuesta a su vez esmuy parecida a la respuesta obtenida al resolver las ecuaciones diferenciales (Ver gráfica 3.8).Esta diferencia se debe a que al momento resolver las ecuaciones diferenciales del modelo,

Page 50: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

CAPÍTULO 5. CONCLUSIONES 49

la dilución es un parámetro fijo que se puede ajustar a un valor próximo a los encontrados,mientras que para el problema de optimización, la dilución esta dada por D = Fin

V , implicandoasí que la tasa de crecimiento va a depender directamente del valor que tome este término.Es por eso que a partir de estos resultados se llegó a la conclusión de que para desarrollosfuturos, es necesario definir una función de flujo de entrada Fin y de volumen V mas apro-ximadas a la realidad, debido a que alguna de las dos, o las dos variables está limitando elcrecimiento de X y P. Es importante aclarar que para este trabajo desarrollado era imposibleestimar estos parámetros debido a que hasta el momento no existen los dispositivos ni losmedios para poder realizar una medición que las represente adecuadamente.

Page 51: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

Bibliografía

[1] Díaz Dennis Johanna Beltrán Laura Milena. EVALUACIÓN DE LA PRODUCCIÓN DEPROTEÍNAS RECOMBINANTES EN Pichia pastoris MEDIANTE ESTRATEGIAS DECULTIVO LIMITADO POR OXÍGENO Y SUSTRATO. Universidad Javeriana, 2012.

[2] Massimiliano Caramia and Paolo Dell’Olmo. Multi-objective Management in FreightLogistics: Increasing Capacity, Service Level and Safety with Optimization Algorithms.Springer, 2008.

[3] B. Houska D. Ariens and H.J. Ferreau. ACADO Toolkit User’s Manual.http://www.acadotoolkit.org, 2010-2011.

[4] Kalyanmoy Deb and Deb Kalyanmoy. Multi-Objective Optimization Using Evolutio-nary Algorithms. Wiley, 2001.

[5] Pinar Çalik Eda Çelik. A structured kinetic model for recombinant protein productionby mut+ strain of pichia pastoris. Chemical Engineering Science, 64:5028 – 5035, 2009.

[6] Peter Geschek. Gaucher disease: The fight for market share.

[7] Raúl Poutou Piñales Luis Alejandro Barrera Avellaneda Henry Córdoba Ruiz, NéstorAlgecira Encizo. Pichia pastoris one alternative for human glycoprotein production oftherapeutic use. fermentation strategies. Revista Colombiana de Bioteconología, Volú-men 5 (2):16, 2003.

[8] Boris Houska. Robust Optimization of Dynamic Systems. PhD thesis, KATHOLIEKEUNIVERSITEIT LEUVEN, August 2011.

[9] K.-H. Bellgardt Karl Schügerl. Bioreaction engineering: modeling and control. Berlin; New York : Springer, c2000., 2000.

[10] Dmitrii Lozovanu. Optimization and Multiobjective Control of Time-Discrete Systems:Dynamic Networks and Multilayered Structures. Springer, 2009.

[11] M. Martanez, S. Garca.a.Nieto, J. Sanchis, and X. Blasco. Genetic algorithms optimi-zation for normalized normal constraint method under pareto construction. Advances inEngineering Software, 40(4):260 – 267, 2009.

50

Page 52: OPTIMIZACIÓN DE LA PRODUCCIÓN DE PROTEÍNAS …

BIBLIOGRAFÍA 51

[12] Jens Nielsen, John Villadsen, and Gunnar Lidén. Bioreaction Engineering Principles.Springer, 2002.

[13] Hongxing Niu, Marc Daukandt, Christian Rodriguez, Patrick Fickers, and Philippe Bo-gaerts. Dynamic modeling of methylotrophic pichia pastoris culture with exhaust gasanalysis: From cellular metabolism to process simulation. Chemical Engineering Scien-ce, 87(0):381 – 392, 2013.

[14] Thiele Ines Palsson Bernhard O Orth, Jeffrey D. What is flux balance analysis? NatBiotech, 28:248, 2010/03//print.

[15] Bernhard Palsson. Metabolic systems biology. {FEBS} Letters, 583(24):3900 – 3904,2009. Systems Biology - Nobel Symposium 146.

[16] H.T. Ren, J.Q. Yuan, and K.-H. Bellgardt. Macrokinetic model for methylotrophic pi-chia pastoris based on stoichiometric balance. Journal of Biotechnology, 106(1):53 –68, 2003.

[17] J. A. Rossiter. Model-based predictive control: a practical approach. CRC Press, 2003.

[18] Ralph E. Steuer. Multiple Criteria Optimization: Theory, Computation, and Application(Wiley Series in Probability and Statistics). Wiley, 1986.

[19] Palsson Bernhard O Thiele, Ines. A protocol for generating a high-quality genome-scalemetabolic reconstruction. Nat. Protocols, 5:93, 2010/01//print.

[20] John Villadsen, Jens Nielsen, and Gunnar Lidaon. Bioreaction Engineering Principles.Springer, 2011.