observaciÓn y control neuroadaptable por …
TRANSCRIPT
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
1
OBSERVACIÓN Y CONTROL NEUROADAPTABLE POR ESTIMACIÓN DE
ESTADOS PARA MODELOS DE BIOINGENIERÍA
QUE PARA OBTENER EL TÍTULO DE
INGENIERO BIOMÉDICO
PRESENTA
C. FONSECA PALMA HUMBERTO MARTIN
DIRECTOR INTERNO: DR. AGUSTÍN IGNACIO CABRERA LLANOS
CO DIRECTOR: DR. JORGE ISSAC CHAIREZ ORIA
MÉXICO D. F. MAYO 2011
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
2
AGRADECIMIENTOS
- A mis padres Martín y Ruth, gracias por darme la oportunidad de mi desarrollo
escolar, por otorgarme lo que necesitaba durante este proceso, gracias por la
confianza que me brindaron, por su apoyo y consejos
- A mis hermanos Marlen, Erika y Jovanny por su apoyo, cariño y confianza que
hemos compartido durante el desarrollo de nuestras vidas
- Al Dr Agustín Cabrera Llanos y el M en C Isaac Chaires Oria por darme la
oportunidad de pertenecer a su grupo de trabajo en el desarrollo de
investigación de técnicas de control moderno, por la convivencia que
desarrollamos durante los años que colabore con ellos.
- A los amigos que he encontrado durante el camino de mi vida que me han
demostrado su amistad a pesar de los conflictos que hemos tenido por que han
sido unos de los impulsos que he tenido durante mi formación, se que a
algunos tal vez no los vuelva a encontrar puesto que tomamos caminos
diferentes, pero siempre estarán en mis recuerdos y las cosas que enfrentamos
durante nuestras formaciones.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
3
RESUMEN
En la presente tesis se desarrollaron las aplicaciones de redes neuronales
diferenciales (RND), en un modelo biológico matemático el cual describe la interacción
de glucosa e insulina (modelo de Bergman) para el proceso de salud enfermedad
asociado a la diabetes. Para este sistema se desarrollo un identificador para las
variables que describen su dinámica las cuales son: Diferencia de la concentración de
insulina en plasma 1x , Diferencia de concentración de glucosa en plasma 2x ;
mientras que 3x es un valor proporcional a la concentración de insulina en el
compartimiento remoto. Esto último obedece a la descripción compartamental del
modelo de Bergman, el cual asume que dicho comportamiento representa toda la
glucosa que se encuentra en el cuerpo pero no en el torrente sanguíneo. A este
mismo modelo, por sus características de simulación y estructura matemática, se le
desarrollo un controlador basado en técnicas de control adaptable que resolviera el
problema de seguimiento de trayectoria mediante un sistema de referencia el cual
tiene las características necesarias para describir las condiciones fisiológicas de un
paciente sano. Lo anterior se traduciría en el correcto funcionamiento del sistema de
interacción insulina-glucosa utilizando una fuente externa de suministro de la insulina
que regule automáticamente la relación entre estas dos sustancias (páncreas
artificial).
Por otro lado, se utilizó una combinación de dos técnicas de control, conocidas como
lógica difusa y redes neuronales las que pueden generar estructuras mixtas las cuales
se define como un Sistema neurodifuso, el cual demostró ser una aplicación más
orientado a desarrollar una aplicación real o prototipo de controlador para finalmente,
crear un infusor de insulina automático.
La solucion, para el sistema de insulina-glucosa, demostro la aplicabilidad de los
conceptos de redes neuronales y lógica difusa en la identificación no paramétrica y el
diseño de controladores automáticos para sistemas de tipo biológico que se asumen
no lineales, inciertos en su descripción matemática y afectada por perturbaciones
externas.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
4
La propuesta de combinar las redes neuronales diferenciales y la lógica difusa, es una
propuesta muy atractiva que favorecería el desarrollo de controladores basados en
inteligencia artificial para solventar problemas que afectan a la población mundial
como la diabetes.
JUSTIFICACION
A pesar de que la diabetes es una enfermedad que no tiene una cura definitiva, su
prevalencia en la población mundial y considerando el número de muertes que causa
cada año demandan la generación de sistemas que permitan disminuir el impacto que
tiene dicha enfermedad en los sistemas de salud de todos los países alrededor del
mundo.
El desarrollo de nuevas técnicas y herramientas de control abre grandes posibilidades
para implementar algoritmos y dispositivos que puedan coadyuvar a la resolución de
problemas de control avanzado de sistemas no lineales inciertos. En este sentido, la
medicina es un área muy prometedora por las necesidades que se requieren de
control para poder resolver las múltiples patologías que se presentan en el ser
humano y que son susceptibles, utilizando un método adecuado, para resolverse por
tratamientos que necesitan de un control riguroso. Esto se debe a que un mejor control
conlleva a múltiples beneficios tanto económicos, de salud y de funcionalidad. En
particular el principal concepto de mejoramiento u optimización en los tratamientos se
da en el ahorro de medicamentos dado que solo se utilizarían los necesarios. En el
caso del aspecto salud, se presenta un beneficio inmediato debido a que el
medicamento sería suministrado en el momento en el que se requiere y finalmente, se
incrementa la funcionalidad a consecuencia de que mejora la salud evitando la pérdida
de horas hombre por el padecimiento en particular que sufra el paciente.
Es por este motivo que se implementan en este trabajo técnicas de aprendizaje,
control y observación basadas en redes neuronales diferenciales, para la
implementación de otras opciones de solución para los problemas que se tienen con
los modelos biológicos en donde se encuentra la descripción matemática de la
diabetes.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
5
APORTACIONES
Mediante la realización del presente trabajo se pretende dar una opción para la
elaboración de instrumentación médica para el tratamiento de la diabetes en dos
maneras, una de ellas es mediante un control de seguimiento de parámetros normales
por medio de suministro de insulina y glucosa, el otro método es mediante la
combinación de dos técnicas redes neuronales y lógica difusa, para la creación de un
infusor de insulina que suministrara la dosis necesaria de insulina conforme el cuerpo
del paciente lo requiera, estas concentraciones suministradas estarán delimitadas por
un experto el cual creara las reglas de la lógica difusa conforme a las entradas
proporcionadas por la red neuronal y las necesidades del paciente
OBJETIVOS
GENERALES
Aplicar redes neuronales diferenciales a dos modelos biológicos para obtener una
representación aproximada del modelo matemático que los describe (identificación no
para métrica) utilizando solo la información de entrada-salida.
Crear un control para la regulación de insulina y glucosa mediante la infusión de
insulina empleando el modelo no para métrico.
PARTICULARES
- Designación de un modelo matemático que represente la evolución de la
concentración de glucosa
- Desarrollo de un identificador para el modelo de Bergman
- Desarrollo de un observador para el modelo de Bergman
- Realizar un control neuronal en seguimiento de trayectoria para el modelo de
Bergman
- Realizar un control neurodifuso para el modelo de Bergman que controle el
suministro de insulina
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
6
INDICE GENERAL
Introducción 10
CAPITULO I Redes Neuronales Artificiales 14
1.1 Perceptron 14
1.2 Características De Las Redes Neuronales 17
1.3 Regla De Aprendizaje 19
CAPITULO II Técnicas Aplicadas 23
2.1 Redes Neuronales Diferenciales 23
2.1.1 Identificación 23
2.1.1.1leyes De Aprendizaje 26
2.1.2 Observador Con Redes Neuronales Diferenciales 28
A) Observadores De Estado 28
B) Neuro Observador 30
C) Leyes De Aprendizaje 30
2.1.3 Control Con Redes Neuronales Diferenciales 33
A) Condiciones De Control 33
B) Descripción Del Sistema De Control 34
2.2 Lógica Difusa 36
A) Funciones De Membrecía 38
B) Reglas Lógicas 40
C) Estructura De La Lógica Difusa 40
2.3 Sistema Neuro Difuso 43
A) Taxonomía De Los Sistemas Neuro Difusos 43
B) Ventajas De Los Sistemas Neurodifusos 44
C) Limitaciones De Los Sistemas Neurodifusos 45
CAPITULO III Modelos de aplicación 46
Análisis De Observabilidad Y Controlabilidad 46
3.1 Sistema Biológico Utilizado 49
A) Diabetes 49
B) Tipo De Diabetes 50
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
7
C) Modelos Matemáticos 50
CAPITULO IV Metodología Y Resultados 53
4.1 Identificación Con Rnd 53
4.1.1 Dinámica De Glucosa En Sangre (Modelo De Bergman) 53
4.1.2 Resultados 56
4.2 Neuro Control 63
4.2.1 Dinámica De Glucosa En Sangre (Modelo De Bergman) 63
4.2.2 Resultados 67
4.3 Neuro Observador 77
4.3.1 Dinámica De Glucosa En Sangre (Modelo De Bergman) 77
4.3.2 Resultados 79
4.4. Sistema Neuro Difuso 83
4.4.1 Dinámica De Glucosa En Sangre (Modelo De Bergman) 83
4.4.2 Resultados 87
Conclusiones 88
Bibliografía 89
Anexos I 91
Anexos Ii 95
INDICE DE FIGURAS
Figura I Neuronas 11
Figura. II Sinapsis 12
Figura. 1.1 Perceptor 14
Figura 1.2 Topología De Una Red 16
Figura 1.3 Funciones De Transferencia 17
Figura 1.4 Red De Tres Capas 20
Figura 2.1 Satisfacción De Las Condiciones 25
Figura 2.2 Topología De Una RND 27
Figura 2.3 Diagrama De Identificación 28
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
8
Figura 2.4 Diagrama Del Observador 30
Figura 2.5 Rnd En Observador 32
Figura 2.6 Diagrama De Control 36
Figura 2.7 Formas Comunes De Las Funciones De Membrecía 38
Figura 2.8 Muestra Del Trapezoide En Un Conjunto Difuso 39
Figura 2.9 Método Del Centro Idee 42
Figura 2.10 Modelo Concurrente 44
Figura 4.1 Aplicación De RND Al Modelo De Bergman Para Su
Identificación
53
Figura 4.2 Diagrama De Ecuaciones Aplicadas 54
Figura 4.3 Estructura De Simulación Del Identificador Con Simulink 56
Figura 4.4 Simulacion Del Modelo De Bergman 57
Figura. 4.5 Identificación De La Concentración De Glucosa 58
Figura. 4.6 Error Del Identificador De Glucosa 59
Figura. 4.7 Identificación De La Concentración De Insulina 60
Figura. 4.8 Error Del Identificador De Insulina 61
Figura. 4.9 Identificación De La Concentración De Insulina En El
Compartimiento Remoto
62
Figura. 4.10 Error Del Identificador De Insulina En El Compartimiento
Remoto
63
Figura. 4.11 Diagrama A Bloques Del Control De Seguimiento De
Trayectoria
64
Figura. 4.12 Sistema De Referencia 65
Figura 4.13 Esquema De Simulación Del Neurocontrol 67
Figura. 4.25 Control Aplicado Al Modelo Y A La RND 68
Figura. 4.26 Modelo Controlado 69
Figura 4.27 Aprendizaje De La RND Por Medio Del Control 70
Figura. 4.28 Error De La RND Para La Glucosa Con El Control 71
Figura. 4.29 Aprendizaje De La RND Por Medio Del Control 72
Figura. 4.30 Error De La Insulina En El Compartimiento Remoto Contra El 73
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
9
Sistema De Referencia
Figura. 4.31 Seguimiento De La Planta Al Modelo De Referencia 74
Figura. 4.32 Error Del Seguimiento De La Concentración De Glucosa 75
Figura. 4.33 Seguimiento De La Planta Al Modelo De Referencia 76
Figura. 4.34 Error Del Seguimiento De La Concentración De Glucosa 77
Figura. 4.35 Esquema De Simulación De La Estructura Del Observador 78
Figura. 4.36 Observador De Glucosa 79
Figura. 4.37 Error Del Observador 80
Figura. 4.38 Estimación De La Insulina 81
Figura. 4.39 Error Del Estimador De Insulina 82
Figura. 4.40 Estimación De Insulina En El Compartimiento Remoto 82
Figura. 4.41 Error Del Estimador De Insulina En El Compartimiento
Remoto
83
Figura. 4.42 Representación A Bloques Del Esquema Difuso Con Dos
Entradas Y Una Salida
84
Figura. 4.43 Funciones De Membrecía Para La Concentración De
Glucosa
84
Figura. 4.44 Funciones De Membrecía Para La Concentración De Insulina 85
Figura. 4.45 Funciones De Membrecía Para El Suministro De Insulina 85
Figura. 4.46 Diagrama Sistema Neuro Difuso 86
Figura. 4.47 Respuesta Del Infusor 87
Figura. 4.48 Dinámica Del Infusor Y La Glucosa 87
INDICE DE TABLAS
Tabla 2.1 Descripciones Matemáticas De Las Principales Funciones De
Membrecía
39
Tabla 4.1 Reglas Empleadas Por El Experto 86
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
10
INTRODUCCION
Como es sabido el hombre ha intentado crear máquinas semejantes al humano con
capacidades como el aprendizaje, razonamiento, e inteligencia, los cuales simplifiquen
las tareas más complejas que necesitan de estos conceptos. Una de las alternativas
es enfocarse en cómo funciona principalmente el cerebro para comprender su
funcionamiento y como interactua con el medio en el que se encuentra. El cerebro
humano continuamente recibe señales de entrada de muchas fuentes principalmente
de los sentidos y las procesa a manera de crear una apropiada respuesta de salida
para una determinada tarea, cabe mencionar que para obtener la respuesta el cerebro
debe de estar entrenado, este entrenamiento se logra mediante las experiencias
vividas durante el transcurso de la vida conforme a pruebas y errores hasta que el
resultado sea el adecuado para la solución del problema. Los cerebros cuentan con
millones de neuronas que se interconectan formando grandes redes (Redes
Neuronales). Estas redes ejecutan los millones de instrucciones necesarias para
mantener una vida normal.
Las neuronas son las células que forman la corteza cerebral de los seres vivos, cada
una está formada por elementos llamados cuerpo, axón y dendritas, las cuales se
comunican por medio de sinapsis como se muestra en la siguiente (Figura I).
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
11
Figura I Neuronas
Las dendritas forman una estructura de filamentos muy fina que rodean el cuerpo de la
neurona. El axón es un tubo largo y delgado que se ramifica en su extremo en
pequeños bulbos finales que casi tocan las dendritas de las células vecinas. La
pequeña separación entre los bulbos finales y las dendritas se le denomina sinapsis.
Las neuronas, al igual que las demás células del cuerpo, funcionan a través de
impulsos eléctricos y reacciones químicas. Los impulsos eléctricos que utiliza una
neurona para intercambiar información con las demás, viajan por el axón que hace
contacto con las dendritas de la neurona vecina mediante las sinapsis. La intensidad
de la corriente transmitida depende de la eficiencia de la transmisión sináptica. Una
neurona en especial transmitirá un impulso eléctrico por su axón si suficientes señales
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
12
de las neuronas vecinas transmiten a través de sus dendritas en un tiempo corto. La
señal que se transmite a la neurona podrá ser además inhibitoria o excitatoria. La
neurona dispara, esto es, manda el impulso por su axón, si la excitación excede su
inhibición por un valor crítico al umbral de la neurona,. (Figura II).
Figura. II Sinapsis
La inteligencia artificial es la ciencia que intenta la creación de programas para
máquinas que imiten el comportamiento y la comprensión humana. La investigación en
el campo de la IA se caracteriza por la producción de máquinas para la automatización
de tareas que requieran un comportamiento inteligente.
Fundamentalmente existen dos vertientes para trasladar la inteligencia y forma de
razonamiento humano. Una es la Inteligencia Simbólica que está caracterizada por un
gran nivel de abstracción y un punto de vista macroscópico, los sistemas de
conocimiento ingenieriles y la programación lógica caen en esta categoría. La segunda
rama está basada en modelos biológicos microscópicos de bajo nivel, este es similar
al énfasis de la fisiología y genética. Las redes neuronales y los algoritmos genéticos
son ejemplos de esta tecnología. El principal tema de desarrollo es por el modelaje del
cerebro como un dispositivo computacional en paralelo, con varias tareas por
separado. Las redes neuronales tienen una gran cantidad de elementos de
procesamiento altamente interconectados (nodos), que usualmente trabajan en
paralelo y están en arquitecturas regulares. El comportamiento colectivo de una red
neuronal como la del cerebro humano, demuestra la habilidad de aprender, reajustar y
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
13
generalizar a partir de patrones de entrenamiento o datos. Las aplicaciones donde las
redes neuronales son más prometedoras son aquellas que tienen que ver con un
amiente del mundo real, como el reconocimiento de patrones, conversión de
imágenes, procesamiento de imágenes y percepción visual, aplicaciones médicas,
aplicaciones industriales, etc.
Los modelos de las redes neuronales están especificados en tres modos básicos:
modelos de los elementos de programación por si solos, modelos de interconexión y
estructuras (topologías de la red), así como las reglas de aprendizaje. Cada nodo en la
red neuronal colecciona todos los valores de todas sus conexiones de entrada,
desarrolla una operación matemática predefinida, y produce un valor único de salida.
Cada conexión tiene un peso asociado que determina el efecto de la entrada actual en
el nivel de activación del nodo, los pesos pueden ser positivos (excitatorios) y
negativos (inhibitorios). Los pesos de conexión almacenan la información y el valor de
los pesos de conexión están determinados de manera común por un procesamiento
de aprendizaje de la red neuronal, a esto se le conoce como leyes de aprendizaje.
Estas determinaran el aprendizaje de la red neuronal. Las leyes de aprendizaje son
de diferentes formas, pero la más conocida es la de backpropagation, este
procedimiento toma la salida de la red y la retroalimenta a los pesos subsecuentes de
la red para así poder modificar los pesos y que la red neuronal complete su
aprendizaje. Al igual que este método de aprendizaje existen más como: el
aprendizaje no supervisado y supervisado estas características darán forma al tipo de
redes que se emplearan para este trabajo ya que estas son las bases para el
desarrollo de las redes neuronales artificiales.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
14
CAPITULO I
REDES NEURONALES ARTIFICIALES
Basadas en las redes neuronales biológicas, fueron creadas las redes neuronales
diferenciales. Al igual es necesario un estructura y funcionamiento, mediante el
aprendizaje para la realización de un procedimiento, es por ello que por cada
fenómeno, modelo o tarea, es necesario la creación de una red particular para cada
una de estas que dependiendo de la complejidad será el tipo de estructura empleada.
1.1 PERCEPTRON
Las redes neuronales artificiales son algoritmos numéricos programables en los
cuales se basan en una estructura biológica (neurona) la cual es representada
matemáticamente (Figura 1.1) y es conocida como perceptron, esta es más básica de
las redes neuronales. Un conjunto de perceptrones interconectados determinaran la
complejidad y dimensión de la red neuronal esta será estructurada por el diseñador
que designara cuantos perseptrones serán implementados para el mejor
funcionamiento para la aplicación dada. Se debe tomar en cuenta que dependiendo de
la complejidad del problema es el número de perseptrones implementados si se
excede el número, la red se haría muy grande para el problema y se obtendrá el
mismo resultado que con una más pequeña por lo que la red estará sobrada.
Figura.. 1.1 Perceptron
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
15
En la (Figura 1.1) nxxxx ....,, 321 son las entradas del perseptron, nwwww ....,, 321
son los pesos, bwxf nn es la sumatoria de cada una de las entradas por cada
uno de los pesos sumando una constante de entrenamiento y a todo eso se evalúa
con respecto a una función de activación )(f , lo cual solo produce un solo valor único
de salida y. Este valor se distribuye a la entrada del siguiente perceptron y así
sucesivamente hasta el último.
Podemos observar que el proceso de las redes son sumatorias de entradas por pesos
que producen un valor numérico y este valor se transmite al siguiente perceptron
evaluándose en una ecuación para dar un único valor. En la (Figura 1.3) se muestran
señales conocidas como funciones de activación, estas determinaran un umbral. A
este umbral se conoce como barrera de aprendizaje, esto es que si el valor entregado
por la sumatoria no sobrepasa el valor de este umbral no se trasmite esta sumatoria al
siguiente perseptron, la función es determinada por el programador. Existen diferentes
tipos de funciones de transferencia, el programador determinara cual considera
necesaria para las propiedades de aprendizaje.
Un conjunto de perceptrones forman una red neuronal la cual tiene ciertas
características que describen de manera general su funcionamiento algunas son;
Unidad de proceso: En la neurona Artificial. Existen tres tipos de capas: entradas,
salidas y ocultas (Figura 1.2). Las unidades de entrada reciben señales desde el
entorno; las de salida envían la señal fuera de la red, y las unidades ocultas son
aquellas cuyas entradas y salidas se encuentran dentro del sistema. Se conoce como
capa o nivel a un conjunto de neuronas cuyas entradas provienen de la misma fuente
y cuyas salidas se dirigen al mismo destino.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
16
Figura 1.2 Topología De Una Red
Los valores de activación pueden ser continuos o discretos, limitados o ilimitados. Si
son discretos, suelen tomar un conjunto finito de valores binarios, así un estado activo
se indicaría con un 1 y un estado pasivo se representaría por un cero. En otros
modelos se considera un conjunto de estados de activación, en cuyo valor entre [0,1],
o en el intervalo [-1,1], siendo una función sigmoidea o lineal. La Figura 1.3 muestra
algunas de las funciones de activación más conocidas.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
17
Figura 1.3 Funciones De Transferencia
1.2 CARACTERÍSTICAS DE LAS REDES NEURONALES
Existen aspectos que caracterizan una red neuronal: su topología, el mecanismo de
aprendizaje, tipo de asociación realizada entre la información de entrada salida, y la
forma de representación de estas informaciones.
Topología de las Redes Neuronales. La arquitectura de las redes neuronales
consiste en la organización y disposición de las neuronas formando capas más o
menos alejadas de la entrada y salida de la red. En este sentido, los parámetros
fundamentales de la red son: el número de capas, el número de neuronas por capa, el
grado de conectividad y el tipo de conexiones entre neuronas.
Redes Mono capa: Se establecen conexiones laterales, cruzadas o autorrecurrentes
entre las neuronas que pertenecen a la única capa que constituye la red. Se utilizan en
tareas relacionadas con lo que se conoce como auto asociación; por ejemplo, para
generar informaciones de entrada que se presentan a la red incompleta o
distorsionada.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
18
Redes Multicapa: Son aquellas que disponen de conjuntos de neuronas agrupadas
en varios niveles o capas. Una forma de distinguir la capa a la que pertenece la
neurona, consiste en fijarse en el origen de las señales que recibe a la entrada y el
destino de la señal de salida. Según el tipo de conexión, se distinguen las redes
feedforward y las redes feedforward/feedback [10],[11].
Mecanismo de Aprendizaje. El aprendizaje es el proceso por el cual una red
neuronal modifica sus pesos en respuesta a una información de entrada. Los cambios
que se producen durante el proceso de aprendizaje se reducen a la destrucción,
modificación y creación de conexiones entre las neuronas. La creación de una nueva
conexión implica que el peso de la misma pasa a tener un valor distinto de cero, una
conexión se destruye cuando su peso es cero. Se puede afirmar que el proceso de
aprendizaje ha finalizado (la red ha aprendido) cuando los valores de los pesos
permanecen estables es decir que la diferencial de los pesos con respecto al tiempo
es cero 0
t
wij
Un criterio para diferenciar las reglas de aprendizaje se basa en considerar si la red
puede aprender durante su funcionamiento habitual, o si el aprendizaje supone la
desconexión de la red. Otro criterio suele considerar dos tipos de reglas de
aprendizaje: las de aprendizaje supervisado y las correspondientes a un aprendizaje
no supervisado. Estas reglas dan pie a una de las clasificaciones que se realizan de
las RNA:
1) Redes neuronales con aprendizaje supervisado y redes neuronales con
aprendizaje no supervisado. La diferencia fundamental entre ambos tipos
estriba en la existencia o no de un agente externo (supervisor) que controle el
aprendizaje de la red.
2) Redes con Aprendizaje Supervisado. El proceso de aprendizaje se realiza
mediante un entrenamiento controlado por un agente externo (supervisor,
maestro) que determina la respuesta que debería generar la red a partir de una
entrada determinada. El supervisor comprueba la salida de la red y en el caso
de que ésta no coincida con la deseada, se procederá a modificar los pesos de
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
19
las conexiones, con el fin de conseguir que la salida se aproxime a la deseada.
Se consideran tres formas de llevar a cabo este tipo de aprendizaje:
• Aprendizaje por corrección de error: Consiste en ajustar los pesos en función de la
diferencia entre los valores deseados y los obtenidos en la salida de la red; es decir,
en función del error.
• Aprendizaje por refuerzo: Se basa en la idea de no indicar durante el entrenamiento
exactamente la salida que se desea que proporcione la red ante una determinada
entrada. La función del supervisor se reduce a indicar mediante una señal de refuerzo
si la salida obtenida en la red se ajusta a la deseada (éxito=+1 o fracaso=-1), y en
función de ello se ajustan los pesos basándose en un mecanismo de probabilidad.
• Aprendizaje estocástico: Este tipo de aprendizaje consiste básicamente en realizar
cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar
su efecto a partir del objetivo deseado y de distribuciones de probabilidad.
Redes con Aprendizaje No Supervisado. Estas redes no requieren influencia externa
para ajustar los pesos de las conexiones entre neuronas. La red no recibe ninguna
información por parte del entorno que le indique si la salida generada es o no correcta,
así que existen varias posibilidades en cuanto a la interpretación de la salida de estas
redes.
El tipo de aprendizaje implementado en esta aplicación es supervisado por medio de
la diferencia de la salida esperada y la salida proporcionada por la dinámica de la red,
como se realiza este aprendizaje, lo veremos más adelante.
1.3 REGLAS DE APRENDIZAJE
El algoritmo backpropagation para redes multicapa realiza su labor de actualización de
pesos y ganancias con base en el error medio cuadrático, esta red trabaja bajo
aprendizaje supervisado y por tanto necesita un set de entrenamiento que le describa
cada salida y su valor de la salida esperado de la siguiente forma
QQ tptptp ,,.....,,,, 2211 (1.1)
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
20
Donde Qp es una entrada a la red y Qt es la correspondiente salida deseada para el
sistema. Este algoritmo debe de ajustar los parámetros de la red para minimizar el
error medio cuadrático, para realizar el proceso de aprendizaje debemos definir la
topología de la red, objetivos y funciones de activación requeridas en cada capa.
Figura 1.4 Red De Tres Capas
Para poder iniciar el entrenamiento se le presenta a la red un patrón de entrenamiento
el cual tiene n componente.
np
p
p
P
2
1
(1.2)
Este se transmite por cada uno de los componentes de la primera capa como se
muestra en la figura (1.4) dando como respuesta un valor descrito en la ecuación (1.3)
n
i
jiijj bpwn1
(1.3)
Donde:
ijw Peso que une la componente i de la entrada con la neurona j de primera capa
oculta.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
21
ip Componente i del vector p que contiene el patrón de entrenamiento de n
componentes.
jb Ganancia de la neurona j en la capa oculta.
Cada una de las neuronas nos entrega una salida ja
n
i
jiijj bpwfa1
(1.4)
Recuérdese que f es la función de activación. Las salidas ja son las entradas a los
pesos de la conexión de la siguiente neurona por lo que este comportamiento esta
dado por la ecuación (1.5)
m
j
kjkj
s
k bawn1
(1.5)
Podemos observar que la red produce una última salida.
s
k
ss
k nfa (1.6)
La salida de la red de cada neurona s
ka se compara con la salida deseada kt para
calcular el error en cada unidad de salida (1.7)
s
kkk at (1.7)
El error debido a cada patrón de entrada p propagado esta dado por (1.8) donde esta
ecuación describe el error medio cuadrático para cada patrón de entrada. Este
proceso se repite para cada uno de los patrones de entrenamiento, para un proceso
de aprendizaje exitoso el objetivo del algoritmo es actualizar todos los pesos y
ganancias de la red minimizando el error medio cuadrático total descrito en (1.9)
s
k
kep1
22
2
1 (1.8)
r
p
epe1
22 (1.9)
La condición requerida para realizar la actualización de la matriz de pesos utilizando el
algoritmo del gradiente descendiente en el algoritmo es:
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
22
2
1 epWW kk (1.10)
El gradiente negativo de 2ep se denomina como 2ep y se calcula como la derivada
del error respecto a todos los pesos de la red. En la capa de salida el gradiente
negativo del error con respecto a los pesos es:
s
kj
s
ks
kk
s
k
s
kks
kj
s
kj W
aatat
WW
ep
1
22
2
1 (1.11)
Haciendo las reducciones y simplificaciones de los términos que están involucrados
obtenemos:
j
s
k
ss
kks
kj
anfatW
ep
'
2
(1.12)
Como se observa en la ecuación (1.12), las funciones de transferencia utilizadas en
este tipo de redes deben de ser continuas para que su derivada exista en todo el
intervalo. Los términos del error para cada neurona de la capa oculta están dados por
la ecuación (1.13)
s
kj
s
kjj Wnf ' (1.13)
Luego de encontrar el valor del gradiente del error se procede a actualizar los pesos
de todas las capas empezando por la de salida. En esta capa la actualización de
pesos y ganancias está dada por (1.14) (1.15)
s
kkjkj tWtW 2)()1( (1.14)
s
kkk tbtb 2)()1( (1.15)
Donde es la constante de aprendizaje que varía de 0 y 1 dependiendo de las
características del problema a solucionar.
En resumen existen diversos tipos de redes y métodos de aprendizaje. En particular,
el tipo de red descrito en los parámetros anteriores que acabamos de ver es uno de
los más aplicados para solución de problemas por su gran versatilidad para algunos
procesos ingenieriles. Existen muchas ramas dentro del ámbito ingenieril, la
implementación de nuevas técnicas para la creación y mejora de tecnología son muy
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
23
competitivas, solo las mejores y más sencillas de elaborar dependiendo del problema
nos ayudaran a resolver problemas reales. En este trabajo daremos una opción para
un problema real que afecta gran parte de la población mundial el cual es la Diabetes,
implementando este tipo de técnicas analizaremos y estudiaremos el comportamiento
de estas técnicas en este problema para dar alternativas de tratamiento.
CAPITULO II TECNICAS APLICADAS
2.1 REDES NEURONALES DIFERENCIALES
Como hemos visto en el capitulo anterior la topología de las redes, sus funciones de
transferencia y su método de aprendizaje tienen un orden especifico. Este tipo de
redes neuronales diferenciales (RND), tiene las mismas características que las antes
vistas, las cuales son las salidas de las redes y que en este caso son denominadas
estados del sistema agrupados en un vector, pesos de los cuales su cambio involucra
el aprendizaje, funciones de transferencia y la entrada del sistema, los cuales se
describirán como funciona cada uno y cuál es su objetivo.
Existen muchos tipos de redes neuronales los cuales se aplican a diferentes procesos
dependiendo de sus características. En este trabajo empleamos modelos biológicos
los cuales tienen la característica de no ser lineales. Por consiguiente emplearemos
redes neuronales diferenciales, la función básica de las redes neuronales diferenciales
es tomando un sistema de comparación disminuir el error lo más cercano a cero
mediante la corrección de sus pesos, en el transcurso de su aprendizaje el cual debe
de ser muy corto dependiendo del sistema que se quiera identificar. La estructura de la
red debe de ser con las mismas características del modelo o sistema que se quiera
identificar preferentemente y a criterio del programador.
2.1.1 IDENTIFICACION
La aproximación clásica relacionada con el control de la dinámica de un proceso,
demanda el conocimiento del modelo así como de todos los parámetros envueltos en
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
24
la descripción del mismo. Por tanto un sistema no lineal a identificar tiene las
características de tener una entrada, unos estados y ambos dependientes del tiempo,
este tipo de sistemas puede ser representado por la ecuación (2.1)
mnux
tuxfx
m
t
n
t
ttt
,,
,, (2.1)
Utilizando la técnica de redes neuronales diferenciales (RND) se utiliza la estructura
de identificador de la forma siguiente
ttttttt uxWxWxAx ˆˆˆˆ ,2,1 (2.2)
Donde:
ˆ n
tx Son los estados del sistema de la red neuronal
q
tu Es la entrada a la red y al modelo
W kn
t1,
Es la matriz de pesos de la red
rn
t2, W Es la matriz de pesos de entrada
nxnA Es la matriz de Hurtwistz, respectivamente las funciones vectoriales
k : ˆ tx Es la función de transferencia para la red
: ˆsrtx Es la función de transferencia de la entrada
tu Es la entrada al sistema neuronal
El vector formado por la función de transferencia k : ˆ tx lo obtenemos mediante la
siguiente expresión:
i
xb
iti ceax ii 1
1 (2.3)
La matriz : ˆsrtx está determinada por la siguiente expresión:
ij
xb
ijtij ceax p pp
ij
1
1 (2.4)
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
25
La red mencionada se puede clasificar como tipo Hopfield por que las funciones de
transferencia , son determinadas como funciones sigmoidales. Estas funciones
satisfacen las condiciones descritas en la ecuación (2.5) (figura 2.1)
2
2~~
,~~
tt
T
ttt
T
tt
T
tt
T
ttt
T
tt
T
t
T
tt
T
tt
T
tt
T
t
uxCxuxZxu
uDuu
xCxxZxD
(2.5)
ttt xx ˆ: (2.6)
Donde
ttt
ttt
xx
xx
ˆ~
:~
ˆ:~ (2.7)
Y CZDCZD ,,,,, son constantes positivas
Figura 2.1 Satisfacción De Las Condiciones
La entrada se asume como el control y lo podemos describir como:
uut 2
(2.8)
Donde existen dos posibilidades: la primera se considera que es una función de
entrada, y la segunda que es tomada como acción de control uuu tt ,
suponiendo que es continúo.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
26
2.1.1.1 LEYES DE APRENDIZAJE
La forma de aprendizaje de este tipo de redes RND es basándose en los pesos la
ecuación (2.9) describe las leyes de aprendizaje
inicialessCondicioneWW
xuPKW
xPKW
T
t
T
ttt
T
ttt
0,20,1
2,2
1,1
,
ˆ
ˆ
(2.9)
Donde 1K y
2K son matrices definidas positivas, P Es la matriz de solución de la
ecuación de Riccati donde la ecuación es (2.10)
0 QPRPPAPAT (2.10)
Se obtendrá una solución positiva P al resolver la ecuación (2.10). En esta ecuación
la matriz A , es una matriz estable, R , Q son matrices definidas positivas para dar
una mejor aproximación de la solución. Cabe mencionar que la asignación de estas
matrices se determinara mediante prueba y error, al igual que la matriz A
dependiendo de los parámetros del sistema que se requiere que la red aprenda
t Sera descrito como el error producido por la RND y el sistema de referencia (2.11)
ttt xx ˆ: (2.11)
La figura 2.2 describe la topología de este tipo de redes
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
27
Figura 2.2 Topología De Una RND
El diagrama a bloques de la figura 2.3 muestra el proceso de la identificación de
estados implementando una RND a un sistema no lineal que satisfaga las condiciones
de observabilidad y controlabilidad [18]. En este diagrama se observa que los estados
y los estados identificados conforme pase el tiempo serán semejantes y el error
disminuirá. Esto permite asegurar que la red aprendió y el bloque de RND será
semejante al bloque de la PLANTA siempre y cuando se use la misma entrada para
ambos sistemas
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
28
Figura 2.3 Diagrama De Identificación
2.1.2 OBSERVADOR CON REDES NEURONALES DIFERENCIALES
A) OBSERVADORES DE ESTADO
Para los sistemas a los que se han diseñado las teorías antes mencionadas, se
supuso que todas las variables de estado estaban disponibles para su realimentación.
Sin embargo, en la práctica, no todas las variables están disponibles para su
realimentación. Entonces, es necesario estimar las variables de estado que no están
disponibles. Es importante señalar que debemos evitar diferenciar una variable de
estado para generar otra. Existen métodos para estimar las variables de estado que
no se miden sin un proceso de diferenciación. La estimación de semejantes variables
de estado por lo general se denomina observación. Un dispositivo (o un programa de
computadora) que estima u observa las variables de estado se llama observador de
estado o simplemente observador. Si el observador de estado capta todas las
variables del sistema, sin importar si algunas están disponibles para una medición
directa, se denomina observador de estado de orden completo. Hay ocasiones en las
que un observador no es necesario por ejemplo en las que solo se requiere de la
observación de variables de estado que no se miden, pero no de aquellas que también
se miden directamente
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
29
Observador de estado. Un observador de estado estima las variables de estado con
base en las mediciones de las variables de salida y de control. Aquí tiene una función
importante el concepto de observabilidad. Como veremos más adelante, los
observadores de estado pueden diseñarse si y sólo si satisface la condición de
observabilidad.
Consideramos un sistema definido mediante:
Cxy
Buxx
: (2.12)
El estado x se aproxima mediante el estado x̂ del modelo dinámico que representa al
observador de estado
xCyKeBuxx ˆˆ:ˆ (2.13)
Nótese que el observador de estado tiene y y u como entradas y x como salida. El
último término del segundo miembro de esta ecuación, es un término de corrección
que contiene la diferencia entre la salida y medida y la salida xCˆ estimada. La matriz
Ke funciona como una matriz de ponderación. El término de corrección vigila el estado
x̂ . Ante la presencia de una discrepancia entre las matrices A y B usadas en este
modelo y las del sistema real, la adición del término de corrección ayuda a reducir los
efectos producidos por la diferencia entre el modelo dinámico y el sistema real. La
siguiente figura 2.4 muestra el diagrama a bloques del sistema y el observador de
estado de orden completo.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
30
Figura 2.4 Diagrama Del Observador
B) NEURO OBSERVADOR
Basado en las técnicas de Redes Neuronales Dinámicas (RND) , [8], se selecciona el
observador del sistema dado por la ecuación.
)ˆ()()ˆ()ˆ(ˆ:ˆ ,2,2,1,1 ttttttttttt xCyKuxVWxVWxx (2.14)
Donde las características de los elementos de esta ecuación son los mismos que los
descritos anteriormente en el identificador. Nótese que en el término de la función de
transferencia existe el elemento 21 ,VV Estas matrices se presentan debido a que en
esta estructura de red tiene capas ocultas, y que estas son determinadas en la
topografía de la red neuronal, el término )ˆ( tt xCyK que se encuentra en la ecuación
(2.14) es el termino del observador,
C) LEY DE APRENDIZAJE
La ley de aprendizaje para los pesos iW y
iV con 2,1i en el proceso de la
estimación usando la RND. Es representada por las ecuaciones diferenciales.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
31
.1 *
1, 1 1 1,1,
1,
.1 *
2, 2 2 2,2,
2,
.2 *
1, 3 1, 1 1
.2 2 *
2, 4 2 2, 2
ˆ( )
ˆ ˆ( )
ˆ( ) ( )
ˆ ˆ( ) ( )
ˆ ˆ
ˆ ˆ( ) ,
t t t tt
T T
t t t t
t t t t tt
T T T
t t t t t t
T
t t t t
T
t t t t t
W s K PN G W W V x
C y Cx V x
W K PN G P W W V x u
C y Cx u V x
V K L V V x W x
V K u L W V V x x
(2.15)
Entonces, el error en la salida es
ttttt Cyye ,2ˆ (2.16)
Donde Es un escalar positivo pequeño. Es claro que las funciones sigmoidales
)()( y , comúnmente usadas en las redes neuronales, satisfacen las
condiciones de sector
Donde basados en el lema: para cualquier función vectorial diferible
nm RxRxg ,)( la cual satisface:
La condición de sector global, es decir, que existe una constante positiva gL tal que
2121 )()( xxLxgxg g (2.17)
Para cualquier ,, 21
nRxx
O la condición Lipschitz para el gradiente en forma global, es decir, existe una
constante positiva gL tal que para cualquier nRxx 21,
2121 )()( xxLxgxg g (2.18)
Así las siguientes propiedades para cualquier nRxx , son tomadas
2
2))()(()(
2))()(()(
xL
xxgxgxxg
xLxxgxgxxg
gT
g
T
(2.19)
Así las variables introducidas satisfacen
,,,, 21 y Son matrices definidas positivas.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
32
Para generalizar la existencia global de la solución las siguientes condiciones deben
de ser satisfechas
2
3
2
1
22),,( tttt uCxCCtuxf (2.20)
1C y 2C constantes positivas. En vista de estos y tomando en cuenta que las
funciones sigmoidales son uniformemente acotadas.
Figura 2.5 Rnd En Observador
Por tanto la figura 2.5 nos muestra el diagrama a bloques del funcionamiento del neuro
observador, en donde solo se puede medir los elementos del segundo estado para
poder estimar los otros dos estados mediante un neuro observador diferencial, Este
tipo de sistemas son de gran ayuda cuando en un sistema se necesitan todos los
datos del sistema y solo podemos obtener los datos de uno de los estados del
sistema.
2.1.3 CONTROL CON REDES NEURONALES DIFERENCIALES
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
33
Se ha descrito las leyes de aprendizaje de las redes neuronales diferenciales para la
solución de identificación de los estados de un sistema no lineal, emplearemos un
identificador para realizar nuestro control, En este capítulo se procede a establecer las
características y propiedades del sistema con que se realizara este esquema de
control, se obtienen las condiciones de estabilidad de los estados en lazo cerrado y se
seleccionan las técnicas de control para el sistema. Responde al objetivo de
seguimiento de trayectoria se implementara un control el cual se describirá más
adelante
A) CONDICIONES DE CONTROL
Debido a que el control que se obtendrá en la retro alimentación de los estados
estimados, es no lineal y además no estacionario, es decir, ),ˆ( txuut , todo 0t
para todo estado estimado n
tx ˆ , se pide que satisfaga la desigualdad
2
10
22ˆ),ˆ( ttt xvvtxuu (2.21)
Donde 0v y 1v son constantes conocidas no negativas.
Uuuu tt ,2
12
022
(2.22)
Obtenemos la cota superior para )(u con respecto a los estados estimados
2
10
2ˆ)( txvvu (3.3)
Donde
1
2
11
0
2
1
2
00
:ˆ
:ˆ
vv
vv
(2.23)
Además suponemos que existen matrices definidas positivas
,,,,,,,, 03211 Qyf las cuales proporcionan la solución positiva a la ecuación
de Ricatti dada por 0 T
ii PP
B) DESCRIPCION DEL SISTEMA DE CONTROL
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
34
Sea el sistema no lineal dado por
mnux
tuxfx
m
t
n
t
ttt
,,
),,(.
(2.24)
Considerando como en el capítulo precedente la dinámica de la red es:
)()ˆ()ˆ(ˆ:ˆ,2,2,1,1 ttttttttt uxVWxVWxx (2.25)
Con todas sus características antes mencionadas el vector de funciones )( se
supone n-dimensional cuyos elementos se incrementan monótonamente. La
presentación de los )(i es de funciones sigmoidales. El vector n
tu es la acción
de control, el sistema no lineal puede ser descrito por
ttttttt
ttttttttt
uxxWxxW
tuxfuxWxWxx
))ˆ()(())ˆ()((
),,()()ˆ()ˆ(
,2,1
,2,1
.
(2.26)
Para el neuro- control se empleara el método de seguimiento de trayectoria el cual se
describe tomando como base el identificador como se muestra en la ecuación (2.25)
Donde ( , , )t tf x u t es el error que siempre existirá entre el modelo y el identificador
con (RND), tomando en cuenta la realidad del identificador que este por muy cercano
que sea a la planta siempre existirá un error el cual la expresión se da como
)]()()([),,(),,( ,2,1 tttttttttt uxWxWxtuxftuxf
(2.27)
Por tanto se puede expresar como:
),,()]()()([),,( ,2,1 tuxfuxWxWxtuxf tttttttttt
(2.28)
Para poder reestructurar la ecuación y que esta se parezca a lo que conocemos y
poderla simplificar tenemos:
ttttttt
ttttttttt
uxxWxxW
tuxfuxWxWxx
))ˆ()(())ˆ()((
),,()()ˆ()ˆ(
,2,1
,2,1
.
(2.29)
Definiendo:
tttttttttt uxxWxxWtuxfd ))ˆ()(())ˆ()((),,( ,2,1
(2.30)
Por lo que nos queda
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
35
tttttttt duxWxWxx )ˆ()ˆ( ,2,1
.
(2.31)
Para la realización de un control primero debemos de ver que es lo que queremos que
se realice, es por ello que en este caso se designa una trayectoria a seguir
*.*( , )t tx x t
(2.32)
Una vez que se fijo la trayectoria podemos realizar la aproximación por medio de la
función del error dado por
*xxtt
(2.33)
Al sustituir (2.31) y (2.32) en (2.33) obtenemos
),*()ˆ()ˆ( ,2,1 txduxWxWx ttttttttt
(2.34)
Para poder simplificar se propone:
ttttt uxWuu ,2,2,1 )ˆ(
(2.35)
Por lo que una de las entradas podemos proponerlas como:
)ˆ(),()ˆ( ,1
**
,2,1 ttttttt xWAxtxxWu
(2.36)
Donde la diferencial del gradiente nos queda como:
tttt du ,2
(2.37)
En esta estructura podemos observar que la única incógnita es ,u t)(2, es por esto que
el control solo dependerá de la estructura que tome esta variable. Para poder
determinar esta estructura existen diferentes formas acontinuacion mencionamos
algunas de ellas:
-Compensación directa con estados derivativos
)ˆ()ˆ(,2 ttttt xxxxAu (2.38)
-Modos deslizantes
0)(1
,2 ksignkPu tt
(2.39)
-Control optimo local
tt PRu 1
,2 2 (2.40)
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
36
En la figura 2.6 se observa la estructura que presentara un control de seguimiento de
trayectoria
Figura 2.6 Diagrama De Control
En este tipo de sistema de control podemos observar que tanto a la planta como a la
RND tienen la misma entrada que en este caso es el control producido por la salida de
la planta, la salida de la RND y un sistema de referencia. El sistema de referencia es
de gran importancia para el programador ya que este es lo que el programador quiere
que haga la planta y la RND.
2.2 LOGICA DIFUSA
La lógica difusa es una extensión de la lógica multivalente, cuyos enunciados pueden
tener valores de verdad comprendidos entre el 0 (FALSO), y el 1 (CIERTO), de la
lógica clásica. Aplicando la lógica multivalente a la teoría de conjuntos, estableciendo
la posibilidad de que los elementos pudieran tener diferentes grados de pertenencia a
un conjunto. La denominada lógica difusa permite tratar información imprecisa, como
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
37
estatura media, temperatura baja o mucha fuerza, en términos de conjuntos difusos
(imprecisos en definitiva). Estos conjuntos difusos se combinan en reglas para definir
acciones [7].
La lógica difusa es una herramienta muy poderosa, técnica para la solución de
problemas, que ha adquirido recientemente una gran difusión especialmente en áreas
de control y toma de decisiones basado en referencias. Ha surgido como una
herramienta lucrativa para el control de subsistemas y procesos industriales
complejos, así como también para la electrónica de entretenimiento y hogar, sistemas
de diagnóstico y otros sistemas expertos.
Tradicionalmente las premisas lógicas tienen sólo dos extremos: o son completamente
ciertas o son totalmente falsas. En el mundo de la lógica difusa, las premisas lógicas
cambian en un rango a grado de verdad de 0 a 100 por ciento, esto permite acercar la
matemática al lenguaje impreciso del hombre común, ya que está repleto de términos
vagos como “poco”, “mucho”, “tibio”, etc. Estos términos se contraponen con el mundo
de las matemáticas convencionales y la lógica (en la teoría convencional de conjuntos,
un elemento es o no miembro, en lógica Booleana algo es cierto o es falso) así, bajo
estas condiciones, un término tal como "tibio" no tiene ningún sentido, y sólo tienen
sentido las premisas que se definen de forma precisa y cuantificable. Por ejemplo,
podría definirse tibio como una temperatura comprendida en el rango de 15 a 20
grados. Para la definición convencional 15 es tibio, pero 14.75 no es tibio. Esto que es
la consecuencia del modelo de lógica Booleana, hace que parezca verdaderamente
absurdo que esta temperatura sea totalmente excluida de la definición tibio por tan
sólo 0.25 grados.
Visto esto, el paradigma del "es" y "no es", es una seria limitación al construir sistemas
de control de procesos en tiempo real y sistemas expertos de control. Muchos
sistemas expertos tienen la habilidad de tomar decisiones basados en entradas vagas
o imprecisas. Esta habilidad es muy difícil o imposible de obtener empleando lógica
convencional, siendo en estos campos donde entra la lógica difusa.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
38
A) FUNCIONES DE MEMBRECÍA.
La lógica difusa trabaja con las llamadas funciones difusas Figura. 2.7 las cuales
permiten efectuar condiciones como “si temperatura es caliente entonces velocidad de
ventilador es alta”. Para ello la lógica difusa introduce los conjuntos difusos que
relacionan subconjuntos dentro de un determinado universo de valores numéricos con
unas variables lingüísticas convertidas en función, estas son las nombradas funciones
difusas o funciones de membrecía. Ahora bien, esta técnica lo que hace es relacionar
primero si un determinado valor dentro de un gran conjunto, pertenece o no a un
determinado subconjunto de éste (lógica absoluta o booleana: cero si no pertenece o
uno si pertenece) y si no pertenece qué relación tendría en función de una
determinada variable lingüística o función de membrecía
Figura 2.7 Formas Comunes De Las Funciones De Membrecía
Las representaciones matemáticas de las funciones Gaussianas y triangulares tienen
definiciones que se aplican de acuerdo al tipo de sistema empleado. Algunos
ejemplos importantes de las funciones de membrecía son las funciones triangulares y
las gaussianas (Tabla 2.1).
Triangular Trapezoidal Gaussiana Pico FinoTriangular Trapezoidal Gaussiana Pico Fino
Tabla 2.1 Descripciones Matemáticas De Las Principales Funciones De Membrecía
Función Triangular Función Gaussiana
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
39
Se presentan las funciones triangulares derecha (“S”), izquierda (“Z”) y triangular (T)
normal. De la misma forma aparecen las expresiones matemáticas para las funciones
de tipo campana de Gauss.
Gráficamente las funciones de membrecía se representan por un trapezoide (análogo
a una señal analógica), a diferencia del rectángulo que define los conjuntos tajantes o
lógicos (análogos a una señal digital). El trapezoide se construye definiendo cuatro
puntos dentro del conjunto difuso. Figura. 2.8
Figura 2.8Muestra Del Trapezoide En Un Conjunto Difuso
Los puntos A y D definen los puntos que limitan el inicio y término de la función de
membrecía. Los puntos B y C definen el rango de valores para los que se tiene el más
alto grado de membrecía (1.0). En muchos casos se deseará que sea un sólo valor el
Izq.
otro
w
uc
cuSí
u
L
L
L
L
*5.01,0max
1
Izq.
otro
cu
cuSí
u
L
L
L
L 2
2
1exp
1
Con.
otrow
uc
cuSíw
cu
uC
*5.01,0max
*5.01,0max
Con.
2
2
1exp
cuuC
Der.
otro
cuSíw
cu
u
R
R
R
C
1
*5.01,0max
Der.
otro
cuSícu
u
L
R
R
R
1
2
1exp
2
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
40
que dé la máxima membrecía. En estos casos puede hacerse que el trapezoide
degenere en un triángulo haciendo que los puntos B y C sean idénticos.
B) REGLAS LÓGICAS.
Las reglas definen las relaciones entre los conjuntos difusos de entrada y salida. Las
reglas reflejan como una persona normalmente pensaría sobre el proceso o la
aplicación, tanto en forma lógica como lingüística [12]. Cada regla está en la forma de
un sentencia SI... ENTONCES. La porción correspondiente al SI, o antecedente,
especifica la condición que deberá cumplirse. La porción ENTONCES, o
consecuencia, especifica la consecuencia del antecedente. Una regla simple podría
escribirse como:
“Si temperatura es caliente entonces velocidad de ventilador es alta.”
C) ESTRUCTURA DE LA LÓGICA DIFUSA
Existen tres componentes básicos en un sistema de lógica difusa: el fusificador, la
base de reglas, y el defusificador.
Ya se ha considerado con algún detalle la componente de fusificador. Este es el
mecanismo de conversión de una entrada a valores difusos mediante la definición de
conjuntos difusos y sus funciones de membrecía. A este procedimiento se le denomina
fusificación.
También en forma breve se ha tocado la base de reglas. Aquí deberá extenderse la
discusión para explicar como se evalúan las reglas en el sistema de lógica difusa.
Finalmente, el defusificador, es el mecanismo empleado para convertir los valores
difusos de la salida a un valor tajante utilizable por la aplicación.
Recordando que para una determinada entrada pueden lograrse distintos grados de
membrecía, esto es, puede existir traslape. Esto es importante al evaluar las
sentencias en las reglas lógicas. Las reglas lógicas en un sistema de lógica difusa
tienen una cierta "fortaleza" o grado de influencia sobre el resultado de la salida final.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
41
Esta fortaleza depende del grado de membrecía de sus variables de entrada y de
salida. Hay que pensar en la fortaleza de la regla como algo análogo al grado de
verdad de la propia regla: Entre más alta sea su fortaleza, en mayor grado la regla es
cierta. Como frecuentemente los valores de las funciones de entrada, caen en más de
una función de membrecía, es posible obtener reglas aparentemente contradictorias.
Cuando, debido al traslape, el valor proporcionado como entrada cae en las dos
funciones de membrecía “caliente” y “tibio”, dispararán ambas reglas. Durante la
evaluación de la regla, cada una de ellas se calculan basándose en sus antecedentes
y entonces asignando a la salida de la regla, utilizando el antecedente menos cierto o
más débil. Cuando más de una regla se aplica a una acción específica, la salida se
resuelve tomando la más fuerte o regla más verdadera:
Regla 1: si A y B entonces Z y X
Regla 2: si C y D entonces Z y Y
Fortaleza de Regla 1 = min(A,B)
Fortaleza de Regla 2 = min(C,D)
X = Fortaleza de Regla 1
Y = Fortaleza de Regla 2
Z = Salida = max (Fortaleza de Regla 1, Fortaleza de Regla 2 )
Z = max (min (A, B), min(C, D))
Z es el supremo, del máximo de la regla 1 y 2, X y Y es la probabilidad mas alta de la
regla 1 y 2 respectivamente. Si la temperatura es caliente y tibia entonces es la unión
del valor supremo de las dos reglas y la probabilidad más alta en la regla 1.
Aún cuando el proceso de evaluación de reglas asigna fortalezas a cada acción
específica, se requiere otra etapa más o "defusificación", por dos razones:
Primero, para descifrar el significado de acciones "vagas", tal como “la velocidad del
ventilador es alta”, empleando funciones de membrecía.
Segundo, para resolver conflictos entre dos acciones que compiten entre si tales como
"la velocidad es mediana" y "la velocidad en alta", que pudieran haber sido disparadas
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
42
bajo ciertas condiciones durante la evaluación de las reglas. El proceso de
defusificación Figura.2.9 emplea técnicas para resolver posibles conflictos y vaguedad
resultantes durante la evaluación de las reglas.
Figura 2.9 Método Del Centro Idee
La técnica usada es el "método del centro de gravedad", este consiste en varios
pasos. Inicialmente, se calcula el centroide (centro de gravedad), para cada función de
membrecía; entonces, las funciones de membrecía se limitan en su altura (ver figura)
dependiendo de la regla aplicada, y se evalúan las áreas trapezoidales de las
funciones de membrecía. Finalmente, se obtiene la salida defusificada mediante el
cálculo de un promedio ponderado de los puntos correspondientes a los centros de
gravedad y las áreas calculadas, siendo estas últimas los factores de peso o
ponderación:
R
i
ni
R
i
ni
q
icrisp
q
uuu
uuub
y
1
21
1
21
,,,
,,,
(2.41)
2.3 SISTEMAS NEURODIFUSOS
Re-definiendo las motivaciones para crear los sistemas híbridos neurodifusos,
podemos esbozar lo siguiente:
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
43
Los problemas a resolver con estas técnicas inteligentes tienen generalmente una
componente de datos empíricos y otra de conocimiento previo, que con los sistemas
neurodifusos pueden ser explotados a cabalidad mezclando los métodos cuantitativos
y cualitativos de las RNA y la LD respectivamente.
La expresión de conocimiento como una base de reglas lingüísticas, enriquecida o
surgida con o a través de datos cuantitativos, es una forma adecuada para hacer
realimentación al usuario humano de la forma como el sistema realiza las tareas.
Habiendo encontrado que la representación del conocimiento como un Sistema Difuso
se acerca a la forma de razonamiento humana, es natural intentar adicionar a estos
Sistemas capacidades de aprendizaje, de forma que se emule mejor tal
comportamiento o que se mejoren los resultados obtenidos con el sólo Sistema Difuso.
Habiendo definido las motivaciones para la realización de los Sistemas Híbridos
Neurodifusos, en el resto del trabajo se revisará la taxonomía de estos sistemas,
clasificándolos según la interacción de sus dos componentes (LD y RNA),
posteriormente se estudiarán algunos ejemplos de cada una de las divisiones,
tratando finalmente, mas en profundo, las arquitecturas de los Sistemas NF para el
modelamiento de sistemas, tarea que resulta obtener, tal como se verá, grandes
ventajas de las técnicas NF.
A) TAXONOMIA DE LOS SISTEMAS NEURODIFUSOS
Hasta hoy, pueden ser enmarcadas dentro de estas divisiones propuestas que se
basan en las diferentes combinaciones de las RNA y los Sistemas Difusos:
1. Modelos Concurrentes: Cuando la RNA y el Sistema Difuso trabajan juntos pero
sin interactuar el uno en el otro, es decir, ninguno determina las características del
otro.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
44
Figura 2.10 Modelo Concurrente
2. Modelos Cooperativos: Cuando la RNA se usa para determinar los parámetros de
funcionamiento del Sistema Difuso. En estos modelos, se distinguen dos fases: la de
Entrenamiento y la de Funcionamiento. En la primera, la RNA interactúa con el
Sistema Difuso determinando los parámetros del mismo, mientras en la segunda, la
RNA desaparece dejando sólo el Sistema Difuso. Ejemplos de estos sistemas, son el
ASR (Agente de Sintonización neuronal por Refuerzo), la determinación de
parámetros de control de un sistema difuso, etc.
3. Modelos Híbridos: En esta aproximación, los sistemas difusos y de RNA, trabajan
juntos en una arquitectura homogénea que puede ser interpretada como una RNA con
parámetros difusos o como un Sistema Difuso con parámetros o funcionamiento
distribuidos
B) VENTAJAS DE LOS SISTEMAS NEURODIFUSOS
La estructura neurodifusa permite el uso de métodos cualitativos y cuantitativos en la
construcción de modelos, en la etapa de aprendizaje, en la de funcionamiento y en la
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
45
realimentación de conocimiento al usuario, permitiendo así, todo el conocimiento
disponible. Los métodos cuantitativos que se observan en el aprendizaje que los
sistemas neurodifusos pueden realizar a partir de datos del ambiente y en su forma
matemática de funcionamiento, mientras los métodos cualitativos se reflejan en el
sentido lingüístico que tiene la base de conocimiento de los sistemas difusos y que
genera una interacción bilateral sistema-hombre, permitiendo la introducción de
conocimiento previo al sistema y la realimentación del estado final del modelo en
forma de reglas expresadas lingüísticamente desde el sistema al hombre. Las otras
ventajas, son las conocidas ya ampliamente y que vienen heredadas de los sistemas
difusos y de las RNA, tales como interpretación lingüística, introducción de
conocimiento previo, autoaprendizaje, generalización, interpolación, etc.
C) LIMITACIONES DE LOS SISTEMAS NEURODIFUSOS
1. Curso de la dimensionalidad: Los sistemas difusos presentan el problema del
crecimiento exponencial del tamaño del modelo respecto al número de variables que
poseen, haciendo impráctico su uso para sistemas de más de cuatro dimensiones.
Este crecimiento se puede representar en dos formas diferentes: Tamaño del modelo:
El número de conjuntos multivariados de la entrada crece exponencialmente con el
número de entradas:
n
i
PiP1
donde P es el número de conjuntos multivariados, n
es el número de entradas y pi es el número de conjuntos difusos para la entrada
Como resultado de este crecimiento exponencial, el costo de cálculo y de
implementación crece en igual forma y la interpretabilidad se limita cada vez más. Y el
tamaño de la muestra requerido para el sistema
2. Calidad de los datos: Existen problemas asociados con la cantidad, distribución y
ruido en y de los datos. Si los datos están mal distribuidos, el aprendizaje puede no
ser muy bueno, presentando especialmente problemas de generalización de
interpolación si faltan muchos datos en cierta región. Este inconveniente es herencia
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
46
de los sistemas neuronales y puede ser superado interpolando los datos, haciendo un
tratamiento previo o buscando una representación adecuada de los mismos.
3. Conocimiento previo: En los sistemas neurodifusos es deseable tener el
conocimiento previo y confiable de un experto en el sistema, pues de otro modo, se
debe realizar un modelamiento por "Fuerza Bruta" exclusivamente a través de los
datos numéricos empíricos y existirán problemas al no haber descripción cualitativa
del sistema, a menos que se apliquen técnicas de minería de datos (descubrimiento
de conocimiento) a la base de conocimiento del sistema neurodifuso.
CAPITULO III MODELOS DE APLICACIÓN
ANALISIS DE OBSERVABILIDAD Y CONTROLABILIDAD
Los sistemas no lineales tienen diferentes características. Posiblemente dos de las
mas importantes son las propiedades de contolabilidad y observabilidad. En general
un sistema puede ser ni controlable ni observable, controlable y no observable, no
controlable y si observable, controlable y observable. Este ultimo tipo de sistemas son
de gran interés para nosotros, a un sistema que es controlable y observable podemos
aplicarle las técnicas antes mencionadas sin problema alguno.
Para poder saber si un sistema es controlable y observable debe de cumplir con los
teoremas de controlabilidad y observabilidad que a continuación se describen:
ANALISIS DE CONTROLABILIDAD
Sea un sistema de control no lineal
)(
)()(.
xhy
uxgxfx
(3.1)
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
47
Donde nx , u , f y
g son campos vectoriales suaves definidos en una
vecindad abierta en hu m , es un campo escalar suave significa kC como )(xh es
una función escalar analítica, el gradiente de h se define:
xd
dh
dx
dh
dx
dh
dx
dhdh
n
,......,,
21
(3.2)
La derivada de Lie de una función escalar h con respecto a un campo vectorial suave
f , es una derivada direccional definida como:
n
i
ii
xfdx
dhfdhLfh1
)(, (3.3)
Una derivada de Lie es también un campo escalar suave sobre n una derivada de
orden superior para cualquier número positivo k , se define inductivamente como:
hhLf
con
fhdLfhLfLfhLf kkk
0
11 ,)(
(3.4)
Por otro el corchete de Lie se define por:
gdx
dff
dx
dggf ,
(3.5)
Donde dx
dfy
dx
dg son matrices Jacobianas de rango nxn . El corchete de Lie puede ser
interpretado como una nueva dirección a lo largo de la cual puede moverse una
trayectoria de estado con una ley apropiada. Los corchetes sucesivos de Lie son
definidos por:
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
48
),(,),(
,,),(
,),(
),(
1
2
0
gadffgadf
gffgadf
gfgadf
ygadf
kk
(3.6)
En términos de derivadas y paréntesis de Lie, se define como matriz de controlabilidad
de un sistema:
),(,,,, 1 gadfgfgC n (3.7)
Si esta matriz es no singular el sistema enunciado satisface la condición de rango de
controlabilidad
ANALISIS DE OBSERVABILIDAD
Se consideran los criterios de observabilidad dado un sistema no lineal de una
entrada y varias salidas como:
),(
),(),(.
txhy
utxgtxfx
(3.8)
Donde
ux n ; Se selecciona los nuevos estados, dados por:
dt
txhdw
dt
txdhw
txhw
n
n
),(
),(
),(
1
2
1
(3.9)
Para estos estados se calcula la matriz de observabilidad del sistema la cual se
describe por:
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
49
nn w
w
xd
dw
xd
dw
dt
d
1
1
(3.10)
Si esta matriz es no singular el sistema enunciado satisface la condición de rango de
observabilidad
El modelo de Bergman satisface las condiciones de control habilidad y observabilidad
demostrado por [5], es por ello que podemos aplicarle un control y un observador
basado en (RND). Como este modelo demostró ser tanto controlable momo
observable da una mejor confianza paras técnicas de control y observación que
hemos visto
3.1 SISTEMAS BIOLOGICOS UTILIZADOS
A) DIABETES
El proceso para adquirir energía en el organismo humano, es debido a la síntesis de
los alimentos en glucosa y la asimilación de esta en las células por medio de la
insulina, la cual se produce en el páncreas. Este es el factor más importante en la
síntesis de alimentos, ya que sin este la glucosa no se asimilaría en las células []. Este
no es el único problema que puede presentarse, si no que las células del cuerpo no
respondan a la insulina que se produce y por tanto la glucosa se almacene en el
torrente sanguíneo provocando otras patologías consecuentes.
La acumulación de la glucosa en la sangre puede ocasionar varios problemas, como la
ceguera, insuficiencia renal o daños a los nervios. La glucosa en sangre alta puede
contribuir al desarrollo de enfermedades cardiovasculares. Por este motivo, la vida de
las personas que padecen esta enfermedad tienen la necesidad de llevar un control
con su forma de alimentación y su vida cotidiana ya no es normal.
B) TIPOS DE DIABETES
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
50
Hay dos tipos de diabetes. La diabetes tipo 1, que también se llama diabetes insulino-
dependiente, se diagnostica generalmente durante la infancia, en este tipo el páncreas
produce poca insulina o no la produce en lo absoluto, así que inyecciones diarias de
insulina son necesarias.
La forma más común es la diabetes tipo 2, que también se le llama diabetes no
dependiente de insulina. Aunque ésta generalmente se presenta en los adultos de
edad media, los adolecentes y los adultos jóvenes también están desarrollando este
tipo de enfermedad a una velocidad alarmante. Este padecimiento se desarrolla
cuando el cuerpo no produce suficiente insulina y, además, no utiliza la cantidad de
insulina disponible con eficiencia. Esta enfermedad se puede controlar mediante la
dieta y el ejercicio, sin embargo, algunas personas también necesitan medicamentos
orales o insulina para ayudar a controlar el azúcar en sangre. Los antecedentes
familiares son un factor de riesgo muy importante de tener diabetes tipo 2, al igual que
la obesidad y la falta de actividad física.
Hasta el día de hoy no existe una cura para la diabetes. Por lo tanto, el método de
cuidar la salud de personas afectadas por este desorden, es controlarlo: mantener los
niveles de glucosa en la sangre lo más cercanos posibles a los normales. Un buen
control puede ayudar enormemente a la prevención de complicaciones de la diabetes
relacionadas al corazón y al sistema circulatorio, los ojos, riñones y nervios. Un buen
control de los niveles de azúcar es posible mediante las siguientes medidas básicas:
una dieta planificada, actividad física, toma correcta de medicamentos, y chequeos
frecuentes del nivel de azúcar en la sangre al igual que la inyección de insulina para
evitar las complicaciones subsecuentes a esta enfermedad
C) MODELOS MATEMÁTICOS
Una forma de representación de la evolución de las concentraciones de glucosa en el
organismo humano es la implementación de modelos matemáticos que nos describen
el comportamiento de estas variables que necesitamos debido a que poder entrenar la
red se necesita tiempo y constante reestructuración de los parámetros seleccionados,
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
51
por esta razón y por cadencia de tecnología para la monitorización de las variables
que se necesitan empleamos modelos matemáticos que nos dan las representaciones
similares a los fenómenos en estudio. En este trabajo nos basamos en su
implementación, algunos de los modelos utilizados son;
Modelo de Mattei
2
323
00210322
211
)()(
)()(
)()(
xy
tgKxxKx
KKigxxKxxKx
tuKgxKxKx
rsh
fsh
sdgi
(3.11)
Donde 1x es la diferencia de la concentración de insulina en el plasma y 2x es la
diferencia de concentración de glucosa en el plasma; 3x es la diferencia de insulina
-kt
ru(t) y g (t) Be son las razones de inyección de insulina y glucosa externa
respectivamente, 0 0i y g son los valores básales de la concentración de insulina y
glucosa en el plasma. iK Es el reciproco de la constante de tiempo del decaimiento de
insulina, inversamente proporcional al tiempo de vida media gK coeficiente que
expresa la razón de insulina libre cuando el valor de glicemia es igual a uno hK es el
reciproco de la constante de tiempo, representando el retraso de infusión del dextrosa
y variación de la glicemia entre el coeficiente. 0K , expresa la razón de metabolización
de la glucosa cuando la insulinemia y glicemia son iguales a uno. sK coeficiente de
reducción del cambio de infusión de insulina con la variación del cambio del a
insulinemia. fK valor para el decremento de glicemia. dg constante introducida para
tomar en cuenta la reducción de insulina liberada durante la hipoglucemia.
Modelo de Bergman
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
52
2
13323
23212
1111
)()(
)/)(()(
xy
xpxpx
tGxxxpx
Vtuxnx
B
(3.12)
Donde 1x es la diferencia de la concentración de insulina en el plasma y 2x es la
diferencia de concentración de glucosa en el plasma; 3x es proporcional a la
concentración de insulina en el compartimiento remoto; -ktu(t) y P(t) Be son las
razones de infusión de insulina y glucosa externa respectivamente, B BI y G son los
valores básales de la concentración de insulina y glucosa en el plasma. 1V Es el
volumen de distribución de insulina y n es la fracción de la razón de eliminación de
insulina; 1 2 3,p p y p representan los parámetros del sistema.
Cabe mencionar que el modelo de Bergman describe el cuerpo en forma
compartamental, es decir la glucosa generada al momento de la ingesta de alimento
es un compartimento, y la insulina producida para metabolizar la glucosa es otro
compartimento y la insulina distribuida en el resto del cuerpo es un compartimento
remoto debido a la pequeña cantidad de esta distribuida en el organismo.
Estos modelos nos dan características del comportamiento de glucosa e insulina
durante la ingesta de alimentos, tomando relevancia en el modelo de Bergman el cual
proporciona una dinámica más completa de este fenómeno, características de las
ecuaciones diferenciales y estructura para la aplicación de las técnicas que
emplearemos, este modelo se convierte en el más apropiado para su estudio e
implementación de las técnicas de (RND).
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
53
CAPITULO IV METODOLOGIA Y RESULTADOS
En esta sección se describirán como se aplicaron las técnicas de estimación,
observación, lógica difusa, control basad en redes neuronales diferenciales las cuales
se aplicaron en el modelo de glucosa en sangre (modelo de Bergman).
4.1 IDENTIFICACION CON RND
4.1.1 DINAMICA DE GLUCOSA EN SANGRE (MODELO DE BERGMAN)
Para la realización de identificación del modelo de Bergman descrito en la ecuación
(3.12), se toma este modelo porque tiene las características que se necesitan para
este desarrollo. Las tres variables que describe este modelo son muy representativas
del sistema real de glucosa en sangre interpretada en forma de compartimentos. El
siguiente diagrama describe como se implementara la identificación.
Figura 4.1 Aplicación De RND Al Modelo De Bergman Para Su Identificación
La estructura que se implemento es la descrita en la ecuación (2.2). Esta ecuación
representa una red neuronal sin capas ocultas la cual es adecuada para el modelo que
emplearemos. Describiendo la ecuación 2.2 y la figura 4.1 obtendremos las
características del identificador empleado como se describe en la figura 4.2.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
54
Figura 4.2 Diagrama De Ecuaciones Aplicadas
Como hemos visto son necesarias algunas constantes tanto en el modelo como en la
RND. En el modelo de Bergman nótese que la asignación de estas constantes son de
gran importancia, dado que controlan el comportamiento de las variables en su
evaluación.
Donde los valores de las constantes antes mencionadas en el modelo de Bergman
son determinadas por diferentes propiedades para la generación de la curva de
interacción glucosa e insulina cercana a los valores reales como se muestra en la
(Figura 4.4). Estas constantes son seleccionadas por el programador. Para el modelo
de Bergman las constantes son:
5.5n
1.0
11 p
1275 eIb
1.0
12 p
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
55
121 V
1000
13 p
35.4 eGb
Para la RND como se menciona anteriormente requiere de constantes de integración,
y una matriz A totalmente estable que actuara como anclaje para que la red no se
haga inestable en el periodo de aprendizaje, la matriz escogida es determinada por la
solución de la ecuación de Riccati (210), las constantes de integración son:
00091.000
00268.00
0007012.0
1222A
2500
0150
0015
65P
1954
8849
2
1
k
k
Estas constantes determinaran el aprendizaje de la RND el cual puede ser lento o
rápido y con un mayor error o menor por lo que la elección de estas constantes son
de gran importancia. Para la simulación se desarrollo el siguiente programa, el cual
indica la estructura principal de la interacción que existe entre el modelo que se
empleo en este caso el de la dinámica de glucosa y como el factor de aprendizaje está
determinado por el error al igual que la entrada que son las parámetros necesarios
para la realización del identificador.
La programación se realizo en la plataforma de Matlab dentro de simulink ya que es
una herramienta muy factible para simulación y herramientas de bloques como se
muestra a continuación
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
56
Figura 4.3 Estructura De Simulación Del Identificador Con Simulink
Realizando la sustitución de las constantes de la tala en la ecuación 3.12 en ua
evolución de 24 hr. Se obtiene una simulación del comportamiento de la glucosa-
insulina como se aprecia en la figura 4.4.
4.1.2 RESULTADOS
La RND entrega una señal parecida para cada variable debido a que esta se acopla,
en este proceso cuando el error sea mínimo y las señales de salida de la RND sean
similares a las entregadas por el modelo podemos afirmar que la RND ha aprendido.
Mediante la simulación del modelo de Bergman en Simulink se obtuvo la
representación grafica de la insulina, la glucosa, y la insulina en el compartimiento
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
57
remoto en un periodo de 24 hr. En esta simulación se supuso que se tendría una
ingesta de comida cada 6 hr, como se muestra en la figura 4.4
Figura 4.4 Simulacion Del Modelo De Bergman
En la graficas de la figura 4.4 se presentan las concentraciones de Glucosa,
concentraciones de insulina y las concentraciones de de insulina en el compartimiento
remoto. Estas concentraciones varían dependiendo la ingesta de alimento. Cabe
mencionar que estas graficas corresponden a un modelo matemático al cual
asignamos parámetros para obtener la representación del comportamiento de las
diferentes concentraciones antes mencionadas en cada ingesta las cuales aumentan y
disminuyen.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
58
Figura. 4.5 Identificación De La Concentración De Glucosa
Primeramente al realizar una ingesta de comida los niveles de glucosa en sangre
aumenta y disminuye normalmente, la RND se adapta a este comportamiento. Esto lo
realiza conforme evolucione lo cual implica que se acoplara a la señal en este caso a
la grafica de glucosa, como se muestra en la figura 4.5 en donde se puede observar la
adaptación de la RND a la señal de concentración de insulina y que esta sin importar
los cambios considerables de concentraciones de glucosa la red se acopla a estos
cambios.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
59
Figura. 4.6 Error Del Identificador De Glucosa
Los cambios de los niveles de concentraciones afectan a la RND de diferentes formas
en su aprendizaje, este depende de la diferenciación de ambas señales ya que
constantemente están evolucionando, la calidad de aprendizaje podemos apreciarla
mediante la grafica del error Figura 4.6. En ella se puede observar que en el primer
instante en que empezó la evolución el error es el de mayor magnitud y que este error
disminuye conforme se estabiliza la señal, también podemos observar que cuando
existe otra ingesta de comida las concentraciones aumentan bruscamente, esto
provoca una pequeña inestabilidad en la red neuronal muy pequeña y esta se
estabiliza rápidamente después de cada ingesta.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
60
Figura. 4.7 Identificación De La Concentración De Insulina
Otra de las graficad que se encuentran descritas por el modelo es la concentración de
insulina producida por el páncreas. Esta es de menor magnitud puesto que es la
suficiente para metabolizar la glucosa y poderla convertir en energía. Al igual que la
dinámica de glucosa aumenta con respecto a cada ingesta de comida, el páncreas
también tiene que aumentar la concentración de insulina en cada ingesta para poder
metabolizar la glucosa y ambas puedan regresar a los valores normales de
concentración de glucosa e insulina en el torrente sanguíneo. Al igual que en la grafica
anterior la figura 4.7 nos muestra como la RND se acopla a la grafica de concentración
el pasar el tiempo de evolución del sistema.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
61
Figura. 4.8 Error Del Identificador De Insulina
El comportamiento del aprendizaje se puede apreciar en la figura 4.8 que al igual que
en la concentración de glucosa disminulle o aumenta dependiendo de los cambios de
concentración de insulina.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
62
Figura. 4.9 Identificación De La Concentración De Insulina En El Compartimiento
Remoto
En el comportamiento de insulina en el compartimiento remoto tiene la misma
característica que las dos graficas de concentraciones anteriores pero la
concentración de insulina es más baja por lo que podemos apreciar en la figura 4.9. La
RND también se acopla a la señal de concentración pero en el inicio nuevamente de la
ingesta de comida el error aumenta muy poco.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
63
Figura. 4.10 Error Del Identificador De Insulina En El Compartimiento Remoto
En la figura 4.10 observe que al inicio de la evolución el error se decrementa
considerablemente y en cada seis horas el error aumenta apenas notoriamente por las
variables antes mencionadas
4.2 NEURO CONTROL
4.2.1 DINAMICA DE GLUCOSA EN SANGRE (MODELO DE BERGMAN)
Para la implementación del control se describe la estructura del siguiente diagrama a
bloque figura 4.11, que describe como se genera la dinámica del sistema de control y
las variables que se necesitan para su desarrollo
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
64
Figura. 4.11 Diagrama A Bloques Del Control De Seguimiento De Trayectoria
La red empleada para el desarrollo de control es la descrita en la ecuación (3.6) La
diferencia es la entrada del sistema que cambiara por la descrita en la ecuación (3.12),
(3.21), en donde el análisis esta descrito en el capítulo 3
Para la realización del control se determinan los parámetros constantes propiamente
de la red neuronal empleada los cuales son:
00091.000
00268.00
0007012.0
1222A
2500
0150
0015
65P
195
89
2
1
k
k
265628
476625
695315
15R
Este control pide un sistema de referencia en el cual se basa para la realización de
nuestro control ),( * txt , este sistema de referencia es de gran importancia puesto que
nuestra red cambiara las señales de la planta a las señales del sistema de referencia,
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
65
por lo que este sistema de referencia básicamente será lo que el programador quiera
que realice la planta, el cual se en este caso de describe por:
5
23
22
21
10*2)(
)(
2.0)(
xux
xux
xux
Donde 1x es la diferencia de la concentración de insulina en el plasma a la que
queremos llegar y 2x es la diferencia de concentración de glucosa en el plasma a la
que se quiere llegar; 3x es proporcional a la concentración de insulina en el
compartimiento remoto que esperamos obtener. Por lo que en la siguiente grafica
figura 4.12 muestra la dinámica del sistema que emplearemos para este control
Figura. 4.12 Sistema De Referencia
Para la simulación se desarrollo el siguiente esquema de simulación, el cual indica la
estructura principal de la interacción que existe entre el modelo que emplearemos en
este caso el de la dinámica de glucosa. Como el factor de aprendizaje esta
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
66
determinado por el error al igual que la entrada la cual estará determinada por el
sistema de control que son las parámetros necesarios para la realización de nuestro
sistema
Para la realización del neurocontrol empleado
ttttt uxWuu ,2,2,1 )ˆ(
Donde la primera sección del control se utiliza como un compensador de la no
linealidad presente en la estructura de la RND .
)ˆ(),()ˆ( ,1
**
,2,1 ttttttt xWAxtxxWu
Y la segunda parte u2 se utiliza para alcanzar el seguimiento de la trayectoria
deseada ),( * txt , lo cual se obtiene de la elección de una función de Lyapunov
adecuada y su correspondiente prueba de estabilidad [4]:
)ˆ()ˆ(,2 ttttt xxxxAu
Se realizara la parte de programación en simulik como lo muestra la figura 4.13
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
67
Figura 4.13 Esquema De Simulación Del Neurocontrol
4.2.2 RESULTADOS
Mediante la realización del sistema de control por seguimiento de trayectoria la
entrada proporcionada por el sistema es el descrito en la figura 4.25, la cual muestra
que la entrada generada son dos variables con características diferentes, estas
entradas son tanto para el modelo como para la rede neuronal para la generación de
control de los estados.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
68
Figura. 4.25 Control Aplicado Al Modelo Y A La RND
La simulación realizada del control para el modelo de Bergman esta mostrada en la
figura 4.26 la cual muestra la evolución de las variables de insulina y glucosa
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
69
Figura. 4.26 Modelo Controlado
Primeramente la dinámica de glucosa descrita en la figura 4.27 la cual muestra esta
evolución, nótese que la dinámica del modelo y de la RND, son semejantes pero
diferentes a la dinámica del modelo de Bergman original descrito anteriormente en el
identificador.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
70
Figura. 4.27 Aprendizaje De La RND Por Medio Del Control
La figura 4.28 muestra que el error entre la RND y el modelo disminuye y aumenta en
distintos puntos esto es debido a los cambios de magnitud del sistema original y como
la red actúa para que este error en la dinámica de glucosa se aproxime a cero.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
71
Figura. 4.28 Error De La RND Para La Glucosa Con El Control
Para la figura 4.29 la concentración de insulina para el modelo y la red nuevamente
muestra que son semejantes en la dinámica de control
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
72
Figura.4.29 Aprendizaje De La RND Por Medio Del Control
En la figura 4.30 podemos notar que el aumento y decremento del error de la
concentración de insulina pero en magnitud este sigue siendo mínimo como se aprecia
en la escala.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
73
Figura. 4.30 Error De La Insulina En El Compartimiento Remoto Contra El
Sistema De Referencia
Como se menciono anteriormente para la realización del control basado en un sistema
de referencia el cual se describe su dinámica en la figura 4.22. Se determinara la
calidad del control diseñado mediante la comparación de cada una de las variables del
modelo con cada una de las del sistema de referencia.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
74
Figura. 4.31 Seguimiento De La Planta Al Modelo De Referencia
La Figura. 4.31 se muestra la dinámica de la concentración de glucosa y el estado del
sistema de referencia que asemeja este estado, para esta dinámica nótese que son
semejantes estos dos estados.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
75
Figura. 4.32 Error Del Seguimiento De La Concentración De Glucosa
Para la confirmación del funcionamiento del control la figura 4.32 podemos observar
las intervenciones del control mediante el erro de la concentración de glucosa y el
sistema de referencia, estas diferencias que se incrementan en algunos puntos estas
son pequeñas en magnitud y constantemente decrecen después de su incremento
para aproximarse a cero.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
76
Figura. 4.33 Seguimiento De La Planta Al Modelo De Referencia
Para la concentración de insulina en la figura 4.33 podemos observar la dinámica de
este estado con su equivalente en el sistema de referencia se aprecia que estas
graficas son semejantes.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
77
Figura. 4.34 Error Del Seguimiento De La Concentración De Glucosa
Para comprobarlo este control podemos apreciar en la figura 4.34 que el error al igual
que el anterior es pequeño e magnitud
4.3 NEURO OBSERVADOR CON (RND)
4.3.1 DINAMICA DE GLUCOSA EN SANGRE (MODELO DE BERGMAN)
La aplicación de un observador para el modelo de Bergman se realizo basándose en
la ecuación 2.14, las siguientes condiciones. Estas condiciones se tomaron como un
individuo que padece de diabetes, por lo que en la realidad solo se cuentan con
medidores de glucosa, por lo que se diseño el observador para la glucosa y se
estimaran los otros dos estados
)ˆ()()ˆ()ˆ(ˆ:ˆ,2,2,1,1 ttttttttttt xCyKuxVWxVWxx
9100
040
002
A 150
891
2
1
k
k
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
78
7744.000
07133.10
002379.3
1.0P
010C
La realización de la simulación está en la plataforma de Simulink como se muestra en
la figura 4.35 la cual describe el procedimiento realizado en esquema de bloques.
Cabe mencionar que este tipo de redes tiene capas ocultas como se describe en la
ecuación principal del observador.
Figura..35 Esquema De Simulación De La Estructura Del Observador
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
79
En esta aplicación se considera que el modelo de Bergman tiene solo una salida
medible, la cual es la concentración de glucosa, esta única señal será introducida a la
RND (observador), al igual variables que la señal de entrada del modelo. El
observador tomara estas variables y estimara los otros dos estados faltantes del
modelo (concentración de insulina y concentración de insulina en el compartimiento
remoto).
4.3.2 RESULTADOS
Figura. 4.36 Observador De Glucosa
Mediante la simulación se obtuvo la grafica de la figura 4.36 la cual describe la
observación de la concentración de glucosa tanto del modelo como el de la red, se
puede observar que ambas graficas son similares al igual que en las aplicaciones
anteriores. La grafica de la figura 4.37 muestra el error entre ambas señales se
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
80
aprecia que el error es pequeño en magnitud aunque aumenta bruscamente en
algunos puntos pero nuevamente se decremento a cero.
Figura. 4.37 Error Del Observador
En la estimación realizada por el observador para la concentración de insulina se
representa en la figura 4.38 donde se comparan la concentración estimada y la
producida por el modelo se aprecia que la grafica de estimación de insulina es
parecida a la del modelo.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
81
Figura. 4.38 Estimación De La Insulina
En la grafica de la figura 4.39 se muestra el error se puede apreciar que se aproxima a
cero pero tiene un error mayor que el obtenido en los identificadores, esto es porque el
observador no tiene contacto directo con este estado sino porque lo está
reconstruyendo a partir del estado medible que en este caso es el estado de la
concentración de glucosa y por concerniente el error tiende a aumentar y la estimación
es aproximada.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
82
Figura. 4.39 Error Del Estimador De Insulina
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
83
Figura. 4.40 Estimación De Insulina En El Compartimiento Remoto
La Figura 4.40 demuestra que el identificador para la insulina en el compartimiento
remoto entra dentó de los rangos necesarios y el error tiende acero como se
demuestra en la Figura. 4.41
Figura. 4.41 Error Del Estimador De Insulina En El Compartimiento Remoto
4.4. SISTEMA NEURO DIFUSO
4.4.1 DINAMICA DE GLUCOSA EN SANGRE (MODELO DE BERGMAN)
La implementación de este sistema se desarrollara para la posible solución de
suministro de insulina a personas con diabetes. Para la realización de la parte difusa
empleamos las siguientes características en Matlab en donde creamos un esquema
difuso como lo muestran las Figuras 4.44, 4.43, 4.42
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
84
Figura. 4.42 Representación A Bloques Del Esquema Difuso Con Dos Entradas Y
Una Salida
Dentro de esta estructura manejamos dos entradas las cuales nos la proporcionara
nuestra red neuronal. Una de esas entradas es la concentración de glucosa la cual la
dividimos en tres funciones de membrecía (baja, normal y alta) con diferentes grados
de pertenencia, estos grados de pertenencias dependen del experto el cual
determinara cuales son los valores de pertenencia adecuados, este experto puede ser
cualquiera que tenga los conocimientos dentro del fenómeno.
Figura. 4.43 Funciones De Membrecía Para La Concentración De Glucosa
Otra de las entradas que manejamos en la insulina producida por el páncreas la cual
también la dividimos en tres funciones de membrecía (baja, normal y alta) sus grados
de pertenencia también son determinadas por el experto.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
85
Figura. 4.44 Funciones De Membrecía Para La Concentración De Insulina
Los paramentos de salida son determinados a las concentraciones de insulina que se
suministraran dependiendo de las entradas y de las reglas que se editaron
Figura. 4.45 Funciones De Membrecía Para El Suministro De Insulina
Para la determinación de niveles de concentraciones de insulina suministradas
depende de una serie de reglas que se describen en la tabla 4.1
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
86
Tabla 4.1 Reglas empleadas por el experto
Núm. Reglas
1 Si glucosa es normal y insulina es normal entonces salida es
cero
2 Si glucosa es baja y insulina es baja entonces salida es cero
3 Si glucosa es alta y insulina es baja entonces salida es alta
4 Si glucosa es alta y insulina es normal entonces salida es
moderado
5 Si glucosa es alta y insulina es alta entonces salida es cero
Figura 4.46 Diagrama Sistema Neuro Difuso
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
87
4.4.2 RESULTADOS
Figura. 4.47 Respuesta Del Infusor
Esta figura nos indica que dependiendo la concentración de glucosa será la respuesta
del infusor como se muestra en la figura y que estos niveles de suministro dependen
del experto
Figura. 4.48 Dinámica Del Infusor Y La Glucosa
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
88
11.1 CONCLUSIONES
El diseño del identificador basado en RND con la selección de las funciones de ajuste
de los pesos, fue adecuado para identificar los tres estados del modelo de Bergman
satisfactoriamente. La obtención de las variables de un sistema incierto con la
subsecuente reconstrucción de un modelo aproximado para tal sistema, generó un
diseño de una función de control que resuelve el problema de seguimiento de
trayectoria con un error muy pequeño.
Por otro lado, la aplicación del identificador para datos reales demuestra que no es
necesario ecuaciones que representen el fenómeno biológico y que estas técnicas
(identificación y control adaptable) puedan ser implementadas para la realización de
instrumentación de equipos de asistencia médica, incluyendo un posible
prediagnosticador de la dosificación de la insulina en sangre.
Con el diseño del observador para estados del modelo de Bergman, se consiguieron
estimar los estados restantes con un error dentro de los límites establecidos por las
sugerencias bibliográficas. Esto conllevo a la realización de un sistema neurodifuso
para el suministro de insulina mediante los criterios de un experto que utilizó las
variables reconstruidas por el estimador de estados basado en redes neuronales
diferenciales.
La recomendación promovida por esta tesis deriva en la posible implementación de
estas técnicas de control automático que aunque con poco desarrollo, pueden
aplicarse satisfactoriamente en el ámbito biológico para la creación de instrumental
que nos permita desarrollar más tecnología, como en el caso que manejamos en este
escrito que es la creación de un sistema neurodifuso para el suministro de insulina a
personas que padecen de Diabetes. En base a los resultados obtenidos, es posible
suponer que la aplicación de los algoritmos diseñados, pueden promover en los
pacientes que padecen diabetes a alcanzar una mejoría en sus niveles de glucosa que
a final de cuentas provoque un aumento en la calidad de vida del paciente diabético
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
89
BIBLIOGRAFIA
[1] Montgomerie, G. A., Nicholson, H., Biological Systems Modelling and Control. Peter
Peregrinus Ltd. 1979
[2] Khoo, M. C. K., Physiological Control Systems: Analysis, Simulation, and
Estimation. Metin Akay Ed. 2000
[3] Murano, D. A., Poznyak, A. S. Robust High-Gain DNN Observer for Nonlinear
Stochastic Continuos Time Systems.
[4] D. Bergman, Mt Sinai J M Pathogenesis and prediction of diabetes mellitus: lessons
from integrative physiology (ed McGraw Hill, 1982).
[5] Fonseca. H. M., Ortiz V. H., Cabrera A. I, Redes Neuronales Estocasticas
Aplicadas al Modelo Dinámico de Glucosa para Pacientes Diabeticos. XXVI SOMIB
Congreso Nacional De Ingeniería Biomédica, (CINVESTAV), México,. Noviembre
2003,
[6] Guyton, A. C., Tratado de Fisiología Médica.( McGraw Hill, 2001)
[7] Poznyak1 : A.S. Poznyak, E.N. Sanchez and Wen Yu. , 2001 Dynamic Neural
Networks for Nonlinear Control: Identification, State Estimation and Trajectory
Tracking. World Scientific, New Jersey, London, Singapore, Hong Kong.
[8] Poznyak : A. S. Poznyak, W. Yu, E. N. Sanchez, and J. P. Perez, Nov. 1999.
"Nonlinear adaptive trajectory tracking using dynamic neural networks," IEEE Trans.
Neural Networks, vol. 10, pp. 1402--1411,
[9] Chairez J., 2003. Control inteligente aplicado a incubadoras neonatales, Tesis
individual de licenciatura, Unidad Profesional Interdisciplinaria de Biotecnología,
México D.F..
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
90
[10] Dunn I, Heinzle E, Ingham J and Prenosil. 1992. Biological Reaction Engineering.
Ed. Verlagsgesellshaft. Pág. 263-273.
[11] Holland J, 1975, Adaptation in Natural and Artificial Systems, University of
Michigan Press, Pág. 211 p.
[12] Stein ocker, G. Difusa genetic programming — offline acquisition of difusa rules
using variable-length GAs. Master’s thesis, Johannes Kepler Universit¨at Linz, January
2002.
[13] Zimmermann, H.-J. Difusa Set Theory—and its Applications, second ed. Kluwer
Academic Publishers, Boston, 1991.
[14] Ward, Owen P. 1991 Biotecnología de la Fermentación. Acribia. [España].
[15] Schügerl, Karl. 1990 .Bioreaction Engineering. Vol. 2. John Wiley and Sons. [Great
Britain],
[16] McNeil, B. and Harvey, 1990 L.M., "Fermentation: a practical approach" En:
Laboratory Fermenters. IRL press. Oxford University,.
[17] Bailey, James E. 1986 Biochemical Engineering Fundamentals. Second edition.
McGraw-Hill. [Singapore],.
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
91
ANEXO I PONENCIAS EN EXTENSO EN FOROS NACIONALES
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
92
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
93
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
94
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
95
ANEXO II PONENCIAS EN EXTENSO EN FOROS INTERNACIONALES
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
96
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
97
UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA
INSTITUTO POLITÉCNICO NACIONAL
98