observaciÓn y control neuroadaptable por …

UNIDAD PROFESIONAL INTERDISCIPLINARIA DE BIOTECNOLOGÍA

INSTITUTO POLITÉCNICO NACIONAL

1

OBSERVACIÓN Y CONTROL NEUROADAPTABLE POR ESTIMACIÓN DE

ESTADOS PARA MODELOS DE BIOINGENIERÍA

QUE PARA OBTENER EL TÍTULO DE

INGENIERO BIOMÉDICO

PRESENTA

C. FONSECA PALMA HUMBERTO MARTIN

DIRECTOR INTERNO: DR. AGUSTÍN IGNACIO CABRERA LLANOS

CO DIRECTOR: DR. JORGE ISSAC CHAIREZ ORIA

MÉXICO D. F. MAYO 2011



2

AGRADECIMIENTOS

- A mis padres Martín y Ruth, gracias por darme la oportunidad de mi desarrollo

escolar, por otorgarme lo que necesitaba durante este proceso, gracias por la

confianza que me brindaron, por su apoyo y consejos

- A mis hermanos Marlen, Erika y Jovanny por su apoyo, cariño y confianza que

hemos compartido durante el desarrollo de nuestras vidas

- Al Dr Agustín Cabrera Llanos y el M en C Isaac Chaires Oria por darme la

oportunidad de pertenecer a su grupo de trabajo en el desarrollo de

investigación de técnicas de control moderno, por la convivencia que

desarrollamos durante los años que colabore con ellos.

- A los amigos que he encontrado durante el camino de mi vida que me han

demostrado su amistad a pesar de los conflictos que hemos tenido por que han

sido unos de los impulsos que he tenido durante mi formación, se que a

algunos tal vez no los vuelva a encontrar puesto que tomamos caminos

diferentes, pero siempre estarán en mis recuerdos y las cosas que enfrentamos

durante nuestras formaciones.



3

RESUMEN

En la presente tesis se desarrollaron las aplicaciones de redes neuronales

diferenciales (RND), en un modelo biológico matemático el cual describe la interacción

de glucosa e insulina (modelo de Bergman) para el proceso de salud enfermedad

asociado a la diabetes. Para este sistema se desarrollo un identificador para las

variables que describen su dinámica las cuales son: Diferencia de la concentración de

insulina en plasma 1x , Diferencia de concentración de glucosa en plasma 2x ;

mientras que 3x es un valor proporcional a la concentración de insulina en el

compartimiento remoto. Esto último obedece a la descripción compartamental del

modelo de Bergman, el cual asume que dicho comportamiento representa toda la

glucosa que se encuentra en el cuerpo pero no en el torrente sanguíneo. A este

mismo modelo, por sus características de simulación y estructura matemática, se le

desarrollo un controlador basado en técnicas de control adaptable que resolviera el

problema de seguimiento de trayectoria mediante un sistema de referencia el cual

tiene las características necesarias para describir las condiciones fisiológicas de un

paciente sano. Lo anterior se traduciría en el correcto funcionamiento del sistema de

interacción insulina-glucosa utilizando una fuente externa de suministro de la insulina

que regule automáticamente la relación entre estas dos sustancias (páncreas

artificial).

Por otro lado, se utilizó una combinación de dos técnicas de control, conocidas como

lógica difusa y redes neuronales las que pueden generar estructuras mixtas las cuales

se define como un Sistema neurodifuso, el cual demostró ser una aplicación más

orientado a desarrollar una aplicación real o prototipo de controlador para finalmente,

crear un infusor de insulina automático.

La solucion, para el sistema de insulina-glucosa, demostro la aplicabilidad de los

conceptos de redes neuronales y lógica difusa en la identificación no paramétrica y el

diseño de controladores automáticos para sistemas de tipo biológico que se asumen

no lineales, inciertos en su descripción matemática y afectada por perturbaciones

externas.



4

La propuesta de combinar las redes neuronales diferenciales y la lógica difusa, es una

propuesta muy atractiva que favorecería el desarrollo de controladores basados en

inteligencia artificial para solventar problemas que afectan a la población mundial

como la diabetes.

JUSTIFICACION

A pesar de que la diabetes es una enfermedad que no tiene una cura definitiva, su

prevalencia en la población mundial y considerando el número de muertes que causa

cada año demandan la generación de sistemas que permitan disminuir el impacto que

tiene dicha enfermedad en los sistemas de salud de todos los países alrededor del

mundo.

El desarrollo de nuevas técnicas y herramientas de control abre grandes posibilidades

para implementar algoritmos y dispositivos que puedan coadyuvar a la resolución de

problemas de control avanzado de sistemas no lineales inciertos. En este sentido, la

medicina es un área muy prometedora por las necesidades que se requieren de

control para poder resolver las múltiples patologías que se presentan en el ser

humano y que son susceptibles, utilizando un método adecuado, para resolverse por

tratamientos que necesitan de un control riguroso. Esto se debe a que un mejor control

conlleva a múltiples beneficios tanto económicos, de salud y de funcionalidad. En

particular el principal concepto de mejoramiento u optimización en los tratamientos se

da en el ahorro de medicamentos dado que solo se utilizarían los necesarios. En el

caso del aspecto salud, se presenta un beneficio inmediato debido a que el

medicamento sería suministrado en el momento en el que se requiere y finalmente, se

incrementa la funcionalidad a consecuencia de que mejora la salud evitando la pérdida

de horas hombre por el padecimiento en particular que sufra el paciente.

Es por este motivo que se implementan en este trabajo técnicas de aprendizaje,

control y observación basadas en redes neuronales diferenciales, para la

implementación de otras opciones de solución para los problemas que se tienen con

los modelos biológicos en donde se encuentra la descripción matemática de la

diabetes.



5

APORTACIONES

Mediante la realización del presente trabajo se pretende dar una opción para la

elaboración de instrumentación médica para el tratamiento de la diabetes en dos

maneras, una de ellas es mediante un control de seguimiento de parámetros normales

por medio de suministro de insulina y glucosa, el otro método es mediante la

combinación de dos técnicas redes neuronales y lógica difusa, para la creación de un

infusor de insulina que suministrara la dosis necesaria de insulina conforme el cuerpo

del paciente lo requiera, estas concentraciones suministradas estarán delimitadas por

un experto el cual creara las reglas de la lógica difusa conforme a las entradas

proporcionadas por la red neuronal y las necesidades del paciente

OBJETIVOS

GENERALES

Aplicar redes neuronales diferenciales a dos modelos biológicos para obtener una

representación aproximada del modelo matemático que los describe (identificación no

para métrica) utilizando solo la información de entrada-salida.

Crear un control para la regulación de insulina y glucosa mediante la infusión de

insulina empleando el modelo no para métrico.

PARTICULARES

- Designación de un modelo matemático que represente la evolución de la

concentración de glucosa

- Desarrollo de un identificador para el modelo de Bergman

- Desarrollo de un observador para el modelo de Bergman

- Realizar un control neuronal en seguimiento de trayectoria para el modelo de

Bergman

- Realizar un control neurodifuso para el modelo de Bergman que controle el

suministro de insulina



6

INDICE GENERAL

Introducción 10

CAPITULO I Redes Neuronales Artificiales 14

1.1 Perceptron 14

1.2 Características De Las Redes Neuronales 17

1.3 Regla De Aprendizaje 19

CAPITULO II Técnicas Aplicadas 23

2.1 Redes Neuronales Diferenciales 23

2.1.1 Identificación 23

2.1.1.1leyes De Aprendizaje 26

2.1.2 Observador Con Redes Neuronales Diferenciales 28

A) Observadores De Estado 28

B) Neuro Observador 30

C) Leyes De Aprendizaje 30

2.1.3 Control Con Redes Neuronales Diferenciales 33

A) Condiciones De Control 33

B) Descripción Del Sistema De Control 34

2.2 Lógica Difusa 36

A) Funciones De Membrecía 38

B) Reglas Lógicas 40

C) Estructura De La Lógica Difusa 40

2.3 Sistema Neuro Difuso 43

A) Taxonomía De Los Sistemas Neuro Difusos 43

B) Ventajas De Los Sistemas Neurodifusos 44

C) Limitaciones De Los Sistemas Neurodifusos 45

CAPITULO III Modelos de aplicación 46

Análisis De Observabilidad Y Controlabilidad 46

3.1 Sistema Biológico Utilizado 49

A) Diabetes 49

B) Tipo De Diabetes 50



7

C) Modelos Matemáticos 50

CAPITULO IV Metodología Y Resultados 53

4.1 Identificación Con Rnd 53

4.1.1 Dinámica De Glucosa En Sangre (Modelo De Bergman) 53

4.1.2 Resultados 56

4.2 Neuro Control 63


4.2.2 Resultados 67

4.3 Neuro Observador 77


4.3.2 Resultados 79

4.4. Sistema Neuro Difuso 83


4.4.2 Resultados 87

Conclusiones 88

Bibliografía 89

Anexos I 91

Anexos Ii 95

INDICE DE FIGURAS

Figura I Neuronas 11

Figura. II Sinapsis 12

Figura. 1.1 Perceptor 14

Figura 1.2 Topología De Una Red 16

Figura 1.3 Funciones De Transferencia 17

Figura 1.4 Red De Tres Capas 20

Figura 2.1 Satisfacción De Las Condiciones 25

Figura 2.2 Topología De Una RND 27

Figura 2.3 Diagrama De Identificación 28



8

Figura 2.4 Diagrama Del Observador 30

Figura 2.5 Rnd En Observador 32

Figura 2.6 Diagrama De Control 36

Figura 2.7 Formas Comunes De Las Funciones De Membrecía 38

Figura 2.8 Muestra Del Trapezoide En Un Conjunto Difuso 39

Figura 2.9 Método Del Centro Idee 42

Figura 2.10 Modelo Concurrente 44

Figura 4.1 Aplicación De RND Al Modelo De Bergman Para Su

Identificación

53

Figura 4.2 Diagrama De Ecuaciones Aplicadas 54

Figura 4.3 Estructura De Simulación Del Identificador Con Simulink 56

Figura 4.4 Simulacion Del Modelo De Bergman 57

Figura. 4.5 Identificación De La Concentración De Glucosa 58

Figura. 4.6 Error Del Identificador De Glucosa 59

Figura. 4.7 Identificación De La Concentración De Insulina 60

Figura. 4.8 Error Del Identificador De Insulina 61

Figura. 4.9 Identificación De La Concentración De Insulina En El

Compartimiento Remoto

62

Figura. 4.10 Error Del Identificador De Insulina En El Compartimiento

Remoto

63

Figura. 4.11 Diagrama A Bloques Del Control De Seguimiento De

Trayectoria

64

Figura. 4.12 Sistema De Referencia 65

Figura 4.13 Esquema De Simulación Del Neurocontrol 67

Figura. 4.25 Control Aplicado Al Modelo Y A La RND 68

Figura. 4.26 Modelo Controlado 69

Figura 4.27 Aprendizaje De La RND Por Medio Del Control 70

Figura. 4.28 Error De La RND Para La Glucosa Con El Control 71

Figura. 4.29 Aprendizaje De La RND Por Medio Del Control 72

Figura. 4.30 Error De La Insulina En El Compartimiento Remoto Contra El 73



9

Sistema De Referencia

Figura. 4.31 Seguimiento De La Planta Al Modelo De Referencia 74

Figura. 4.32 Error Del Seguimiento De La Concentración De Glucosa 75

Figura. 4.33 Seguimiento De La Planta Al Modelo De Referencia 76

Figura. 4.34 Error Del Seguimiento De La Concentración De Glucosa 77

Figura. 4.35 Esquema De Simulación De La Estructura Del Observador 78

Figura. 4.36 Observador De Glucosa 79

Figura. 4.37 Error Del Observador 80

Figura. 4.38 Estimación De La Insulina 81

Figura. 4.39 Error Del Estimador De Insulina 82

Figura. 4.40 Estimación De Insulina En El Compartimiento Remoto 82

Figura. 4.41 Error Del Estimador De Insulina En El Compartimiento

Remoto

83

Figura. 4.42 Representación A Bloques Del Esquema Difuso Con Dos

Entradas Y Una Salida

84

Figura. 4.43 Funciones De Membrecía Para La Concentración De

Glucosa

84

Figura. 4.44 Funciones De Membrecía Para La Concentración De Insulina 85

Figura. 4.45 Funciones De Membrecía Para El Suministro De Insulina 85

Figura. 4.46 Diagrama Sistema Neuro Difuso 86

Figura. 4.47 Respuesta Del Infusor 87

Figura. 4.48 Dinámica Del Infusor Y La Glucosa 87

INDICE DE TABLAS

Tabla 2.1 Descripciones Matemáticas De Las Principales Funciones De

Membrecía

39

Tabla 4.1 Reglas Empleadas Por El Experto 86



10

INTRODUCCION

Como es sabido el hombre ha intentado crear máquinas semejantes al humano con

capacidades como el aprendizaje, razonamiento, e inteligencia, los cuales simplifiquen

las tareas más complejas que necesitan de estos conceptos. Una de las alternativas

es enfocarse en cómo funciona principalmente el cerebro para comprender su

funcionamiento y como interactua con el medio en el que se encuentra. El cerebro

humano continuamente recibe señales de entrada de muchas fuentes principalmente

de los sentidos y las procesa a manera de crear una apropiada respuesta de salida

para una determinada tarea, cabe mencionar que para obtener la respuesta el cerebro

debe de estar entrenado, este entrenamiento se logra mediante las experiencias

vividas durante el transcurso de la vida conforme a pruebas y errores hasta que el

resultado sea el adecuado para la solución del problema. Los cerebros cuentan con

millones de neuronas que se interconectan formando grandes redes (Redes

Neuronales). Estas redes ejecutan los millones de instrucciones necesarias para

mantener una vida normal.

Las neuronas son las células que forman la corteza cerebral de los seres vivos, cada

una está formada por elementos llamados cuerpo, axón y dendritas, las cuales se

comunican por medio de sinapsis como se muestra en la siguiente (Figura I).



11

Figura I Neuronas

Las dendritas forman una estructura de filamentos muy fina que rodean el cuerpo de la

neurona. El axón es un tubo largo y delgado que se ramifica en su extremo en

pequeños bulbos finales que casi tocan las dendritas de las células vecinas. La

pequeña separación entre los bulbos finales y las dendritas se le denomina sinapsis.

Las neuronas, al igual que las demás células del cuerpo, funcionan a través de

impulsos eléctricos y reacciones químicas. Los impulsos eléctricos que utiliza una

neurona para intercambiar información con las demás, viajan por el axón que hace

contacto con las dendritas de la neurona vecina mediante las sinapsis. La intensidad

de la corriente transmitida depende de la eficiencia de la transmisión sináptica. Una

neurona en especial transmitirá un impulso eléctrico por su axón si suficientes señales

http://iibce.edu.uy/neuromol/FinFrankTotal.jpg



12

de las neuronas vecinas transmiten a través de sus dendritas en un tiempo corto. La

señal que se transmite a la neurona podrá ser además inhibitoria o excitatoria. La

neurona dispara, esto es, manda el impulso por su axón, si la excitación excede su

inhibición por un valor crítico al umbral de la neurona,. (Figura II).

Figura. II Sinapsis

La inteligencia artificial es la ciencia que intenta la creación de programas para

máquinas que imiten el comportamiento y la comprensión humana. La investigación en

el campo de la IA se caracteriza por la producción de máquinas para la automatización

de tareas que requieran un comportamiento inteligente.

Fundamentalmente existen dos vertientes para trasladar la inteligencia y forma de

razonamiento humano. Una es la Inteligencia Simbólica que está caracterizada por un

gran nivel de abstracción y un punto de vista macroscópico, los sistemas de

conocimiento ingenieriles y la programación lógica caen en esta categoría. La segunda

rama está basada en modelos biológicos microscópicos de bajo nivel, este es similar

al énfasis de la fisiología y genética. Las redes neuronales y los algoritmos genéticos

son ejemplos de esta tecnología. El principal tema de desarrollo es por el modelaje del

cerebro como un dispositivo computacional en paralelo, con varias tareas por

separado. Las redes neuronales tienen una gran cantidad de elementos de

procesamiento altamente interconectados (nodos), que usualmente trabajan en

paralelo y están en arquitecturas regulares. El comportamiento colectivo de una red

neuronal como la del cerebro humano, demuestra la habilidad de aprender, reajustar y



13

generalizar a partir de patrones de entrenamiento o datos. Las aplicaciones donde las

redes neuronales son más prometedoras son aquellas que tienen que ver con un

amiente del mundo real, como el reconocimiento de patrones, conversión de

imágenes, procesamiento de imágenes y percepción visual, aplicaciones médicas,

aplicaciones industriales, etc.

Los modelos de las redes neuronales están especificados en tres modos básicos:

modelos de los elementos de programación por si solos, modelos de interconexión y

estructuras (topologías de la red), así como las reglas de aprendizaje. Cada nodo en la

red neuronal colecciona todos los valores de todas sus conexiones de entrada,

desarrolla una operación matemática predefinida, y produce un valor único de salida.

Cada conexión tiene un peso asociado que determina el efecto de la entrada actual en

el nivel de activación del nodo, los pesos pueden ser positivos (excitatorios) y

negativos (inhibitorios). Los pesos de conexión almacenan la información y el valor de

los pesos de conexión están determinados de manera común por un procesamiento

de aprendizaje de la red neuronal, a esto se le conoce como leyes de aprendizaje.

Estas determinaran el aprendizaje de la red neuronal. Las leyes de aprendizaje son

de diferentes formas, pero la más conocida es la de backpropagation, este

procedimiento toma la salida de la red y la retroalimenta a los pesos subsecuentes de

la red para así poder modificar los pesos y que la red neuronal complete su

aprendizaje. Al igual que este método de aprendizaje existen más como: el

aprendizaje no supervisado y supervisado estas características darán forma al tipo de

redes que se emplearan para este trabajo ya que estas son las bases para el

desarrollo de las redes neuronales artificiales.



14

CAPITULO I

REDES NEURONALES ARTIFICIALES

Basadas en las redes neuronales biológicas, fueron creadas las redes neuronales

diferenciales. Al igual es necesario un estructura y funcionamiento, mediante el

aprendizaje para la realización de un procedimiento, es por ello que por cada

fenómeno, modelo o tarea, es necesario la creación de una red particular para cada

una de estas que dependiendo de la complejidad será el tipo de estructura empleada.

1.1 PERCEPTRON

Las redes neuronales artificiales son algoritmos numéricos programables en los

cuales se basan en una estructura biológica (neurona) la cual es representada

matemáticamente (Figura 1.1) y es conocida como perceptron, esta es más básica de

las redes neuronales. Un conjunto de perceptrones interconectados determinaran la

complejidad y dimensión de la red neuronal esta será estructurada por el diseñador

que designara cuantos perseptrones serán implementados para el mejor

funcionamiento para la aplicación dada. Se debe tomar en cuenta que dependiendo de

la complejidad del problema es el número de perseptrones implementados si se

excede el número, la red se haría muy grande para el problema y se obtendrá el

mismo resultado que con una más pequeña por lo que la red estará sobrada.

Figura.. 1.1 Perceptron



15

En la (Figura 1.1) nxxxx ....,, 321 son las entradas del perseptron, nwwww ....,, 321

son los pesos, bwxf nn es la sumatoria de cada una de las entradas por cada

uno de los pesos sumando una constante de entrenamiento y a todo eso se evalúa

con respecto a una función de activación )(f , lo cual solo produce un solo valor único

de salida y. Este valor se distribuye a la entrada del siguiente perceptron y así

sucesivamente hasta el último.

Podemos observar que el proceso de las redes son sumatorias de entradas por pesos

que producen un valor numérico y este valor se transmite al siguiente perceptron

evaluándose en una ecuación para dar un único valor. En la (Figura 1.3) se muestran

señales conocidas como funciones de activación, estas determinaran un umbral. A

este umbral se conoce como barrera de aprendizaje, esto es que si el valor entregado

por la sumatoria no sobrepasa el valor de este umbral no se trasmite esta sumatoria al

siguiente perseptron, la función es determinada por el programador. Existen diferentes

tipos de funciones de transferencia, el programador determinara cual considera

necesaria para las propiedades de aprendizaje.

Un conjunto de perceptrones forman una red neuronal la cual tiene ciertas

características que describen de manera general su funcionamiento algunas son;

Unidad de proceso: En la neurona Artificial. Existen tres tipos de capas: entradas,

salidas y ocultas (Figura 1.2). Las unidades de entrada reciben señales desde el

entorno; las de salida envían la señal fuera de la red, y las unidades ocultas son

aquellas cuyas entradas y salidas se encuentran dentro del sistema. Se conoce como

capa o nivel a un conjunto de neuronas cuyas entradas provienen de la misma fuente

y cuyas salidas se dirigen al mismo destino.



16

Figura 1.2 Topología De Una Red

Los valores de activación pueden ser continuos o discretos, limitados o ilimitados. Si

son discretos, suelen tomar un conjunto finito de valores binarios, así un estado activo

se indicaría con un 1 y un estado pasivo se representaría por un cero. En otros

modelos se considera un conjunto de estados de activación, en cuyo valor entre [0,1],

o en el intervalo [-1,1], siendo una función sigmoidea o lineal. La Figura 1.3 muestra

algunas de las funciones de activación más conocidas.



17

Figura 1.3 Funciones De Transferencia

1.2 CARACTERÍSTICAS DE LAS REDES NEURONALES

Existen aspectos que caracterizan una red neuronal: su topología, el mecanismo de

aprendizaje, tipo de asociación realizada entre la información de entrada salida, y la

forma de representación de estas informaciones.

Topología de las Redes Neuronales. La arquitectura de las redes neuronales

consiste en la organización y disposición de las neuronas formando capas más o

menos alejadas de la entrada y salida de la red. En este sentido, los parámetros

fundamentales de la red son: el número de capas, el número de neuronas por capa, el

grado de conectividad y el tipo de conexiones entre neuronas.

Redes Mono capa: Se establecen conexiones laterales, cruzadas o autorrecurrentes

entre las neuronas que pertenecen a la única capa que constituye la red. Se utilizan en

tareas relacionadas con lo que se conoce como auto asociación; por ejemplo, para

generar informaciones de entrada que se presentan a la red incompleta o

distorsionada.



18

Redes Multicapa: Son aquellas que disponen de conjuntos de neuronas agrupadas

en varios niveles o capas. Una forma de distinguir la capa a la que pertenece la

neurona, consiste en fijarse en el origen de las señales que recibe a la entrada y el

destino de la señal de salida. Según el tipo de conexión, se distinguen las redes

feedforward y las redes feedforward/feedback [10],[11].

Mecanismo de Aprendizaje. El aprendizaje es el proceso por el cual una red

neuronal modifica sus pesos en respuesta a una información de entrada. Los cambios

que se producen durante el proceso de aprendizaje se reducen a la destrucción,

modificación y creación de conexiones entre las neuronas. La creación de una nueva

conexión implica que el peso de la misma pasa a tener un valor distinto de cero, una

conexión se destruye cuando su peso es cero. Se puede afirmar que el proceso de

aprendizaje ha finalizado (la red ha aprendido) cuando los valores de los pesos

permanecen estables es decir que la diferencial de los pesos con respecto al tiempo

es cero 0

t

wij

Un criterio para diferenciar las reglas de aprendizaje se basa en considerar si la red

puede aprender durante su funcionamiento habitual, o si el aprendizaje supone la

desconexión de la red. Otro criterio suele considerar dos tipos de reglas de

aprendizaje: las de aprendizaje supervisado y las correspondientes a un aprendizaje

no supervisado. Estas reglas dan pie a una de las clasificaciones que se realizan de

las RNA:

1) Redes neuronales con aprendizaje supervisado y redes neuronales con

aprendizaje no supervisado. La diferencia fundamental entre ambos tipos

estriba en la existencia o no de un agente externo (supervisor) que controle el

aprendizaje de la red.

2) Redes con Aprendizaje Supervisado. El proceso de aprendizaje se realiza

mediante un entrenamiento controlado por un agente externo (supervisor,

maestro) que determina la respuesta que debería generar la red a partir de una

entrada determinada. El supervisor comprueba la salida de la red y en el caso

de que ésta no coincida con la deseada, se procederá a modificar los pesos de



19

las conexiones, con el fin de conseguir que la salida se aproxime a la deseada.

Se consideran tres formas de llevar a cabo este tipo de aprendizaje:

• Aprendizaje por corrección de error: Consiste en ajustar los pesos en función de la

diferencia entre los valores deseados y los obtenidos en la salida de la red; es decir,

en función del error.

• Aprendizaje por refuerzo: Se basa en la idea de no indicar durante el entrenamiento

exactamente la salida que se desea que proporcione la red ante una determinada

entrada. La función del supervisor se reduce a indicar mediante una señal de refuerzo

si la salida obtenida en la red se ajusta a la deseada (éxito=+1 o fracaso=-1), y en

función de ello se ajustan los pesos basándose en un mecanismo de probabilidad.

• Aprendizaje estocástico: Este tipo de aprendizaje consiste básicamente en realizar

cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar

su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

Redes con Aprendizaje No Supervisado. Estas redes no requieren influencia externa

para ajustar los pesos de las conexiones entre neuronas. La red no recibe ninguna

información por parte del entorno que le indique si la salida generada es o no correcta,

así que existen varias posibilidades en cuanto a la interpretación de la salida de estas

redes.

El tipo de aprendizaje implementado en esta aplicación es supervisado por medio de

la diferencia de la salida esperada y la salida proporcionada por la dinámica de la red,

como se realiza este aprendizaje, lo veremos más adelante.

1.3 REGLAS DE APRENDIZAJE

El algoritmo backpropagation para redes multicapa realiza su labor de actualización de

pesos y ganancias con base en el error medio cuadrático, esta red trabaja bajo

aprendizaje supervisado y por tanto necesita un set de entrenamiento que le describa

cada salida y su valor de la salida esperado de la siguiente forma

QQ tptptp ,,.....,,,, 2211 (1.1)



20

Donde Qp es una entrada a la red y Qt es la correspondiente salida deseada para el

sistema. Este algoritmo debe de ajustar los parámetros de la red para minimizar el

error medio cuadrático, para realizar el proceso de aprendizaje debemos definir la

topología de la red, objetivos y funciones de activación requeridas en cada capa.

Figura 1.4 Red De Tres Capas

Para poder iniciar el entrenamiento se le presenta a la red un patrón de entrenamiento

el cual tiene n componente.

np

p

p

P

2

1

(1.2)

Este se transmite por cada uno de los componentes de la primera capa como se

muestra en la figura (1.4) dando como respuesta un valor descrito en la ecuación (1.3)

n

i

jiijj bpwn1

(1.3)

Donde:

ijw Peso que une la componente i de la entrada con la neurona j de primera capa

oculta.



21

ip Componente i del vector p que contiene el patrón de entrenamiento de n

componentes.

jb Ganancia de la neurona j en la capa oculta.

Cada una de las neuronas nos entrega una salida ja

n

i

jiijj bpwfa1

(1.4)

Recuérdese que f es la función de activación. Las salidas ja son las entradas a los

pesos de la conexión de la siguiente neurona por lo que este comportamiento esta

dado por la ecuación (1.5)

m

j

kjkj

s

k bawn1

(1.5)

Podemos observar que la red produce una última salida.

s

k

ss

k nfa (1.6)

La salida de la red de cada neurona s

ka se compara con la salida deseada kt para

calcular el error en cada unidad de salida (1.7)

s

kkk at (1.7)

El error debido a cada patrón de entrada p propagado esta dado por (1.8) donde esta

ecuación describe el error medio cuadrático para cada patrón de entrada. Este

proceso se repite para cada uno de los patrones de entrenamiento, para un proceso

de aprendizaje exitoso el objetivo del algoritmo es actualizar todos los pesos y

ganancias de la red minimizando el error medio cuadrático total descrito en (1.9)

s

k

kep1

22

2

1 (1.8)

r

p

epe1

22 (1.9)

La condición requerida para realizar la actualización de la matriz de pesos utilizando el

algoritmo del gradiente descendiente en el algoritmo es:



22

2

1 epWW kk (1.10)

El gradiente negativo de 2ep se denomina como 2ep y se calcula como la derivada

del error respecto a todos los pesos de la red. En la capa de salida el gradiente

negativo del error con respecto a los pesos es:

s

kj

s

ks

kk

s

k

s

kks

kj

s

kj W

aatat

WW

ep

1

22

2

1 (1.11)

Haciendo las reducciones y simplificaciones de los términos que están involucrados

obtenemos:

j

s

k

ss

kks

kj

anfatW

ep

'

2

(1.12)

Como se observa en la ecuación (1.12), las funciones de transferencia utilizadas en

este tipo de redes deben de ser continuas para que su derivada exista en todo el

intervalo. Los términos del error para cada neurona de la capa oculta están dados por

la ecuación (1.13)

s

kj

s

kjj Wnf ' (1.13)

Luego de encontrar el valor del gradiente del error se procede a actualizar los pesos

de todas las capas empezando por la de salida. En esta capa la actualización de

pesos y ganancias está dada por (1.14) (1.15)

s

kkjkj tWtW 2)()1( (1.14)

s

kkk tbtb 2)()1( (1.15)

Donde es la constante de aprendizaje que varía de 0 y 1 dependiendo de las

características del problema a solucionar.

En resumen existen diversos tipos de redes y métodos de aprendizaje. En particular,

el tipo de red descrito en los parámetros anteriores que acabamos de ver es uno de

los más aplicados para solución de problemas por su gran versatilidad para algunos

procesos ingenieriles. Existen muchas ramas dentro del ámbito ingenieril, la

implementación de nuevas técnicas para la creación y mejora de tecnología son muy



23

competitivas, solo las mejores y más sencillas de elaborar dependiendo del problema

nos ayudaran a resolver problemas reales. En este trabajo daremos una opción para

un problema real que afecta gran parte de la población mundial el cual es la Diabetes,

implementando este tipo de técnicas analizaremos y estudiaremos el comportamiento

de estas técnicas en este problema para dar alternativas de tratamiento.

CAPITULO II TECNICAS APLICADAS

2.1 REDES NEURONALES DIFERENCIALES

Como hemos visto en el capitulo anterior la topología de las redes, sus funciones de

transferencia y su método de aprendizaje tienen un orden especifico. Este tipo de

redes neuronales diferenciales (RND), tiene las mismas características que las antes

vistas, las cuales son las salidas de las redes y que en este caso son denominadas

estados del sistema agrupados en un vector, pesos de los cuales su cambio involucra

el aprendizaje, funciones de transferencia y la entrada del sistema, los cuales se

describirán como funciona cada uno y cuál es su objetivo.

Existen muchos tipos de redes neuronales los cuales se aplican a diferentes procesos

dependiendo de sus características. En este trabajo empleamos modelos biológicos

los cuales tienen la característica de no ser lineales. Por consiguiente emplearemos

redes neuronales diferenciales, la función básica de las redes neuronales diferenciales

es tomando un sistema de comparación disminuir el error lo más cercano a cero

mediante la corrección de sus pesos, en el transcurso de su aprendizaje el cual debe

de ser muy corto dependiendo del sistema que se quiera identificar. La estructura de la

red debe de ser con las mismas características del modelo o sistema que se quiera

identificar preferentemente y a criterio del programador.

2.1.1 IDENTIFICACION

La aproximación clásica relacionada con el control de la dinámica de un proceso,

demanda el conocimiento del modelo así como de todos los parámetros envueltos en



24

la descripción del mismo. Por tanto un sistema no lineal a identificar tiene las

características de tener una entrada, unos estados y ambos dependientes del tiempo,

este tipo de sistemas puede ser representado por la ecuación (2.1)

mnux

tuxfx

m

t

n

t

ttt

,,

,, (2.1)

Utilizando la técnica de redes neuronales diferenciales (RND) se utiliza la estructura

de identificador de la forma siguiente

ttttttt uxWxWxAx ˆˆˆˆ ,2,1 (2.2)

Donde:

ˆ n

tx Son los estados del sistema de la red neuronal

q

tu Es la entrada a la red y al modelo

W kn

t1,

Es la matriz de pesos de la red

rn

t2, W Es la matriz de pesos de entrada

nxnA Es la matriz de Hurtwistz, respectivamente las funciones vectoriales

k : ˆ tx Es la función de transferencia para la red

: ˆsrtx Es la función de transferencia de la entrada

tu Es la entrada al sistema neuronal

El vector formado por la función de transferencia k : ˆ tx lo obtenemos mediante la

siguiente expresión:

i

xb

iti ceax ii 1

1 (2.3)

La matriz : ˆsrtx está determinada por la siguiente expresión:

ij

xb

ijtij ceax p pp

ij

1

1 (2.4)



25

La red mencionada se puede clasificar como tipo Hopfield por que las funciones de

transferencia , son determinadas como funciones sigmoidales. Estas funciones

satisfacen las condiciones descritas en la ecuación (2.5) (figura 2.1)

2

2~~

,~~

tt

T

ttt

T

tt

T

tt

T

ttt

T

tt

T

t

T

tt

T

tt

T

tt

T

t

uxCxuxZxu

uDuu

xCxxZxD

(2.5)

ttt xx ˆ: (2.6)

Donde

ttt

ttt

xx

xx

ˆ~

:~

ˆ:~ (2.7)

Y CZDCZD ,,,,, son constantes positivas

Figura 2.1 Satisfacción De Las Condiciones

La entrada se asume como el control y lo podemos describir como:

uut 2

(2.8)

Donde existen dos posibilidades: la primera se considera que es una función de

entrada, y la segunda que es tomada como acción de control uuu tt ,

suponiendo que es continúo.



26

2.1.1.1 LEYES DE APRENDIZAJE

La forma de aprendizaje de este tipo de redes RND es basándose en los pesos la

ecuación (2.9) describe las leyes de aprendizaje

inicialessCondicioneWW

xuPKW

xPKW

T

t

T

ttt

T

ttt

0,20,1

2,2

1,1

,

ˆ

ˆ

(2.9)

Donde 1K y

2K son matrices definidas positivas, P Es la matriz de solución de la

ecuación de Riccati donde la ecuación es (2.10)

0 QPRPPAPAT (2.10)

Se obtendrá una solución positiva P al resolver la ecuación (2.10). En esta ecuación

la matriz A , es una matriz estable, R , Q son matrices definidas positivas para dar

una mejor aproximación de la solución. Cabe mencionar que la asignación de estas

matrices se determinara mediante prueba y error, al igual que la matriz A

dependiendo de los parámetros del sistema que se requiere que la red aprenda

t Sera descrito como el error producido por la RND y el sistema de referencia (2.11)

ttt xx ˆ: (2.11)

La figura 2.2 describe la topología de este tipo de redes



27

Figura 2.2 Topología De Una RND

El diagrama a bloques de la figura 2.3 muestra el proceso de la identificación de

estados implementando una RND a un sistema no lineal que satisfaga las condiciones

de observabilidad y controlabilidad [18]. En este diagrama se observa que los estados

y los estados identificados conforme pase el tiempo serán semejantes y el error

disminuirá. Esto permite asegurar que la red aprendió y el bloque de RND será

semejante al bloque de la PLANTA siempre y cuando se use la misma entrada para

ambos sistemas



28

Figura 2.3 Diagrama De Identificación

2.1.2 OBSERVADOR CON REDES NEURONALES DIFERENCIALES

A) OBSERVADORES DE ESTADO

Para los sistemas a los que se han diseñado las teorías antes mencionadas, se

supuso que todas las variables de estado estaban disponibles para su realimentación.

Sin embargo, en la práctica, no todas las variables están disponibles para su

realimentación. Entonces, es necesario estimar las variables de estado que no están

disponibles. Es importante señalar que debemos evitar diferenciar una variable de

estado para generar otra. Existen métodos para estimar las variables de estado que

no se miden sin un proceso de diferenciación. La estimación de semejantes variables

de estado por lo general se denomina observación. Un dispositivo (o un programa de

computadora) que estima u observa las variables de estado se llama observador de

estado o simplemente observador. Si el observador de estado capta todas las

variables del sistema, sin importar si algunas están disponibles para una medición

directa, se denomina observador de estado de orden completo. Hay ocasiones en las

que un observador no es necesario por ejemplo en las que solo se requiere de la

observación de variables de estado que no se miden, pero no de aquellas que también

se miden directamente



29

Observador de estado. Un observador de estado estima las variables de estado con

base en las mediciones de las variables de salida y de control. Aquí tiene una función

importante el concepto de observabilidad. Como veremos más adelante, los

observadores de estado pueden diseñarse si y sólo si satisface la condición de

observabilidad.

Consideramos un sistema definido mediante:

Cxy

Buxx

: (2.12)

El estado x se aproxima mediante el estado x̂ del modelo dinámico que representa al

observador de estado

xCyKeBuxx ˆˆ:ˆ (2.13)

Nótese que el observador de estado tiene y y u como entradas y x como salida. El

último término del segundo miembro de esta ecuación, es un término de corrección

que contiene la diferencia entre la salida y medida y la salida xCˆ estimada. La matriz

Ke funciona como una matriz de ponderación. El término de corrección vigila el estado

x̂ . Ante la presencia de una discrepancia entre las matrices A y B usadas en este

modelo y las del sistema real, la adición del término de corrección ayuda a reducir los

efectos producidos por la diferencia entre el modelo dinámico y el sistema real. La

siguiente figura 2.4 muestra el diagrama a bloques del sistema y el observador de

estado de orden completo.



30

Figura 2.4 Diagrama Del Observador

B) NEURO OBSERVADOR

Basado en las técnicas de Redes Neuronales Dinámicas (RND) , [8], se selecciona el

observador del sistema dado por la ecuación.

)ˆ()()ˆ()ˆ(ˆ:ˆ ,2,2,1,1 ttttttttttt xCyKuxVWxVWxx (2.14)

Donde las características de los elementos de esta ecuación son los mismos que los

descritos anteriormente en el identificador. Nótese que en el término de la función de

transferencia existe el elemento 21 ,VV Estas matrices se presentan debido a que en

esta estructura de red tiene capas ocultas, y que estas son determinadas en la

topografía de la red neuronal, el término )ˆ( tt xCyK que se encuentra en la ecuación

(2.14) es el termino del observador,

C) LEY DE APRENDIZAJE

La ley de aprendizaje para los pesos iW y

iV con 2,1i en el proceso de la

estimación usando la RND. Es representada por las ecuaciones diferenciales.



31

.1 *

1, 1 1 1,1,

1,

.1 *

2, 2 2 2,2,

2,

.2 *

1, 3 1, 1 1

.2 2 *

2, 4 2 2, 2

ˆ( )

ˆ ˆ( )

ˆ( ) ( )

ˆ ˆ( ) ( )

ˆ ˆ

ˆ ˆ( ) ,

t t t tt

T T

t t t t

t t t t tt

T T T

t t t t t t

T

t t t t

T

t t t t t

W s K PN G W W V x

C y Cx V x

W K PN G P W W V x u

C y Cx u V x

V K L V V x W x

V K u L W V V x x

(2.15)

Entonces, el error en la salida es

ttttt Cyye ,2ˆ (2.16)

Donde Es un escalar positivo pequeño. Es claro que las funciones sigmoidales

)()( y , comúnmente usadas en las redes neuronales, satisfacen las

condiciones de sector

Donde basados en el lema: para cualquier función vectorial diferible

nm RxRxg ,)( la cual satisface:

La condición de sector global, es decir, que existe una constante positiva gL tal que

2121 )()( xxLxgxg g (2.17)

Para cualquier ,, 21

nRxx

O la condición Lipschitz para el gradiente en forma global, es decir, existe una

constante positiva gL tal que para cualquier nRxx 21,

2121 )()( xxLxgxg g (2.18)

Así las siguientes propiedades para cualquier nRxx , son tomadas

2

2))()(()(

2))()(()(

xL

xxgxgxxg

xLxxgxgxxg

gT

g

T

(2.19)

Así las variables introducidas satisfacen

,,,, 21 y Son matrices definidas positivas.



32

Para generalizar la existencia global de la solución las siguientes condiciones deben

de ser satisfechas

2

3

2

1

22),,( tttt uCxCCtuxf (2.20)

1C y 2C constantes positivas. En vista de estos y tomando en cuenta que las

funciones sigmoidales son uniformemente acotadas.

Figura 2.5 Rnd En Observador

Por tanto la figura 2.5 nos muestra el diagrama a bloques del funcionamiento del neuro

observador, en donde solo se puede medir los elementos del segundo estado para

poder estimar los otros dos estados mediante un neuro observador diferencial, Este

tipo de sistemas son de gran ayuda cuando en un sistema se necesitan todos los

datos del sistema y solo podemos obtener los datos de uno de los estados del

sistema.

2.1.3 CONTROL CON REDES NEURONALES DIFERENCIALES



33

Se ha descrito las leyes de aprendizaje de las redes neuronales diferenciales para la

solución de identificación de los estados de un sistema no lineal, emplearemos un

identificador para realizar nuestro control, En este capítulo se procede a establecer las

características y propiedades del sistema con que se realizara este esquema de

control, se obtienen las condiciones de estabilidad de los estados en lazo cerrado y se

seleccionan las técnicas de control para el sistema. Responde al objetivo de

seguimiento de trayectoria se implementara un control el cual se describirá más

adelante

A) CONDICIONES DE CONTROL

Debido a que el control que se obtendrá en la retro alimentación de los estados

estimados, es no lineal y además no estacionario, es decir, ),ˆ( txuut , todo 0t

para todo estado estimado n

tx ˆ , se pide que satisfaga la desigualdad

2

10

22ˆ),ˆ( ttt xvvtxuu (2.21)

Donde 0v y 1v son constantes conocidas no negativas.

Uuuu tt ,2

12

022

(2.22)

Obtenemos la cota superior para )(u con respecto a los estados estimados

2

10

2ˆ)( txvvu (3.3)

Donde

1

2

11

0

2

1

2

00

:ˆ

:ˆ

vv

vv

(2.23)

Además suponemos que existen matrices definidas positivas

,,,,,,,, 03211 Qyf las cuales proporcionan la solución positiva a la ecuación

de Ricatti dada por 0 T

ii PP

B) DESCRIPCION DEL SISTEMA DE CONTROL



34

Sea el sistema no lineal dado por

mnux

tuxfx

m

t

n

t

ttt

,,

),,(.

(2.24)

Considerando como en el capítulo precedente la dinámica de la red es:

)()ˆ()ˆ(ˆ:ˆ,2,2,1,1 ttttttttt uxVWxVWxx (2.25)

Con todas sus características antes mencionadas el vector de funciones )( se

supone n-dimensional cuyos elementos se incrementan monótonamente. La

presentación de los )(i es de funciones sigmoidales. El vector n

tu es la acción

de control, el sistema no lineal puede ser descrito por

ttttttt

ttttttttt

uxxWxxW

tuxfuxWxWxx

))ˆ()(())ˆ()((

),,()()ˆ()ˆ(

,2,1

,2,1

.

(2.26)

Para el neurocontrol se empleara el método de seguimiento de trayectoria el cual se

describe tomando como base el identificador como se muestra en la ecuación (2.25)

Donde ( , , )t tf x u t es el error que siempre existirá entre el modelo y el identificador

con (RND), tomando en cuenta la realidad del identificador que este por muy cercano

que sea a la planta siempre existirá un error el cual la expresión se da como

)]()()([),,(),,( ,2,1 tttttttttt uxWxWxtuxftuxf

(2.27)

Por tanto se puede expresar como:

),,()]()()([),,( ,2,1 tuxfuxWxWxtuxf tttttttttt

(2.28)

Para poder reestructurar la ecuación y que esta se parezca a lo que conocemos y

poderla simplificar tenemos:

ttttttt

ttttttttt

uxxWxxW

tuxfuxWxWxx

))ˆ()(())ˆ()((

),,()()ˆ()ˆ(

,2,1

,2,1

.

(2.29)

Definiendo:

tttttttttt uxxWxxWtuxfd ))ˆ()(())ˆ()((),,( ,2,1

(2.30)

Por lo que nos queda



35

tttttttt duxWxWxx )ˆ()ˆ( ,2,1

.

(2.31)

Para la realización de un control primero debemos de ver que es lo que queremos que

se realice, es por ello que en este caso se designa una trayectoria a seguir

*.*( , )t tx x t

(2.32)

Una vez que se fijo la trayectoria podemos realizar la aproximación por medio de la

función del error dado por

*xxtt

(2.33)

Al sustituir (2.31) y (2.32) en (2.33) obtenemos

),*()ˆ()ˆ( ,2,1 txduxWxWx ttttttttt

(2.34)

Para poder simplificar se propone:

ttttt uxWuu ,2,2,1 )ˆ(

(2.35)

Por lo que una de las entradas podemos proponerlas como:

)ˆ(),()ˆ( ,1

**

,2,1 ttttttt xWAxtxxWu

(2.36)

Donde la diferencial del gradiente nos queda como:

tttt du ,2

(2.37)

En esta estructura podemos observar que la única incógnita es ,u t)(2, es por esto que

el control solo dependerá de la estructura que tome esta variable. Para poder

determinar esta estructura existen diferentes formas acontinuacion mencionamos

algunas de ellas:

-Compensación directa con estados derivativos

)ˆ()ˆ(,2 ttttt xxxxAu (2.38)

-Modos deslizantes

0)(1

,2 ksignkPu tt

(2.39)

-Control optimo local

tt PRu 1

,2 2 (2.40)



36

En la figura 2.6 se observa la estructura que presentara un control de seguimiento de

trayectoria

Figura 2.6 Diagrama De Control

En este tipo de sistema de control podemos observar que tanto a la planta como a la

RND tienen la misma entrada que en este caso es el control producido por la salida de

la planta, la salida de la RND y un sistema de referencia. El sistema de referencia es

de gran importancia para el programador ya que este es lo que el programador quiere

que haga la planta y la RND.

2.2 LOGICA DIFUSA

La lógica difusa es una extensión de la lógica multivalente, cuyos enunciados pueden

tener valores de verdad comprendidos entre el 0 (FALSO), y el 1 (CIERTO), de la

lógica clásica. Aplicando la lógica multivalente a la teoría de conjuntos, estableciendo

la posibilidad de que los elementos pudieran tener diferentes grados de pertenencia a

un conjunto. La denominada lógica difusa permite tratar información imprecisa, como



37

estatura media, temperatura baja o mucha fuerza, en términos de conjuntos difusos

(imprecisos en definitiva). Estos conjuntos difusos se combinan en reglas para definir

acciones [7].

La lógica difusa es una herramienta muy poderosa, técnica para la solución de

problemas, que ha adquirido recientemente una gran difusión especialmente en áreas

de control y toma de decisiones basado en referencias. Ha surgido como una

herramienta lucrativa para el control de subsistemas y procesos industriales

complejos, así como también para la electrónica de entretenimiento y hogar, sistemas

de diagnóstico y otros sistemas expertos.

Tradicionalmente las premisas lógicas tienen sólo dos extremos: o son completamente

ciertas o son totalmente falsas. En el mundo de la lógica difusa, las premisas lógicas

cambian en un rango a grado de verdad de 0 a 100 por ciento, esto permite acercar la

matemática al lenguaje impreciso del hombre común, ya que está repleto de términos

vagos como “poco”, “mucho”, “tibio”, etc. Estos términos se contraponen con el mundo

de las matemáticas convencionales y la lógica (en la teoría convencional de conjuntos,

un elemento es o no miembro, en lógica Booleana algo es cierto o es falso) así, bajo

estas condiciones, un término tal como "tibio" no tiene ningún sentido, y sólo tienen

sentido las premisas que se definen de forma precisa y cuantificable. Por ejemplo,

podría definirse tibio como una temperatura comprendida en el rango de 15 a 20

grados. Para la definición convencional 15 es tibio, pero 14.75 no es tibio. Esto que es

la consecuencia del modelo de lógica Booleana, hace que parezca verdaderamente

absurdo que esta temperatura sea totalmente excluida de la definición tibio por tan

sólo 0.25 grados.

Visto esto, el paradigma del "es" y "no es", es una seria limitación al construir sistemas

de control de procesos en tiempo real y sistemas expertos de control. Muchos

sistemas expertos tienen la habilidad de tomar decisiones basados en entradas vagas

o imprecisas. Esta habilidad es muy difícil o imposible de obtener empleando lógica

convencional, siendo en estos campos donde entra la lógica difusa.



38

A) FUNCIONES DE MEMBRECÍA.

La lógica difusa trabaja con las llamadas funciones difusas Figura. 2.7 las cuales

permiten efectuar condiciones como “si temperatura es caliente entonces velocidad de

ventilador es alta”. Para ello la lógica difusa introduce los conjuntos difusos que

relacionan subconjuntos dentro de un determinado universo de valores numéricos con

unas variables lingüísticas convertidas en función, estas son las nombradas funciones

difusas o funciones de membrecía. Ahora bien, esta técnica lo que hace es relacionar

primero si un determinado valor dentro de un gran conjunto, pertenece o no a un

determinado subconjunto de éste (lógica absoluta o booleana: cero si no pertenece o

uno si pertenece) y si no pertenece qué relación tendría en función de una

determinada variable lingüística o función de membrecía

Figura 2.7 Formas Comunes De Las Funciones De Membrecía

Las representaciones matemáticas de las funciones Gaussianas y triangulares tienen

definiciones que se aplican de acuerdo al tipo de sistema empleado. Algunos

ejemplos importantes de las funciones de membrecía son las funciones triangulares y

las gaussianas (Tabla 2.1).

Triangular Trapezoidal Gaussiana Pico FinoTriangular Trapezoidal Gaussiana Pico Fino

Tabla 2.1 Descripciones Matemáticas De Las Principales Funciones De Membrecía

Función Triangular Función Gaussiana



39

Se presentan las funciones triangulares derecha (“S”), izquierda (“Z”) y triangular (T)

normal. De la misma forma aparecen las expresiones matemáticas para las funciones

de tipo campana de Gauss.

Gráficamente las funciones de membrecía se representan por un trapezoide (análogo

a una señal analógica), a diferencia del rectángulo que define los conjuntos tajantes o

lógicos (análogos a una señal digital). El trapezoide se construye definiendo cuatro

puntos dentro del conjunto difuso. Figura. 2.8

Figura 2.8Muestra Del Trapezoide En Un Conjunto Difuso

Los puntos A y D definen los puntos que limitan el inicio y término de la función de

membrecía. Los puntos B y C definen el rango de valores para los que se tiene el más

alto grado de membrecía (1.0). En muchos casos se deseará que sea un sólo valor el

Izq.

otro

w

uc

cuSí

u

L

L

L

L

*5.01,0max

1

Izq.

otro

cu

cuSí

u

L

L

L

L 2

2

1exp

1

Con.

otrow

uc

cuSíw

cu

uC

*5.01,0max

*5.01,0max

Con.

2

2

1exp

cuuC

Der.

otro

cuSíw

cu

u

R

R

R

C

1

*5.01,0max

Der.

otro

cuSícu

u

L

R

R

R

1

2

1exp

2



40

que dé la máxima membrecía. En estos casos puede hacerse que el trapezoide

degenere en un triángulo haciendo que los puntos B y C sean idénticos.

B) REGLAS LÓGICAS.

Las reglas definen las relaciones entre los conjuntos difusos de entrada y salida. Las

reglas reflejan como una persona normalmente pensaría sobre el proceso o la

aplicación, tanto en forma lógica como lingüística [12]. Cada regla está en la forma de

un sentencia SI... ENTONCES. La porción correspondiente al SI, o antecedente,

especifica la condición que deberá cumplirse. La porción ENTONCES, o

consecuencia, especifica la consecuencia del antecedente. Una regla simple podría

escribirse como:

“Si temperatura es caliente entonces velocidad de ventilador es alta.”

C) ESTRUCTURA DE LA LÓGICA DIFUSA

Existen tres componentes básicos en un sistema de lógica difusa: el fusificador, la

base de reglas, y el defusificador.

Ya se ha considerado con algún detalle la componente de fusificador. Este es el

mecanismo de conversión de una entrada a valores difusos mediante la definición de

conjuntos difusos y sus funciones de membrecía. A este procedimiento se le denomina

fusificación.

También en forma breve se ha tocado la base de reglas. Aquí deberá extenderse la

discusión para explicar como se evalúan las reglas en el sistema de lógica difusa.

Finalmente, el defusificador, es el mecanismo empleado para convertir los valores

difusos de la salida a un valor tajante utilizable por la aplicación.

Recordando que para una determinada entrada pueden lograrse distintos grados de

membrecía, esto es, puede existir traslape. Esto es importante al evaluar las

sentencias en las reglas lógicas. Las reglas lógicas en un sistema de lógica difusa

tienen una cierta "fortaleza" o grado de influencia sobre el resultado de la salida final.



41

Esta fortaleza depende del grado de membrecía de sus variables de entrada y de

salida. Hay que pensar en la fortaleza de la regla como algo análogo al grado de

verdad de la propia regla: Entre más alta sea su fortaleza, en mayor grado la regla es

cierta. Como frecuentemente los valores de las funciones de entrada, caen en más de

una función de membrecía, es posible obtener reglas aparentemente contradictorias.

Cuando, debido al traslape, el valor proporcionado como entrada cae en las dos

funciones de membrecía “caliente” y “tibio”, dispararán ambas reglas. Durante la

evaluación de la regla, cada una de ellas se calculan basándose en sus antecedentes

y entonces asignando a la salida de la regla, utilizando el antecedente menos cierto o

más débil. Cuando más de una regla se aplica a una acción específica, la salida se

resuelve tomando la más fuerte o regla más verdadera:

Regla 1: si A y B entonces Z y X

Regla 2: si C y D entonces Z y Y

Fortaleza de Regla 1 = min(A,B)

Fortaleza de Regla 2 = min(C,D)

X = Fortaleza de Regla 1

Y = Fortaleza de Regla 2

Z = Salida = max (Fortaleza de Regla 1, Fortaleza de Regla 2 )

Z = max (min (A, B), min(C, D))

Z es el supremo, del máximo de la regla 1 y 2, X y Y es la probabilidad mas alta de la

regla 1 y 2 respectivamente. Si la temperatura es caliente y tibia entonces es la unión

del valor supremo de las dos reglas y la probabilidad más alta en la regla 1.

Aún cuando el proceso de evaluación de reglas asigna fortalezas a cada acción

específica, se requiere otra etapa más o "defusificación", por dos razones:

Primero, para descifrar el significado de acciones "vagas", tal como “la velocidad del

ventilador es alta”, empleando funciones de membrecía.

Segundo, para resolver conflictos entre dos acciones que compiten entre si tales como

"la velocidad es mediana" y "la velocidad en alta", que pudieran haber sido disparadas



42

bajo ciertas condiciones durante la evaluación de las reglas. El proceso de

defusificación Figura.2.9 emplea técnicas para resolver posibles conflictos y vaguedad

resultantes durante la evaluación de las reglas.

Figura 2.9 Método Del Centro Idee

La técnica usada es el "método del centro de gravedad", este consiste en varios

pasos. Inicialmente, se calcula el centroide (centro de gravedad), para cada función de

membrecía; entonces, las funciones de membrecía se limitan en su altura (ver figura)

dependiendo de la regla aplicada, y se evalúan las áreas trapezoidales de las

funciones de membrecía. Finalmente, se obtiene la salida defusificada mediante el

cálculo de un promedio ponderado de los puntos correspondientes a los centros de

gravedad y las áreas calculadas, siendo estas últimas los factores de peso o

ponderación:

R

i

ni

R

i

ni

q

icrisp

q

uuu

uuub

y

1

21

1

21

,,,

,,,

(2.41)

2.3 SISTEMAS NEURODIFUSOS

Re-definiendo las motivaciones para crear los sistemas híbridos neurodifusos,

podemos esbozar lo siguiente:



43

Los problemas a resolver con estas técnicas inteligentes tienen generalmente una

componente de datos empíricos y otra de conocimiento previo, que con los sistemas

neurodifusos pueden ser explotados a cabalidad mezclando los métodos cuantitativos

y cualitativos de las RNA y la LD respectivamente.

La expresión de conocimiento como una base de reglas lingüísticas, enriquecida o

surgida con o a través de datos cuantitativos, es una forma adecuada para hacer

realimentación al usuario humano de la forma como el sistema realiza las tareas.

Habiendo encontrado que la representación del conocimiento como un Sistema Difuso

se acerca a la forma de razonamiento humana, es natural intentar adicionar a estos

Sistemas capacidades de aprendizaje, de forma que se emule mejor tal

comportamiento o que se mejoren los resultados obtenidos con el sólo Sistema Difuso.

Habiendo definido las motivaciones para la realización de los Sistemas Híbridos

Neurodifusos, en el resto del trabajo se revisará la taxonomía de estos sistemas,

clasificándolos según la interacción de sus dos componentes (LD y RNA),

posteriormente se estudiarán algunos ejemplos de cada una de las divisiones,

tratando finalmente, mas en profundo, las arquitecturas de los Sistemas NF para el

modelamiento de sistemas, tarea que resulta obtener, tal como se verá, grandes

ventajas de las técnicas NF.

A) TAXONOMIA DE LOS SISTEMAS NEURODIFUSOS

Hasta hoy, pueden ser enmarcadas dentro de estas divisiones propuestas que se

basan en las diferentes combinaciones de las RNA y los Sistemas Difusos:

1. Modelos Concurrentes: Cuando la RNA y el Sistema Difuso trabajan juntos pero

sin interactuar el uno en el otro, es decir, ninguno determina las características del

otro.



44

Figura 2.10 Modelo Concurrente

2. Modelos Cooperativos: Cuando la RNA se usa para determinar los parámetros de

funcionamiento del Sistema Difuso. En estos modelos, se distinguen dos fases: la de

Entrenamiento y la de Funcionamiento. En la primera, la RNA interactúa con el

Sistema Difuso determinando los parámetros del mismo, mientras en la segunda, la

RNA desaparece dejando sólo el Sistema Difuso. Ejemplos de estos sistemas, son el

ASR (Agente de Sintonización neuronal por Refuerzo), la determinación de

parámetros de control de un sistema difuso, etc.

3. Modelos Híbridos: En esta aproximación, los sistemas difusos y de RNA, trabajan

juntos en una arquitectura homogénea que puede ser interpretada como una RNA con

parámetros difusos o como un Sistema Difuso con parámetros o funcionamiento

distribuidos

B) VENTAJAS DE LOS SISTEMAS NEURODIFUSOS

La estructura neurodifusa permite el uso de métodos cualitativos y cuantitativos en la

construcción de modelos, en la etapa de aprendizaje, en la de funcionamiento y en la



45

realimentación de conocimiento al usuario, permitiendo así, todo el conocimiento

disponible. Los métodos cuantitativos que se observan en el aprendizaje que los

sistemas neurodifusos pueden realizar a partir de datos del ambiente y en su forma

matemática de funcionamiento, mientras los métodos cualitativos se reflejan en el

sentido lingüístico que tiene la base de conocimiento de los sistemas difusos y que

genera una interacción bilateral sistema-hombre, permitiendo la introducción de

conocimiento previo al sistema y la realimentación del estado final del modelo en

forma de reglas expresadas lingüísticamente desde el sistema al hombre. Las otras

ventajas, son las conocidas ya ampliamente y que vienen heredadas de los sistemas

difusos y de las RNA, tales como interpretación lingüística, introducción de

conocimiento previo, autoaprendizaje, generalización, interpolación, etc.

C) LIMITACIONES DE LOS SISTEMAS NEURODIFUSOS

1. Curso de la dimensionalidad: Los sistemas difusos presentan el problema del

crecimiento exponencial del tamaño del modelo respecto al número de variables que

poseen, haciendo impráctico su uso para sistemas de más de cuatro dimensiones.

Este crecimiento se puede representar en dos formas diferentes: Tamaño del modelo:

El número de conjuntos multivariados de la entrada crece exponencialmente con el

número de entradas:

n

i

PiP1

donde P es el número de conjuntos multivariados, n

es el número de entradas y pi es el número de conjuntos difusos para la entrada

Como resultado de este crecimiento exponencial, el costo de cálculo y de

implementación crece en igual forma y la interpretabilidad se limita cada vez más. Y el

tamaño de la muestra requerido para el sistema

2. Calidad de los datos: Existen problemas asociados con la cantidad, distribución y

ruido en y de los datos. Si los datos están mal distribuidos, el aprendizaje puede no

ser muy bueno, presentando especialmente problemas de generalización de

interpolación si faltan muchos datos en cierta región. Este inconveniente es herencia



46

de los sistemas neuronales y puede ser superado interpolando los datos, haciendo un

tratamiento previo o buscando una representación adecuada de los mismos.

3. Conocimiento previo: En los sistemas neurodifusos es deseable tener el

conocimiento previo y confiable de un experto en el sistema, pues de otro modo, se

debe realizar un modelamiento por "Fuerza Bruta" exclusivamente a través de los

datos numéricos empíricos y existirán problemas al no haber descripción cualitativa

del sistema, a menos que se apliquen técnicas de minería de datos (descubrimiento

de conocimiento) a la base de conocimiento del sistema neurodifuso.

CAPITULO III MODELOS DE APLICACIÓN

ANALISIS DE OBSERVABILIDAD Y CONTROLABILIDAD

Los sistemas no lineales tienen diferentes características. Posiblemente dos de las

mas importantes son las propiedades de contolabilidad y observabilidad. En general

un sistema puede ser ni controlable ni observable, controlable y no observable, no

controlable y si observable, controlable y observable. Este ultimo tipo de sistemas son

de gran interés para nosotros, a un sistema que es controlable y observable podemos

aplicarle las técnicas antes mencionadas sin problema alguno.

Para poder saber si un sistema es controlable y observable debe de cumplir con los

teoremas de controlabilidad y observabilidad que a continuación se describen:

ANALISIS DE CONTROLABILIDAD

Sea un sistema de control no lineal

)(

)()(.

xhy

uxgxfx

(3.1)



47

Donde nx , u , f y

g son campos vectoriales suaves definidos en una

vecindad abierta en hu m , es un campo escalar suave significa kC como )(xh es

una función escalar analítica, el gradiente de h se define:

xd

dh

dx

dh

dx

dh

dx

dhdh

n

,......,,

21

(3.2)

La derivada de Lie de una función escalar h con respecto a un campo vectorial suave

f , es una derivada direccional definida como:

n

i

ii

xfdx

dhfdhLfh1

)(, (3.3)

Una derivada de Lie es también un campo escalar suave sobre n una derivada de

orden superior para cualquier número positivo k , se define inductivamente como:

hhLf

con

fhdLfhLfLfhLf kkk

0

11 ,)(

(3.4)

Por otro el corchete de Lie se define por:

gdx

dff

dx

dggf ,

(3.5)

Donde dx

dfy

dx

dg son matrices Jacobianas de rango nxn . El corchete de Lie puede ser

interpretado como una nueva dirección a lo largo de la cual puede moverse una

trayectoria de estado con una ley apropiada. Los corchetes sucesivos de Lie son

definidos por:



48

),(,),(

,,),(

,),(

),(

1

2

0

gadffgadf

gffgadf

gfgadf

ygadf

kk

(3.6)

En términos de derivadas y paréntesis de Lie, se define como matriz de controlabilidad

de un sistema:

),(,,,, 1 gadfgfgC n (3.7)

Si esta matriz es no singular el sistema enunciado satisface la condición de rango de

controlabilidad

ANALISIS DE OBSERVABILIDAD

Se consideran los criterios de observabilidad dado un sistema no lineal de una

entrada y varias salidas como:

),(

),(),(.

txhy

utxgtxfx

(3.8)

Donde

ux n ; Se selecciona los nuevos estados, dados por:

dt

txhdw

dt

txdhw

txhw

n

n

),(

),(

),(

1

2

1

(3.9)

Para estos estados se calcula la matriz de observabilidad del sistema la cual se

describe por:



49

nn w

w

xd

dw

xd

dw

dt

d

1

1

(3.10)

Si esta matriz es no singular el sistema enunciado satisface la condición de rango de

observabilidad

El modelo de Bergman satisface las condiciones de control habilidad y observabilidad

demostrado por [5], es por ello que podemos aplicarle un control y un observador

basado en (RND). Como este modelo demostró ser tanto controlable momo

observable da una mejor confianza paras técnicas de control y observación que

hemos visto

3.1 SISTEMAS BIOLOGICOS UTILIZADOS

A) DIABETES

El proceso para adquirir energía en el organismo humano, es debido a la síntesis de

los alimentos en glucosa y la asimilación de esta en las células por medio de la

insulina, la cual se produce en el páncreas. Este es el factor más importante en la

síntesis de alimentos, ya que sin este la glucosa no se asimilaría en las células []. Este

no es el único problema que puede presentarse, si no que las células del cuerpo no

respondan a la insulina que se produce y por tanto la glucosa se almacene en el

torrente sanguíneo provocando otras patologías consecuentes.

La acumulación de la glucosa en la sangre puede ocasionar varios problemas, como la

ceguera, insuficiencia renal o daños a los nervios. La glucosa en sangre alta puede

contribuir al desarrollo de enfermedades cardiovasculares. Por este motivo, la vida de

las personas que padecen esta enfermedad tienen la necesidad de llevar un control

con su forma de alimentación y su vida cotidiana ya no es normal.

B) TIPOS DE DIABETES



50

Hay dos tipos de diabetes. La diabetes tipo 1, que también se llama diabetes insulino-

dependiente, se diagnostica generalmente durante la infancia, en este tipo el páncreas

produce poca insulina o no la produce en lo absoluto, así que inyecciones diarias de

insulina son necesarias.

La forma más común es la diabetes tipo 2, que también se le llama diabetes no

dependiente de insulina. Aunque ésta generalmente se presenta en los adultos de

edad media, los adolecentes y los adultos jóvenes también están desarrollando este

tipo de enfermedad a una velocidad alarmante. Este padecimiento se desarrolla

cuando el cuerpo no produce suficiente insulina y, además, no utiliza la cantidad de

insulina disponible con eficiencia. Esta enfermedad se puede controlar mediante la

dieta y el ejercicio, sin embargo, algunas personas también necesitan medicamentos

orales o insulina para ayudar a controlar el azúcar en sangre. Los antecedentes

familiares son un factor de riesgo muy importante de tener diabetes tipo 2, al igual que

la obesidad y la falta de actividad física.

Hasta el día de hoy no existe una cura para la diabetes. Por lo tanto, el método de

cuidar la salud de personas afectadas por este desorden, es controlarlo: mantener los

niveles de glucosa en la sangre lo más cercanos posibles a los normales. Un buen

control puede ayudar enormemente a la prevención de complicaciones de la diabetes

relacionadas al corazón y al sistema circulatorio, los ojos, riñones y nervios. Un buen

control de los niveles de azúcar es posible mediante las siguientes medidas básicas:

una dieta planificada, actividad física, toma correcta de medicamentos, y chequeos

frecuentes del nivel de azúcar en la sangre al igual que la inyección de insulina para

evitar las complicaciones subsecuentes a esta enfermedad

C) MODELOS MATEMÁTICOS

Una forma de representación de la evolución de las concentraciones de glucosa en el

organismo humano es la implementación de modelos matemáticos que nos describen

el comportamiento de estas variables que necesitamos debido a que poder entrenar la

red se necesita tiempo y constante reestructuración de los parámetros seleccionados,



51

por esta razón y por cadencia de tecnología para la monitorización de las variables

que se necesitan empleamos modelos matemáticos que nos dan las representaciones

similares a los fenómenos en estudio. En este trabajo nos basamos en su

implementación, algunos de los modelos utilizados son;

Modelo de Mattei

2

323

00210322

211

)()(

)()(

)()(

xy

tgKxxKx

KKigxxKxxKx

tuKgxKxKx

rsh

fsh

sdgi

(3.11)

Donde 1x es la diferencia de la concentración de insulina en el plasma y 2x es la

diferencia de concentración de glucosa en el plasma; 3x es la diferencia de insulina

-kt

ru(t) y g (t) Be son las razones de inyección de insulina y glucosa externa

respectivamente, 0 0i y g son los valores básales de la concentración de insulina y

glucosa en el plasma. iK Es el reciproco de la constante de tiempo del decaimiento de

insulina, inversamente proporcional al tiempo de vida media gK coeficiente que

expresa la razón de insulina libre cuando el valor de glicemia es igual a uno hK es el

reciproco de la constante de tiempo, representando el retraso de infusión del dextrosa

y variación de la glicemia entre el coeficiente. 0K , expresa la razón de metabolización

de la glucosa cuando la insulinemia y glicemia son iguales a uno. sK coeficiente de

reducción del cambio de infusión de insulina con la variación del cambio del a

insulinemia. fK valor para el decremento de glicemia. dg constante introducida para

tomar en cuenta la reducción de insulina liberada durante la hipoglucemia.

Modelo de Bergman



52

2

13323

23212

1111

)()(

)/)(()(

xy

xpxpx

tGxxxpx

Vtuxnx

B

(3.12)

Donde 1x es la diferencia de la concentración de insulina en el plasma y 2x es la

diferencia de concentración de glucosa en el plasma; 3x es proporcional a la

concentración de insulina en el compartimiento remoto; -ktu(t) y P(t) Be son las

razones de infusión de insulina y glucosa externa respectivamente, B BI y G son los

valores básales de la concentración de insulina y glucosa en el plasma. 1V Es el

volumen de distribución de insulina y n es la fracción de la razón de eliminación de

insulina; 1 2 3,p p y p representan los parámetros del sistema.

Cabe mencionar que el modelo de Bergman describe el cuerpo en forma

compartamental, es decir la glucosa generada al momento de la ingesta de alimento

es un compartimento, y la insulina producida para metabolizar la glucosa es otro

compartimento y la insulina distribuida en el resto del cuerpo es un compartimento

remoto debido a la pequeña cantidad de esta distribuida en el organismo.

Estos modelos nos dan características del comportamiento de glucosa e insulina

durante la ingesta de alimentos, tomando relevancia en el modelo de Bergman el cual

proporciona una dinámica más completa de este fenómeno, características de las

ecuaciones diferenciales y estructura para la aplicación de las técnicas que

emplearemos, este modelo se convierte en el más apropiado para su estudio e

implementación de las técnicas de (RND).



53

CAPITULO IV METODOLOGIA Y RESULTADOS

En esta sección se describirán como se aplicaron las técnicas de estimación,

observación, lógica difusa, control basad en redes neuronales diferenciales las cuales

se aplicaron en el modelo de glucosa en sangre (modelo de Bergman).

4.1 IDENTIFICACION CON RND

4.1.1 DINAMICA DE GLUCOSA EN SANGRE (MODELO DE BERGMAN)

Para la realización de identificación del modelo de Bergman descrito en la ecuación

(3.12), se toma este modelo porque tiene las características que se necesitan para

este desarrollo. Las tres variables que describe este modelo son muy representativas

del sistema real de glucosa en sangre interpretada en forma de compartimentos. El

siguiente diagrama describe como se implementara la identificación.

Figura 4.1 Aplicación De RND Al Modelo De Bergman Para Su Identificación

La estructura que se implemento es la descrita en la ecuación (2.2). Esta ecuación

representa una red neuronal sin capas ocultas la cual es adecuada para el modelo que

emplearemos. Describiendo la ecuación 2.2 y la figura 4.1 obtendremos las

características del identificador empleado como se describe en la figura 4.2.



54

Figura 4.2 Diagrama De Ecuaciones Aplicadas

Como hemos visto son necesarias algunas constantes tanto en el modelo como en la

RND. En el modelo de Bergman nótese que la asignación de estas constantes son de

gran importancia, dado que controlan el comportamiento de las variables en su

evaluación.

Donde los valores de las constantes antes mencionadas en el modelo de Bergman

son determinadas por diferentes propiedades para la generación de la curva de

interacción glucosa e insulina cercana a los valores reales como se muestra en la

(Figura 4.4). Estas constantes son seleccionadas por el programador. Para el modelo

de Bergman las constantes son:

5.5n

1.0

11 p

1275 eIb

1.0

12 p



55

121 V

1000

13 p

35.4 eGb

Para la RND como se menciona anteriormente requiere de constantes de integración,

y una matriz A totalmente estable que actuara como anclaje para que la red no se

haga inestable en el periodo de aprendizaje, la matriz escogida es determinada por la

solución de la ecuación de Riccati (210), las constantes de integración son:

00091.000

00268.00

0007012.0

1222A

2500

0150

0015

65P

1954

8849

2

1

k

k

Estas constantes determinaran el aprendizaje de la RND el cual puede ser lento o

rápido y con un mayor error o menor por lo que la elección de estas constantes son

de gran importancia. Para la simulación se desarrollo el siguiente programa, el cual

indica la estructura principal de la interacción que existe entre el modelo que se

empleo en este caso el de la dinámica de glucosa y como el factor de aprendizaje está

determinado por el error al igual que la entrada que son las parámetros necesarios

para la realización del identificador.

La programación se realizo en la plataforma de Matlab dentro de simulink ya que es

una herramienta muy factible para simulación y herramientas de bloques como se

muestra a continuación



56

Figura 4.3 Estructura De Simulación Del Identificador Con Simulink

Realizando la sustitución de las constantes de la tala en la ecuación 3.12 en ua

evolución de 24 hr. Se obtiene una simulación del comportamiento de la glucosa-

insulina como se aprecia en la figura 4.4.

4.1.2 RESULTADOS

La RND entrega una señal parecida para cada variable debido a que esta se acopla,

en este proceso cuando el error sea mínimo y las señales de salida de la RND sean

similares a las entregadas por el modelo podemos afirmar que la RND ha aprendido.

Mediante la simulación del modelo de Bergman en Simulink se obtuvo la

representación grafica de la insulina, la glucosa, y la insulina en el compartimiento



57

remoto en un periodo de 24 hr. En esta simulación se supuso que se tendría una

ingesta de comida cada 6 hr, como se muestra en la figura 4.4

Figura 4.4 Simulacion Del Modelo De Bergman

En la graficas de la figura 4.4 se presentan las concentraciones de Glucosa,

concentraciones de insulina y las concentraciones de de insulina en el compartimiento

remoto. Estas concentraciones varían dependiendo la ingesta de alimento. Cabe

mencionar que estas graficas corresponden a un modelo matemático al cual

asignamos parámetros para obtener la representación del comportamiento de las

diferentes concentraciones antes mencionadas en cada ingesta las cuales aumentan y

disminuyen.



58

Figura. 4.5 Identificación De La Concentración De Glucosa

Primeramente al realizar una ingesta de comida los niveles de glucosa en sangre

aumenta y disminuye normalmente, la RND se adapta a este comportamiento. Esto lo

realiza conforme evolucione lo cual implica que se acoplara a la señal en este caso a

la grafica de glucosa, como se muestra en la figura 4.5 en donde se puede observar la

adaptación de la RND a la señal de concentración de insulina y que esta sin importar

los cambios considerables de concentraciones de glucosa la red se acopla a estos

cambios.



59

Figura. 4.6 Error Del Identificador De Glucosa

Los cambios de los niveles de concentraciones afectan a la RND de diferentes formas

en su aprendizaje, este depende de la diferenciación de ambas señales ya que

constantemente están evolucionando, la calidad de aprendizaje podemos apreciarla

mediante la grafica del error Figura 4.6. En ella se puede observar que en el primer

instante en que empezó la evolución el error es el de mayor magnitud y que este error

disminuye conforme se estabiliza la señal, también podemos observar que cuando

existe otra ingesta de comida las concentraciones aumentan bruscamente, esto

provoca una pequeña inestabilidad en la red neuronal muy pequeña y esta se

estabiliza rápidamente después de cada ingesta.



60

Figura. 4.7 Identificación De La Concentración De Insulina

Otra de las graficad que se encuentran descritas por el modelo es la concentración de

insulina producida por el páncreas. Esta es de menor magnitud puesto que es la

suficiente para metabolizar la glucosa y poderla convertir en energía. Al igual que la

dinámica de glucosa aumenta con respecto a cada ingesta de comida, el páncreas

también tiene que aumentar la concentración de insulina en cada ingesta para poder

metabolizar la glucosa y ambas puedan regresar a los valores normales de

concentración de glucosa e insulina en el torrente sanguíneo. Al igual que en la grafica

anterior la figura 4.7 nos muestra como la RND se acopla a la grafica de concentración

el pasar el tiempo de evolución del sistema.



61

Figura. 4.8 Error Del Identificador De Insulina

El comportamiento del aprendizaje se puede apreciar en la figura 4.8 que al igual que

en la concentración de glucosa disminulle o aumenta dependiendo de los cambios de

concentración de insulina.



62

Figura. 4.9 Identificación De La Concentración De Insulina En El Compartimiento

Remoto

En el comportamiento de insulina en el compartimiento remoto tiene la misma

característica que las dos graficas de concentraciones anteriores pero la

concentración de insulina es más baja por lo que podemos apreciar en la figura 4.9. La

RND también se acopla a la señal de concentración pero en el inicio nuevamente de la

ingesta de comida el error aumenta muy poco.



63

Figura. 4.10 Error Del Identificador De Insulina En El Compartimiento Remoto

En la figura 4.10 observe que al inicio de la evolución el error se decrementa

considerablemente y en cada seis horas el error aumenta apenas notoriamente por las

variables antes mencionadas

4.2 NEURO CONTROL


Para la implementación del control se describe la estructura del siguiente diagrama a

bloque figura 4.11, que describe como se genera la dinámica del sistema de control y

las variables que se necesitan para su desarrollo



64

Figura. 4.11 Diagrama A Bloques Del Control De Seguimiento De Trayectoria

La red empleada para el desarrollo de control es la descrita en la ecuación (3.6) La

diferencia es la entrada del sistema que cambiara por la descrita en la ecuación (3.12),

(3.21), en donde el análisis esta descrito en el capítulo 3

Para la realización del control se determinan los parámetros constantes propiamente

de la red neuronal empleada los cuales son:

00091.000

00268.00

0007012.0

1222A

2500

0150

0015

65P

195

89

2

1

k

k

265628

476625

695315

15R

Este control pide un sistema de referencia en el cual se basa para la realización de

nuestro control ),( * txt , este sistema de referencia es de gran importancia puesto que

nuestra red cambiara las señales de la planta a las señales del sistema de referencia,



65

por lo que este sistema de referencia básicamente será lo que el programador quiera

que realice la planta, el cual se en este caso de describe por:

5

23

22

21

10*2)(

)(

2.0)(

xux

xux

xux

Donde 1x es la diferencia de la concentración de insulina en el plasma a la que

queremos llegar y 2x es la diferencia de concentración de glucosa en el plasma a la

que se quiere llegar; 3x es proporcional a la concentración de insulina en el

compartimiento remoto que esperamos obtener. Por lo que en la siguiente grafica

figura 4.12 muestra la dinámica del sistema que emplearemos para este control

Figura. 4.12 Sistema De Referencia

Para la simulación se desarrollo el siguiente esquema de simulación, el cual indica la

estructura principal de la interacción que existe entre el modelo que emplearemos en

este caso el de la dinámica de glucosa. Como el factor de aprendizaje esta



66

determinado por el error al igual que la entrada la cual estará determinada por el

sistema de control que son las parámetros necesarios para la realización de nuestro

sistema

Para la realización del neurocontrol empleado

ttttt uxWuu ,2,2,1 )ˆ(

Donde la primera sección del control se utiliza como un compensador de la no

linealidad presente en la estructura de la RND .

)ˆ(),()ˆ( ,1

**

,2,1 ttttttt xWAxtxxWu

Y la segunda parte u2 se utiliza para alcanzar el seguimiento de la trayectoria

deseada ),( * txt , lo cual se obtiene de la elección de una función de Lyapunov

adecuada y su correspondiente prueba de estabilidad [4]:

)ˆ()ˆ(,2 ttttt xxxxAu

Se realizara la parte de programación en simulik como lo muestra la figura 4.13



67

Figura 4.13 Esquema De Simulación Del Neurocontrol

4.2.2 RESULTADOS

Mediante la realización del sistema de control por seguimiento de trayectoria la

entrada proporcionada por el sistema es el descrito en la figura 4.25, la cual muestra

que la entrada generada son dos variables con características diferentes, estas

entradas son tanto para el modelo como para la rede neuronal para la generación de

control de los estados.



68

Figura. 4.25 Control Aplicado Al Modelo Y A La RND

La simulación realizada del control para el modelo de Bergman esta mostrada en la

figura 4.26 la cual muestra la evolución de las variables de insulina y glucosa



69

Figura. 4.26 Modelo Controlado

Primeramente la dinámica de glucosa descrita en la figura 4.27 la cual muestra esta

evolución, nótese que la dinámica del modelo y de la RND, son semejantes pero

diferentes a la dinámica del modelo de Bergman original descrito anteriormente en el

identificador.



70

Figura. 4.27 Aprendizaje De La RND Por Medio Del Control

La figura 4.28 muestra que el error entre la RND y el modelo disminuye y aumenta en

distintos puntos esto es debido a los cambios de magnitud del sistema original y como

la red actúa para que este error en la dinámica de glucosa se aproxime a cero.



71

Figura. 4.28 Error De La RND Para La Glucosa Con El Control

Para la figura 4.29 la concentración de insulina para el modelo y la red nuevamente

muestra que son semejantes en la dinámica de control



72

Figura.4.29 Aprendizaje De La RND Por Medio Del Control

En la figura 4.30 podemos notar que el aumento y decremento del error de la

concentración de insulina pero en magnitud este sigue siendo mínimo como se aprecia

en la escala.



73

Figura. 4.30 Error De La Insulina En El Compartimiento Remoto Contra El

Sistema De Referencia

Como se menciono anteriormente para la realización del control basado en un sistema

de referencia el cual se describe su dinámica en la figura 4.22. Se determinara la

calidad del control diseñado mediante la comparación de cada una de las variables del

modelo con cada una de las del sistema de referencia.



74

Figura. 4.31 Seguimiento De La Planta Al Modelo De Referencia

La Figura. 4.31 se muestra la dinámica de la concentración de glucosa y el estado del

sistema de referencia que asemeja este estado, para esta dinámica nótese que son

semejantes estos dos estados.



75

Figura. 4.32 Error Del Seguimiento De La Concentración De Glucosa

Para la confirmación del funcionamiento del control la figura 4.32 podemos observar

las intervenciones del control mediante el erro de la concentración de glucosa y el

sistema de referencia, estas diferencias que se incrementan en algunos puntos estas

son pequeñas en magnitud y constantemente decrecen después de su incremento

para aproximarse a cero.



76

Figura. 4.33 Seguimiento De La Planta Al Modelo De Referencia

Para la concentración de insulina en la figura 4.33 podemos observar la dinámica de

este estado con su equivalente en el sistema de referencia se aprecia que estas

graficas son semejantes.



77

Figura. 4.34 Error Del Seguimiento De La Concentración De Glucosa

Para comprobarlo este control podemos apreciar en la figura 4.34 que el error al igual

que el anterior es pequeño e magnitud

4.3 NEURO OBSERVADOR CON (RND)


La aplicación de un observador para el modelo de Bergman se realizo basándose en

la ecuación 2.14, las siguientes condiciones. Estas condiciones se tomaron como un

individuo que padece de diabetes, por lo que en la realidad solo se cuentan con

medidores de glucosa, por lo que se diseño el observador para la glucosa y se

estimaran los otros dos estados

)ˆ()()ˆ()ˆ(ˆ:ˆ,2,2,1,1 ttttttttttt xCyKuxVWxVWxx

9100

040

002

A 150

891

2

1

k

k



78

7744.000

07133.10

002379.3

1.0P

010C

La realización de la simulación está en la plataforma de Simulink como se muestra en

la figura 4.35 la cual describe el procedimiento realizado en esquema de bloques.

Cabe mencionar que este tipo de redes tiene capas ocultas como se describe en la

ecuación principal del observador.

Figura..35 Esquema De Simulación De La Estructura Del Observador



79

En esta aplicación se considera que el modelo de Bergman tiene solo una salida

medible, la cual es la concentración de glucosa, esta única señal será introducida a la

RND (observador), al igual variables que la señal de entrada del modelo. El

observador tomara estas variables y estimara los otros dos estados faltantes del

modelo (concentración de insulina y concentración de insulina en el compartimiento

remoto).

4.3.2 RESULTADOS

Figura. 4.36 Observador De Glucosa

Mediante la simulación se obtuvo la grafica de la figura 4.36 la cual describe la

observación de la concentración de glucosa tanto del modelo como el de la red, se

puede observar que ambas graficas son similares al igual que en las aplicaciones

anteriores. La grafica de la figura 4.37 muestra el error entre ambas señales se



80

aprecia que el error es pequeño en magnitud aunque aumenta bruscamente en

algunos puntos pero nuevamente se decremento a cero.

Figura. 4.37 Error Del Observador

En la estimación realizada por el observador para la concentración de insulina se

representa en la figura 4.38 donde se comparan la concentración estimada y la

producida por el modelo se aprecia que la grafica de estimación de insulina es

parecida a la del modelo.



81

Figura. 4.38 Estimación De La Insulina

En la grafica de la figura 4.39 se muestra el error se puede apreciar que se aproxima a

cero pero tiene un error mayor que el obtenido en los identificadores, esto es porque el

observador no tiene contacto directo con este estado sino porque lo está

reconstruyendo a partir del estado medible que en este caso es el estado de la

concentración de glucosa y por concerniente el error tiende a aumentar y la estimación

es aproximada.



82

Figura. 4.39 Error Del Estimador De Insulina



83

Figura. 4.40 Estimación De Insulina En El Compartimiento Remoto

La Figura 4.40 demuestra que el identificador para la insulina en el compartimiento

remoto entra dentó de los rangos necesarios y el error tiende acero como se

demuestra en la Figura. 4.41

Figura. 4.41 Error Del Estimador De Insulina En El Compartimiento Remoto

4.4. SISTEMA NEURO DIFUSO


La implementación de este sistema se desarrollara para la posible solución de

suministro de insulina a personas con diabetes. Para la realización de la parte difusa

empleamos las siguientes características en Matlab en donde creamos un esquema

difuso como lo muestran las Figuras 4.44, 4.43, 4.42



84

Figura. 4.42 Representación A Bloques Del Esquema Difuso Con Dos Entradas Y

Una Salida

Dentro de esta estructura manejamos dos entradas las cuales nos la proporcionara

nuestra red neuronal. Una de esas entradas es la concentración de glucosa la cual la

dividimos en tres funciones de membrecía (baja, normal y alta) con diferentes grados

de pertenencia, estos grados de pertenencias dependen del experto el cual

determinara cuales son los valores de pertenencia adecuados, este experto puede ser

cualquiera que tenga los conocimientos dentro del fenómeno.

Figura. 4.43 Funciones De Membrecía Para La Concentración De Glucosa

Otra de las entradas que manejamos en la insulina producida por el páncreas la cual

también la dividimos en tres funciones de membrecía (baja, normal y alta) sus grados

de pertenencia también son determinadas por el experto.



85

Figura. 4.44 Funciones De Membrecía Para La Concentración De Insulina

Los paramentos de salida son determinados a las concentraciones de insulina que se

suministraran dependiendo de las entradas y de las reglas que se editaron

Figura. 4.45 Funciones De Membrecía Para El Suministro De Insulina

Para la determinación de niveles de concentraciones de insulina suministradas

depende de una serie de reglas que se describen en la tabla 4.1



86

Tabla 4.1 Reglas empleadas por el experto

Núm. Reglas

1 Si glucosa es normal y insulina es normal entonces salida es

cero

2 Si glucosa es baja y insulina es baja entonces salida es cero

3 Si glucosa es alta y insulina es baja entonces salida es alta

4 Si glucosa es alta y insulina es normal entonces salida es

moderado

5 Si glucosa es alta y insulina es alta entonces salida es cero

Figura 4.46 Diagrama Sistema Neuro Difuso



87

4.4.2 RESULTADOS

Figura. 4.47 Respuesta Del Infusor

Esta figura nos indica que dependiendo la concentración de glucosa será la respuesta

del infusor como se muestra en la figura y que estos niveles de suministro dependen

del experto

Figura. 4.48 Dinámica Del Infusor Y La Glucosa



88

11.1 CONCLUSIONES

El diseño del identificador basado en RND con la selección de las funciones de ajuste

de los pesos, fue adecuado para identificar los tres estados del modelo de Bergman

satisfactoriamente. La obtención de las variables de un sistema incierto con la

subsecuente reconstrucción de un modelo aproximado para tal sistema, generó un

diseño de una función de control que resuelve el problema de seguimiento de

trayectoria con un error muy pequeño.

Por otro lado, la aplicación del identificador para datos reales demuestra que no es

necesario ecuaciones que representen el fenómeno biológico y que estas técnicas

(identificación y control adaptable) puedan ser implementadas para la realización de

instrumentación de equipos de asistencia médica, incluyendo un posible

prediagnosticador de la dosificación de la insulina en sangre.

Con el diseño del observador para estados del modelo de Bergman, se consiguieron

estimar los estados restantes con un error dentro de los límites establecidos por las

sugerencias bibliográficas. Esto conllevo a la realización de un sistema neurodifuso

para el suministro de insulina mediante los criterios de un experto que utilizó las

variables reconstruidas por el estimador de estados basado en redes neuronales

diferenciales.

La recomendación promovida por esta tesis deriva en la posible implementación de

estas técnicas de control automático que aunque con poco desarrollo, pueden

aplicarse satisfactoriamente en el ámbito biológico para la creación de instrumental

que nos permita desarrollar más tecnología, como en el caso que manejamos en este

escrito que es la creación de un sistema neurodifuso para el suministro de insulina a

personas que padecen de Diabetes. En base a los resultados obtenidos, es posible

suponer que la aplicación de los algoritmos diseñados, pueden promover en los

pacientes que padecen diabetes a alcanzar una mejoría en sus niveles de glucosa que

a final de cuentas provoque un aumento en la calidad de vida del paciente diabético



89

BIBLIOGRAFIA

[1] Montgomerie, G. A., Nicholson, H., Biological Systems Modelling and Control. Peter

Peregrinus Ltd. 1979

[2] Khoo, M. C. K., Physiological Control Systems: Analysis, Simulation, and

Estimation. Metin Akay Ed. 2000

[3] Murano, D. A., Poznyak, A. S. Robust High-Gain DNN Observer for Nonlinear

Stochastic Continuos Time Systems.

[4] D. Bergman, Mt Sinai J M Pathogenesis and prediction of diabetes mellitus: lessons

from integrative physiology (ed McGraw Hill, 1982).

[5] Fonseca. H. M., Ortiz V. H., Cabrera A. I, Redes Neuronales Estocasticas

Aplicadas al Modelo Dinámico de Glucosa para Pacientes Diabeticos. XXVI SOMIB

Congreso Nacional De Ingeniería Biomédica, (CINVESTAV), México,. Noviembre

2003,

[6] Guyton, A. C., Tratado de Fisiología Médica.( McGraw Hill, 2001)

[7] Poznyak1 : A.S. Poznyak, E.N. Sanchez and Wen Yu. , 2001 Dynamic Neural

Networks for Nonlinear Control: Identification, State Estimation and Trajectory

Tracking. World Scientific, New Jersey, London, Singapore, Hong Kong.

[8] Poznyak : A. S. Poznyak, W. Yu, E. N. Sanchez, and J. P. Perez, Nov. 1999.

"Nonlinear adaptive trajectory tracking using dynamic neural networks," IEEE Trans.

Neural Networks, vol. 10, pp. 1402--1411,

[9] Chairez J., 2003. Control inteligente aplicado a incubadoras neonatales, Tesis

individual de licenciatura, Unidad Profesional Interdisciplinaria de Biotecnología,

México D.F..



90

[10] Dunn I, Heinzle E, Ingham J and Prenosil. 1992. Biological Reaction Engineering.

Ed. Verlagsgesellshaft. Pág. 263-273.

[11] Holland J, 1975, Adaptation in Natural and Artificial Systems, University of

Michigan Press, Pág. 211 p.

[12] Stein ocker, G. Difusa genetic programming — offline acquisition of difusa rules

using variable-length GAs. Master’s thesis, Johannes Kepler Universit¨at Linz, January

2002.

[13] Zimmermann, H.-J. Difusa Set Theory—and its Applications, second ed. Kluwer

Academic Publishers, Boston, 1991.

[14] Ward, Owen P. 1991 Biotecnología de la Fermentación. Acribia. [España].

[15] Schügerl, Karl. 1990 .Bioreaction Engineering. Vol. 2. John Wiley and Sons. [Great

Britain],

[16] McNeil, B. and Harvey, 1990 L.M., "Fermentation: a practical approach" En:

Laboratory Fermenters. IRL press. Oxford University,.

[17] Bailey, James E. 1986 Biochemical Engineering Fundamentals. Second edition.

McGraw-Hill. [Singapore],.



91

ANEXO I PONENCIAS EN EXTENSO EN FOROS NACIONALES



92



93



94



95

ANEXO II PONENCIAS EN EXTENSO EN FOROS INTERNACIONALES



96



97



98

observaciÓn y control neuroadaptable por …

Documents