red para el control de un sistema no lineal

7

Click here to load reader

Upload: oscar-duque-suarez

Post on 04-Aug-2015

13 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Red Para El Control de Un Sistema No Lineal

Aplicación de las Redes Neuronales para la Identificación de unSistema no lineal. Un Caso Práctico

Jesús Acosta* Josep Fernandez* Lenin Becerra**

*Departament d’Enginyeria de Sistemes, Automàtica i Informàtica Industrial.Universitat Politècnica de Catalunya. Barcelona, España.

{jacosta,ruzafa}@esaii.upc.es

** Depto. de Ingeniería ElectrónicaUniversidad Nacional Experimental Politécnica “Antonio José de Sucre” (UNEXPO). Barquisimeto, Venezuela.

[email protected]

Resumen

En el presente trabajo se obtuvieron y analizaronmodelos de un sistema de reacción continuo(hidrólisis del anhídrido acético) utilizando las redesneuronales (RN) con el fin de determinar si losmismos realmente presentan un comportamientodinámico que sea representantivo del proceso real.Se compararon tres métodos: el modelo matemático(MM) y dos modelos neuronales desarrollados bajoarquitecturas tipo feedforward: Redesperceptrónicas multicapas (RPM) y redes de baseradial. La formulación del MM se basó en el balancede materia para el anhídrido acético, el balance deenergía en el reactor y en la expresión de velocidadde reacción. En el patrón de entrenamiento de lasRN se incluyeron tiempos de retardo. Para las RPMse usó como método de aprendizaje el AlgoritmoLevenberg Marquardt. Todos los modelos obtenidosdescribieron adecuadamente el comportamientodinámico real del proceso. Sin embargo, los modelosneuronales dieron mejor aproximación que el MM, yentre ellos, el de base radial lo describió másacertadamente, por lo cual presenta una mayorcalidad en la identificación. Estos resultadospermitieron comprobar que las RN realmente poseenla habilidad para representar cualquier sistema nolineal, donde la mayoría de los métodos deidentificación clásicos no conducen a resultadosaceptables.

Palabras Claves: Inteligencia artificial, simulación,algoritmo Levenberg Marquardt, redes neuronales.

1 INTRODUCCIÓN

La aplicación de técnicas de control a sistemasdinámicos requieren de una representación quecaracterice el proceso físico, o sea, un modelomatemático del mismo. Esta representación

matemática puede obtenerse en forma estrictamenteteórica, lo que se denomina Modelado; así comotambién en forma empírica, mediante experimentossobre el sistema real, basándose en datos de entrada ysalida del proceso, llamado Identificación.

La principal ventaja del modelado de procesos, esque permite predecir el comportamiento dinámico yestático de los sistemas antes de construirlos ytambién se puede analizar el desempeño de uno exis-tente, con la intención de estudiar su comportamien-to. Además, sin exponer el proceso a daños, se puededeterminar que puede ocurrirle, simulando el modelocon una condición, entrada inusual o perturbación.

Para obtener los modelos existen diferentes técnicasde identificación de sistemas. Algunas de ellasrequieren medición completa del estado, pero suaplicabilidad se ve limitada ya que esto no siempre esposible, debido a la gran cantidad de no linealidadesy perturbaciones presentes en los procesos. Una grancantidad de los métodos clásicos no conducen aresultados aceptables, por lo tanto, puede ser algunasveces difícil de encontrar modelos matemáticosrepresentativos. Para obviar este problema esnecesario hacer uso de observadores ([1]; [2]; [3];[4]), lo que conlleva a un incremento en la dinámicadel sistema. Esto ha llevado a explorar otras técnicascon los cuales se puedan eliminar estosinconvenientes.

Las redes neuronales artificiales o simplemente redesneuronales, constituyen una de las áreas de lainteligencia artificial que ha despertado mayor interésen los últimos años y constituyen una herramientasumamente general para abordar una amplia clase deproblemas de identificación de sistemas dinámicos,como se conoce a través de trabajos realizados por[5]. En particular, este enfoque resulta muy ventajosocuando se trata de la identificación de sistemas nolineales (como es el caso de todos los procesos

Page 2: Red Para El Control de Un Sistema No Lineal

industriales), donde la mayoría de los métodosclásicos no conducen a resultados aceptables. Encambio, las redes neuronales son capaces de resolverproblemas cuya solución por otros métodosconvencionales resulta extremadamente difícil y/oinsatisfactoria.

El presente estudio tiene como objetivo la evaluaciónde las prestaciones de las redes neuronales para lamodelización de un sistema no lineal. En él seanaliza un caso práctico: “un sistema de reaccióncontinuo” y se obtienen modelos utilizando las redesneuronales artificiales para determinar si los mismosrealmente presentan un comportamiento dinámicoque sea representativo del proceso real, asimismo secomparan los resultados de diferentes alternativas demodelización.

2 DESCRIPCION DEL SISTEMA DEREACCIÓN CONTINUO

Para la presente investigación se tomó comoreferencia el sistema de reacción estudiado por [6], elcual es la Hidrólisis del Anhídrido Acético (ecuación(1)), debido a que su naturaleza cumple con todos losrequisitos establecidos: es una reacción simple yelemental, en presencia de un exceso de agua, sucinética se ajusta a una expresión de primer orden;asimismo, es una reacción química exotérmica. Susreactivos (anhídrido acético y agua), así como suproducto (ácido acético), son líquidos a presiónatmosférica y temperatura ambiente, condiciones alas cuales la reacción puede llevarse a cabocompletamente. Además, dicho estudio devela unagran cantidad de datos experimentales, los cualesfueron datos excelentes para el desarrollo de ésta.

COOHCHOHOCOCH 3223 2)( →+

Esta reacción química fue llevada a cabo en dossistemas diferentes, uno continuo y otro discontinuo.La instalación en este caso del sistema de reaccióncontinuo (Véase Figura 1), se realizó con lossiguientes elementos: a) Reactor continuo, recipientecilíndrico con una capacidad de 250 ml (beaker).Operó por rebose, los reactivos se alimentaronempleando un par de buretas de 50 ml, la mezclareaccionante se mantuvo homogénea con lautilización de un agitador magnético y el productoabandonó el reactor por medio de un canal colocadoen la parte superior del mismo (a nivel de lasuperficie del líquido), b) Termocupla, elementosensor de temperatura del medio reaccionante, susalida se conectó a un amplificador, con el fin derealizar las mediciones con mayor precisión, y c)Colector, recipiente rectangular empleado para larecolección del producto de la reacción.

Figura 1: Montaje para el Sistema de ReacciónContinuo

3 FORMULACIÓN DEL MODELOMATEMÁTICO

Se tomaron en cuenta las siguientes consideraciones:a) Las densidades de los reactivos y la del productopermanecen constantes, b) Las capacidadescaloríficas del medio reaccionante no varía con loscambios de temperatura y composición,adicionalmente Cv y Cp son aproximadamenteiguales, c) El calor de reacción es constante en elintervalo de temperaturas de operación, d) Lasentalpías de los reactivos se consideran constantes,pues la temperatura de alimentación no cambia, e) Latemperatura ambiente permanece constante, y f) Elflujo volumétrico del producto permanece constante.

a) Balance molar en estado dinámico para elreactivo limitante A.

dt

tdCVtCqtVrtq

PMA

ASAAA

A )()()()( =−−

ρ

donde: ρA: densidad del anhídrido acético, g/ml.PMA: peso molecular del anhídrido acético, g/mol.qA(t): flujo volumétrico del anhídrido acéticoalimentado, ml/seg.V: volumen del reactor, ml.rA(t): velocidad de reacción, mol/ml*segqS: flujo volumétrico del producto, ml/seg.CA(t): concentración del anhídrido acético, g/ml

b) Velocidad de reacción:

rA(t) = )()(/ tCeK AtRTE

o−

(1)

(2)

(3)

Page 3: Red Para El Control de Un Sistema No Lineal

c) Balance de energía en el reactor.

HrtrVtqHtqH AWWWAAA ∆−+ ).(.)(..)(.. ρρ

dt

tdTCVTtTCqTtTAU VrefPSS

)(..))((..))((. ρρ =−−−−

donde:HA: entalpía del anhídrido acético alimentado,Cal/gr.ρw: densidad del agua, g/ml.Hw: entalpía del agua alimentada, Cal/gr.qw(t): flujo volumétrico del agua, ml/seg.∆Hr: calor de reacción, Cal/mol consumido de A.U: coeficiente global de transferencia de calor,Cal/cm2

*ºK*segA: área de transferencia de calor, cm2ρ: densidad del medio reaccionante, g/cm3CP: capacidad calorífica del medio reaccionante apresión constante, Cal/g*ºK.Cv: capacidad calorífica del medio reaccionante avolumen constante, Cal/g*ºK.TS: temperatura ambiente, ºK.Tref: temperatura de referencia para el cálculo de lasentalpías, ºK.T(t): temperatura del medio reaccionante, ºK.

Luego de realizar un proceso de linealización yaplicando Transformada de Laplace se obtiene lasiguiente expresión:

CA(s) ∗+∗

=11

1

s

K

τQA(s) ∗

+∗−

11

2

s

K

τT(s)

T(s) ∗+∗

=12

3

s

K

τQA(s) ∗

+∗+

12

4

s

K

τQW(s)

∗+∗

−12

5

s

K

τCA(s)

donde: T(s): Temperatura del medio reaccionante en eldominio de LaplaceCA(s): Concentración del anhídrido acético en eldominio de Laplace.QA(s): Flujo volumétrico de anhídrido en el dominiode Laplace.QW(s): Flujo volumétrico del agua en el dominio deLaplace.K1,K2,K3,K4,K5: Ganancias

τ1,τ2: Constantes de tiempo

Personalizando el sistema usando los parámetrosoperacionales y sus propiedades físicas parradeterminar las constantes de tiempo y las ganancias,se obtiene el modelo matemático:

CA(s) ∗+∗

=1115

00508,0

sQA(s) ∗

+∗−−

1115

600,8

s

E T(s)

T(s) ∗+∗

=1031,270

74,19s

QA(s)

∗+∗

+1031,270

62,33

sQW(s) ∗

+∗−−

1031,270

)9,352.10(

sCA(s)

4 TOPOLOGÍA DE LA REDNEURONAL

Se entiende por topología la configuración física dela red, es decir, la manera en que estáninterconectados los elementos de procesamiento.Pueden agruparse en dos: a) Redes con topología“feedforward” y b) Redes con topología “withfeedback”. En las primeras, las comunicaciones vanen una sola dirección, de las neuronas de entradahacia las neuronas de salida, un ejemplo de este tipode topología son las redes tipo perceptrón y las redesde base radial. Y en las segundas, algunas neuronastienen sus salidas conectadas a las neuronas de lascapas previas, un ejemplo de estas se ve en las redesrecurrentes y las redes Hopfield.

En esta investigación los modelos neuronales sedesarrollaron bajo topología tipo feedforward: Redesperceptrónicas multicapas (RNPM) y redes de baseradial (RNBR), por ser las más populares yapropiadas para una gran variedad de problemas eningeniería, con entrenamiento supervisado usándosecomo método de aprendizaje el Algoritmo LevenbergMarquardt para el primer caso, una mejora al deretropropagación del error (Backpropagation) por lasventajas que éste presenta y porque se probó conotros algoritmos señalados por [7], tales como:Fletcher-Reeves (traincgf), Polak-Ribiére (traincgp),Powell-Beale (traincgb), BFGS (trainbfg) y un pasosecante (trainoss); pero éstos no convergieron tanrápidamente.

5 EXPERIMENTO, RESULTADOS YDISCUSION

El software utilizado estuvo conformado por lostoolboxes “Simulink” y “Redes Neuronales” deMatlab 5.2, el cual permite realizar simulaciones eimplementar una gran variedad de redes neuronalesfacilitando el proceso de investigación. En cuanto alhardware, se usó un computador PENTIUM 200MMX.En un principio, se obtuvieron los datos deentrenamiento, éstos debían de cubrir todo elconjunto de entradas esperado, es decir, todo el rangode frecuencia y amplitud de las señales de entrada alsistema. Debido a las características del sistema dereacción estudiado (sistema SISO, Single InputSingle Output), para poder ampliar el conjunto devalores que conforman el patrón de entrenamiento

(4)

(5)

(6)

(7)

(8)

Page 4: Red Para El Control de Un Sistema No Lineal

Figura 2: Identificación del proceso en estudio usando Redes Neuronales.

cuando se realizara la simulación, se incluyerontiempos de retardo de tal manera de obtenersuficientes datos históricos del proceso en estudiodebido a que sólo se poseían inicialmente treinta ytres pares de datos muestreados, es decir, unaentrada con su respectiva salida. Es por ello que elpatrón de entrenamiento estaba formado por nueveseñales: por la señal de entrada y sus respectivoscuatro retardos, y por cuatro retardos de la señal desalida. Mientras más retardos se agregan se obtieneuna mejor aproximación pero conlleva a un mayortiempo de entrenamiento, menos retardos implicadisminuir la calidad de identificación con unentrenamiento rápido. Cada señal contiene unamuestra de teinta y tres datos, lo que hace un total de297 datos muestreados para el patrón deentrenamiento. Esquemáticamente se observa en laFigura 2.

Los parámetros de aprendizaje para la RNPM usadosfueron los siguientes: a) Tasa de aprendizaje(ta)=0,005, b) Ciclos de entrenamiento(epochs)=1000, c) Mínimo gradiente =1e-20. Enrelación a la RNBR fue el Spread (Difusión de lafunción de base radial) establecido por defecto en 1.Para ambas redes el error medio cuadrático (mse)final fue de 0,001.

Acerca del dimensionamiento de la topología de estetipo de redes, se indica que no existe una teoría quedefina a ciencia cierta el número de capas de la red yel número de neuronas en cada capa; esto se haceusando pruebas por ensayo y error. En el caso de lasRNPM, se utilizaron tres capas para definir eldimensionamiento de la red: una de entrada, unaoculta y otra de salida; y se obtuvo la mejor

combinación de neuronas por capa para el algoritmode entrenamiento seleccionado, la cual arrojó ser unared con nueve neuronas en la capa de entrada, diezneuronas en la capa oculta y una neurona en la capade salida. En cambio en las RNBR, se utilizaron doscapas para definir el dimensionamiento de la red: unaentrada y otra de salida; el software utilizado diseñaredes de éste tipo de dos capas y adiciona neuronasen la capa entrada de la red hasta encontrar laespecificación del mse ó alcanzar el máximo númerode neuronas, es así como se obtuvo la mejorcombinación de neuronas por capa, la cual arrojóser una red con dieciocho neuronas en la capa entraday una neurona en la capa de salida. En la Tabla 2, sepresentan los resultados obtenidos en el proceso deentrenamiento.

Las funciones de activación utilizadas sondiferenciables no lineales (tales como tangentesigmoidal “tansig” para RNPM y base radial“radbas” para RNBR) y lineal (purelin). Después derealizar diferentes pruebas resultó conveniente tantopara la capa de entrada como para la oculta de laRNPM usar tansig y para la capa de salida purelin.En cambio para la RNBR, la capa entrada usó radbasy la capa de salida purelin, en este tipo de redneuronal Matlab fija el tipo de función de activación.Al usar la función tansig ó radbas los datos sonescalados (normalizados) para reducir la velocidad deentrenamiento; en cambio en la salida se usa lafunción purelin y los datos de salida no setransforman. En la tabla 1 se muestran las funcionesmatemáticas generales que se aplican a una RNBR,en donde: ni = N° de neurona (1:N), Pr = Vector deentrada (1:n), w = pesos RNBR , θ = pesos nodolineal, b = bias, )k(y =salida predicha por la red.

PROCESO (Sistema Real)

REDNEURONAL

u (k) y (k)

Σ-

+

e (k)

Z-1

Z-1

Z-1

Z-1

Z-1

Z-1

Z-1

Z-1

Page 5: Red Para El Control de Un Sistema No Lineal

Confluencia ( ) bpwnn

r

2riri ⋅−= ∑

Función de Activación (Transferencia) ai = radbas(ni) = exp (-ni2)

Función de Salida de Nodo Lineal i

N

iik ay θ⋅= ∑

Tabla 1: Funciones matemáticas generales que se aplican en una RNBR.

Modelo mseobtenido

Tiempo(seg)

Combinaciónóptima de neuronas

por capasRNPM 0,000995496 79,70 09 10 01RNBR 0,000011559 2,86 18 01

Tabla 2: Resultados del entrenamiento de las redes neuronales.

MODELO DESVIACIONMatemático < 1,5%

Neuronal Perceptrónico Multicapa (NPM) < 0,40%Neuronal de Base Radial (NBR) < 0,05%

Tabla 3: Desviación en % entre los modelos con respecto al proceso real

La asignación de los pesos de las neuronas y sesgosfue asignado automáticamente en ambos casos por elsoftware Matlab.

De los resultados de la Tabla 2 se puede indicar losiguiente:� La RNPM obtenida para este problema presentó

mayor número de capas que la RNBR. Laprimera estuvo conformada por tres capas, encambio la otra estuvo constituida por dos capas.

� Para la RNPM, un mayor número de neuronas enla capa escondida (oculta) aportó mejoresresultados en este estudio, lo cual en ciertamedida no da cabida a la regla práctica señaladapor [8], de que: el número de neuronas de lacapa oculta se puede seleccionaraproximadamente igual a la mitad de lasneuronas de la capa de entrada. Esto puede serdebido a las funciones de activación utlizadas, esdecir, tanto para la capa de entrada como para laoculta se usó tansig y para la capa de salidapurelin .

� Tal como lo señaló [9], cuando se inicia elentrenamiento de una RNPM y ésta no converge,se debe comenzar a aumentar el número deneuronas por capas, hasta que se llegue a lacombinación óptima con el sistema. Estasituación se dio en el experimento.

� Tal como lo afirma [7], la RNBR necesitómucho menos tiempo que la RNPM para sudiseño. Esto es debido en cierto modo a que la

RNBR estuvo constituida por un menor númerode capas: una con dieciocho neuronas (capa deentrada) y otra con una neurona (capa de salida).

� La RNBR presenta un menor error mediocuadrático que la RNPM, por lo cual debepresentar una mayor calidad de identificación.

En la Tabla 3 se muestra el porcentaje de desviaciónentre los modelos obtenidos con respecto al procesoreal. En él se observa que los modelos neuronalespresentan menores variaciones que el modelomatemático, esto no significa, que la obtención de unmodelo matemático no es instrumento válido paraobtener una aproximación a un sistema, sino que eneste caso, las redes neuronales se ajustan mejor alcomportamiento dinámico del sistema en estudio.Dicha desviación en porcentaje (%) para cada tipode modelo e instante de tiempo fue calculadamediante las siguientes expresiones matemáticas:

Desviación (%) = ((Tmodi – Texpi)/Texpi) * 100 (7)Desviación (%) = ((Trnpmi – Texpi)/Texpi) * 100 (8)Desviación (%) = ((Trnbri – Texpi)/Texpi) * 100 (9)

donde:Tmodi: Temperatura del modelo matemático en elinstante de tiempo i.Trnpmi: Temperatura de la red neuronalperceptrónica multicapa (ó de la red neuronal de baseradial) en el instante de tiempo i.

Page 6: Red Para El Control de Un Sistema No Lineal

Figura 3: Comparación del proceso real con los modelos obtenidos

Trnbri :Temperatura de la red neuronal base radial enel instante de tiempo i.Texpi : Temperatura experimental en el instante detiempo i.

Todos los modelos obtenidos describieronadecuadamente el comportamiento dinámico real delproceso. Sin embargo, los modelos neuronales dieronuna mejor aproximación que el modelo matemático,y entre ellos, el de la RNBR lo describió másacertadamente (% de desviación inferior a 0,05), porlo cual presenta una mayor calidad en laidentificación (Figura 3).

6 CONCLUSIONES Y TRABAJOSFUTUROS

De los resultados del presente estudio se desprendenlas siguientes conclusiones:� La Hidrólisis del anhídrido acético, permitió

realizar de manera sencilla, el seguimiento delcomportamiento del sistema de reacción, ya quees una reacción exotérmica, homogénea en fase

líquida, que puede llevarse a cabocompletamente en condiciones de temperaturaambiente y presión atmosférica. Su cinética seajusta a una expresión de primer orden.

� La aplicación de simulación para el sistemacontinuo describió el comportamiento dinámicodel mismo, a través de los cambios deconcentración del anhídrido acético y latemperatura del medio reaccionante. Fuediseñada en el Toolbox Simulink del softwareMatlab a partir del modelo matemático.

� Las redes neuronales seleccionadas contopología feedforward (Red PerceptrónicaMulticapa y Red de Base Radial), así como losalgoritmos de entrenamiento implementadospara cada caso, permitieron realizarexitosamente ésta investigación.

� El uso de tiempos de retardos, permitió ampliarel conjunto de valores que conformaron el patrónde entrenamiento cuando se realizó la simulaciónde las redes neuronales. En otras palabras, tuvocomo objeto obtener suficientes datos históricosdel proceso en estudio, debido a que sólo seposeen inicialmente treinta y tres pares de datos

27

28

29

30

31

32

33

34

35

0 60 120

180

240

300

360

420

480

540

600

660

720

780

840

900

960

Tiempo (se g )

Tem

pera

tura

(ºC

)

Experimental Modelo Matemático

Modelo Neuronal RPM Modelo Neuronal RBR

Page 7: Red Para El Control de Un Sistema No Lineal

muestreados. El patrón de entrenamiento seconformó por nueve señales, lo que dió lugar a297 datos muestreados.

� El método Levenberg Marquardt convergió másrápidamente que otros algoritmos, tales como:Fletcher-Reeves (traincgf), Polak-Ribiére(traincgp), Powell-Beale (traincgb), BFGS(trainbfg) y un paso secante (trainoss); y por eso,además de las ventajas que éste presenta, seseleccionó como algoritmo para entrenar laRNPM.

� El método Levenberg Marquardt no presentóninguna ventaja evidente sobre el de base radial,esto se debe a su mayor complejidad.

� Tanto el modelo matemático formulado para elsistema de reacción continuo como los modelosneuronales, describieron adecuadamente sucomportamiento dinámico real. Sin embargo, losmodelos neuronales dieron una mejoraproximación que el modelo matemático.

� Entre los modelos neuronales el de base radialdescribió más acertadamente el comportamientodinámico real, por lo cual presenta una mayorcalidad en la identificación.

En resumen, se puede señalar que los modelosneuronales realmente presentan un comportamientodinámico representativo del proceso real. Estaventaja es aplicable tanto a modelos lineales como ano lineales, ya que es una habilidad de éstasrepresentar cualquier función lineal o no entre unadata de entrada y una de salida.

Como trabajo futuro se piensa realizar:� La aplicación de las redes neuronales con

topología “with feedback” (entre ellas redesrecurrentes y redes de Hopfield), para laidentificación del mismo proceso en estudio, conel objeto de observar si aportan mejoresresultados que las redes con topologíafeedforward (Redes perceptrónicas multicapas yredes de base radial).

Referencias

[1] Anstrom, K. J. And Wittenmark, B., (1995)Adaptive Control, Addison Wesley.

[2] Franklin, G. et al. (1994) Digital Control ofDynamic Systems, Addison Wesley.

[3] Ioannou, P. And Sun, J., (1996) Robust AdaptiveControl, Prentice Hall.

[4] Mosca, E. (1995) Optimal Predictive andAdaptive Control, Prentice Hall.

[5] Narendra, Kumpati et al. (1990) “Identificationand Control of Dynamical Systems using NeuralNetworks”, IEEE Transactions on NeuronalNetworks, Vol. 1, Nº 1, pp. 4-27.

[6] Suárez, J. Y Lucena, M (1998) Estudio de laEstabilidad de un Sistema de Reacción mediantesimulación dinámica. Universidad NacionalExperimental Politécnica “Antonio José de Sucre”(UNEXPO), Departamento de Ingeniería Química.Barquisimeto, Venezuela.

[7] Demuth, H. and Beale, M. (1997) NeuralNetwork Toolbox for Use with MALTLAB: User´sGuide Version 3.0, U.S.A., The MathWorks, Inc.

[8] Aguado, A. y Otros (1998) “Identificación desistemas dinámicos no lineales mediante redesneuronales”, Instituto de Cibernética, Matemática yFísica de la Habana-Universidad Autónoma deQuerétaro de México, III Congreso de la AsociaciónColombiana de Automática, Colombia.

[9] Angulo, F. y Delgado, A. (1998) “Identificaciónde sistemas dinámicos no lineales con redesneuronales recurrentes”, Universidad Nacional deColombia, III Congreso de la AsociaciónColombiana de Automática, Colombia.