el modelo de espacio-estado - ehu.eus · 4.1. introducci on tal y como hemos ... y r 2 pero...

42
Cap´ ıtulo 4 El Modelo de Espacio-Estado 4.1. Introducci´ on Tal y como hemos visto en la lecci´ on anterior el punto de vista cl´ asico en la Teor´ ıa de Control consiste en estudiar las propiedades de los sistemas a partir de su comportamiento entrada salida. La teor´ ıa moderna de control pone el ´ enfasis en el concepto de estado del sistema. En una primera aproximaci´ on el estado de un sistema en un instante dado es el valor de unas variables internas del sistema (en ocasiones ficticias y no accesibles) que describen, a lo largo del tiempo, la evoluci´ on del mismo. Antes de proceder a una definici´on formal del concepto de estado, de un sistema un ejemplo puede servir de ilustraci´on. Ejemplo 4.1 Supongamos que la funci´ on de transferencia de un sistema es ˆ ypsq ˆ upsq ˆ gpsq“ 1 ` s 1 ` 2s ` 5s 2 (4.1) de modo que p1 ` 2s ` 5s 2 q ˆ ypsq“p1 ` sq ˆ upsq. 57

Upload: doanphuc

Post on 19-Aug-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

Capıtulo 4

El Modelo de Espacio-Estado

4.1. Introduccion

Tal y como hemos visto en la leccion anterior el punto de vista clasico en laTeorıa de Control consiste en estudiar las propiedades de los sistemas a partir desu comportamiento entrada salida. La teorıa moderna de control pone el enfasis enel concepto de estado del sistema. En una primera aproximacion el estado de unsistema en un instante dado es el valor de unas variables internas del sistema (enocasiones ficticias y no accesibles) que describen, a lo largo del tiempo, la evoluciondel mismo.

Antes de proceder a una definicion formal del concepto de estado, de un sistemaun ejemplo puede servir de ilustracion.

Ejemplo 4.1 Supongamos que la funcion de transferencia de un sistema es

ypsqupsq “ gpsq “ 1` s

1` 2s` 5s2(4.1)

de modo que

p1` 2s` 5s2qypsq “ p1` squpsq.

57

58 El modelo de espacio-estado

Usando la transformada de Laplace inversa podemos escribir las ecuaciones del sis-tema en el dominio del tiempo suponiendo el sistema en reposo en t “ 0:

5:yptq ` 2 9yptq ` yptq “ 9uptq ` uptq (4.2)

Definiendo: x1ptq “ yptq, x2ptq “ 9yptq ´ 1

5uptq, la ecuacion (4.2) es equivalente al

siguiente conjunto de sistemas; uno de ecuaciones diferenciales y otro de ecuacionesalgebraicas:

$’&’%

9x1ptq “ x2ptq ` 1

5uptq

9x2ptq “ ´1

5x1ptq ´ 2

5x2ptq ` 3

25uptq

, (4.3)

yptq “ x1ptq ““1 0

‰ „x1ptqx2ptq

. (4.4)

En efecto,

9x1ptq “ 9yptq “ x2ptq ` 1

5uptq,

y

9x2ptq “ :yptq ´ 1

59uptq “ ´2

59yptq ´ 1

5yptq ` 1

5uptq “

“ 1

5x1ptq ´ 2

5x2ptq ´ 2

25uptq ` 1

5uptq “

“ ´1

5x1ptq ´ 2

5x2ptq ` 3

25uptq

Este sistema algebraico-diferencial tiene una unica solucion una vez fijadas unascondiciones iniciales para x1ptq y x2ptq. Al vector (funcion vectorial)

xptq “„x1ptqx2ptq

se le llama vector de estados del sistema, mientras que las funciones vectoriales(en este caso escalares) yptq y uptq son, como siempre, las salidas y entradas delsistema. Si tomamos transformadas de Laplace de los sistemas (4.3) y (4.4) con lacondicion inicial x1p0q “ x2p0q “ 0, la relacion entre las transformadas de Laplacede yptq y uptq es la funcion de transferencia gpsq de (4.1). Por lo tanto, el sistemaformado por las ecuaciones (4.3) y (4.4) es un modelo cuyas soluciones tienen elmismo comportamiento entrada salida que el sistema original. Este modelo es, engeneral, no unico y se llama modelo de espacio-estado del sistema (4.1).

4.2 El modelo de Espacio-Estado. Formalismo 59

4.2. El modelo de Espacio-Estado. Formalismo

Segun Rosenbrock “es mas facil distinguir un sistema dinamico que definirlo”([13]). Se han propuesto varias definiciones formales de “sistema”, todas ellas bus-cando un modelo para el mismo concepto. Algunas referencias son: [4], [6], [10] or[14]; sin olvidar, por supuesto que formalismos similares se han usado desde hace mu-cho tiempo en la teorıa de sistemas dinamicos (sin controles ni salidas). Seguiremosaquı algunas ideas de [9] y [15].

En vez de presentar una definicion formal vamos a introducir la terminologıa ylas relaciones que se necesitan entre distintos elementos constitutivos de los sistemasde control cuando se utiliza el modelo de espacio-estado. Algunas de ellas ya fueronpresentadas en el Capıtulo 1. Ahora las introducimos con mas detalle. En este tipode sistemas estan presentes los siguientes elementos:

Un conjunto tiempo. Un sistema dinamico evoluciona con el tiempo y, por lotanto, las variables que describen el comportamiento del sistema son funciones deltiempo. Con cada sistema dinamico hay un conjunto tiempo asociado a el T Ă Rque contiene todos los valores de t en los que pueden ser evaluadas las variables.Este conjunto T puede ser continuo como en los ejemplos 2.4, 2.8 o el de la Seccion2.5.3 en los que T “ r0,8q, o discreto; i.e. T consiste de puntos aislados de R;e.g. T “ Z o T “ N como en el ejemplo de la Seccion 2.5.2. Por conveniencianotacional escribiremos rt0, t1q en vez de T X rt0, t1q para referirnos al intervalo (enT ) tt P T |t0 ď t ă t1u siempre que el conjunto tiempo T subyacente sea claro.

Unas variables externas. Son las que describen las interacciones del sistemacon el mundo exterior. Es el disenador del modelo quien debe determinar cuales sonlas variables significativas que intervienen en el problema. Es habitual (aunque nosiempre evidente) dividir las variables en una familia u “ puiq de entradas y otrade salidas y “ pyiq. Las entradas son las variables que representan la influencia delmundo exterior en el sistema fısico. Pueden ser de diferentes tipos; por ejemplo,entradas que se pueden utilizar para tener algun control sobre el sistema (controles)o sobre las que no se puede influir como perturbaciones. En el Ejemplo 2.8 carro-pendulo la entrada con la que se pretende controlar el pendulo invertido es la fuerzahorizontal ejercida sobre el carro (βuptq en la notacion usada allı).

Las salidas son las variables con las que el sistema actua sobre el mundo exterior.Tambien las hay de distintos tipos; algunas de ellas sirven para medir lo que sucede enel sistema, sobre otras se quiere tener control. Ası las salidas medibles en el Ejemplo2.4 de la suspension del coche son el desplazamiento del chasis y sus velocidad, ylas salidas en el Ejemplo 2.8 del carro-pendulo son el desplazamiento del carro rptqdesde una posicion de referencia dada y el angulo del pendulo θptq teniendo comoobjetivo que este angulo sea 0. Para el sistema en tiempo discreto del Ejemplo 2.5.2

60 El modelo de espacio-estado

esta claro que la entrada es la desviacion del gasto publico Gptq mientras que hay dostipos de salidas: unas que se pueden medir (el consumo C˚ptq, las inversiones I˚ptqy el PIB P ˚ptq) cuya desviaciaciones de unos valores objetivo se quieren controlar.

En un sistema dinamico debe estar claro el conjunto U donde las entradas to-man sus valores y el conjunto Y donde lo hacen las salidas. Ası en el Ejemplo 2.8podrıamos tomar U “ R, Y “ R2 pero tambien, quiza, ciertos subconjuntos de R yR2, respectivamente. Supondremos que los valores admisibles de las entradas estanen un conjunto determinado de una vez por todas y que, por consiguiente, no cambiacon el tiempo.

El sımbolo U lo usaremos para el conjunto de las funciones de entrada o decontrol: up¨q : T Ñ U . Por lo general seran funciones continuas, o continuas atrozos; suficentemente generales como para que podamos usar la teorıa matematicabasica de existencia de soluciones sin tener que prestar demasiada atencion a losdetalles.

De forma similar Y se usara para denotar el conjunto de las funciones de salidaadmisibles: yp¨q : T Ñ Y .

El estado interno. Las variables de estado describen los procesos que tienenlugar en el interior del sistema y sirven para modelizarlos. Al igual que las entradasy salidas, evolucionan con el tiempo y para cada valor de t P T , xptq representarael valor de la variable de estado en el instante t. Sencillamente diremos que xptq esel estado del sistema en el instante t. El conjunto de estados; es decir, el conjuntodonde toman valores los estados, lo denotamos con X de modo que la variable deestados es una funcion xp¨q : T Ñ X. Requeriremos que xp¨q cumpla las siguientespropiedades basicas:

(I) El estado actual del sistema y la funcion de control elegida determinan losfuturos estados del sistema. Con mas precision: dado el estado xpt0q “ x0 delsistema en el instante t0 P T y una funcion de control up¨q P U , la evoluciondel estado del sistema xptq P X queda completamente determinada para todot en algun intervalo de tiempo de T que comienza en t0. Este intervalo detiempo puede verse como el “intervalo de existencia” de la funcion (tambienllamada trayectoria) xp¨q que comienza en x0 en el instante t0 bajo la accionde la funcion de control up¨q. Lo representaremos como Tt0,x0,up¨q.

(II) Dado xpt0q “ x0 en el instante t0 P T , el estado xptq en cualquier instanteposterior t P T (t ě t0) solo depende de los valores upsq para s P rt0, tq. Ası,en el instante t, el estado xptq no esta influenciado por los valores presentey futuros de la funcion de control upsq, s ě t, ni por los controles pasadosanteriores a t0; es decir, por upsq para s ă t0. .

4.2 El modelo de Espacio-Estado. Formalismo 61

(III) Los valores de las salidas en el instante t estan determinados completamentepor los valores de las entradas, uptq, y estados, xptq, en t. En otras palabras,las entradas antiguas solo actuan sobre las salidas presentes a traves de losefectos acumulados en el estado presente.

Estos requerimientos aseguran el principio de causalidad de los sistemas de con-trol. Si miramos las salidas yptq como el “efecto” de las “causas” (=entradas) pasa-das, entonces uptq representa la causa en el instante t y el estado xptq acumula latotalidad de las “causas” pasadas.

Las condiciones (I), (II) y (III) permiten introducir dos funciones fundamentales:

La funcion de transicion de estados. De acuerdo con (I) y (II) el estado delsistema a lo largo del tiempo (tambien llamado trayectoria) puede describirse poruna aplicacion ψ llamada funcion de transicion de estados definida como sigue:

xptq “ ψpt; t0, x0, up¨qq, t P Tt0,x0,up¨q.

Realmente, por (II), ψpt; t0, x0, up¨qq solo depende de la restriccion de up¨q a rt0, tq. Enla mayorıa de los casos, esta aplicacion viene definida implıcitamente por las ecua-ciones que definen el sistema. Si estas son ecuaciones diferenciales o en diferenciascomo en todos los ejemplos del Capıtulo 2, entonces se debe resolver un problema decondiciones iniciales con xpt0q “ x0 y un control up¨q dado para conseguir la funcionψpt; t0, x0, up¨qq, t P Tt0,x0,up¨q, que es la solucion del sistema xptq.

La funcion de salida. Debido a (III) la salida del sistema esta determinada encada instante de tiempo t por el control y el estado en este instante:

yptq “ ηpt, xptq, uptqq.Esta funcion η recibe el nombre de funcion de salida.

En el Ejemplo 4.1, la funcion de transicion de estados es la unica solucion delsistema (4.2) que cumple la condicion inicial que se establezca. En concreto, sixpt0q “ x0, up¨q es una funcion continua en el intervalo rt0, t1s,

A “„

0 1´15 ´25

y b “

„15325

entonces la funcion de transicion de estados serıa

ψpt; t0, x0, up¨qq “ eApt´t0qx0 `ż t

t0

eApt´sqbupsqds, t P rt0, t1s.

Y la de salidas:yptq “ ηppt, xptq, uptqq “ “

1 0‰xptq,

62 El modelo de espacio-estado

que, en este caso, no tiene una depencia explıcita de t y de u.

En este ejemplo, Tt0,x0,up¨q “ rt0, t1s, y no se ve la dependencia del periodo deexistencia de la trayectoria respecto de las condiciones iniciales y la funcion decontrol. Este otro ejemplo lo ilustra mejor.

Ejemplo 4.2 Consideremos el problema de condiciones iniciales

9xptq “ xptq2 ` uptq, xpt0q “ x0 (4.5)

donde T “ R y x0 P X “ R. Supongamos que el control es constante pero arbitrariouptq “ a para todo t P R. Separando las variables e integrando obtenemos:

arctan

ˆx?a

˙´ arctan

ˆx0

?a

˙“ ?apt´ t0q.

Poniendo cpx0, aq “ arctan

ˆx0

?a

˙tenemos que la solucion de (4.5) es

xptq “ ?a tanp?apt´ t0q ` cpx0, aqq, t ě 0.

Ahora bien, como tanp˘π2q “ ˘8, resulta que x “explota”para t´t0 “ 1?a

´˘π

2´ cpx0, aq

¯.

En consecuencia

Tt0,x0,up¨q “ˆt0 ´ π2` cpx0, aq?

a, t0 ` π2´ cpx0, aq?

a

˙,

en el que se ve la dependencia del periodo de existencia de la solucion respecto delas condiciones iniciales y los controles.

Hay sistemas de control de lo mas variados, presentamos algunos de ellos:

1. Sistemas diferenciales: Son los sistemas en los que la funcion de transicionde estados es la solucion de un Problema de Condiciones Iniciales (P.C.I.). Loselementos definitorios son:

(i) T Ă R es un intervalo abierto.

(ii) U Ă Rm, Y Ă Rp y X Ă Rn abiertos.

(iii) Supondremos en todo lo que sigue que U es el conjunto de las funcionescontinuas o continuas a trozos.

4.2 El modelo de Espacio-Estado. Formalismo 63

(iv) xptq “ ψpt; t0, x0, up¨qq es la unica solucion del P.C.I.1

"9xptq “ fpt, xptq, uptqq, t ě t0, t P Txpt0q “ x0 (4.6)

(v) η : T ˆX ˆ U Ñ Y es continua.

2. Sistemas recursivos o en diferencias finitas: En estos sistemas la funcionde transicion de estados tambien es la solucion de un Problema de Condicio-nes Iniciales pero de sistemas dados por ecuaciones en recurrencias (tambienllamados en diferencias finitas):

(i) T “ N o Z.

(ii) U,X, Y conjuntos no vacıos

(iii) xptq “ ψpt; t0, x0, up¨qq es la unica solucion del sistema en diferenciasfinitas

xpt` 1q “ fpt, xptq, uptqqcon la condicion inicial xpt0q “ x0 con t0 P T , x0 P X y t ě t0.

(iv) La funcion de salidas es cualquier tipo de aplicacion η : T ˆX ˆU Ñ Y .

3. Sistemas Lineales: Un sistema es lineal si:

(i) U , U , X, Y son espacios vectoriales sobre K (un cuerpo).

(ii) Las aplicaciones

ψpt; t0, ¨, ¨q : X ˆ U Ñ Xpx0, up¨qq Ñ ψpt; t0, x0, up¨qq

ηpt, ¨, ¨q : X ˆ U Ñ Ypxptq, uptqq Ñ ηpt, xptq, uptqq

(4.7)

son lineales para todo t, t0 P T , t ě t0.

En particular, dado que ψpt; t0, ¨, ¨q es lineal,

ψpt; t0, 0X , 0Uq “ 0X , t, t0 P T , t ě t0 (4.8)

Tambien, por ser ψ y η lineales:

ψ

˜t; t0,

kÿ

i“1

λix0i ,

kÿ

i“1

λiuip¨q¸“

kÿ

i“1

λiψpt; t0, x0i , uip¨qq, (4.9)

1Existen varios teorema de existencia y unicidad de soluciones para sistemas diferenciales conuna condicion inicial en los que gpt, xq “ fpt, x, uptqq no es continua respecto de t. El Teorema deCaratheodory ([9, Sec. 2.1.2]) es nuestra referencia principal en este curso.

64 El modelo de espacio-estado

y

η

˜t,

kÿ

i“1

λixiptq,kÿ

i“1

λiuiptq¸“

kÿ

i“1

λiηpt, xiptq, uiptqq. (4.10)

Estas ecuaciones expresan el principio de superposicion para los estados y las salidas:la salida de una suma de estados y entradas es la suma de las salidas de cada uno delos estados y entradas. Como caso especial obtenemos el principio de descomposicion:

ψpt; t0, x0, up¨qq “ ψpt; t0, x0, 0Uq ` ψpt; t0, 0X , up¨qq,

que muestra que las trayectorias de los sistemas lineales se descomponen en una sumade dos terminos: un movimiento libre: tÑ ψpt; t0, x0, 0Uq que depende exclusivamen-te del estado inicial del sistema x0; y un movimiento forzado: t Ñ ψpt; t0, 0X , up¨qqque depende solo de la entrada o control up¨q. Y en relacion con estos dos tipos demovimientos tenemos los siguientes casos especiales de (4.9): si ponemos uip¨q “ 0Uentonces obtenemos la ley de superposicion para el movimiento libre

ψ

˜t; t0,

kÿ

i“1

λix0i ,

kÿ

i“1

λi0U

¸“

kÿ

i“1

λiψpt; t0, x0i , 0Uq; (4.11)

y si ponemos x0i “ 0X obtenemos la ley de superposicion del movimiento forzado

ψ

˜t; t0, 0x,

kÿ

i“1

λiuip¨q¸“

kÿ

i“1

λiψpt; t0, 0X , uip¨qq. (4.12)

Los mismos conceptos pueden aplicarse a las salidas del sistema y en tal caso ha-blarıamos de los principios de descomposicion y superposicion para los movimientoslibre y forzado respecto a las salidas. O, mejor, de la respuesta del sistema al movi-miento libre (o control cero) y de la respuesta del sistema al movimiento forzado (oal estado inicial cero), respectivamente.

En dimension finita, los sistemas diferenciales y en diferencias finitas estan de-finidos a partir de sistemas de ecuaciones lineales:

Sistemas Diferenciales Sistemas en Diferencias"9xptq “ Aptqxptq `Bptquptqyptq “ Cptqxptq `Dptquptq

"xpt` 1q “ Aptqxptq `Bptquptqyptq “ Cptqxptq `Dptquptq

(4.13)

Es decir, los estados son soluciones de problemas de condiciones iniciales de sistemasde ecuaciones diferenciales (o en diferencias finitas) lineales y las salidas en cadainstante t son combinaciones lineales de los estados del sistema y de los controles endicho instante. El sistema del Ejemplo 4.1 es un sistema diferencial lineal.

4.2 El modelo de Espacio-Estado. Formalismo 65

Las matrices (de funciones) Aptq, Bptq, Cptq y Dptq en (4.13) reciben nombresespeciales: a Aptq se le llama matriz de estados, a Bptq matriz de entradaso controles, a Cptq matriz de salidas desde los estados y a Dptq matriz desalidas desde las entradas o controles. Con frecuencia Dptq es la matriz cero yen tales casos se dice que Cptq es la matriz de salidas.

En el caso de sistemas diferenciales supondremos que las funciones matricialesAp¨q P PCpT ,Rnˆn, Bp¨q P PCpT ,Rnˆm, Cp¨q P PCpT ,Rpˆn y Dp¨q P PCpT ,Rpˆm

donde T Ă R es un intervalo y PCpT ,Rq es el espacio vectorial (respecto a R)de las funciones continuas a trozos definidas en el interval T y con valores reales.Supondremos tambien, como ya se ha dicho, que U “ PCpT ,Rmq. Se cumplenentonces las condiciones de Caratheodory de existencia y unicidad de soluciones entodo T del P.C.I. "

9xptq “ Aptqxptq `Bptquptq, t P Txpt0q “ x0

para todo up¨q P U , t0 P T y x0 P X “ Rn. La solucion de estos sistemas xptq “ψpt; t0, x0, up¨qq son funciones continuas en T y diferenciables en todo T exceptoen los puntos de discontinuidad de Ap¨q, Bp¨q y up¨q. Mucha de la teorıa se puededesarrollar tambien para sistemas en C pero nos restringiremos a sistemas reales (esdecir, sobre R).

En este curso solo trabajaremos los sistemas diferenciales con especial atenciona los lineales. En particular, en esta leccion nos centraremos en el estudio de lassoluciones de los sistemas lineales mientras que las propiedades de controlabilidad,observabilidad y estabilidad de los mismos seran estudiadas en lecciones posteriores.Tambien se hara una breve incursion en estas mismas propiedades para sistemas nolineales.

4.2.1. Estados de Equilibrio o Estacionarios

Hay estados para ciertos sistemas que adquieren importancia especial: son losestados estacionarios o de equilibrio. Supongamos que tenemos un sistema sobre elque actua una funcion de control up¨q y cuya funcion de transicion de estados esψpt; t0, x0, up¨qq; es decir, el estado en el instante t es

xptq “ ψpt; t0, x0, up¨qq P X, t ě t0, t0, t P T .,

donde X es el espacio de estados para el sistema. Un estado x P X es un estado deequilibrio o estacionario de un sistema bajo el control up¨q si

ψpt; t0, x, up¨qq “ x

66 El modelo de espacio-estado

parar todo t P T con t ě t0. En otras palabras, los estados estacionarios son losestados xptq tales que si xpt0q “ x entonces xptq “ x para todo t P T con t ě t0. Setrata pues de estados que se mantienen constantes durante su periodo de existencia.

Tal y como hemos visto en (4.8) para los sistemas lineales:

ψpt; t0, 0X , 0Uq “ 0X , t, t0 P T , t ě t0,

lo que indica que el estado cero, 0X , es siempre un estado estacionario de los sistemaslineales cuando el control es la funcion nula: uptq “ 0 para todo t P T , t ě t0. Estoes facil de comprobar en los sistemas finito-dimensionales. En efecto, en tal caso lasecuaciones de estados con control cero son:

9xptq “ Aptqxptq,de modo que xptq “ 0 es una solucion del sistema cuando el sistema esta en reposo enel instante inicial; es decir, xpt0q “ 0. Lo mismo sucede en los sistemas en diferenciasfinitas.

Para los sistemas diferenciales generales

pΣq"

9xptq “ fpt, xptq, uptqq, t ě t0, t P Txpt0q “ x0

los estados estacionarios son las soluciones de equilibrio; es decir, las soluciones xeque cumplen lo siguiente: si en un instante inicial t0 P T el estado es xpt0q “ xe y elsistema esta bajo el control de up¨q entonces el estado de Σ es xptq “ xe para todot ě t0, t P T . En otras palabras, los estados estacionarios bajo el control up¨q sonlas soluciones constantes de 9xptq “ fpt, x, uptqq. Es decir, las que cumplen:

fpt, xe, uptqq “ 0, para todo t ě t0, t P T .Veremos a continuacion un par de ejemplos.

Figura 4.1: Controldel pendulo invertido

Ejemplo 4.3 Consideremos el pendulo invertido de laFigura 4.1. Se quiere aplicar una fuerza en la base delpendulo amortiguado para devolverlo a la posicion ver-tical. Recordando la expresion para el par de fuerzas:xptqF2ptq ´ yptqF1ptq “ Nptq “ mr2 9ωptq:

m`2 :θptq “ ´c 9θptq `mg` sen θptq ` uptq` cos θptq,donde c es la constante de amortiguamiento produci-do, por ejemplo, por el rozamiento sobre el brazo del

pendulo. Suponiendo, por sencillez que ` “ g “ c “ 1

my suprimiendo el argumento t:

:θ “ ´ 9θ ` sen θ ` u cos θ.

4.2 El modelo de Espacio-Estado. Formalismo 67

Para obtener las ecuaciones del espacio-estado realizamos el cambio de variableshabitual: x1 “ θ, x2 “ 9θ. De esta manera el sistema de primer orden equivalente es:

"9x1 “ x2

9x2 “ ´x2 ` senx1 ` u cosx1

Ası pues, si x “„x1

x2

fpt, x, uq “„

x2

´x2 ` senx1 ` u cosx1

.

Los estados estacionarios bajo el control up¨q son las soluciones constantes de fpt, x, uq “0. Si consideramos el control cero (uptq “ 0) entonces

fpt, x, 0q “„

x2

´x2 ` senx1

,

de modo que fpt, x, 0q “ 0 si y solo si x2 “ 0 y x1 “ kπ, k “ 0,˘1,˘2, . . . Enefecto, los estados estacionarios corresponden a la posicion vertical (arriba o abajo)del pendulo porque en ausencia de una accion externa, el pendulo permanecerıa endicha posicion indefinidamente.

Ejemplo 4.4 Se trata de modelizar el movimiento de un satelite de comunicaciones.Estos reciben y emiten ondas electromagneticas desde y hacia radares situados en lasuperficie terrestre. A fin de no tener que estar moviendo estos radares para apuntarcontinuamente al satelite, se intenta que este ocupe una posicion fija relativamentea ellos. Las orbitas que deben describir dichos satelites se llaman geosıncronas.

Figura 4.2: Satelite en orbita estacionaria.

Para simplificar el modelo supondremos que el movimiento del satelite se haceen el plano del Ecuador. Tomaremos el centro de la Tierra como origen de coordena-das, usaremos coordenadas polares pr, θq. Denotamos la masa de la Tierra por MT

(5,973 ˆ 1019 Kgr., aproximadamente), por MS la del satelite, por G la constante

68 El modelo de espacio-estado

de gravitacion universal (6,67428 ˆ 10´11 N¨m2/kgr2) y por Ω la velocidad angularde la Tierra (7,27ˆ 10´5 rad/seg). Supondremos que el satelite esta dotado de dospropulsores que pueden impulsarlo en la direccion radial y tangencial con fuerzasFr y Fθ. Aplicando las leyes de Newton, las siguientes ecuaciones proporcionan lasposibles trayectorias que describe el satelite:

$&%

MS:rptq “MSrptq 9θptq2 ´ GMTMS

rptq2 `Grptq ` FrptqMSrptq:θptq “ ´2MS 9rptq 9θptq `Gθptq ` Fθptq

(4.14)

Estas ecuaciones son el resultado de tener en cuenta las diversas fuerzas a lasque esta sometido el satelite: La fuerza debida al movimiento del satelite alrededorde la Tierra (~F “ m ¨ ~a), la fuerza de atraccion de masas, la fuerza debida a losmotores y la fuerza perturbadora y, posiblemente mucho mas debil que las demas,ejercida por la Luna, el Sol, otros planetas, viento solar, etc. y que las hemos reunidoen Gr y Gθ

Para calcular la fuerza debida al movimiento, se toman vectores unitarios ~er y~eθ en las direcciones radial y tangencial de la trayectoria del satelite. Ası ~er “ ~erptqy ~eθ “ ~eθptq son vectores que cambian en cada instante de tiempo y si ~rptq es elvector de posicion del satelite; es decir, el que une el centro de masa de la Tierracon el del satelite, la trayectoria de este esta determinada por la funcion vectorial~rptq “ rptq~erptq, siendo rptq el modulo del vector (de forma general consideramos unapartıcula que se mueve alrededor de la Tierra pero a una distancia no constante).

Un calculo simple muestra que para cada instante fijo t,

~erpt` hq ´ ~erptq “ ´p1´ cospθpt` hq ´ θptqqq~erptq ` senpθpt` hq ´ θptqq~eθptq~eθpt` hq ´ ~eθptq “ ´ senpθpt` hq ´ θptqq~erptq ` p1´ cospθpt` hq ´ θptqqq~eθptq.

Ahora bien, para h proximo a 0, y suponiendo θ infinitamente diferenciable, podemosdesarrollar esta funcion en serie de Taylor cerca de t:

θpt` hq “ θptq ` h 9θptq ` gphq “ θptq ` hωptq ` gphq

donde lımhÑ0

gphqh

“ 0. Hacemos lo mismo con las funciones seno y coseno cerca de 0

(recordemos que t esta fijo):

cospθpt` hq ´ θptqq “ cospωptqh` gphqq “ 1` fphq,senppθpt` hq ´ θptqq “ senpωptqh` gphqq “ ωptqh` gphq `mphq

con lımhÑ0

fphqh

“ 0 y lımhÑ0

mphqh2

“ 0 y donde ωptq es la velocidad angular del satelite

4.2 El modelo de Espacio-Estado. Formalismo 69

en el instante fijo t. Por lo tanto,

d~erdtptq “ lım

hÑ0

~erpt` hq ´ ~erptqh

“ ωptq~eθptq “ dθ

dtptq~eθptq

d~eθdtptq “ lım

hÑ0

~eθpt` hq ´ ~eθptqh

“ ´ωptq~erptq “ ´dθ

dtptq~erptq.

Se sigue entonces qued~r

dt“ dr

dt~er ` rdθ

dt~eθ,

y

d2~r

dt2“˜

d2r

dt2´ r

ˆdθ

dt

˙2¸~er `

ˆr

d2θ

dt2` 2

dr

dt

dt

˙~eθ.

Usando la terminologıa de la Fısica:

d2r

dt2= aceleracion debida al cambio de posicion del satelite en la direccion

radial,

r

ˆdθ

dt

˙2

= aceleracion centrıpeta,

rd2θ

dt2= aceleracion debida al cambio de posicion del satelite en la direccion

tangencial,

2dr

dt

dt= aceleracion de Coriolis.

Aplicando las leyes de Newton:

MSd2~r

dt2“MS

˜d2r

dt2´ r

ˆdθ

dt

˙2¸~er `Ms

ˆr

d2θ

dt2` 2

dr

dt

dt

˙~eθ.

Por otra parte, la fuerza de atraccion de masas es

~Fg “ ´GMTMS

rptq2 ~er

Y las fuerzas de los motores del satelite y de la perturbacion son:

~Fm “ Fr~er ` Fθ~eθ, ~Fp “ Gr~er `Gθ~eθ

70 El modelo de espacio-estado

En el sistema de referencia no inercial correspondiente al satelite la fuerza totalque actua sobre el mismo es nula (en otras palabras, “en el satelite no se nota quehaya ninguna fuerza cuyo origen este en el mismo satelite”). Por consiguiente:

MS

˜d2r

dt2´ r

ˆdθ

dt

˙2¸~er `MS

ˆr

d2θ

dt2` 2

dr

dt

dt

˙~eθ ´ ~Fg “ ~Fm ` ~Fp.

Igualando las componentes radial y tangencial obtenemos (4.14).

En una primera aproximacion vamos a suponer que las fuerzas Gr y Gθ son des-preciables respecto a las demas. A fin de simplificar la expresion (4.14) renombramosFr “ FrMS, y Fθ “ FθMS, obteniendo ası:

$&%

:rptq “ rptq 9θptq2 ´ GMT

rptq2 ` Frptqrptq:θptq “ ´2 9rptq 9θptq ` Fθptq

(4.15)

Para obtener las ecuaciones de espacio-estados podrıamos hacer el cambio de varia-bles habitual: x1ptq “ rptq, x2ptq “ 9rptq, x3ptq “ θptq y x4ptq “ 9θptq. Sin embargo,este cambio de variables no tendrıa en cuenta que se quiere que el satelite mantengauna posicion constante respecto de la Tierra. Es decir, que gire a la misma velocidadangular que la Tierra (recordemos que la hemos denotado con Ω y que su valor es7,27ˆ 10´5 rad/seg). El cambio de variables apropiado entonces es:

x1ptq “ rptq, x2ptq “ 9rptq, x3ptq “ θptq ´ pθ0 ` Ωtq y x4ptq “ 9θptq ´ Ω,

donde θ0 es el angulo inicial de la posicion del satelite respecto de un punto dereferencia prefijado (por ejemplo, el meridiano cero). Por lo tanto, x3p0q “ 0. Elsistema que se obtiene es:

»——–

9x1ptq9x2ptq9x3ptq9x4ptq

fiffiffifl “

»——————–

x2ptqx1ptqpx4ptq ` Ωq2 ´ GMT

x1ptq2 ` Frptqx4ptq

´2x2ptqpx4ptq ` Ωqx1ptq ` Fθptq

x1ptq

fiffiffiffiffiffiffifl

Vamos a estudiar los estados estacionarios de este sistema con control nulo Frptq “Fθptq “ 0. Estamos presuponiendo que x1ptq “ rptq ‰ 0 (lo contrario significarıaque el satelite esta en el centro de masa de la Tierra). En particular, los estadosestacionarios deben cumplir este requerimiento. Como para los estados estacionariosx1ptq debe ser constante (digamos R0), tendremos x1ptq “ R0. Como x1ptq y x3ptq

4.3 Sistemas Lineales 71

son constantes, x2ptq “ x4ptq “ 0. Ahora bien, esto implica (sustituyendo en laecuacion de 9x2) que

0 “ x1ptqΩ2 ´ GMT

x1ptq2 “ R0Ω2 ´ GMT

R20

.

Por lo cual

R0 “ˆGMT

Ω2

˙ 13

(4.16)

es el valor de x1ptq para el estado estacionario. Finalmente, x3ptq es constante yx3p0q “ 0. Esto implica que x3ptq “ 0 para todo t ą 0. En definitiva, el estado deequilibrio a control constante es pR0, 0, 0, 0q. En terminos de rptq y θptq, esto significaque el estado estacionario corresponde a

rptq “ R0, θptq “ θ0 ` Ωt, t ě 0.

Es decir, el estado estacionario a control constante determina una trayectoria del

satelite a distancia fija de la Tierra (R0 “ˆGMT

Ω2

˙ 13

) y con la misma velocidad an-

gular que la Tierra. Esto es lo que se llama una orbita geoestacionaria y geosıncrona.

4.3. Sistemas Lineales

Consideremos el siguiente sistema lineal con una condicion inicial para el estado:$&%

9xptq “ Aptqxptq `Bptquptqyptq “ Cptqxptq `Dptquptqxpt0q “ x0,

t P T (4.17)

donde Aptq P Rnˆn, Bptq P Rnˆm, Cptq P Rpˆn y Dptq P Rpˆm para todo t P T .

Tal y como hemos comentado mas arriba, bajo la hipotesis de continuidad atrozos de Ap¨q, Bp¨q y up¨q en un intervalo de tiempo T , el Problema de CondicionInicial (P.C.I.) "

9xptq “ Aptqxptq `Bptquptqxpt0q “ x0,

t P T (4.18)

tiene solucion unica. Esta se puede obtener por el metodo de variacion de las cons-tantes :

xptq “ ψpt; t0, x0, up¨qq “ Φpt, t0qx0 `ż t

t0

Φpt, sqBpsqupsqds, t P T (4.19)

72 El modelo de espacio-estado

donde Φpt, t0q es una matriz fundamental de soluciones del sistema

9xptq “ Aptqxptq; (4.20)

es decir, cada columna de Φpt, t0q es solucion de este sistema. En algunos tratados(ver por ejemplo [9]) se diferencia el operador evolucion: Φpt, t0q : Rn Ñ Rn definidopor Φpt, t0qx “ ψpt; t0, x0, 0Uq de la matriz de este operador en las bases canonicas.Nosotros no haremos distincion entre el operador y la matriz que lo representa.Y dada la estrecha relacion, (4.19), entre la funcion de transicion de estados ψ yΦpt, t0q, a esta matriz se le suele llamar Matriz de Transicion de Estados y esesta la denominacion que usaremos de ahora en adelante.

Dado que cada una de las columnas de Φpt, t0q es solucion del sistema (4.20) ycumple la condicion inicial xpt0q “ x0, concluımos que Φpt, t0q es la unica soluciondel P.C.I. matricial: " 9Xptq “ AptqXptq, t P T

Xpt0q “ In

donde In es la matriz identidad de orden n. En efecto, 9Φpt, t0q “ AptqΦpt, t0q columnaa columna y, sustituyendo en (4.19), para cada x0 P Rn, x0 “ xpt0q “ Φpt0, t0qx0.Esto significa que Φpt0, t0q “ In necesariamente. Esta caracterizacion de Φpt, t0qpermite demostrar propiedades importantes de esta matriz que se proponen comoejercicios.

Por otra parte la funcion de salida para el sistema (4.17) sera:

yptq “ ηpt; t0, x0, up¨qq “ Cptqxptq `Dptquptq ““ CptqΦpt, t0qx0 `

ż t

t0

CptqΦpt, sqBpsqupsqds`Duptq, t P T . (4.21)

No hay formulas explıcitas para calcular las matrices de transicion de estadospara sistemas lineales generales, pero sı para el caso en que la matriz Aptq no dependedel tiempo (es constante); es decir, sistemas de la forma:

"9xptq “ Axptq `Bptquptqxpt0q “ x0 . (4.22)

En este caso, la matriz de transicion de estados es la matriz exponencial:

Φpt, t0q “ eApt´t0q.

La matriz exponencial eAt se puede definir de varias formas equivalentes. La masrapida y conveniente para este curso es la que se obtiene a partir de una serie depotencias matriciales:

eAt “8ÿ

k“0

tk

k!Ak, t P R. (4.23)

4.3 Sistemas Lineales 73

Se puede demostrar que la serie de potencias8ÿ

k“0

1

k!Ak converge para toda matriz

A siempre que en Rnˆn ( conjunto de matrices de numeros reales de n filas y ncolumnas) consideremos las normas de matriz habituales. Por ello es perfectamenterazonable definir eA como el lımite de esta serie.

De la definicion se desprende que

d

dteAt “ AeAt,

de modo que Φpt, t0q “ eApt´t0q es la unica solucion del P.C.I.

" 9Xptq “ AXptq, t P TXpt0q “ In.

Por lo tanto, tal y como se ha mencionado mas arriba, Φpt, t0q “ eApt´t0q es la matrizde transicion de estados del sistema (4.22).

4.3.1. Sistemas lineales invariantes en el tiempo

Los sistemas lineales invariantes en el tiempo son aquellos en los que todas lasmatrices (de estados, controles y salidas) son independientes del tiempo; es decir,son constantes:

"9xptq “ Axptq `Buptq, t P R A P Rnˆn, B P Rnˆm

yptq “ Cxptq `Duptq C P Rpˆn, D P Rpˆm (4.24)

Estos sistemas son los mas sencillos y mas estudiados. En realidad son los modelos deespacio-estado de los sistemas estudiados en el Capıtulo 3 en terminos de la funcionde transferencia.

Dado que la matriz de transicion de estados para los sistemas lineales con Aconstante es Φpt, t0q “ eApt´t0q, la funcion de transicion de estados (solucion) paraestos sistemas se puede dar explıcitamente (ver (4.19)):

xptq “ eApt´t0qx0 `ż t

t0

eApt´sqBupsqds, t P T . (4.25)

En consecuencia, la respuesta del sistema sera:

yptq “ Cxptq `Duptq “ CeApt´t0qx0 `ż t

t0

CeApt´sqBupsqds`Duptq. (4.26)

74 El modelo de espacio-estado

En la practica, el calculo de la matriz eApt´t0q no es una tarea sencilla y se basa,por lo general, en el calculo de los valores y vectores propios (generalizados) de lamatriz de estados A. Es conocido que dada una matriz A P Rnˆn, existe una matrizno singular (determinante distinto de cero) T P Cnˆn, de numeros complejos, talque

T´1AT “ J,

donde

J “

»—–J1

. . .

Jr

fiffifl y Jk “

»—————–

λk 1 0 ¨ ¨ ¨ 00 λk 1 ¨ ¨ ¨ 0...

.... . . . . .

...0 0 ¨ ¨ ¨ λk 10 0 ¨ ¨ ¨ 0 λk

fiffiffiffiffiffiflP Cnkˆnk . (4.27)

La matriz J , diagonal por bloques, recibe el nombre de Forma Normal de Jordande A. Los numeros, λk, que aparecen en la diagonal de cada uno de los bloques Jk, sonlos valores propios (quiza repetidos) de A. En general son numeros complejos porqueson las raıces del polinomio caracterıstico de A; es decir, las raıces del polinomio quese obtiene al calcular detpλIn ´ Aq.

Para muchas matrices (casi todas en un cierto sentido) sus valores propios sontodos distintos. En tal caso, nk “ 1 y

J “ Diagpλ1, λ2, . . . , λnq “

»———–

λ1 0 ¨ ¨ ¨ 00 λ2 ¨ ¨ ¨ 0...

.... . .

...0 0 ¨ ¨ ¨ λn

fiffiffiffifl

En este caso, las columnas de las matrices T para las que T´1AT “ J son vectorespropios de A (la i-esima columna de T es vector propio de A asociado al valor propioλi). Cuando J no es diagonal, a las columnas de T se les llama vectores propiosgeneralizados para los correspondientes valores propios que forman los bloques deJordan Jk.

Es facil ver, utilizando la definicion de eA como serie de potencias, que siT´1AT “ J entonces

eAt “ TeJtT´1. (4.28)

Ademas, de la propia definicion se tiene tambien que

eJt “

»—–eJ1t

. . .

eJrt

fiffifl . (4.29)

4.3 Sistemas Lineales 75

Ahora bien cada bloque en la diagonal de la forma de Jordan se puede escribir como

Jk “ λkInk `Nk, con Nk “

»—————–

0 1 0 ¨ ¨ ¨ 00 0 1 ¨ ¨ ¨ 0...

.... . . . . .

...0 0 0 ¨ ¨ ¨ 10 0 0 ¨ ¨ ¨ 0

fiffiffiffiffiffifl

y donde Ink es la matriz identidad de orden (o tamano) nk. Se comprueba sin difi-cultad que Nnk

k “ 0 y, en consecuencia, en el desarrollo de la serie de potencias

eJkt “8ÿ

i“0

ti

i!J ik “ eλk

8ÿ

i“0

ti

i!N ik, t P R.

solo hay un numero finito de sumandos no nulos. En definitiva, sumando los terminosno nulos se obtiene

eJkt “ eλkt

»————————————–

1 tt2

2!¨ ¨ ¨ tnk´2

pnk ´ 2q!tnk´1

pnk ´ 1q!0 1 t ¨ ¨ ¨ tnk´3

pnk ´ 3q!tnk´2

pnk ´ 2q!...

.... . . . . .

......

0 0 0. . . t

t2

2!0 0 0 ¨ ¨ ¨ 1 t0 0 0 ¨ ¨ ¨ 0 1

fiffiffiffiffiffiffiffiffiffiffiffiffifl

. (4.30)

Finalmente, si λk “ ak ` ibk entonces

eλkt “ eakteibkt “ eaktpcospbktq ` i senpbktqq.

El siguiente ejemplo, en el que se estudian las soluciones del oscilador armonicoamortiguado, es ilustrativo de este proceso.

Ejemplo 4.5 (Oscilador Armonico Amortiguado Lineal) Vimos en el Capıtu-lo 2 que las ecuaciones que rigen el comportamiento dinamico de los sistemas en lasFiguras 4.3, 4.4, 4.5 son las mismas:

m:xptq ` c 9xptq ` kxptq “ uptqxp0q “ x0, 9xp0q “ v0.

(4.31)

En cada caso, por supuesto, el significado de m, c, k y u es diferente, pero estos tressistemas tienen un comportamiento dinamico que puede modelizarse con la misma

76 El modelo de espacio-estado

Figura 4.3: Sistema masa-muelle con amortiguamien-to

Figura 4.4: Cuerpo rıgidosen rotacion

Figura 4.5: Circuito electri-co simple

ecuacion. Diremos que (4.31) es la ecuacion del oscilador armonico amortiguado (sic ‰ 0) lineal. Por consiguiente, los tres sistemas son modelos fısicos diferentes dedicho oscilador.

La forma en la que se suele presentar la ecuacion de los osciladores lineales noes (4.31) sino una equivalente que se obtiene al hacer las sustituciones

ω0 “ck

m, ζ “ c

2?km

.

A ω0 se le conoce con el nombre de frecuencia natural del sistema y a ζ como larazon de amortiguamiento. Con esta sustitucion el sistema de (4.31) se convierteen

:x` 2ζω0 9x` ω20x “ kω2

0uptq, (4.32)

donde hemos sustituıdo k por1

kpara simplificar la notacion.

Las ecuaciones del modelo espacio-estado correspondiente a esta ecuacion se ob-tienen mediante el cambio de variables: x1ptq “ xptq y x2ptq “ 9xptq. Ası el problemade condiciones iniciales (4.31) es equivalente a:

„9x1

9x2

“„

0 1´ω2

0 ´2ζω0

„x1

x2

`„

0kω2

0

uptq,

„x1p0qx2p0q

“„x0

v0

(4.33)

Como una aplicacion simple de la forma de Jordan, vamos a analizar la dinamica delos osciladores lineales en movimiento libre; es decir, cuando no hay fuerzas externasactuando sobre el (uptq “ 0). En este caso la ecuacion diferencial (4.32) queda:

:x` 2ζω0 9x` ω20x “ 0. (4.34)

Y las ecuaciones en espacio-estado:„

9x1

9x2

“„

0 1´ω2

0 ´2ζω0

„x1

x2

,

„x1p0qx2p0q

“„x0

v0

(4.35)

4.3 Sistemas Lineales 77

Calculamos los valores propios de la matriz de estados:

det

„λ ´1ω2

0 λ` 2ζω0

“ λ2 ` 2ζω0λ` ω2

0

“´λ` ζω0 ` ω0

aζ2 ´ 1

¯´λ` ζω0 ´ ω0

aζ2 ´ 1

¯.

Ası pues, la matriz de estados puede tener valores propios reales y distintos (si ζ ą 1),complejos no reales conjugados (si 0 ă ζ ă 1) o un valor propio real doble (si ζ “ 1).Analizaremos el comportamiento de las soluciones del sistema (trayectorias) en cadacaso. Recordemos que la solucion de (4.35) es

„x1ptqx2ptq

“ eAt “ TeJtT´1

„x0

v0

donde A “„

0 1´ω2

0 ´2ζω0

es la matriz de estados, T es una matriz de vectores

propios (o vectores propios generalizados) de A y J es su forma de Jordan.

1. ζ ą 1. En este caso ζ2 ´ 1 ą 0, y la matriz de estados A tiene dos valores

propios reales distintos λ1 “ ´ζω0 ´ ω0

aζ2 ´ 1 y λ2 “ ´ζω0 ` ω0

aζ2 ´ 1.

Su forma de Jordan es J “ Diagpλ1, λ2q y

eJt “»–e

´ω0

´ζ`?ζ2´1

¯t

0

0 e´ω0

´ζ´?ζ2´1

¯t

fifl .

Ahora, si T “ “t1 t2

‰y T´1 “ “pt1 pt2

‰son las matrices T y T´1 escritas en

funcion de sus columnas, entonces

TeJt “”e´ω0

´ζ`?ζ2´1

¯tt1 e

´ω0

´ζ´?ζ2´1

¯tt2

ı, T´1

„x0

v0

“ x0

pt1 ` v0pt2.

Observemos que x0pt1` v0

pt2 es un vector columna y escrıbamoslo x0pt1` v0

pt2 “„ab

. Se tiene entonces

„x1ptqx2ptq

“ eAt

„x0

v0

“ TeJtT´1

„x0

v0

“ ae

´ω0

´ζ`?ζ2´1

¯tt1 ` be´ω0

´ζ´?ζ2´1

¯tt2.

En palabras, tanto el desplazamiento x1ptq como la velocidad x2ptq “ 9x1ptqson combinaciones lineales de las funciones exponenciales e

´ω0

´ζ`?ζ2´1

¯t

y

e´ω0

´ζ´?ζ2´1

¯t.

La Figura 4.6 muestra las graficas del desplazamiento y la velocidad de unsistema en el que ζ ą 1. El sistema se dice que es sobreamortiguado.

78 El modelo de espacio-estado

2. 0 ă ζ ă 1. En este caso ζ2 ´ 1 ă 0 y la matriz de estados tiene dos valores

complejos (no reales) conjugados. Es decir, si ωd “ ω0

a1´ ζ2 (cantidad que se

conoce con el nombre de frecuencia de amortiguamiento) entonces los valorespropios de A son λ1 “ ´ζω0 ` ωdi y λ2 “ ´ζω0 ´ ωdi.De esta forma tenemos:

eJt “„ep´ζω0`ωdiqt 0

0 ep´ζω0´ωdiqt

“ e´ζω0t

„cospωdtq ` i senpωdtq 0

0 cospωdtq ´ i senpωdtq

“ e´ζω0t

„cospωdtq 0

0 cospωdtq` i

„senpωdtq 0

0 ´ senpωdtq

Aparentemente las soluciones van a ser funciones complejas. Sin embargo, losvectores propios de A se pueden escoger de forma que sean tambien complejosconjugados y tras ciertas manipulaciones algebraicas (ver por ejemplo [7, pp80–90]) se puede ver que se puede elegir de forma adecuada una matriz T talque

„x1ptqx2ptq

“ eAt

„x0

v0

“ TeJtT´1

„x0

v0

“ e´ζω0t pa cospωdtq ` b senpωdtqq

donde a y b son vectores columna reales de 2 componentes. Vemos ası que,tambien en este caso, tanto el desplazamiento x1ptq como la velocidad x2ptq “9x1ptq son productos de la funcion exponencial e´ζω0t y de una combinacionlineal de las funciones cospωdtq y senpωdtq. No obstante, el hecho de que a y bsean reales permite escribir la expresion x1ptq “ e´ζω0tpa1 cospωdtq`b1 senpωdtqqde otra forma mas compacta siempre que a1 ‰ 0. En efecto, podemos pensar ena1 y b1 como los catetos de un triangulo rectangulo tal que arctanpb1a1q “ φ.Si A es la hipotenusa, tenemos a1 “ A cosφ y 1b “ A senφ. Es claro que larelacion entre pa1, b1q, a1 ‰ 0 y pA, φq, 0 ď φ ă π, es biunıvoca. Entonces

x1ptq “ e´ζω0tpa1 cospωdtq ` b1 senpωdtqq ““ Ae´ζω0tpcosφ cospωdtq ` A senφ senpωdtqq ““ Ae´ζω0t cospωdt´ φq.

El caso a1 “ 0 corresponde a φ “ π2. Ademas, x2ptq “ 9x1ptq.Ae´ζω0t es conocido con el nombre de amplitud amortiguada y φ como fase de lasolucion. La Figura 4.7 muestra las graficas del desplazamiento y la velocidadde un sistema en el que 0 ă ζ ă 1. El sistema se dice que es subamortiguado.

3. ζ “ 1. Los sistemas con razon de amortiguamiento igual a 1 se llaman sistemascrıticamente amortiguados. Tienen un unico valos propio doble: ´ω0 por

4.3 Sistemas Lineales 79

Figura 4.6: Trayectoria deun oscilador lineal con so-breamortiguamiento.

Figura 4.7: Trayectoria deun oscilador lineal subamor-tiguado.

Figura 4.8: Trayectoria deun oscilador lineal crıtica-mente amortiguado .

lo que la forma de Jordan de la matriz de estados es

J “„´ω0 1

0 ´ω0

.

Ası, ((4.30)))

eJt “ e´ω0t

„1 t0 1

.

Y si A “ TJT´1 entonces la solucion del problema de condiciones iniciales es„x1ptqx2ptq

“ TeJtT´1

„x0

v0

.

Usando el mismo procedimiento que en el caso de dos valores propios reales ydistintos, existen vectores reales a y b de dos componentes tales que:

„x1ptqx2ptq

“ e´ω0t

“t1 t2

‰ „1 t0 1

“pt1 pt2‰ „x0

v0

“ e´ω0tpa` btqLos vectores a y b se pueden dar explıcitamente:

„x1ptqx2ptq

“ e´ω0t

ˆ„x0

v0

`„ pv0 ` ω0x0qv0 ´ ω0pv0 ` ω0x0q

t

˙

La Figura 4.8 muestra las graficas de un oscilador lineal crıticamente amorti-guado en funcion del signo de la velocidad inicial del mismo.

Una caracterıstica comun a las tres graficas es que las trayectorias, despues deun periodo transitorio en el que pueden crecer o decrecer, tienden a cero asintotica-mente. Ello es debido a que los valores propios, λ1 y λ2, de los osciladores linealescon amortiguamiento siempre tienen la parte real negativa: ´ω0ζ y, por lo tanto,para t suficientemente grande la funcion exponencial e´ω0ζt tienden a cero.

80 El modelo de espacio-estado

Figura 4.9: Entrada para un sistema li-neal.

Figura 4.10: Respuesta transitoria y deespacio-estado a la entrada de la Figura4.9.

4.3.2. Respuesta de un sistema lineal

Recordemos que la respuesta de los sistemas lineales

"9xptq “ Aptqxptq `Bptquptq,yptq “ Cptqxptq `Dptquptq t P T . (4.36)

viene dada por la formula (4.21) que reproducimos de nuevo aquı:

yptq “ CptqΦpt, t0qx0 `ż t

t0

CptqΦpt, sqBpsqupsqds`Dptquptq, t P T . (4.37)

Vemos en esta expresion que la solucion consiste de una respuesta a la condicion

inicial, CptqΦpt, t0qx0, y una respuesta a la entrada,

ż t

t0

CptqΦpt, sqBpsqupsqds `Dptquptq. Utlizando la terminologıa de la Seccion 4.2, ηpt, x, 0Uq “ CptqΦpt, t0qx0 es

la respuesta del sistema al movimiento libre, y ηpt, 0X , uq “ż t

t0

CptqΦpt, sqBpsqupsqds`Dptquptq es la respuesta del sistema al movimiento forzado.

Resulta ademas que la respuesta a la entrada (movimiento forzado) se divide endos respuestas: una que se conoce con el nombre de respuesta transitoria y otra quese llama respuesta de estado estacionario. La Figura 4.10 muestra la respuesta de unsistema lineal a una entrada de tipo sinusoidal (Figura 4.9). En ella se aprecian lasdos partes de la respuesta a dicha entrada. En particular para entradas periodicas larespuesta de estado-estacionario suele ser tambien periodica y representa el compor-tamiento del sistema a largo plazo. Veremos este fenomeno con mas claridad cuandoanalicemos la respuesta del sistema a las funciones salto unidad y a las funcionesde tipo sinusoidal. De hecho, hay tres tipos de funciones de entrada que se usanhabitualmente para el analisis de la respuesta de los sistemas lineales: la funcionimpulso, la funcion salto unidad y las funciones seno o coseno. Analizaremos cada

4.3 Sistemas Lineales 81

una de ellas por separado para sistemas invariantes en el tiempo. Para la funcionimpulso tambien daremos la expresion de la solucion para sistemas lineales genera-les. Para las demas funciones, expresiones explıcitas son solo posible para sistemainvariantes en el tiempo.

Recordemos que para sistemas invariantes en el tiempo"

9xptq “ Axptq `Buptq,yptq “ Cxptq `Duptq (4.38)

la matriz de transicion de estados es Φpt, t0q “ eApt´t0q.

Respuesta a un impulso

Se llama respuesta a un impulso a la respuesta forzada de un sistema cuando laentrada es la “funcion” impluso unidad en un instante τ . Es decir, se supone que elsistema esta en reposo hasta el instante τ (xpτ´q “ 0) y el sistema se excita con unimpulso unidad en el instante τ . Recordemos que el impulso unidad viene represen-tado por la delta de Dirac que en el instante τ tiene la siguiente representacion:

δτ ptq :“"

0, t ‰ τ`8, t “ τ.

Equivalentemente δτ ptq “ δpt ´ τq siendo δ la delta de Dirac en τ “ 0. Ya vimosen el Capıtulo 3 (vease la Seccion 3.4) que δ no es una funcion en sentido clasico yen el Apendice A se ponen las bases para un uso riguroso de δ. En particular se dasentido a la expresion:

ż `8

´8fpuqδpt´ uqdu “

ż `8

´8fpt´ uqδpuqdu “ fptq, t P R. (4.39)

Con esta propiedad en nuestras manos podemos decir cual es la respuesta de unsistema lineal a un impulso. Sea ei la i-esima columna de la matriz Im; es decir,el vector de tamano m con todas sus componentes 0 excepto la i-esima que es 1,y consideremos como entrada del sistema uptq “ δpt ´ τqei. Aplicando (4.39) a lafuncion fpzq “ CptqΦpt, zqBpzq en el intervalo rτ, ts tenemos que

ż t

τ

CptqΦpt, zqBpzqδpz ´ τqeidz “ CptqΦpt, τqBpτq.

Por otra parte, δpt´ τq solo es distinta de cero en t “ τ . Esto implica que Dptqδpt´τq ‰ 0 solo para t “ τ . Por lo tanto, la respuesta forzada del sistema a un impulsounidad en el instante τ es

hipt, τq “ rCptqΦpt, τqBpτq `Dpτqδpt´ τqsei, t ě τ.

82 El modelo de espacio-estado

Observamos que hi : R` ˆR` Ñ Rmˆ1 es una funcion vectorial: la i-esima columnade la matriz CptqΦpt, τqBpτq ` Dpτqδpt ´ τq. Se suele escribir (sustituyendo τ pors):

Hpt, sq “"CptqΦpt, sqBpsq `Dpsqδpt´ sq @t ě s0 @t ă s,

(4.40)

y esta matriz recibe el nombre de matriz de respuesta a un impulso. Teniendo encuenta que por (4.39)

ż t

0

Dpsqupsqδpt´ sqds “ Dptquptq,

tenemos que

ż t

t0

Hpt, squpsqds “ż t

t0

CptqΦpt, sqBpsqupsqds`Dptquptq.

En consecuencia, la respuesta de un sistema lineal a la entrada uptq puede escribirsede la siguiente forma:

yptq “ CptqΦpt, t0qx0 `ż t

t0

Hpt, squpsqds, (4.41)

Esta expresion se puede interpretar como que la respuesta del sistema lineal (4.36)yptq es la superposicion de las respuestas a un “conjunto infinito de impulsos des-plazados entre t0 y t, cada uno de los cuales tiene magnitud uptq”.

Para los sistemas (4.38) invariantes en el tiempo, la matriz de transicion deestados es Φpt, t0q “ eApt´t0q y para t ě s tendrıamos Hpt, sq “ CeApt´sqBpsq `Dδpt´sq. Ası pues, la matriz de respuesta a un impulso para los sistemas invariantesen el tiempo solo depende del ”tiempo transcurrido” t´ s. Por eso se suele escribirHpt´sq en vez de Hpt, sq y dado que Hpt´sq “ Hpt, sq “ Hpt´s, 0q se suele tomarcomo matriz de respuesta a un impulso la correspondiente al impulso en el instantes “ 0. Es decir,

Hptq “"CeAtB `Dδptq @t ě 00 @t ă 0,

(4.42)

Ası, la respuesta del sistema lineal (4.38) a una entrada arbitraria uptq se puedeescribir de la siguiente forma:

yptq “ CeApt´t0qx0 `ż t

0

Hpt´ squpsqds. (4.43)

El Control System Toolbox de MATLAB dispone de las funciones impulse yimpulseplot para calcular y dibujar las graficas de la respuesta de un sistema

4.3 Sistemas Lineales 83

lineal a la funcion impulso. Por ejemplo, para dibujar la grafica del desplazamientoy velocidad de un oscilador lineal, inicialmente en reposo, cuando es sometido aun impulso podrıamos proceder de la siguiente forma (suponiendo que el osciladorlineal tiene una frecuencia natural ω0 “ 0,5 una razon de amortiguamiento ζ “ 0,25y k “ 1ω2

o):

1. Definimos el sistema con el comando ss (veremos cuando estudiemos la res-puesta a la funcion salto que hay otras formas de definir un sistema). Paraello construımos las matrices A, B y C. En este caso D “ 0 y C “ I2 porquequeremos tener informacion de xptq “ x1ptq y 9xptq “ x2ptq. Es decir, queremosque la salida sea el estado completo.

>> w=0.5; z=0.25;

>> A=[0 1; -w^2 -2*z*w]; B=[0;1]; C=eye(2);

>> sis=ss(A,B,C,0)

sis =

a =

x1 x2

x1 0 1

x2 -0.25 -0.25

b =

u1

x1 0

x2 1

c =

x1 x2

y1 1 0

y2 0 1

d =

u1

y1 0

y2 0

Continuous-time state-space model.

2. Usamos impulse o impulseplot (vease la ayuda de MATLAB para conocerel alcance de estas dos funciones) para dibujar las grafica de x1ptq y x2ptq:

>> impulse(sis)

84 El modelo de espacio-estado

Figura 4.11: Graficas de los estados del sistema en forma de espacio-estado para eloscilador lineal con parametros ω0 “ 0,5, ζ “ 0,25 y k “ 1ω2

0.

En la Figura 4.11 se muestran las graficas de las dos variables. Out(1) secorresponde con el desplazamiento (xptq “ x1ptq) y Out(2) con la velocidad( 9xptq “ x2ptq).

Respuesta a un salto

Recordemos que la funcion salto unidad (o funcion de Heavisade) es:

γptq :“"

0, t ă 01, t ě 0.

Observese que cualquier funcion continua puede aproximarse por una sucesion defunciones que son multiplo de funciones de salto unidad.

La respuesta a un salto del sistema (4.38) con m “ p “ 1 se define como la salidayptq del sistema cuando el estado inicial esta en reposo (xp0q “ 0) y la entrada esγptq para t ě 0. Cuando el sistema es lineal, invariante en el tiempo y la matriz deestados A es invertible, la respuesta a un salto se obtiene a partir de (4.37):

yptq “ż t

0

CeApt´τqBupτqdτ `Duptq “ C

ż t

0

eApt´τqBdτ `D “

“ C

ż t

0

eAσBdσ `D “ CpA´1 eAσBqˇσ“tσ“0

`D ““ CA´1eAtB ´ CA´1B `D.

Podemos reescribir la solucion de la siguiente forma:

yptq “ CA´1eAtBlooooomooooontransitoria

` D ´ CA´1Bloooooomoooooonestado-estacionario

, t ą 0. (4.44)

4.3 Sistemas Lineales 85

Figura 4.12: Ejemplo de respuesta a un salto. El tiempo de subida, exceso, tiempode ajuste, y el valor de la respuesta de estado-estacionario son los valores que definenel comportamiento de la senal del sistema.

El primer termino es la respuesta transitoria y converge a cero cuando tÑ 8 cuandolas partes reales de los valores propios de A son negativas. El segundo termino esla respuesta de estado-estacionario y representa el valor de la salida del sistema alargo plazo. Notese que

d

dtyptq “ CeAtB,

que comparando con (4.42) nos permite decir que la respuesta a un impulso es laderivada de la respuesta a un salto unidad. De hecho, tal y como se demuestra en elApendice A, la funcion impulso es la la derivada, en el sentido de las distribuciones,de la funcion de Heavisade.

En la Figura 4.12 se muestra un ejemplo de respuesta a un salto para un sistemalineal. Se suele usar cierta terminologıa para referirse a los parametros fundamentalesque definen el comportamiento de la senal de salida:

El valor de estado estacionario yee es el valor final de la salida (suponiendoque converja).

Tiempo de Subida Tr es la cantidad de tiempo que se requiere para que lasenal pase del 10 % al 90 % de su valor final.

Sobreelongacion (Overshoot) Mp es el porcentaje del valor final que la senalsube por encima de este en la etapa transitoria (en el supuesto de que la senalno sube en tiempos posteriores por encima del valor en la etapa transitoria).

Tiempo de Ajuste Ts es la cantidad de tiempo necesaria para que la senal sesitue en el 2 % de su valor final.

Al igual que en el caso de la respuesta a un impulso, si el sistema es multivariable(m ą 1 o p ą 1) en vez de funcion de respuesta a un salto hablarıamos de matriz derespuesta a un salto. La expresion de esta matriz serıa la misma que en (4.44).

86 El modelo de espacio-estado

Hay varias funciones en el Control System Toolbox de MATLAB disenadas paraanalizar la respuesta de un sistema a un salto. Explicaremos el uso de algunas deellas tomando como referencia el oscilador lineal con amortiguamiento. Recordemosque la ecuacion que rige la dinamica de los osciladores lineales viene dada por (4.32)que, en el modelo de espacio-estado, es equivalente a (4.33). Para hacer calculossupondremos que la razon de amortiguamiento del sistema es ζ “ 0,25 y la frecuencianatural es ω0 “ 0,6 rad/seg. Con estos datos concretos el sistema (4.32) queda:

:xptq ` 0,30 9xptq ` 0,36xptq “ 0,36kuptq (4.45)

cuya funcion de trasferencia (suponiendo yptq “ xptq) es

gpsq “ 0,36k

s2 ` 0,30s` 0,36. (4.46)

Por su parte, las ecuaciones del sistema en la forma de espacio-estado quedarıan:$&%

9xptq “„

0 1´0,36 ´0,30

`„

00,36k

uptq

yptq “ “1 0

‰xptq,

(4.47)

siendo, ahora, xptq “„x1ptqx2ptq

. Ya hemos visto que los sistemas (4.45) y (4.47) son

equivalentes a traves del cambio de variable x1ptq “ xptq, x2ptq “ 9xptq donde, ahora,xptq es la variable del sistema (4.45). La ecuacion yptq “ “

1 0‰xptq de (4.47) nos

indica que la salida del sistema es la solucion del sistema (4.45). En consecuencia, larelacion entre las transformadas de Laplace (con condicion inicial cero) de la saliday la entrada del sistema (4.47) debe ser la funcion de transferencia gpsq en (4.46).En efecto, denotando con A, B y C a las matrices de estados, entradas y salidas,respectivamente, del sistema (4.47):

A “„

0 1´0,36 ´0,30

, B “

„0

0,36k

, C “ “

1 0‰,

y usando las propiedades de la transformada de Laplace obtenemos

ypsq “ CpsI2 ´ Aq´1Bupsq.A la matriz CpsIn ´ Aq´1B `D, que es una matriz de tamano pˆm de funcionesracionales, se le llama Matriz de Transferencia del sistema. En este ejemplo m “p “ 1 de modo que la matriz de transferencia se reduce a una sola funcion quepodemos calcular a mano:

CpsI2 ´ Aq´1B “ 0,36k

s2 ` 0,30s` 0,36“ gpsq.

4.3 Sistemas Lineales 87

Para sistemas mas complicados o de mayores dimensiones podemos hacer uso delos comandos ss (state-space) y tf (transfer function) del Control System Toolboxde MATLAB. En nuestro ejemplo, podrıamos proceder como sigue (se ha tomadok “ 1):

>> A=[0 1;-0.36 -0.30]; B=[0;0.36];C=[1 0];

>> sis=ss(A,B,C,0);

>> g=tf(sis)

g =

0.36

------------------

s^2 + 0.3 s + 0.36

Continuous-time transfer function.

Dada una funcion (o matriz, en el caso multivariable) de transferencia se puedeobtener un sistema en forma de espacio-estado cuya matriz de transferencia sea ladada. Los comandos a utilizar son los mismos en orden inverso:

>> num=[0.36]; den=[1 0.3 0.36];

>> sis=tf(num,den)

sis =

0.36

------------------

s^2 + 0.3 s + 0.36

Continuous-time transfer function.

>> sises=ss(sis)

sises =

a =

x1 x2

x1 -0.3 -0.72

x2 0.5 0

b =

u1

x1 1

x2 0

c =

x1 x2

y1 0 0.72

88 El modelo de espacio-estado

d =

u1

y1 0

Continuous-time state-space model.

Las matrices de estados, entradas y salidas producidas se pueden extraer usando lossiguientes comandos:

>> A1=sises.a

A1 =

-0.3000 -0.7200

0.5000 0

>> B1=sises.b

B1 =

1

0

>> C1=sises.c

C1 =

0 0.7200

Observamos que estas matrices

A1 “„´0,3 ´0,72

0,5 0

, B1 “

„10

, C1 “

“0 0,72

‰, (4.48)

son diferentes de las del sistema (4.45). Es facil comprobar, sin embargo que lossistema pA,B,Cq y pA1, B1, C1q son semejantes en el sentido de que existe unamatriz T no singular tal que

A1 “ T´1AT, B1 “ T´1B, C1 “ CT.

En este ejemplo la matriz T “„

0 0,720,36 0

sirve para realizar el cambio. Debe

observarse no obstante que, aunque en este caso concreto los dos sistemas son se-mejantes, es posible, para sistemas mas complejos en general, que el sistema quedevuelva MATLAB no sea semejante a uno que se haya podido obtener por mediode otros procedimientos. Una vez definidos los sistemas, bien a traves de la funciono matriz de transferencia o con las matrices del modelo de espacio-estado, los co-mandos step, stepplot y stepinfo pueden usarse para analizar la respuesta delsistema cuando la entrada es la funcion salto unidad. Para dibujar la grafica dedicha respuesta se puede utilizar tanto step como stepplot. La primera, ademas,produce (si se le pide) los valores de la respuesta en ciertos instantes de tiempo, los

4.3 Sistemas Lineales 89

Figura 4.13: Grafica producida por los comamdos step y stepplot para el sistema(4.47) y sus equivalentes (4.46) y (4.48).

instantes de tiempo en los que se calcula la salida y, cuando el sistema esta dadoen forma de espacio estado, los valores del vector de estados en esos instantes detiempo. El comando stepplot se usa, sobre todo, para poder manipular (editar) lagrafica una vez producida. Los comandos

>> step(g)

>> step(sis)

>> step(sises)

producen los tres la misma grafica; la que aparece en la Figura 4.13. Esta mismagrafica se obtiene sustituyendo step por stepplot en los tres comandos.

Si lo que se desea es una grafica de la evolucion de los estados del sistema, sepodrıa proceder de la siguiente forma:

>> [y t x]=step(sis);

>> plot(t,x(:,1), ’b-’,t,x(:,2), ’r--’)

>> legend(’desplazamiento’, ’velocidad’)

La grafica obtenida se presenta en la Figura 4.14 mientras que la grafica que pro-ducirıan estos comandos para los estados del sistems sises (que es el devuelto porel comando ss a partir de la funcion de transferencia gpsq en (4.45)) se presenta enla Figura 4.15. Notese que aun cuando la respuesta, yptq, de los dos sistemas es lamisma (Figura 4.13), no lo son sus estados.

Finalmente, el comando stepinfo se usa para obtener informacion de los parame-tros de la respuesta del sistema a la funcion salto. Debe recordarse que el valor deestado estacionario (yee) es, de acuerdo con (4.44), D ´ CA´1B. El valor de losdemas parametros los proporciona stepinfo. Ası para el oscilador lineal que veni-mos considerando cualquiera de los tres comandos

90 El modelo de espacio-estado

Figura 4.14: Trayectorias de los estadosdel sistema (4.47).

Figura 4.15: Trayectorias de los estadosdel sistema definido por las matrices en(4.48).

>> S=stepinfo(sis)

>> S=stepinfo(g)

>> S=stepinfo(sises)

produce la misma salida (ver Figura 4.13):

S =

RiseTime: 2.1145

SettlingTime: 23.5265

SettlingMin: 0.8027

SettlingMax: 1.4432

Overshoot: 44.3235

Undershoot: 0

Peak: 1.4432

PeakTime: 5.5262

donde RiseTime es el tiempo de subida, Tr, SettlingTime es el tiempo de ajuste,Ts, Overshoot es la sobreelongacion por encima de yee, Mp, Undershot es el defectopor debajo de yee (que se define como el overshoot pero por defecto), SettlingMin ySettlingMax son los valores mınimo y maximo de y despues del tiempo de subida,Peak es el valor maximo de y, y Peaktime es el instante en el que se alcanza elmaximo valor de y.

En general, para un sistema de segundo orden como el oscilador lineal, la formade la curva que representa la respuesta del sistema a la funcion salto depende dela razon de amortiguamiento ζ mientras que la velocidad depende de la frecuencianatural del sistema ω0. En la Figura 4.16 se muestran las respuestas del sistema(4.32) a la funcion salto unidad (puptq “ γptq) para k “ 1, ζ “ 0,25 y varios valoresde ω0. Y en la Figura 4.17 se muestran las respuestas del mismo sistema para k “ 1,ω0 “ 0,5 y varios valores de ζ.

4.3 Sistemas Lineales 91

Figura 4.16: Respuesta del sistema(4.32) a la funcion salto unidad parak “ 1, ζ “ 0,25 y ω0 “ 0,25, 0,5, 0,75.

Figura 4.17: Respuesta del sistema(4.32) a la funcion salto unidad parak “ 1, ω0 “ 0,5 y ζ “ 0, 0,2, 0,5, 1,05.

Para el oscilador lineal$&%

9xptq “„

0 1´ω2

0 ´2ζω0

`„

0kω2

0

uptq

yptq “ “1 0

‰xptq,

(4.49)

se puede dar una expresion explıcita de la respuesta a la funcion salto unidad uptq “γptq. Para ello, partimos mejor de la ecuacion cuadratica original

:xptq ` 2ζω0 9xptq ` ω20xptq “ kω0, (4.50)

y observamos que xpptq “ k es una solucion particular de la ecuacion. Entonces, lasolucion general de la ecuacion es xptq “ xhptq`xpptq siendo xhptq la solucion generalde la ecuacion (4.50) cuando la fuerza externa es 0; es decir, de la correspondienteecuacion homogenea. Recordemos que la expresion de xhptq es diferente segun queζ ą 1, 0 ă ζ ă 1 o ζ “ 1 (vease Ejemplo 4.5). En cualquier caso, lo que nos interesaes la respuesta del sistema (en este caso yptq “ xptq) cuando el sistema se encuentraen reposo en el instante inicial t “ 0; es decir, cuando xp0q “ 0, 9xp0q “ 0. Un simplecalculo muestra que cuando se impone esta condicion inicial a xptq “ xhptq` k paracada expresion de xhptq en funcion de ζ, se obtiene la siguiente expresion explıcitade la respuesta del sistema:

yptq “ k

˜1´ e´ζω0t

˜cosωdt` ζa

1´ ζ2senωdt

¸¸, 0 ă ζ ă 1;

yptq “ kp1´ e´ω0tp1` ω0tqq, ζ “ 1;

yptq “ k

˜1´ 1

2

˜ζaζ2 ´ 1

` 1

¸e´ω0tpζ´

?ζ2´1q `

`1

2

˜ζaζ2 ´ 1

´ 1

¸e´ω0tpζ`

?ζ2´1q

¸, ζ ą 1

(4.51)

92 El modelo de espacio-estado

donde, recordemos, ωd “ ω0

a1´ ζ2 es la frecuencia de amortiguamiento.

Usando estas formulas se pueden calcular los parametros (tiempo de subida,exceso, tiempo de ajuste,. . . ) asociados a las respuestas a saltos unidad. Por ejemplo,para sistemas subamortiguados (0 ă ζ ă 1) haciendo la sustitucion ϕ “ arc cos ζ, lacorrespondiente expresion en (4.51) queda:

yptq “ k

ˆ1´ e´ζω0t

senϕpcospωdtq senϕ` cosϕ senpωdtqq

˙

“ k

˜1´ 1a

1´ ζ2e´ζω0t senpωdt` ϕq

¸.

(4.52)

Ası, el estado estacionario es

yee “ k, (4.53)

y la sobreelongacion se alcanza en el primer instante en que la derivada de y en (4.52)

se hace 0 que es en t “ π

2ωd. Se puede comprobar que las expresiones explıcitas para

la sobreelongacion, el tiempo de subida y el tiempo de ajuste son, respectivamente:

Mp “ eπζ?1´ζ2 , Tr « 1

ω0

tanϕ , Ts « 4

ζω0

, (4.54)

Respuesta a una excitacion sinusoidal

Otra senal de entrada comunmente usada para el analisis y diseno de sistemaslineales es un sinusoide (o una combinacion de sinusoides). A la respuesta de lossistemas lineales a este tipo de entradas se le conoce con el nombre de respuesta defrecuencia y mide la forma en la que el sistema responde a una excitacion sinusoidalen una de sus entradas. Para ver la forma en que se hace esto, evaluaremos la salida(4.37) para uptq “ cosωt, suponiendo m “ p “ 1. Aquı ω es la frecuencia de lasenal de entrada. Realizar los calculos que se necesitan al implantar directamenteuptq “ cosωt en (4.37) resulta bastante engorroso. Para aliviarlos haremos uso delprincipio de superposicion (ver (4.9)-(4.10)) de los sistemas lineales aplicandolo a lasalida. Para ello, notemos que

cosωt “ 1

2

`eiωt ` e´iωt˘ ,

de modo que calcularemos la respuesta del sistema lineal a una entrada de la formauptq “ est (con s un numero complejo arbitrario) y, luego, escogeremos s “ iωt ys “ ´iωt y calcularemos la media de las salidas correspondientes a estos dos valoresde s. Esto nos proporcionara la respuesta a la entrada uptq “ cosωt. Usando (4.37)

4.3 Sistemas Lineales 93

obtenemos (suponiendo la condicion inicial xp0q “ x0)

yptq “ CeAtx0 `ż t

0

CeApt´τqBestdτ `Dest “

“ CeAtx0 ` CeAtż t

0

epsI´AqτBdτ `Dest.

En el supuesto de que s “ ˘iω no sean valores propios de A, tendrıamos que sI´Aes invertible y podrıamos escribir

yptq “ CeAtx0 ` CeAt `psI ´ Aq´1epsI´AqsB˘ˇt

0`Dest “

“ CeAtx0 ` CeAtpsI ´ Aq´1`epsI´Aqt ´ I˘B `Dest “

“ CeAtx0 ` CeAtpsI ´ Aq´1`este´At ´ I˘B `Dest “

“ CeAtx0 ´ CeAtpsI ´ Aq´1B ` CpsI ´ Aq´1estB `Dest.En consecuencia,

yptq “ CeAt`x0 ´ psI ´ Aq´1B

˘looooooooooooooomooooooooooooooon

respuesta transitoria

` `CpsI ´ Aq´1B `D˘

est.looooooooooooooomooooooooooooooonrespuesta de estado estacionario

(4.55)

Vemos que, de nuevo, la solucion se compone de una respuesta transitoria y una deestado estacionario. La respuesta transitoria decae asintoticamente a cero si todoslos valores propios de la matriz de estados, A, tienen parte real negativa, mientrasque la de estado-estacionario es proporcional a la entrada (compleja) uptq “ est.

Debe observarse que en el caso que estamos estudiando (sistemas con una entraday una salida) la presencia del numero complejo s en CpsI ´ Aq´1B ` D hace queeste numero sea, en general, complejo incluso cuando las matrices A, B, C y Dsean todas reales. Si llamamos M al modulo de este numero y θ a su argumento,respectivamente, en la terminologıa habitual) tenemos que

Meiθ “ CpsI ´ Aq´1B `D, (4.56)

que es, cuando s se mira como una variable compleja, la funcion de transferenciadel sistema. Por lo tanto el valor de yee, la respuesta en estado estacionario (cuandohay convergencia para t suficientemente grande) sera:

yeeptq “Meiθest “Mest`iθ.

Cuando s “ iω, se dice que M es la ganancia y que θ es la fase del sistema auna frecuencia forzada dada ω. Es decir, ganancia(ω)=M y fase(ω)=θ. Esto tienela siguiente interpretacion: supongamos que la entrada es una onda sinusoidal deamplitud Au, frecuencia ω y desfase ψ: uptq “ Au senpωt` ψq. Podemos escribir

uptq “ Aupsenωt cosψ ` cosωt senψq ““ Au

ˆ1

2i

`eiωt ´ e´iωt˘ cosψ ` 1

2

`eiωt ` e´iωt˘ senψ

˙.

94 El modelo de espacio-estado

Figura 4.18: Respuesta de un sistemalineal a un sinusoidal. La entrada enlınea discontinua y la respuesta en con-tinua va adelantada ∆T segundos.

Figura 4.19: Respuesta de frecuencia enla que se muestra la ganancia y fase delsistema en funcion de frecuencia de en-trada.

Usando el principio de superposicion la salida en estado estacionario sera:

yeeptq “ Au

ˆ1

2i

`Meipωt`θq ´Me´ipωt`θq

˘cosψ ` 1

2

`Meipωt`θq `Me´ipωt`θq

˘senψ

˙“

“ MAupsenpωt` θq cosψ ` cospωt` θq senψq ““ MAu senppωt` pθ ` ψqq.

Esto significa que yee es una funcion de la misma naturaleza que la entrada: unafuncion sinusoidal con la misma frecuencia ω pero desplazada hacia la derecha oizquierda segun que θ sea positivo o negativo, respectivamente. Y la amplitud de lasalida es M veces la de la entrada. Es decir, si yeeptq “ Ay senpωt` ϕq entonces

gananciapωq “M “ AyAu

, fasepωq “ ϕ´ ψ “ θ.

Cuando el sistema es multivariable (m ą 1 o p ą 1) para cada elemento dela matriz de trasferencia tendrıamos una ganancia y una fase. Si Gpsq “ CpsIn ´Aq´1B `D entonces pondrıamos

Mkjeiθkj “ gkjpiωjq, 1 ď k ď p, 1 ď j ď m.

Mkj y θkj son la ganancia y fase de la respuesta ykptq a la excitacion sinusoidal

ujptq “ eiωjej

donde ej es a j-esima columna de Im. En la Figura 4.18 se muestra la respuestade frecuencia de un sistema lineal. La lınea discontinua muestra la grafica de laentrada que tiene amplitud 2 y la continua la respuesta a dicha entrada que tienemayor amplitud porque, en este ejemplo, la ganancia es aproximadamente M “ 1,54.Ademas la fase es positiva por lo que la salida va “adelantada” respecto a la entrada.

4.3 Sistemas Lineales 95

Para analizar las respuestas de frecuencia de los sistemas lineales se suelen usarlas graficas de Bode (Bode plot). En ellas se representa la ganancia y la fase delsistema en funcion de la frecuencia de la entrada. Este tipo de graficas se puedenobtener con la funcion bode o bodeplot del Control Toolbox de MATLAB, porejemplo. La Figura 4.19 muestra un ejemplo de este tipo de representacion.

Como en el caso de respuesta a la funcion salto, hay algunas propiedades estandarque se usan para caracterizar la respuesta de frecuencia:

La ganancia de frecuencia cero M0 es la ganancia del sistema para ω “ 0.Corresponde a la razon entre una entrada constante y la salida en estadoestacionario. Su valor se obtiene al sustituir s “ 0 en (4.56)

M0 “ ´CA´1B `D;

i.e., es la respuesta de estado estacionario a la funcion salto unidad. Es impor-tante notar que la ganancia de frecuencia cero solo esta definida cuando A esinvertible; es decir, si no tiene 0 como valor propio.

El ancho de banda ωb es el rango de frecuencia en el que la ganancia ha decre-cido no mas que 1?2 de su valor de referencia. Para sistemas con gananciade frecuencia cero finita y no nula, este valor de referencia es dicha ganancia.El valor de referencia puede ser distinto dependiendo de cada tipo de sistema.

El pico resonante Mr y la frecuencia del pico. El primero es el valor maximode la ganancia del sistema y el segundo es el valor de la frecuencia de entradadonde se alcanza el primero.

La resonancia es un fenomeno que se produce en los sistemas cuadraticos(como los osciladores lineales) que por su propia naturaleza producen unarespuesta (salida) sinusoidal. Para estos sistemas hay valores de frecuenciasque hacen que la ganancia de la respuesta a dicha frecuencia se amplifiqueenormemente. A este fenomeno se le llama resonancia. De ahı que al valormaximo de la ganancia de un sistema a una frecuencia dada se le llame picoresonante.

Comandos del Control Toolbox de MATLAB que proporcionan valores significa-tivos de la respuesta de frecuencia son:

freqresp devuelve un vector, h, (o matriz si el sistema es multivariable)con la respuesta (numero complejo) de frecuencia de un sistema para cier-tas frecuencias, w, determinadas por el propio algoritmo que implementa elcomando. Para saber las frecuencias usadas y sus respuestas, se puede usar

96 El modelo de espacio-estado

[h,w]=freqresp(sis), donde sis es el sistema definido en forma de espacio-estado o como matriz de transferencia. El comando h=freqresp(sis,w) de-vuelve la respuesta de frecuencia del sistema sis a la frecuencia w. En todoslos casos las respuestas de frecuencia son numeros complejos; su modulos sonlas ganancias en unidades absolutas y los angulos las fases en radianes. Parapasar de unidades absolutas a decibelios,dB, hay que multiplicar por 20 log10.El comando mag2db hace esta operacion.

El valor de M0 se puede obtener de la siguiente forma: M0=freqresp(sis,0),aunque el comando dcgain es mas apropiado.

getPeakGain devuelve Mr y la frecuencia ωr donde se alcanza el pico. Lasunidades para Mr que devuelve getPeakGain son unidades absolutas.

bandwidth(sis,vdB) devuelve la primera frecuencia en la que la ganancia dela respuesta del sistema cae por debajo del 70,79 % de M0 , o del valor vdB

especificado en decibelios.

getGainCrossover(sis,vub) devuelve un vector de dos frecuencias; son losextremos del intervalo de frecuencias entre los que la ganancia del sistema estapor encima o por debajo del valor especificado, vub, en unidades absolutas.Por ejemplo, si para un sistema H, wc = getGainCrossover(H,1) devuelve

>>wc =

1.2582

12.1843

esto quiere decir que entre (aproximadamente) 1,3 rad/seg y 12,2 rad/seg, elsistema excede la ganancia 0 dB.

Para el oscilador lineal, podemos dar explıcitamente una expresion para Meiθ.En efecto, Meiθ “ Cpiω ´ Aq´1B `D. Ahora bien,

gpsq “ CpsI ´ Aq´1B `D

es la funcion de trasferencia del sistema, que en el caso del oscilador lineal es:

gpsq “ kω20

s2 ` 2ζω0s` ω20

.

En consecuencia,

Meiθ “ kω20

piωq2 ` 2ζω0piωq ` ω20

“ kω20

ω20 ´ ω2 ` 2iζω0ω

.

4.3 Sistemas Lineales 97

Figura 4.20: Respuesta de frecuencia para un sistema de segundo orden en funcionde ζ. La grafica superior representa la ganancia y la inferior la fase.

Por lo tanto

M “ kω20apω2

0 ´ ω2q2 ` 4ζ2ω20ω

2“ kdˆ´

1´ ωω0

¯2˙2

` 4ζ2´ωω0

¯2

y

θ “ arc cosω2

0 ´ ω2

apω20 ´ ω2q2 ` 4ζ2ω2

0ω2.

Se comprueba ası que la ganancia es muy grande si la frecuencia de entrada, ω,es muy parecida a la frecuencia natural del sistema, ω0, y el coeficiente de amorti-guamiento, ζ, es muy pequeno. Es para estos valores cuando hay peligro de que seproduzca el fenomeno de la resonancia (que “el sistema entre en resonancia’ ’, sesuele decir). Ademas, la fase es casi cero para valores de la frecuencia forzada, ω,proximos a la frecuencia natural del sistema ω0.

En la Figura 4.20 se muestran las graficas de la ganancia y fase de un osciladorlineal para varios valores ζ. Valores pequenos de ζ producen picos resonantes masagudos y un cambio rapido en la fase cuando ω « ω0. A medida que ζ aumenta lamagnitud del pico decrece y los cambios de fase se hacen mas suaves. Notese quecuando ζ es pequeno, θ es casi 0 si ω0 ą ω y casi π radianes si ω0 ă ω.

Los siguientes comandos de MATLAB proporcionan el pico resonante y la fre-cuencia del pico para el oscilador lineal con valores ω0 “ 0,6 y ζ “ 0,05:

>> w=0.6; z=0.05;

>> num=w^2; den=[1 2*z*w w^2];

98 El modelo de espacio-estado

>> ft=tf(num,den)

ft =

0.36

-------------------

s^2 + 0.06 s + 0.36

Continuous-time transfer function.

>> [gp,fp] = getPeakGain(ft)

gp =

10

fp =

0.6000

>> gp_dB = mag2db(gp)

gp_dB =

20

El pico resonante se alcanza cuando la frecuencia de entrada coincide, aproximada-mente, con la frecuencia natural del sistema ω0 “ 0,6 (medidas absolutas).