Download - tesis.ipn.mx...INS TIT(ITO POLITÉCNICO NACIONAL SECRETARí¿ on TNVESTTGAcnów y posGRADo CARTA CESION DE DERECHOS En la Ciudad de Tijuana,Baja California, eldía2 del mes diciembre

Transcript

INSTITUTO POLITÉCNICO NACIONAL

CENTRO DE INVESTIGACIÓN Y DESARROLLO

DE TECNOLOGÍA DIGITAL

MAESTRÍA EN CIENCIAS EN SISTEMAS DIGITALES

“DISEÑO Y CONSTRUCCIÓN DE UN SISTEMAMECÁNICO SUBACTUADO”

TESIS

QUE PARA OBTENER EL GRADO DE

MAESTRO EN CIENCIAS EN SISTEMAS DIGITALES

PRESENTA

ING. RICARDO ARTURO RODRÍGUEZ CALDERÓN

BAJO LA DIRECCIÓN DE

DR. EDUARDO JAVIER MORENO VALENZUELA

DICIEMBRE 2015 TIJUANA, B.C., MÉXICO
INS TIT(ITO POLITÉCNICO NACIONALSECRETARí¿ on TNVESTTGAcnów y posGRADo

CARTA CESION DE DERECHOS

En la Ciudad de Tijuana,Baja California, eldía2 del mes diciembre del año 2015, el(la) que

suscribe Ricardo Arturo Rodríguez Calderón alumno (a) del Programa de MAESTnÍA B¡l

CIENCIAS EN SISTEMAS DIGITALES con número de registro A140815, adscrito al

CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL,manifiesta que es autor (a) intelectual del presente trabajo de Tesis bajo la dirección de

Eduardo Javier Moreno Valenzuela, cede los derechos del trabajo titulado Diseño y

Construcción de un Sistema Mecánico Subactuado, al Instituto Politécnico Nacional para

su difusión, con fines académicos y de investigación.

Los usuarios de la información no deben reproducir el contenido textual, gráficas o datos del

trabajo sin el permiso expreso del autor y/o director del trabajo. Este puede ser obtenido

escribiendo a la siguiente dirección Av. Instituto Politécnico Nacional 1310, Colonia Nueva

Tijuana, Tijuana, Büa California 22435, México, o a la dirección electrónica:[email protected]. Si el permiso se otorga, el usuario deberá dar el agradecimiento

correspondiente y citar la fuente del mismo.

Ricu.do Atturo Rodtígre, C

'fi'J,,y,, (^t1,,,; R A

Nombre y firma
Dedicatoria

A mis padres, Maŕıa Elena Calderón Valenzuela y Gilberto Rodŕıguez, porque los amo

con toda mi alma. Gracias a su amor, apoyo y paciencia he logrado ser lo que ahora

soy. Son mi mayor orgullo y siempre han sido la principal motivación para cumplir mis

metas.

A mis hermanos, Gilberto, César, José, Susana, y Julia Gabriela, por estar siempre

a mi lado y haberme apoyado durante toda mi vida.
Agradecimientos

A mi director de tesis, Dr. Eduardo Javier Moreno Valenzuela, por compartir

desinteresadamente sus conocimientos, mismos que fueron fundamentales en el desarrollo

de este trabajo, aśı como su disponibilidad y experiencia que me motivaron y despertaron

en mı́ la pasión por la investigación. Es motivo de orgullo ser su disćıpulo.

A mi amigo, Carlos Aguilar Avelar por su valioso apoyo y por haber supervisado esta

investigación.

A mi comité tutorial conformado por el Dr. Luis Tupak Aguilar Bustos, Dr. Victor

Hugo Dı́az Ramı́rez, M. C. David Jaime Saucedo Mart́ınez y el Dr. Juan José Tapia

Armenta, por el tiempo dedicado a cada uno de los avances de tesis. También por sus

observaciones y acertados comentarios que permitieron enriquecer el contenido de este

trabajo.

Al Dr. Miguel A. Álvarez Cabanillas por sus sabios consejos, a la Dra. Dolores Ale-

jandra Ferreira de Loza por su apoyo incondicional y al Dr. José Cruz Núñez Pérez por

estar al pendiente de mi formación académica y motivarme a enfrentar esta nueva etapa.

A mis amigos, Nataly Duarte, Sebastián Hernández, Regino Pérez, Alan Garćıa,

Oscar Garduño, Anel Otero, Enrique Hernández, Abraham Montoya, Pablo Obeso, Abel

Murillo, Juan T. Higuera, Ricardo Cárdenas, Diana Gamboa, Nataly Medina, Andrés

Cuevas, Reinier Arbelo, Lester Oropesa, Andrés Calvillo, Katherine Montoya, Luis

Montoya, Antonio de Jesús Obeso, Alejandro Galaviz, Jorge Dı́az, Daniel Espinoza, Luis

Zamudio, Luis Cantera, Carlos Villar, Carlos Magaña, Fabiola Hernández y Bernardo

Garnica, por los inolvidables momentos que compartimos y las atenciones brindadas.

Al Instituto Politécnico Nacional (IPN) y al Consejo Nacional de Ciencia y Tecnoloǵıa

(CONACYT) por el apoyo económico brindado.
Diseño y construcción de un sistema

mecánico subactuado

Resumen

En esta tesis se presenta el diseño y la construcción de un prototipo de un sistema

mecánico subactuado, espećıficamente un péndulo con rueda inercial. Se obtiene el modelo

dinámico del péndulo con rueda inercial mediante las ecuaciones de Euler-Lagrange. El

modelo dinámico considera un modelo de fricción que consiste en la fricción viscosa y la

fricción de Coulomb.

Posteriormente se realiza la identificación paramétrica del prototipo del péndulo con

rueda inercial mediante el algoritmo de mı́nimos cuadrados y utilizando el modelo dinámi-

co filtrado. El modelo dinámico es validado mediante resultados experimentales y de si-

mulación.

Utilizando los parámetros estimados, se diseña un controlador basado en la técnica de

linealización por retroalimentación que compensa las fricciones presentes en el sistema.

Finalmente se realizan experimentos para llevar a cabo la comparación del desempeño

experimental entre el controlador propuesto y un controlador reportado en la literatura.

Palabras Clave: Péndulo con rueda inercial, modelo dinámico, modelo dinámico

filtrado, identificación paramétrica, algoritmo de mı́nimos cuadrados, control basado en

linealización por retroalimentación.
Design and construction of an

underactuated mechanical system

Abstract

In this thesis, the design and construction of an underactuated mechanical system is

presented, particularly an inertia wheel pendulum. The dynamic model of the system

through the Euler-Lagrange equations is obtained. In the dynamic model, the terms of

viscous friction and Coulomb friction are considered.

Besides, the parametric identification of the inertia wheel pendulum test-bed is obtai-

ned by least squares algorithm and using the filtered dynamic model. The dynamic model

is validated by means of simulations and experimental results.

Using the estimated parameters of the system, a feedback linearization based controller

that compensates the friction forces is designed.

Finally, an experimental performance comparison is carried out using the proposed

controller and a known feedback linearization based controller.

Keywords: Inertia wheel pendulum, dynamic model, filtered dynamic model, para-

metric identification, least squares algorithm, feedback linearization control.
Contenido

1. Introducción 1

1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1

1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2.2. Objetivos espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.4. Organización del contenido por caṕıtulo . . . . . . . . . . . . . . . . . . . 5

2. Diseño y construcción de la plataforma experimental 7

2.1. Prototipo en CAD del péndulo con rueda inercial . . . . . . . . . . . . . . 7

2.2. Construcción de la plataforma experimental . . . . . . . . . . . . . . . . . 7

2.2.1. Tarjeta de adquisición de datos . . . . . . . . . . . . . . . . . . . . 9

2.2.2. Servoamplificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.2.3. Codificador óptico para la medición de q1 . . . . . . . . . . . . . . . 11

2.2.4. Actuador con codificador óptico para la medición de q2 . . . . . . . 11

2.2.5. Rodamientos del eje de rotación del péndulo . . . . . . . . . . . . . 12

2.2.6. Estructura del prototipo . . . . . . . . . . . . . . . . . . . . . . . . 12

2.2.7. Plataforma experimental . . . . . . . . . . . . . . . . . . . . . . . . 12

3. Modelo dinámico 14

3.1. Enerǵıa total del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3.2. Enerǵıa potencial total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

3.2.1. Enerǵıa potencial del péndulo . . . . . . . . . . . . . . . . . . . . . 16

3.2.2. Enerǵıa potencial de la rueda . . . . . . . . . . . . . . . . . . . . . 17

3.3. Enerǵıa cinética total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

3.3.1. Enerǵıa cinética del péndulo . . . . . . . . . . . . . . . . . . . . . . 17

3.3.2. Enerǵıa cinética de la rueda . . . . . . . . . . . . . . . . . . . . . . 18

3.4. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange . . . . . . . . 19

i
CONTENIDO ii

3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange del

péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . 20

3.5. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.5.1. Modelo de fricción viscosa . . . . . . . . . . . . . . . . . . . . . . . 21

3.5.2. Modelo de fricción de Coulomb asimétrica . . . . . . . . . . . . . . 22

3.6. Modelo del péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . 23

3.7. Representación de estados del péndulo con rueda inercial . . . . . . . . . . 24

4. Identificación paramétrica 26

4.1. Modelo de regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

4.2. Algoritmo de mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 28

4.3. Linealidad en los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . 29

4.4. Parametrización del modelo dinámico del péndulo con rueda inercial . . . . 29

4.5. Modelo dinámico filtrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial . . . . . . . 32

4.6. Selección del filtro f(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado . . . . . . . 33

4.6.2. Método de diferencias hacia atrás . . . . . . . . . . . . . . . . . . . 34

4.7. Filtro digital pasa bajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.7.1. Filtrado de la posición q . . . . . . . . . . . . . . . . . . . . . . . . 35

4.7.2. Algoritmo de diferenciación central . . . . . . . . . . . . . . . . . . 36

4.8. Filtrado discreto del modelo dinámico . . . . . . . . . . . . . . . . . . . . . 37

4.9. Control PD para excitación del sistema . . . . . . . . . . . . . . . . . . . . 38

4.10. Resultados experimentales de identificación paramétrica . . . . . . . . . . . 40

4.10.1. Validación del modelo dinámico . . . . . . . . . . . . . . . . . . . . 41

4.10.2. Discusión de resultados de identificación paramétrica . . . . . . . . 44

5. Control del péndulo con rueda inercial 47

5.1. Objetivo de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

5.2. Swing Up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.2.1. Modelo del péndulo con rueda inercial sin fricción . . . . . . . . . . 48

5.2.2. Linealización por retroalimentación parcial colocada . . . . . . . . . 49

5.2.3. Controlador de Swing Up . . . . . . . . . . . . . . . . . . . . . . . . 49

5.3. Control basado en linealización por retroalimentación . . . . . . . . . . . . 51

5.3.1. Derivadas de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

5.3.2. Linealización por retroalimentación . . . . . . . . . . . . . . . . . . 52

5.3.3. Controlador propuesto basado en linealización por retroalimentación 53
CONTENIDO iii

5.3.4. Controlador de Spong, Corke y Lozano (2001) . . . . . . . . . . . . 56

5.3.5. Diseño de experimentos de control . . . . . . . . . . . . . . . . . . . 57

5.4. Resultados experimentales de control . . . . . . . . . . . . . . . . . . . . . 59

5.4.1. Caso 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5.4.2. Caso 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.4.3. Caso 3 - Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . 60

5.4.4. Evaluación del desempeño de los controladores . . . . . . . . . . . . 63

5.4.5. Discusión de resultados de control . . . . . . . . . . . . . . . . . . . 65

6. Conclusiones y trabajo futuro 67

Referencias 71

A. Identificación paramétrica de un Acrobot 72

A.1. Modelo del Acrobot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72

A.2. Parametrización del modelo dinámico del Acrobot . . . . . . . . . . . . . . 75

A.3. Modelo dinámico filtrado del Acrobot . . . . . . . . . . . . . . . . . . . . . 76

A.4. Control PD para excitación del sistema (Acrobot) . . . . . . . . . . . . . . 78

A.5. Resultados experimentales de identificación paramétrica del Acrobot . . . . 78

A.5.1. Validación del modelo dinámico del Acrobot . . . . . . . . . . . . . 80

B. Publicaciones 85
Índice de figuras

1.1. Péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2.1. Prototipo en CAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

2.2. Vista lateral del prototipo del péndulo con rueda inercial. . . . . . . . . . . 8

2.3. Servoamplificador 16A20AC. . . . . . . . . . . . . . . . . . . . . . . . . . . 10

2.4. Codificador óptico de la empresa USDigitalr. . . . . . . . . . . . . . . . . 11

2.5. Motor de corriente directa con codificador óptico. . . . . . . . . . . . . . . 11

2.6. Rodamientos SKF 6201 2Z. . . . . . . . . . . . . . . . . . . . . . . . . . . 12

2.7. Estructura del prototipo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

2.8. Integración de la plataforma experimental. . . . . . . . . . . . . . . . . . . 13

3.1. Parámetros del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . 15

3.2. Vista frontal del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . 16

3.3. Función signo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.4. Tangente hiperbólica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4.1. Filtro f(s) y f(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 35

4.2. Filtro h(s) y h(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 36

4.3. Trayectoria deseada qd(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

4.4. Esquema de identificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40

4.5. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

4.6. Comparación entre q1(t) simulación y q1(t) experimento. . . . . . . . . . . 43

4.7. Error de predicción eq1(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 43

4.8. Comparación entre q2(t) simulación y q2(t) experimento. . . . . . . . . . . 44

4.9. Error de predicción eq2(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

4.10. Comparación entre τ(t) simulación y τ(t) experimento. . . . . . . . . . . . 45

4.11. Error de predicción eτ (t). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

5.1. Esquema de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

iv
ÍNDICE DE FIGURAS v

5.2. Comportamiento del sistema en el caso 1. . . . . . . . . . . . . . . . . . . . 59

5.3. Entrada de control τ(t) del sistema en el caso 1. . . . . . . . . . . . . . . . 60

5.4. Comportamiento del sistema en el caso 2. . . . . . . . . . . . . . . . . . . . 61

5.5. Entrada de control τ(t) del sistema en el caso 2. . . . . . . . . . . . . . . . 62

5.6. Perturbación τd(t) aplicada a los controladores de regulación. . . . . . . . . 63

5.7. Comportamiento del sistema en el caso 3 - Perturbado. . . . . . . . . . . . 64

5.8. Entrada de control τ(t) del sistema en el caso 3 - Perturbado. . . . . . . . 65

A.1. Plataforma experimental en configuración de Acrobot. . . . . . . . . . . . . 73

A.2. Vista frontal del Acrobot y sus parámetros. . . . . . . . . . . . . . . . . . 73

A.3. Trayectoria deseada qd(t) en la articulación 2 del Acrobot. . . . . . . . . . 79

A.4. Parámetros estimados θ̂ (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 80

A.5. Comparación entre q1(t) simulación y q1(t) experimento (Acrobot). . . . . 81

A.6. Error de predicción eq1(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 81

A.7. Comparación entre q2(t) simulación y q2(t) experimento (Acrobot). . . . . 82

A.8. Error de predicción eq2(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 82

A.9. Comparación entre τ(t) simulación y τ(t) experimento (Acrobot). . . . . . 83

A.10.Error de predicción eτ (t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 83
Índice de tablas

3.1. Parámetros del modelo dinámico. . . . . . . . . . . . . . . . . . . . . . . . 15

4.1. Parámetros θ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

4.2. Caracteŕısticas del filtro diseñado por el método de ventanas. . . . . . . . . 36

4.3. Caracteŕısticas del experimento de identificación. . . . . . . . . . . . . . . 40

4.4. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

4.5. Valor cuadrático medio (RMS). . . . . . . . . . . . . . . . . . . . . . . . . 46

5.1. Ganancias de los controladores basados en linealización por retroalimenta-

ción y duración de los casos experimentales. . . . . . . . . . . . . . . . . . 57

5.2. Caso 1. Porcentaje significa la mejora con respecto al controlador de Spong,

Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 65

5.3. Caso 2. Porcentaje significa la mejora con respecto al controlador de Spong,

Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66

5.4. Caso 3. Porcentaje significa la mejora con respecto al controlador de Spong,

Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66

A.1. Parámetros del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

A.2. Parámetros θ del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

A.3. Parámetros estimados θ̂ del Acrobot. . . . . . . . . . . . . . . . . . . . . . 79

A.4. Valor cuadrático medio (RMS) (Acrobot). . . . . . . . . . . . . . . . . . . 84

vi
Caṕıtulo 1

Introducción

Los sistemas subactuados son aquellos que poseen menos actuadores que grados de

libertad [1]. El control de sistemas subactuados es un campo de investigación muy popular,

ya que existen muchas aplicaciones de los sistemas subactuados en la robótica, veh́ıculos

marinos y aeroespaciales [2]. El caso de estudio de este proyecto de investigación es el

péndulo con rueda inercial que fue introducido por M. W. Spong en [3] y consiste en un

péndulo que en un extremo está acoplado a un eje rotatorio y en el otro extremo tiene

una rueda con un actuador acoplado. En la figura 1.1 se muestra el péndulo con rueda

inercial.

Los parámetros del sistema son requeridos para la implementación de esquemas de

control basados en el modelo y pueden ser obtenidos por mediciones directas o por métodos

de identificación [4].

1.1. Antecedentes

El péndulo con rueda inercial pertenece a la familia de sistemas mecánicos subactua-

dos de tipo péndulo invertido. Entre otros sistemas de este tipo se encuentran el péndulo

de Furuta presentado en [5], el Acrobot reportado en [1], el pendubot y el carro péndulo,

ambos estudiados a detalle en [2]. Por otro lado, helicópteros, veh́ıculos acuáticos y qua-

drotores son otros ejemplos de sistemas mecánicos subactuados. El estudio de los sistemas

mecánicos subactuados ha incrementado en los últimos años y el estado del arte se ha

enriquecido bastante.

La subactuación se debe a una de las siguientes razones [6]:

1. Puede ser natural debido a la dinámica de los sistemas tal como aeronaves, he-

licópteros y veh́ıculos submarinos.

1
1.1 Antecedentes 2

Figura 1.1: Péndulo con rueda inercial.

2. Puede ser impuesto por diseño para reducir costos y peso tal como satélites con dos

propulsores.

3. Puede ser debido a fallas de los actuadores en un sistema.

4. La subactuación puede ser impuesta artificialmente para generar sistemas complejos

no lineales de bajo orden con el fin de obtener un visión sobre el control de sistemas

mecánicos subactuados de más alto orden.

En algunos sentidos, las caracteŕısticas de subactuación son aún más dif́ıciles de ma-

nipular que las propias caracteŕısticas no lineales de un sistema. Dominar el control de

estos sistemas puede transformar sus deficiencias en ventajas. Por ejemplo para la misma

configuración espacial, un sistema completamente actuado requiere más controles que si

fuera subactuado y como consecuencia se incrementa el costo y el peso del sistema [6].

Adicionalmente la subactuación proporciona una solución de control para la seguridad

de sistemas. Por ejemplo, si un sistema completamente actuado presenta una falla en uno

de sus actuadores pero se cuenta con un sistema de control subactuado, entonces este
1.1 Antecedentes 3

último puede ser usado en situaciones cŕıticas (como por ejemplo en la falla de uno de

los propulsores de un aeroplano o un cohete) con el fin de evitar la falla completa del

sistema [6].

Preguntas frecuentes sobre los sistemas mecánicos subactuados espećıficamente del

péndulo con rueda inercial es para qué sirve o qué tarea realiza. El péndulo con rueda

inercial es un banco de pruebas utilizado en teoŕıas de control lineal, control no lineal,

identificación paramétrica, modelado dinámico de sistemas, entre otras áreas de la inves-

tigación.

Antecedentes sobre el diseño, la construcción, la identificación paramétrica y el control

del péndulo con rueda inercial se mencionan a continuación. En lo que respecta al diseño

y la construcción de prototipos, en [7] se describe a detalle la construcción de un prototipo

de péndulo con rueda inercial y se obtiene el modelo dinámico, posteriormente se realizan

pruebas experimentales para la validación del modelo. En [8] de igual manera se construye

un péndulo con rueda inercial y se realizan experimentos de control.

El péndulo con rueda inercial ha sido identificado fuera de ĺınea en [9] mediante el

algoritmo de mı́nimos cuadrados, donde las velocidades y aceleraciones articulares se

obtienen con la simple diferenciación numérica de las posiciones articulares. Por otro

lado, en [10] se aborda la identificación paramétrica en ĺınea de un péndulo con rueda

inercial mediante el enfoque algebraico.

En cuanto a control, en el péndulo con rueda inercial y otros sistemas mecánicos

subactuados, se estudian tres principales objetivos de control: el Swing Up, la regulación

y la inducción de oscilaciones.

En lo que respecta al Swing Up del péndulo con rueda inercial, en [3] se presenta un

controlador de Swing Up basado en las propiedades de pasividad del sistema, en donde

previamente se implementa en el sistema la técnica de linealización por retroalimentación

parcial colocada. En [11] se detalla el procedimiento para la obtención de un controlador

de Swing Up mediante las propiedades de pasividad del sistema. En [2] se proponen dos

controladores de Swing Up para el péndulo con rueda inercial, ambos basados en la enerǵıa

del sistema.

En [12] se diseña e implementa un controlador de seguimiento de trayectoria mediante

la técnica de linealización por retroalimentación.

Además del Swing Up y la regulación, existen otros objetivos de control tal como

en [13], donde se propone un controlador por doble relevador para generar oscilaciones de

frecuencia y amplitud deseada sin la necesidad de implementar un control de seguimiento

de trayectoria.

La fricción está presente en todos los sistemas mecánicos y tiene un impacto signi-
1.2 Objetivos 4

ficativo en el control. Para el diseño exitóso de sistemas mecatrónicos se requiere de la

comprensión de los efectos de la fricción aśı como de técnicas para la compensación. Los

fenómenos de fricción son complicados porque son causados por diferentes mecanismos

f́ısicos [14].

A pesar de la complejidad del fenómeno de la fricción, varios modelos de fricción sim-

ples suelen ser adoptados por la comunidad de robótica. El modelo de fricción compuesto

por la fricción viscosa y de Coulomb es por lejos el más popular [15].

Para los ingenieros de control es importante entender los fenómenos de fricción y saber

como lidiar con ellos [16]. También es importante entender este fenómeno para mejorar el

comportamiento de los sistemas [14].

Antecedentes sobre estudios de los efectos de la compensación de fricción en sistemas

mecánicos subactuados se describen a continuación.

En [17] se muestran resultados experimentales del control de un péndulo con rueda

inercial mediante la técnica de linealización por retroalimentación. Para el diseño del

controlador se considera fricción viscosa y de Coulomb solo en el péndulo. El controlador

con la salida propuesta es de grado relativo 2.

Para el péndulo de Furuta, en [18] un controlador que considera fricción dinámica fue

diseñado mediante el método IDA-PBC. Para caracterizar la fricción dinámica se utiliza

el modelo de Dahl y con la finalidad de mostrar la efectividad de la compensación de

fricción, se realizan dos experimentos para comparar el desempeño del controlador cuando

la fricción es compensada y cuando no es compensada. Por otro lado, en [19] se estudian

los efectos de la compensación de la fricción en un Pendubot a través de experimentos

que consisten en el Swing Up y regulación del sistema en su punto de equilibrio inestable

(arriba-arriba).

1.2. Objetivos

1.2.1. Objetivo general

Llevar a cabo el diseño, la construcción, la identificación paramétrica y el control de

un sistema mecánico subactuado de dos grados de libertad.

1.2.2. Objetivos espećıficos

Los objetivos espećıficos de este proyecto de investigación son:

Modelar un sistema mecánico subactuado de péndulo con rueda inercial utilizando
1.3 Aportaciones 5

las ecuaciones de Euler-Lagrange.

Diseñar y construir un prototipo de péndulo con rueda inercial.

Identificar los parámetros del péndulo con rueda inercial mediante el algoritmo de

mı́nimos cuadrados.

Controlar el péndulo con rueda inercial.

Obtener resultados experimentales de identificación paramétrica y de control.

1.3. Aportaciones

Las principales aportaciones de este proyecto de tesis son:

El diseño y la construcción de un péndulo con rueda inercial.

La obtención del modelo dinámico del sistema en donde se considera un modelo

suave de fricción de Coulomb asimétrica.

La identificación paramétrica del péndulo con rueda inercial mediante el algoritmo

de mı́nimos cuadrados.

La propuesta de un controlador de regulación que compensa la fricción viscosa y la

fricción de Coulomb y que se basa en la técnica de linealización por retroalimenta-

ción.

La comparación entre el desempeño del controlador propuesto y el desempeño de un

controlador reportado en la literatura y que está basado en la técnica de linealización

por retroalimentación.

1.4. Organización del contenido por caṕıtulo

El presente documento de tesis está organizado como sigue.

En el caṕıtulo 2 se presenta el diseño en CAD y la estructura del prototipo del péndulo

con rueda inercial. En este caṕıtulo se realiza una descripción de los dispositivos que

conforman la plataforma experimental del péndulo con rueda inercial. En el caṕıtulo 3 se

muestra a detalle el proceso de la obtención del modelo dinámico del péndulo con rueda

inercial mediante las ecuaciones de Euler-Lagrange.
1.4 Organización del contenido por caṕıtulo 6

En el caṕıtulo 4 se presenta un procedimiento de identificación paramétrica fuera

de ĺınea utilizando el algoritmo de mı́nimos cuadrados y el modelo dinámico filtrado.

Posteriormente, se obtienen resultados experimentales de la identificación paramétrica

del péndulo con rueda inercial.

En el caṕıtulo 5 se presenta el control del péndulo con rueda inercial. En este caṕıtulo

se define el objetivo de control y se abordan los controladores necesarios para cumplirlo.

En términos generales el objetivo de control consiste en hacer rotar el péndulo de su

posición vertical hacia abajo a una región cercana a su posición vertical hacia arriba y

después conmutar a un controlador que regule el péndulo en su posición vertical hacia

arriba. Posteriormente, se diseña un controlador basado en la técnica de linealización por

retroalimentación y se realiza la evaluación del desempeño entre el controlador propuesto

y un controlador reportado en la literatura.

En el caṕıtulo 6 se dan las conclusiones del proyecto de tesis y los posibles trabajos

futuros.
Caṕıtulo 2

Diseño y construcción de la

plataforma experimental

2.1. Prototipo en CAD del péndulo con rueda iner-

cial

Hoy en d́ıa herramientas de diseño asisitido por computadora (CAD) como

SolidWorksr, permiten diseñar cada uno de los componentes de una estructura y cal-

cular los parámetros tales como masa, momento de inercia, longitud y densidad de cada

una de las piezas que la conforman. SolidWorksr también permite visualizar el com-

portamiento de mecanismos ensamblados con la finalidad de evitar colisiones entre sus

componentes. Existen también herramientas que permiten realizar animaciones en 3D de

sistemas mecánicos tal es el caso de SimMechanicsr de MATLAB Simulinkr.

En la figura 2.1 se aprecia el prototipo en CAD en una vista isométrica aśı como

sus componentes. Por otro lado, en la figura 2.2 se muestra la vista lateral del prototipo

diseñado.

2.2. Construcción de la plataforma experimental

En la actualidad compañias como Quanserr Inc. y B&R Automationr comercializan el

péndulo con rueda inercial instrumentado y listo para su uso en experimentos de tiempo

real. Los fabricantes en ocasiones propocionan el modelo del sistema y el valor de sus

parámetros, en otros casos el usuario debe calcularlos mediante herramientas de medición

u otros medios.

Para diseñar, construir un prototipo y llevar a cabo su instrumentación, se requiere

7
2.2 Construcción de la plataforma experimental 8

Figura 2.1: Prototipo en CAD.

Figura 2.2: Vista lateral del prototipo del péndulo con rueda inercial.
2.2 Construcción de la plataforma experimental 9

de una selección adecuada de la tarjeta de adquisición de datos, de codificadores ópticos,

del actuador, del tipo de material de la estructura, de la etapa de potencia, el equipo de

cómputo para el procesamiento de los datos, los cables de alimentación y herramientas

de maquinado. En el caso de prototipos de gran tamaño y gran inercia, los rodamientos

o baleros juegan un rol importante para el soporte de los ejes no actuados.

Regularmente las plataformas experimentales cuentan únicamente con sensores de po-

sición articular. Sin embargo, las velocidades articulares pueden ser estimadas mediante

la diferenciación discreta de las posiciones articulares. Por otro lado, ante la ausencia de

sensores de torque, una solución para estimar el torque aplicado es utilizar la constante

de torque del motor proporcionada por el fabricante multiplicada por la corriente medida

con un sensor apropiado.

En esta sección se presenta un nuevo prototipo de péndulo con rueda inercial donde se

describen detalladamente los componentes necesarios para su correcto funcionamiento en

experimentos de tiempo real. Antecedentes sobre la construcción de prototipos de péndulo

con rueda inercial se han reportado en [7] y [8].

Una plataforma experimental de un sistema mecánico subactuado para su correcto y

completo funcionamiento debe estar compuesta de las siguientes etapas:

1. Procesamiento y adquisición de datos: Se leen las señales provenientes de dispositi-

vos, se procesan y se toman decisiones de acuerdo a alguna regla o ley.

2. Etapa de potencia: Las señales que se reciben son amplificadas con la finalidad de

energizar un actuador o actuadores acoplados en las articulaciones de un prototipo

y producir movimiento.

3. Retroalimentación de señales: Las señales de salida (posición, velocidad, corriente,

etc.) del sistema medidas en tiempo real mediante dispositivos de instrumentación,

retornan a la etapa inicial de procesamiento y adquisición de datos.

A continuación se presentan los dispositivos seleccionados y se describen las carac-

teŕısticas más importantes. También se muestra esquemáticamente la integración de la

plataforma experimental y la conexión entre sus etapas.

2.2.1. Tarjeta de adquisición de datos

La adquisición de los datos se realiza mediante una tarjeta Sensorayr 626 y el proce-

samiento de los datos con una PC a través de Real Time Windows Target de MATLABr.

La tarjeta de adquisición de datos es encargada de la lectura de los codificadores ópticos
2.2 Construcción de la plataforma experimental 10

Figura 2.3: Servoamplificador 16A20AC.

y de proporcionar las señales de control. El sistema operativo empleado es Windowsr XP

con la versión de MATLABr 2007a con una frecuencia de muestreo de 1 [Khz].

2.2.2. Servoamplificador

El servoamplificador es primordial pues se encarga de amplificar las señales prove-

nientes de la tarjeta de adquisición de datos. El servoamplificador es el 16A20AC de la

empresa Advanced Motion Controlsr y puede ser configurado en modo voltaje o modo

corriente. En este proyecto de investigación se configura el servoamplificador en modo

corriente, es decir,

im = Ksav ,

donde im es la corriente entregada por el servo amplificador, Ksa = 1 [A/V] es una

ganancia ajustable de amplificación y v es el voltaje de entrada al servoamplificador. La

entrada de control al sistema mecánico es

τ = Kmim ,

donde Km = 0.0551 [Nm/A] es la constante de torque del motor de corriente directa

modelo DCM50202-02D-1000 que se describirá más adelante.
2.2 Construcción de la plataforma experimental 11

2.2.3. Codificador óptico para la medición de q1

El codificador óptico para la medición de la posición articular del péndulo es de la em-

presa USDigitalr modelo HB5M-1000-250-IE-D-H con carcasa de aluminio. La resolución

del codificador óptico es de 1000 pulsos por revolución, resaltando que cada pulso puede

proporcionar 1, 2 o 4 conteos dependiendo de la decodificación o multiplicación externa

(x1, x2 o x4). En la figura 2.4 se aprecia el codificador óptico HB5M en tres diferentes

vistas.

Figura 2.4: Codificador óptico de la empresa USDigitalr.

2.2.4. Actuador con codificador óptico para la medición de q2

El actuador utilizado en la rueda es un motor de corriente directa modelo DCM50202-

02D-1000 de la empresa Leadshine Technologyr. El motor cuenta con un codificador

óptico cuya resolución es de 1000 pulsos por revolución. La constante de torque del motor

es Km = 0.0551 [Nm/A] y es de utilidad para estimar el torque aplicado al sistema. En

la figura 2.5 se muestra el motor de corriente directa en una vista frontal y una vista

isométrica.

Codificador

óptico

Figura 2.5: Motor de corriente directa con codificador óptico.
2.2 Construcción de la plataforma experimental 12

2.2.5. Rodamientos del eje de rotación del péndulo

Los rodamientos son cruciales ya que soportan el péndulo, la rueda y el actuador,

además facilitan la medición de la posición del péndulo, pues evitan que el codificador

óptico soporte peso. El modelo usado es el 6201 2Z de la empresa SKFr. En la figura 2.6

se aprecian dichos rodamientos.

Figura 2.6: Rodamientos SKF 6201 2Z.

2.2.6. Estructura del prototipo

En la figura 2.7 se presenta la estructura del péndulo con rueda inercial en donde el

péndulo, la rueda, la base inferior y la base superior son de aleación de aluminio 6061.

Por otro lado las patas y el perno son de acero estirado en fŕıo ya que son componentes de

soporte. El maquinado se realizó mediante máquinas herramientas para dar un acabado

fino a los componentes de la estructura.

2.2.7. Plataforma experimental

En la figura 2.8 se muestra de forma esquemática la plataforma experimental. La

plataforma permite implementar en tiempo real técnicas de control lineal y no lineal.

También permite recolectar información del sistema para la aplicación de algoritmos de

identificación paramétrica, con la finalidad de construir un modelo que represente el com-

portamiento del sistema de una manera aproximada.
2.2 Construcción de la plataforma experimental 13

Figura 2.7: Estructura del prototipo.

Posición del péndulo y

posición de la rueda

ServoamplificadorSensoray 626

Windows

XP

Figura 2.8: Integración de la plataforma experimental.
Caṕıtulo 3

Modelo dinámico

En el presente caṕıtulo se muestra a detalle el proceso para la obtención del modelo

dinámico del péndulo con rueda inercial. El modelo dinámico es obtenido por medio de

las ecuaciones de movimiento de Euler-Lagrange. Posteriormente, en el modelo dinámico

se adiciona un modelo de fricción, conformado por la fricción viscosa y una aproximación

continua de la fricción de Coulomb.

En la literatura se han presentado modelos con diferentes sistemas de referencia, con

distintos modelos de fricción y en algunos casos considerando la dinámica del actuador. Es

común que la fricción no sea considerada en los modelos con la finalidad de simplificarlos

y facilitar su estudio, sin embargo, la calidad en la predicción del comportamiento del

sistema experimental disminuye considerablemente.

Primeramente se aborda la enerǵıa total del sistema, que consiste en la suma de la

enerǵıa cinética total y la enerǵıa potencial total. Posteriormente se obtiene el lagrangiano

pues es requerido en las ecuaciones de movimiento de Euler-Lagrange. En la figura 3.1 se

muestra el péndulo con rueda inercial con los parámetros del sistema y en la tabla 3.1 se

muestra el significado de cada uno de ellos.

3.1. Enerǵıa total del sistema

La enerǵıa total del sistema es dada por

E(q, q̇) = K(q, q̇) + U(q) ,

donde q = [q1 q2]T , K(q, q̇) es la enerǵıa cinética total y U(q) es la enerǵıa potencial total

del sistema.

14
3.1 Enerǵıa total del sistema 15

Figura 3.1: Parámetros del péndulo con rueda inercial.

Tabla 3.1: Parámetros del modelo dinámico.

Parámetro Descripción

m1 Masa del péndulom2 Masa de la ruedal1 Largo del péndulolc1 Distancia del eje de rotación

al centro de masa del pénduloI1 Momento de inercia del pénduloI2 Momento de inercia de la ruedafv1 Fricción viscosa del péndulofv2 Fricción viscosa de la ruedacf1 Coeficiente de fricción de Coulomb 1cf2 Coeficiente de fricción de Coulomb 2g Aceleración de la gravedad
3.2 Enerǵıa potencial total 16

Figura 3.2: Vista frontal del péndulo con rueda inercial.

3.2. Enerǵıa potencial total

La enerǵıa potencial total del sistema es dada por

U(q) = U1(q) + U2(q) ,

donde U1(q) es la enerǵıa potencial del péndulo y U2(q) es la enerǵıa potencial de la rueda.La figura 3.2 es de utilidad para la deducción de la enerǵıa potencial total del sistema.

3.2.1. Enerǵıa potencial del péndulo

La enerǵıa potencial del péndulo con respecto a su centro de masa lc1 se expresa como

U1(q) = h− [lc1 cos(π − q1)m1g] ,

usando la identidad trigonométrica

cos(a− b) = cos(a) cos(b) + sin(a) sin(b) , (3.1)
3.3 Enerǵıa cinética total 17

se obtiene

U1(q) = h− lc1 [cos(π) cos(q1) + sin(π) sin(q1)]m1g ,

= h− lc1 [− cos(q1)]m1g ,

= h+ lc1 cos(q1)m1g.

3.2.2. Enerǵıa potencial de la rueda

La enerǵıa potencial de la rueda se define como

U2(q) = h− [l1 cos(π − q1)m2g] .

Usando la identidad trigonométrica de la ecuación (3.1) se obtiene

U2(q) = h− l1 [cos(π) cos(q1) + sin(π) sin(q1)]m2g ,

= h− l1 [− cos(q1)]m2g ,

= h+ l1 cos(q1)m2g.

3.3. Enerǵıa cinética total

La enerǵıa cinética total del sistema es la suma de la enerǵıa cinética total del péndulo

K1(q, q̇) y la enerǵıa cinética total de la rueda K2(q, q̇), esto es,

K(q, q̇) = K1(q, q̇) +K2(q, q̇).

3.3.1. Enerǵıa cinética del péndulo

La enerǵıa cinética total del péndulo es dada por la suma de la enerǵıa cinética rota-

cional y la enerǵıa cinética traslacional es decir

K1(q, q̇) =1

2I1q̇1

2 +1

2m1V

21 ,

=1

2I1q̇1

2 +1

2m1l

2c1q̇

21 ,

donde V1 es la rapidez del centro de masa del péndulo.

Se debe aclarar que la rapidez es un escalar y representa la magnitud de la velocidad la

cual tiene carácter vectorial. La obtención de V1 se muestra detalladamente a continuación.
3.3 Enerǵıa cinética total 18

Las coordenadas del centro de masa del péndulo expresadas en las coordenadas del

plano x− y son

x1 = lc1 sin(π − q1) ,

y1 = −lc1 cos(π − q1) ,

por lo tanto vector de velocidad v1 del centro de masa del péndulo es

v1 =

[ẋ1

ẏ1

]=

[−lc1 cos(π − q1)q̇1−lc1 sin(π − q1)q̇1

]. (3.2)

Para obtener la rapidez al cuadrado V 21 únicamente se eleva al cuadrado la norma del

vector de velocidad expresado en la ecuación (3.2), es decir,

V 21 = ‖v1‖2 ,

= v1Tv1 ,

= (−lc1)2 cos(π − q1)2q̇21 + (−lc1)2 sin(π − q1)2q̇21 ,

= l2c1q̇21 ,

donde se ha utilizado la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.

3.3.2. Enerǵıa cinética de la rueda

De igual manera la enerǵıa cinética total de la rueda es dada por la suma de la enerǵıa

cinética rotacional y la enerǵıa cinética traslacional, es decir,

K2(q, q̇) =1

2I2(q̇1 + q̇2)

2 +1

2m2V

22 ,

=1

2I2(q̇1 + q̇2)

2 +1

2m2l

21q̇

21 ,

donde V2 es la rapidez del centro de masa de la rueda.

La obtención de V2 se muestra a continuación. Las coordenadas del centro de masa de

la rueda en el plano x− y son

x2 = l1 sin(π − q1) ,

y2 = −l1 cos(π − q1) ,
3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 19

por lo tanto el vector de velocidad v2 es dado por

v2 =

[ẋ2

ẏ2

]=

[−l1 cos(π − q1)q̇1−l1 sin(π − q1)q̇1

]. (3.3)

Se procede a obtener la rapidez V 22 elevando al cuadrado la norma del vector v2

expresado en la ecuación (3.3), es decir,

V 22 = ‖v2‖2 ,

= v2Tv2 ,

= (−l1)2 cos(π − q1)2q̇21 + (−l1)2 sin(π − q1)2q̇21 ,

= l21q̇21 ,

donde se utiliza la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.

3.4. Lagrangiano y ecuaciones de movimiento de

Euler-Lagrange

El lagrangiano L(q, q̇) es la diferencia entre la enerǵıa cinética K y la enerǵıa potencialU , esto es,

L(q, q̇) = K(q, q̇)− U(q).

Las ecuaciones de movimiento de Euler-Lagrange son dadas por

d

dt

[∂L(q, q̇)∂q̇

]− ∂L(q, q̇)

∂q= τ ,

o de manera equivalente

d

dt

[∂L(q, q̇)∂q̇i

]− ∂L(q, q̇)

∂qi= τi , i = 1, 2. (3.4)

donde τi corresponde a los torques entregados por los actuadores.
3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 20

3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-

Lagrange del péndulo con rueda inercial

El lagrangiano L(q, q̇) del péndulo con rueda inercial es dado por

L(q, q̇) = 12I1q̇1

2 +1

2m1l

2c1q̇

21 +

1

2I2(q̇1 + q̇2)

2 +1

2m2l

21q̇

21

−[h+ lc1 cos(q1)m1g + h+ l1 cos(q1)m2g].

Se procede ahora a calcular algunas derivadas requeridas para la obtención de la ecuación

de movimiento del péndulo, esto es,

∂L∂q̇1

= I1q̇1 +m1l2c1q̇1 + I2q̇1 + I2q̇2 +m2l

21q̇1 ,

d

dt

[∂L∂q̇1

]= I1q̈1 +m1l

2c1q̈1 + I2q̈1 + I2q̈2 +m2l

21q̈1 ,

∂L∂q1

= m1glc1 sin(q1) +m2gl1 sin(q1) ,

por lo tanto desarrollando la ecuación (3.4) para la articulación 1 (péndulo), es decir,

d

dt

[∂L(q, q̇)∂q̇1

]− ∂L(q, q̇)

∂q1= τ1 ,

se obtiene la ecuación de movimiento del péndulo

I1q̈1 +m1l2c1q̈1 + I2q̈1 + I2q̈2 +m2l

21q̈1 − [m1glc1 sin(q1) +m2gl1 sin(q1)] = 0 ,

y mediante la factorización de términos se reduce a

[I1 + I2 +m1l

2c1 +m2l

21

]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) = 0 , (3.5)

donde el torque τ1 = 0 porque el péndulo no es actuado.

De igual manera para la obtención de la ecuación de movimiento de la rueda se desa-

rrollan las siguientes derivadas

∂L∂q̇2

= I2q̇1 + I2q̇2 ,

d

dt

[∂L∂q̇2

]= I2q̈1 + I2q̈2 ,

∂L∂q2

= 0 ,
3.5 Modelo de fricción 21

por lo tanto desarrollando la ecuación (3.4) para la articulación 2 (rueda), es decir,

d

dt

[∂L(q, q̇)∂q̇2

]− ∂L(q, q̇)

∂q2= τ2 ,

se obtiene la ecuación de movimiento de la rueda y es dada por

I2q̈1 + I2q̈2 = τ2 , (3.6)

donde τ2 es el torque aplicado a la rueda. Se define τ = τ2 ya que es el único torque

aplicado al sistema.

3.5. Modelo de fricción

Es común que el sistema sea estudiado únicamente con el modelo obtenido con las

ecuaciones de movimiento de Euler-Lagrange, sin embargo, el modelo no predice con pre-

cisión el comportamiento del sistema experimental. Esto se debe a que en la práctica

existen fenómenos tales como la fricción viscosa, la fricción de Coulomb y la fricción

estática que se oponen al movimiento de las articulaciones. Para modelar con precisión un

sistema experimental es crucial tomar en cuenta estas fuerzas no conservativas presentes

en el sistema. El modelo de fricción utilizado en el presente proyecto de investigación es

un modelo que considera fricción viscosa y fricción de Coulomb. La fricción de Coulomb

es aproximada mediante una tangente hiperbólica y debido a la naturaleza del actua-

dor presenta un comportamiento asimétrico. Por lo tanto, la fricción de Coulomb tiene

una estructura particular y en este trabajo será denominada como fricción de Coulomb

asimétrica.

3.5.1. Modelo de fricción viscosa

El modelo de fricción viscosa está dado por

Fvq̇ =

[fv1 0

0 fv2

][q̇1

q̇2

]=

[fv1q̇1

fv2q̇2

], (3.7)

donde Fv ∈ IR2×2 es la matriz de fricción viscosa. En la ecuación (3.7) se aprecia que lafricción viscosa es considerada en las articulaciones del péndulo y de la rueda.
3.5 Modelo de fricción 22

3.5.2. Modelo de fricción de Coulomb asimétrica

La fricción de Coulomb es modelada mediante una función signo. La función signo es

una función con naturaleza discontinua considerada como una no linealidad “dura” y es

dada por

sign(q̇) =

1 si q̇ > 0 ,

0 si q̇ = 0 ,

−1 si q̇ < 0.(3.8)

En la figura 3.3 se muestra la función signo expresada en la ecuación (3.8).

−1 −0.5 0 0.5 1

−1

−0.5

0

0.5

1

q̇

sign(q̇)

Figura 3.3: Función signo.

La función signo puede ser aproximada con una tangente hiperbólica que es una función

continua, esto es,

sign(q̇) ≈ tanh(βq̇) ,

donde β > 0. En la figura 3.4 se muestra la función tangente hiperbólica con distintos

valores de β.

En este proyecto de investigación el modelo de fricción de Coulomb utilizado es la

aproximación continua de la función signo mediante la tangente hiperbólica. Los actua-

dores como los motores de corriente directa pueden comportarse de manera asimétrica en
3.6 Modelo del péndulo con rueda inercial 23

−1 −0.5 0 0.5 1

−1

−0.5

0

0.5

1

q̇

tanh(β

q̇)

β = 100β = 45β = 20β = 7

Figura 3.4: Tangente hiperbólica.

cuanto a la fricción de Coulomb, esto es, cuando la velocidad es positiva se tiene un valor

para el coeficiente de fricción cf1 y cuando es negativa se tiene otro valor de coeficiente

de fricción cf2. Para modelar este comportamiento asimétrico en los actuadores, se utiliza

la tangente hiperbólica estructurada de una manera particular. La estructura del modelo

de fricción de Coulomb asimétrica viene dada por

fc(q̇) =

[0

cf1[12

+ 12

tanh(βq̇2)]

+ cf2[−1

2− 1

2tanh(−βq̇2)

]] , (3.9)donde β = 100. Como se aprecia en la ecuación (3.9) este tipo de fricción es únicamente

adicionada en la articulación actuada.

3.6. Modelo del péndulo con rueda inercial

Finalmente el modelo del péndulo con rueda inercial que considera fricción es repre-

sentado mediante las ecuaciones (3.5), (3.6), (3.7) y (3.9) de la siguiente manera

[I1 + I2 +m1l

2c1 +m2l

21

]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) + fv1q̇1 = 0 ,

I2q̈1 + I2q̈2 + fv2q̇2 + cf1

[1

2+

1

2tanh(βq̇2)

]+ cf2

[−1

2− 1

2tanh(−βq̇2)

]= τ.
3.7 Representación de estados del péndulo con rueda inercial 24

Usualmente los modelos dinámicos se expresan en su forma compacta como

M q̈ + gm(q) + Fvq̇ + fc(q̇) = u , (3.10)

siendo

M =

[I1 + I2 +m1l

2c1 +m2l

21 I2

I2 I2

],

gm(q) =

[− [m1lc1 +m2l1] g sin(q1)

0

],

Fv =

[fv1 0

0 fv2

],

fc(q̇) =

[0

cf1[12

+ 12

tanh(βq̇2)]

+ cf2[−1

2− 1

2tanh(−βq̇2)

]] ,u =

[0

τ

],

donde q, q̇, q̈ ∈ IR2 son los vectores de posición articular, velocidad articular y aceleraciónarticular, respectivamente, M ∈ IR2×2 es la matriz de inercia y es una matriz simétricay positiva definida, gm(q) ∈ IR2 es el vector de pares gravitacionales, Fv ∈ IR2×2 es unamatriz diagonal que contiene los coeficientes de fricción viscosa, u ∈ IR2 es el vector deentrada, fc(q̇) ∈ IR2 es el vector de aproximación continua de la fricción de Coulombasimétrica y β = 100 es parte del argumento de la tangente hiperbólica. Es importante

mencionar que u = [0 τ ]T , donde τ ∈ IR es el torque aplicado a la rueda.

3.7. Representación de estados del péndulo con rue-

da inercial

Un modelo es la correlación entre las variables del sistema y la solución de esta corre-

lación son los estados que describen el comportamiento del sistema.

A continuación se obtiene la representación de estados del péndulo con rueda inercial

dado por la ecuación (3.10). Primeramente, se despejan las aceleraciones articulares, esto

es,

q̈ = M−1 [u− gm(q)− Fvq̇ − fc(q̇)] ,
3.7 Representación de estados del péndulo con rueda inercial 25

donde

M−1 =1

det(M)adj(M) ,

det(M) = M11M22 −M21M12 ,

adj(M) =

[M22 −M12−M21 M11

],

M11 = I1 + I2 +m1l2c1 +m2l

21 ,

M12 = I2 ,

M21 = I2 ,

M22 = I2 ,

y en donde

u− gm(q)− Fvq̇ − fc(q̇) =

[z1

z2

],

con

z1 = [m1lc1 +m2l1] g sin(q1)− fv1q̇1 ,

z2 = τ − fv2q̇2 − cf1[

1

2+

1

2tanh(βq̇2)

]− cf2

[−1

2− 1

2tanh(−βq̇2)

].

Por lo tanto y partiendo del sistema de ecuaciones dado por

q̈ =

[q̈1

q̈2

]=

1

det(M)

[M22 −M12−M21 M11

][z1

z2

],

se obtiene entonces la representación de estados y es dada por

d

dt

q1

q2

q̇1

q̇2

=

q̇1

q̇2M22z1 −M12z2

det(M)−M21z1 +M11z2

det(M)

.
Caṕıtulo 4

Identificación paramétrica

Para caracterizar el comportamiento de un sistema mecánico se requiere en parte del

conocimiento del valor de los parámetros relacionados al modelo dinámico. En sistemas

mecánicos como robots, motores, péndulos, etc., existen tres principales métodos para

estimar los parámetros que forman parte del modelo y son [20]:

1. Experimentos f́ısicos: Se requiere desmontar las piezas y calcular los parámetros

directamente, como ejemplo, pesar las piezas para calcular las masas. Este método

es tedioso y debe ser realizado por el fabricante antes de ensamblar el mecanismo.

2. Usando herramientas CAD/CAM: Herramientas CAD/CAM facilitan el cálculo de

los parámetros introduciendo el tipo de material de las piezas. Este método tiene un

grado de error debido a que se consideran despreciables ciertos componentes como

rodamientos y tornillos.

3. Identificación: Este enfoque es basado en el análisis del comportamiento entrada/-

salida sobre algún movimiento planificado.

En este proyecto de investigación se opta por el método de identificación para estimar

los parámetros del péndulo con rueda inercial. Identificación es el enfoque experimental

en el proceso del modelado y es un proceso iterativo en el que intervienen los siguientes

pasos [21]:

1. Adquisición de datos.

2. Selección de la estructura del modelo.

3. Estimación de parámetros.

4. Validación del modelo.

26
4.1 Modelo de regresión lineal 27

En el presente caṕıtulo se abordan cada uno de los pasos de la identificación enfocada

al caso de estudio del péndulo con rueda inercial. Primeramente se introduce el concepto

de modelo de regresión lineal como punto de partida en la selección de la estructura

del modelo. Además, se presenta la deducción del algoritmo de mı́nimos cuadrados y

del modelo dinámico filtrado. Posteriormente se describe la función de transferencia del

filtro utilizado y el experimento diseñado para la identificación paramétrica. Finalmente

se muestran los resultados experimentales de la identificación de parámetros y se realiza

la validación del modelo por medio de experimentos y simulaciones.

4.1. Modelo de regresión lineal

En [22] se aborda el concepto de modelo de regresión lineal para sistemas de n salidas

y se presenta a continuación. Un sistema del cual se han obtenido N muestras, puede ser

descrito por sus entradas x ∈ IRm y salidas y ∈ IRn mediante un modelo de regresiónlineal de la forma

y(k) = A(k)θ ,

donde k = 0, . . . , N − 1 es el instante de muestreo en el tiempo t = kT , donde T es elperiodo de muestreo, y(k) ∈ IRn es el vector de salidas, θ ∈ IRp es un vector de parámetrosconstantes desconocidos del sistema y es dado por

θ = [θ1 θ2 . . . θp]T ,

y A(k) ∈ IRn×p es la matriz de regresión lineal donde su componentes son funciones delas entradas medidas x(k) ∈ IRm.

Asumiendo que se tiene un vector de parámetros estimados θ̂(k) en el instante k y se

cuenta con la matriz de regresión A(k) es posible estimar las salidas del sistema, es decir,

ŷ(k) = A(k)θ̂ ,

o de manera equivalente

y(k) = A(k)θ̂(k) + e(k) , (4.1)

donde θ̂(k) ∈ IRp es el vector de parámetros estimados del sistema y e(k) ∈ IRn es elvector de error [21,22].
4.2 Algoritmo de mı́nimos cuadrados 28

4.2. Algoritmo de mı́nimos cuadrados

El vector de parámetros desconocidos es estimado mediante el algoritmo de mı́nimos

cuadrados presentado en [21]. A continuación se muestra a detalle la deducción del algo-

ritmo de mı́nimos cuadrados para sistemas de n salidas tal y como es reportado en [22].

Para que el modelo dado por (4.1) represente fielmente el sistema debe tener un vector

de parámetros θ̂(k) donde el error esperado sea

E{eT (k)e(k)

}=

k∑i=0

1

2eT (i)e(i) ,

=k∑i=0

1

2[y(i)− A(i)θ̂(k)]T [y(i)− A(i)θ̂(k)] , (4.2)

tal que satisfaga el criterio de mı́nimos cuadrados

θ̂(k) = argmı́nθ̂E{eT (k)e(k)

}.

Dado que E{eT (k)e(k)

}es cuadrático en θ̂, se puede obtener el mı́nimo derivando la

ecuación (4.2) e igualando a cero el resultado de la derivación, de tal manera que

∂

∂θE{eT (k)e(k)

}= −

k∑i=0

AT (i)[y(i)− A(i)θ̂(k)] = 0 ,

de donde se obtiene

k∑i=0

AT (i)A(i)θ̂(k) =k∑i=0

AT (i)y(i) , (4.3)

de donde se despeja θ̂(k) para obtener la expresión del algoritmo de mı́nimos cuadrados

θ̂(k) =

[k∑i=0

A(i)TA(i)

]−1 [ k∑i=0

A(i)Ty(i)

]. (4.4)

El método de mı́nimos cuadrados es esencial en sistemas de ingenieŕıa de control ya

que brinda una herramienta simple para la estimación de parámetros de un sistema [21].

Cabe señalar que el algoritmo de mı́nimos cuadrados se implementa fuera de ĺınea.
4.3 Linealidad en los parámetros 29

4.3. Linealidad en los parámetros

En el modelo dinámico del péndulo con rueda inercial dado por

M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

las matrices M ∈ IR2×2 y Fv ∈ IR2×2 aśı como los vectores gm(q) ∈ IR2 y fc(q̇) ∈ IR2, nosolo dependen de la geometŕıa del sistema [23], también dependen de diversos parámetros

inerciales y de constantes de fricción. El modelo dinámico expresado expĺıcitamente en

función de los parámetros es dado por

M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) = u , (4.5)

donde los parámetros son denotados por θ ∈ IRp. Es importante resaltar que cada elementodel vector θ no necesariamente corresponde a parámetros f́ısicos individuales del sistema

[23].

El modelo de la ecuación (4.5) posee la propiedad de linealidad en los parámetros si

puede ser expresado en términos lineales de θ, es decir,

Y (q, q̇, q̈)θ = u , (4.6)

donde Y (q, q̇, q̈) ∈ IR2×p, θ ∈ IRp y u ∈ IR2. La ecuación (4.6) es una estructura deregresión lineal donde

Y (q, q̇, q̈)θ = M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) , (4.7)

es una matriz de regresión cuyos elementos son funciones no lineales de las posiciones,

velocidades y aceleraciones articulares. El vector de θ IRp será definido expĺıcitamente en

la siguiente sección.

4.4. Parametrización del modelo dinámico del

péndulo con rueda inercial

En este proyecto de investigación se realiza la estimación de un vector de parámetros

θ ∈ IR7 cuyos elementos se aprecian en la tabla 4.1. Se muestra que los parámetros θi, i =1, 2, ..., 7, no necesariamente corresponden a los parámetros individuales del sistema.

El modelo parametrizado en forma compacta del péndulo con rueda inercial es dado
4.5 Modelo dinámico filtrado 30

Tabla 4.1: Parámetros θ.

Parámetro θ Valor

θ1 I1 + I2 +m1l2c1 +m2l

21

θ2 I2θ3 [m1lc1 +m2l1]θ4 fv1θ5 fv2θ6 cf1θ7 cf2

por

M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

siendo

M =

[θ1 θ2

θ2 θ2

],

gm(q) =

[−θ3g sin(q1)

0

],

Fv =

[θ4 0

0 θ5

],

fc(q̇) =

[0

θ6[12

+ 12

tanh(βq̇2)]

+ θ7[−1

2− 1

2tanh(−βq̇2)

]] ,u =

[0

τ

],

donde M ∈ IR2×2, gm(q) ∈ IR2, Fv ∈ IR2×2, fc(q̇) ∈ IR2 y u ∈ IR2. A partir de esta repre-sentación parametrizada es posible obtener el modelo dinámico filtrado y posteriormente

implementar la metodoloǵıa de identificación para estimar el vector de parámetros θ ∈IR7.

4.5. Modelo dinámico filtrado

La mayoŕıa de los sistemas dinámicos (péndulos, robots, etc.) poseen sensores de po-

sición, pero pocos cuentan con sensores de velocidad y aceleración. En estos casos, para
4.5 Modelo dinámico filtrado 31

identificar los parámetros del sistema, se aborda el modelo dinámico filtrado presentado

en [20] y [24], que permite obtener un modelo regresión que no depende de las acelera-

ciones articulares. La identificación se realiza fuera de ĺınea, por lo tanto, las velocidades

articulares pueden ser estimadas con el algoritmo de diferenciación central directamen-

te de las posiciones articulares medidas con los codificadores ópticos. A continuación se

muestra a detalle el procedimiento para la obtención del modelo dinámico filtrado del

péndulo con rueda inercial. El modelo dinámico del péndulo con rueda inercial es dado

por

M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,

donde M ∈ IR2×2 es la matriz de inercia, gm(q) ∈ IR2 es el vector de pares gravitacionales,Fv ∈ IR2×2 es la matriz de fricción viscosa, fc(q̇) ∈ IR2 es el vector de fricción de Coulomby u ∈ IR2 es el vector de entrada, es posible reacomodarlo de manera equivalente como

M q̈ + Ṁ q̇ − Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u , (4.8)

donde se aprecia que la suma y cancelación de una parte en la ecuación (4.8) no altera el

modelo, pero permite realizar una separación de la parte del modelo que depende de la

aceleración de la que no, esto mediante la factorización

d

dt[M q̇] = M q̈ + Ṁ q̇ ,

que sustituida en (4.8), es decir,

d

dt[M q̇]− Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u ,

permite separar el modelo en dos nuevas matrices Ya(q, q̇) y Yb(q, q̇) que no dependen de

la aceleración q̈, es decir,

Ya(q, q̇)θ = M q̇ ,

Yb(q, q̇)θ = gm(q) + Fvq̇ + fc(q̇) ,

obteniéndose una ecuación diferencial de primer orden

d

dt[Ya(q, q̇)θ] + Yb(q, q̇)θ = u , (4.9)
4.5 Modelo dinámico filtrado 32

donde θ es el vector de parámetros. Finalmente multiplicando la ecuación (4.9) por un

filtro pasa bajas con función de transferencia f(s) donde el operador diferencial ddt

es

reemplazado por s

sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u , (4.10)

se obtiene el modelo dinámico filtrado

Yafθ + Ybfθ = uf . (4.11)

Ahora realizando la factorización

[Yaf + Ybf ]θ = uf ,

se obtiene el modelo de regresión que se utiliza para estimar el vector de parámetros θ

sin la necesidad de calcular la aceleración articular q̈ ∈ IR2.

4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial

Para obtener el modelo dinámico filtrado del péndulo con rueda inercial primeramente

se estructura el modelo como una ecuación diferencial de primer orden tal y como se

indica en la ecuación (4.9). Entonces, para el caso del péndulo con rueda inercial

Ya(q, q̇) =

[q̇1 q̇2 0 0 0 0 0

0 q̇1 + q̇2 0 0 0 0 0

],

Yb(q, q̇) =

[0 0 −g sin(q1) q̇1 0 0 00 0 0 0 q̇2

12

+ 12

tanh(βq̇2) −12 −12

tanh(−βq̇2)

],

θ =[θ1 θ2 θ3 θ4 θ5 θ6 θ7

]T.

Multiplicando por una función de transferencia f(s) ambos lados de la ecuación (4.9) se

tiene que

sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u ,

lo que representa el modelo dinámico filtrado del péndulo con rueda inercial, que compac-

tado es expresado como

Yfθ = uf ,
4.6 Selección del filtro f(s) 33

donde Yf = Yaf + Ybf , con

Yaf = sf(s)Ya(q, q̇) ,

Ybf = f(s)Yb(q, q̇) ,

uf = f(s)u.

4.6. Selección del filtro f (s)

La selección del filtro f(s) es de vital importancia para la implementación del modelo

dinámico filtrado, aśı como también, la determinación de la frecuencia de corte la cual

debe ser seleccionada de manera que no afecte las frecuencias que determinan la dinámica

del sistema. El filtro f(s) se encuentra en el dominio de la frecuencia pero es continuo, por

lo tanto debido a que se pretende identificar un sistema real, se debe hacer un mapeo del

plano s al plano z. En esta sección se selecciona la función de transferencia del filtro f(s)

y también el método de mapeo del plano s a z para obtener la función de transferencia

discreta f(z).

4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado

El filtro a implementar para evitar el cálculo de la aceleración articular q̈ viene dado

por la función de transferencia

f(s) =λ2

(s+ λ)2, (4.12)

donde el filtro está conformado por dos polos repetidos situados en el parte izquierda del

plano s para garantizar estabilidad, donde λ es la frecuencia de corte del filtro y a su

vez la ganancia del filtro debido a que cada polo produce una atenuación proporcional a

la frecuencia de corte. El análisis del comportamiento del filtro se realiza en el dominio

de la frecuencia utilizando diagramas de Bode, que son una representación gráfica que

sirve para visualizar la respuesta en frecuencia de un sistema. Una vez diseñado el filtro

es necesario su transformación a tiempo discreto, esto es posible utilizando un método de

mapeo del plano s al plano z. El filtro dado por la ecuación (4.12) se menciona en [20]

para la identificación de robots manipuladores.
4.6 Selección del filtro f(s) 34

4.6.2. Método de diferencias hacia atrás

Existen métodos comunes para realizar el mapeo del dominio s al dominio z y son:

el método de diferencias hacia atrás y el método de transformación bilineal [25]. En este

trabajo se utiliza el método de diferencias hacia atrás por su sencillez. El método de

diferencias hacia atrás utiliza la relación

s =1− z−1

T,

que multiplicado por zz

equivale a

s =z − 1Tz

, (4.13)

donde T es el periodo de muestreo. El método de diferencias hacia atrás es sencillo de im-

plementar debido a que el derivador puro s es reemplazado por la derivada de primer ordenddt

, la cual es aproximada mediante la diferencia entre muestras consecutivas (diferencias

finitas). Es evidente que entre más pequeño sea el intervalo T aumentará la precisión de

la aproximación. El motivo para discretizar el filtro f(s) es porque en experimentación se

trabaja con señales muestreadas a un periodo T = 1 [ms].

Definiendo el filtro h(s) = sf(s) e implementando la ecuación (4.13) en h(s) y f(s),

se obtienen los filtros pasa bajas discretos

h(z) =

[z − 1Tz

]f(z) ,

=λ2 − λ2z−1

T (T−1 + λ)2 − 2(T−1 + λ)z−1 + T−1z−2, (4.14)

y

f(z) =λ2z2

(T−1 + λ)2z2 − 2(T−1 + λ)T−1z + T−2,

=λ2

(T−1 + λ)2 − 2(T−1 + λ)T−1z−1 + T−2z−2, (4.15)

donde λ > 0 es constante y es la frecuencia de corte y T = 1 [ms] es el periodo de

muestreo. La frecuencia de corte λ puede ser seleccionada con el análisis de las señales en

el dominio de la frecuencia, de tal manera que las componentes de alta frecuencia (debido

al error de cuantización) sean atenuadas. Los filtros discretos f(z) y h(z) se implementan

en MATLABr con el comando filter(b,a,x), donde b y a son los vectores que contienen los

coeficientes del numerador y denominador respectivamente de cada filtro y x es la señal
4.7 Filtro digital pasa bajas 35

a ser filtrada.

Diagrama de Bode

Frecuencia (rad/s)

−100

−80

−60

−40

−20

0

Mag

nitu

d (d

B)

f(s) f(z)

10−1

100

101

102

103

−180

−135

−90

−45

0

Fas

e (d

eg)

f(s) f(z)

Figura 4.1: Filtro f(s) y f(z) con λ = 8.

En la figura 4.1 se aprecia el comportamiento del filtro f(s) y también su versión

discreta f(z) obtenida por medio del método de diferencias hacia atrás. Por otro lado, en la

figura 4.2 se muestra el comportamiento del filtro h(s) y su versión discreta h(z) obtenido

mediante el mismo método de discretización. La razón de graficar la versión continua de

cada filtro contra su versión discreta es para corroborar el método de diferencias hacia

atrás.

4.7. Filtro digital pasa bajas

4.7.1. Filtrado de la posición q

El objetivo de la identificación paramétrica es estimar el vector de parámetros θ del

sistema con las señales obtenidas del experimento. Los codificadores ópticos introducen

error de cuantización en las mediciones del vector de posiciones q ∈ IR2, como consecuen-cia, el vector de velocidades q̇ ∈ IR2 obtenido en ĺınea mediante diferenciación numéricaamplifica dicho error de cuantización. Para mejorar la calidad en la estimación de los

parámetros del sistema, se diseña un filtro digital pasa bajas con el propósito de atenuar
4.7 Filtro digital pasa bajas 36

Diagrama de Bode

Frecuencia (rad/s)

−30

−20

−10

0

10

20

Mag

nitu

d (d

B)

h(s) h(z)

10−1

100

101

102

103

−90

−45

0

45

90

Fas

e (d

eg)

h(s) h(z)

Figura 4.2: Filtro h(s) y h(z) con λ = 8.

las frecuencias no deseadas presentes en las mediciones del vector de posiciones q ∈ IR2.Una vez diseñado el filtro, es implementado fuera de ĺınea con el comando “filtfilt” de

MATLABr, que es un filtrado en ambas direcciones “adelante-atrás” no causal de fase

cero que evita la distorsión de las muestras de la posición articular.

Las caracteŕısticas del filtro digital y el tipo de ventana utilizada para el cálculo de

los coeficientes del filtro se muestran en la tabla 4.2.

Tabla 4.2: Caracteŕısticas del filtro diseñado por el método de ventanas.

Tipo de respuesta Pasa bajasMétodo de diseño Ventanas

Orden 30Tipo de ventana Nutall

4.7.2. Algoritmo de diferenciación central

El vector resultante de posiciones filtradas es dado por qf ∈ IR2 y por medio de éste,es posible estimar las velocidades articulares. La estimación de las velocidades articulares
4.8 Filtrado discreto del modelo dinámico 37

se realiza mediante el algoritmo de diferenciación central

q̇f (k) =qf (k + 1)− qf (k − 1)

2T,

que evita el desplazamiento de fase y donde q̇f ∈ IR2 es el vector de velocidades articularesfiltradas, k es el instante de muestreo y T = 1 [ms] es el periodo de muestreo.

4.8. Filtrado discreto del modelo dinámico

Los vectores qf , q̇f ∈ IR2 y los filtros h(z) y f(z) en las ecuaciones (4.14) y (4.15)permiten obtener el modelo dinámico filtrado en su versión discreta dado por

h(z)Ya(qf , q̇f )θ + f(z)Yb(qf , q̇f )θ = f(z)u ,

que puede ser reescrito como

Yfzθ = ufz , (4.16)

donde Yfz ∈ IR2×7 es la matriz de regresión filtrada en su versión discreta, ufz ∈ IR2 elvector de entradas filtrado discreto y θ ∈ IR7 el vector de parámetros.

Por lo tanto el algoritmo de mı́nimos cuadrados es implementado en el péndulo con

rueda inercial mediante la expresión

θ̂(k) =

[k∑i=0

Yfz(i)TYfz(i)

]−1 [ k∑i=0

Yfz(i)Tufz(i)

], (4.17)

donde ufz(k) = [0 τfz(k)]T es el vector de entradas filtrado discreto, Yfz(k) ∈ IR2×7 la

matriz de regresión filtrada discreta, θ̂(k) ∈ IR7 el vector de parámetros estimados y con0 ≤ k ≤ N − 1 siendo el instante de muestreo y N el número de muestras.

En términos generales para que todos los parámetros sean estimados, la matriz dada

por

Φ =

[k∑i=0

Yfz(i)TYfz(i)

], (4.18)

debe ser positiva definida [21]. La matriz Φ ∈ IR7×7 es simétrica, esto es, Φ = ΦT yserá positiva definida si todos sus eigenvalores son positivos, es decir, si y sólo si λi {Φ} > 0
4.9 Control PD para excitación del sistema 38

donde i = 1, 2, · · · , 7 [23]. Si la matriz dada por la ecuación (4.18) es positiva definidaimplica que el vector de entrada en cierta manera satisface la condición de excitación

persistente. El concepto de excitación persistente es ampliamente aborbado en el área de

identificación, con el fin de garantizar que las entradas exciten debidamente la dinámica

de los sistemas.

4.9. Control PD para excitación del sistema

Una estimación fiable de los parámetros puede ser obtenida con un procedimiento

apropiado de identificación, en el cual se debe involucrar una selección de la entrada τ

que excite toda la dinámica del sistema. Para identificar los parámetros del sistema, en

este trabajo de investigación se diseña un experimento en lazo cerrado que involucra un

controlador PD para el seguimiento de trayectoria

τ = Kpq̃2 +Kd ˙̃q2 , (4.19)

aplicado en la rueda y donde

Kp = 0.551 [Nm/rad] ,

Kd = 0.00551 [Nm s/rad] ,

q̃2 = qd − q2 ,˙̃q2 = q̇d − q̇2 ,

siendo Kp la ganancia de control proporcional, Kd la ganancia derivativa, q̃2 el error de

seguimiento de posición de la rueda y ˙̃q2 la derivada del error de seguimiento de la rueda.

La trayectoria deseada qd(t) es una señal que crece en amplitud al transcurrir el tiempo t

y es dada por

qd(t) = at sin(ωt) , (4.20)

donde at = 0.6t [rad] es la amplitud y ω = 7.8 [rad/s] es la frecuencia.

En la figura 4.3 se muestra la trayectoria deseada a seguir por la rueda durante 10 [s].

Ante la ausencia de sensores de velocidad, las velocidades articulares q̇1 y q̇2 se estiman en
4.9 Control PD para excitación del sistema 39

ĺınea empleando la diferenciación discreta. Las condiciones iniciales del experimento son:[q1(0)

q2(0)

]=

[π

0

][rad] ,[

q̇1(0)

q̇2(0)

]=

[0

0

][rad/s].

0 2 4 6 8 10−6

−4

−2

0

2

4

6

Tiempo [s]

Pos

ició

n [r

ad]

qd(t)

Figura 4.3: Trayectoria deseada qd(t).

En [26] se proponen entradas de excitación para identificación de sistemas, espećıfica-

mente se presenta una sección para experimentos en lazo abierto. Entre las señales que se

proponen en tal referencia están las señales que están compuestas de diferentes frecuen-

cias como sumatorias de señales sinusoidales y señales que cambian en frecuencia a través

del tiempo denominadas señales Chirp. Los experimentos en lazo abierto en la mayoŕıa

de los casos son de alto riesgo debido que los sistemas pueden inestabilizarse. En el caso

del péndulo con rueda inercial es posible realizar experimentos en lazo abierto sin ningún

inconveniente.
4.10 Resultados experimentales de identificación paramétrica 40

4.10. Resultados experimentales de identificación pa-

ramétrica

Las caracteŕısticas del experimento se muestran en la tabla 4.3. Se aprecia que la

frecuencia de muestreo es de 1 [Khz] y la frecuencia de corte del filtro es λ = 8 [rad/s],

que fue elegida con el análisis de las señales en el dominio de la frecuencia mediante la

Transformada de Fourier Discreta.

Tabla 4.3: Caracteŕısticas del experimento de identificación.

Caracteŕıstica Unidades

Frecuencia de muestreo 1 [Khz]Duración del experimento 10 [s]

Frecuencia de corte λ 8 [rad/s]

En la figura 4.4 se detalla de manera esquemática el procedimiento de identificación

paramétrica del péndulo con rueda inercial. Se puede observar que la identificación de los

parámetros se lleva a cabo fuera de ĺınea.

Control PD

Estimación de la

velocidad

filtfilt

Algoritmo de

diferenciación

central

Algoritmo de

identificación de

mínimos cuadrados

Fuera de líneaEn línea

Péndulo con rueda inercial

Figura 4.4: Esquema de identificación.

Los parámetros estimados mediante el algoritmo de mı́nimos cuadrados se aprecian

en la tabla 4.4 y la evolución de la estimación de los parámteros se muestra en la figura

4.5. En este experimento de identificación todos los eigenvalores de la matriz Φ ∈ IR7×7

resultaron positivos, por lo tanto, se garantiza de cierta manera que la entrada cumple la

condición de excitación persistente.

A continuación se presentan los resultados obtenidos de la comparación entre la simu-
4.10 Resultados experimentales de identificación paramétrica 41

Tabla 4.4: Parámetros estimados θ̂.

Parámetro θ Estimado θ̂ Unidades

θ1 4.6244× 10−02 [Kgm2/rad]θ2 6.2758× 10−04 [Kgm2/rad]θ3 2.3588× 10−01 [Kgm2/rad]θ4 2.1919× 10−03 [Nm s/rad]θ5 3.6351× 10−06 [Nm s/rad]θ6 5.0726× 10−03 [Nm]θ7 4.3101× 10−03 [Nm]

lación del modelo con los parámetros estimados mostrados en la tabla 4.4 y el experimento

realizado. Para simular el codificador óptico se introduce un cuantizador en la simulación

del modelo usando 2π/4000 [rad/pulso] como resolución.

La figura 4.6 muestra la comparación entre la posición q1 ∈ IR obtenida en simulacióny q1 ∈ IR medida en el experimento. En la figura 4.7 se observa el error de predicción eq1∈ IR que consiste en la diferencia de la posición q1 ∈ IR obtenida en la simulación delmodelo y la posición q1 ∈ IR medida en el experimento.

Por otro lado, en la figura 4.8 se aprecia la gráfica comparativa entre la posición q2 ∈IR obtenida en simulación y la posición q2 ∈ IR medida del experimento y en la figura 4.9se muestra el error de predicción eq2 ∈ IR, que consiste en la diferencia entre la posiciónq2 ∈ IR obtenida en simulación y la posición q2 ∈ IR obtenida en el experimento.

En la gráfica de la figura 4.10 se aprecia la comparación entre la entrada τ ∈ IR obtenidaen la simulación del modelo y la entrada τ ∈ IR estimada del experimento. Por último enla figura 4.11 se observa el error de predicción eτ ∈ IR que consiste en la diferencia entrela entrada τ ∈ IR obtenida en la simulación del modelo y la entrada τ ∈ IR estimada delexperimento.

4.10.1. Validación del modelo dinámico

El procedimiento de validación del modelo se basa en el análisis del error de predicción

de torque τ ∈ IR aplicado a la rueda del sistema y además del análisis del error depredicción de las posiciones q ∈ IR2 como se realiza en [27]. Los errores de predicciónconsisten en la diferencia del torque τ ∈ IR y de posición q ∈ IR2 obtenidos en la simulacióndel modelo con los parámetros estimados y el torque τ ∈ IR y q ∈ IR2 medidos en elexperimento. En ambos casos, empleando la misma trayectoria deseada (4.20) y el mismo

controlador PD dado por la ecuación (4.19).
4.10 Resultados experimentales de identificación paramétrica 42

0 5−0.1

0

0.1

0.2

θ̂1

0 5

0

5

10

15x 10

−4

θ̂2

0 5−0.2

0

0.2

0.4

θ̂3

0 5−0.2

0

0.2

Tiempo [s]

θ̂4

0 5−4

−2

0

2

4x 10

−3

θ̂5

0 5−0.04

−0.02

0

0.02

0.04

Tiempo [s]

θ̂6

0 5−0.04

−0.02

0

0.02

0.04

Tiempo [s]

θ̂7

Figura 4.5: Parámetros estimados θ̂.

Para analizar los errorres de predicción se define el valor cuadrático medio (RMS),

RMS{e} =

√√√√ 1N

N∑i=1

e2(i) , (4.21)

donde e es el error de predicción y N el número de muestras. Se calcula el valor (RMS) de

cada uno de los errores de predicción con el algoritmo de la ecuación (4.21) y los resultados

se muestran en la tabla 4.5.

Se aprecia que el valor (RMS) de cada error de predicción tiene un valor pequeño, esto

indica que el modelo simulado con los parámetros de la tabla 4.4, puede predecir de una
4.10 Resultados experimentales de identificación paramétrica 43

0 2 4 6 8 102.6

2.8

3

3.2

3.4

3.6

Tiempo [s]

Pos

ició

n [r

ad]

q1(t) Sim. q1(t) Exp.

Figura 4.6: Comparación entre q1(t) simulación y q1(t) experimento.

0 2 4 6 8 10−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

Tiempo [s]

Pos

ició

n [r

ad]

eq1(t)

Figura 4.7: Error de predicción eq1(t).

manera muy aproximada el comportamiento del sistema experimental.
4.10 Resultados experimentales de identificación paramétrica 44

0 2 4 6 8 10−8

−6

−4

−2

0

2

4

6

8

Tiempo [s]

Pos

ició

n [r

ad]

q2(t) Sim. q2(t) Exp.

Figura 4.8: Comparación entre q2(t) simulación y q2(t) experimento.

0 2 4 6 8 10−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

Tiempo [s]

Pos

ició

n [r

ad]

eq2(t)

Figura 4.9: Error de predicción eq2(t).

4.10.2. Discusión de resultados de identificación paramétrica

En este caṕıtulo se ha presentado la identificación paramétrica del péndulo con rueda

inercial. El modelo que considera fricción de Coulomb asimétrica predice de una manera
4.10 Resultados experimentales de identificación paramétrica 45

0 2 4 6 8 10

−0.2

−0.1

0

0.1

0.2

Tiempo [s]

Tor

que

[Nm

]

τ(t) Sim. τ(t) Exp.

Figura 4.10: Comparación entre τ(t) simulación y τ(t) experimento.

0 2 4 6 8 10−0.2

−0.15

−0.1

−0.05

0

0.05

0.1

0.15

0.2

Tiempo [s]

Tor

que

[Nm

]

eτ (t)

Figura 4.11: Error de predicción eτ (t).

aceptable el comportamiento del sistema experimental. Los parámetros obtenidos fue-

ron validados comparando los datos experimentales de posición y de entrada de control

con datos obtenidos por medio de simulaciones. En el siguiente caṕıtulo se presenta el

control del péndulo con rueda inercial mediante esquemas de control que requieren del
4.10 Resultados experimentales de identificación paramétrica 46

Tabla 4.5: Valor cuadrático medio (RMS).

Índice Valor Unidades

RMS{eq1} 0.0054 [rad]RMS{eq2} 0.0159 [rad]RMS{eτ} 0.0089 [Nm]

conocimiento de los parámetros del sistema, es decir, técnicas de control basadas en el

modelo.
Caṕıtulo 5

Control del péndulo con rueda

inercial

En este proyecto de tesis se presentan los resultados experimentales de Swing Up y

de regulación de un péndulo con rueda inercial. Para ello, la plataforma experimental

construida, modelada e identificada con el algoritmo de mı́nimos cuadrados permite la

implementación en tiempo real de los controladores. El presente caṕıtulo es autoconteni-

do y proporciona el procedimiento requerido para la obtención de todos los controladores

implementados en este proyecto de investigación. Cabe señalar que los controladores ci-

tados y que sirvieron de inspiración se expresan con nuestra notación.

5.1. Objetivo de control

El objetivo de control consiste en llevar el péndulo de la posición vertical hacia abajo

q1 = π [rad] a su posición vertical hacia arriba q1 = 0 [rad]. Para ello se utiliza una entrada

de control que conmuta entre un controlador de Swing Up para rotar el péndulo hasta

una región cerca

Top Related

Paulo Ito.

toyo ito - escritos

TipodeDocumento PROCEDIMIENTO AUTORIZACION CESION …

manual ito 2007

Ensayo Cesion Derechos

Expo "Todos los nombres ..." condiciones cesion

CESION DE HERENCIA CESION DE BIENES DETERMINADOS …escribanos.org.ar/rnotarial/wp-content/uploads/2018/06/Cesiones-de... · CESION DE HERENCIA CESION DE BIENES DETERMINADOS Emery

Cesion de Acciones Como Se Hace