-
INSTITUTO POLITÉCNICO NACIONAL
CENTRO DE INVESTIGACIÓN Y DESARROLLO
DE TECNOLOGÍA DIGITAL
MAESTRÍA EN CIENCIAS EN SISTEMAS DIGITALES
“DISEÑO Y CONSTRUCCIÓN DE UN SISTEMAMECÁNICO SUBACTUADO”
TESIS
QUE PARA OBTENER EL GRADO DE
MAESTRO EN CIENCIAS EN SISTEMAS DIGITALES
PRESENTA
ING. RICARDO ARTURO RODRÍGUEZ CALDERÓN
BAJO LA DIRECCIÓN DE
DR. EDUARDO JAVIER MORENO VALENZUELA
DICIEMBRE 2015 TIJUANA, B.C., MÉXICO
-
INS TIT(ITO POLITÉCNICO NACIONALSECRETARí¿ on TNVESTTGAcnów y posGRADo
CARTA CESION DE DERECHOS
En la Ciudad de Tijuana,Baja California, eldía2 del mes diciembre del año 2015, el(la) que
suscribe Ricardo Arturo Rodríguez Calderón alumno (a) del Programa de MAESTnÍA B¡l
CIENCIAS EN SISTEMAS DIGITALES con número de registro A140815, adscrito al
CENTRO DE INVESTIGACIÓN Y DESARROLLO DE TECNOLOGÍA DIGITAL,manifiesta que es autor (a) intelectual del presente trabajo de Tesis bajo la dirección de
Eduardo Javier Moreno Valenzuela, cede los derechos del trabajo titulado Diseño y
Construcción de un Sistema Mecánico Subactuado, al Instituto Politécnico Nacional para
su difusión, con fines académicos y de investigación.
Los usuarios de la información no deben reproducir el contenido textual, gráficas o datos del
trabajo sin el permiso expreso del autor y/o director del trabajo. Este puede ser obtenido
escribiendo a la siguiente dirección Av. Instituto Politécnico Nacional 1310, Colonia Nueva
Tijuana, Tijuana, Büa California 22435, México, o a la dirección electrónica:[email protected]. Si el permiso se otorga, el usuario deberá dar el agradecimiento
correspondiente y citar la fuente del mismo.
Ricu.do Atturo Rodtígre, C
'fi'J,,y,, (^t1,,,; R A
Nombre y firma
-
Dedicatoria
A mis padres, Maŕıa Elena Calderón Valenzuela y Gilberto Rodŕıguez, porque los amo
con toda mi alma. Gracias a su amor, apoyo y paciencia he logrado ser lo que ahora
soy. Son mi mayor orgullo y siempre han sido la principal motivación para cumplir mis
metas.
A mis hermanos, Gilberto, César, José, Susana, y Julia Gabriela, por estar siempre
a mi lado y haberme apoyado durante toda mi vida.
-
Agradecimientos
A mi director de tesis, Dr. Eduardo Javier Moreno Valenzuela, por compartir
desinteresadamente sus conocimientos, mismos que fueron fundamentales en el desarrollo
de este trabajo, aśı como su disponibilidad y experiencia que me motivaron y despertaron
en mı́ la pasión por la investigación. Es motivo de orgullo ser su disćıpulo.
A mi amigo, Carlos Aguilar Avelar por su valioso apoyo y por haber supervisado esta
investigación.
A mi comité tutorial conformado por el Dr. Luis Tupak Aguilar Bustos, Dr. Victor
Hugo Dı́az Ramı́rez, M. C. David Jaime Saucedo Mart́ınez y el Dr. Juan José Tapia
Armenta, por el tiempo dedicado a cada uno de los avances de tesis. También por sus
observaciones y acertados comentarios que permitieron enriquecer el contenido de este
trabajo.
Al Dr. Miguel A. Álvarez Cabanillas por sus sabios consejos, a la Dra. Dolores Ale-
jandra Ferreira de Loza por su apoyo incondicional y al Dr. José Cruz Núñez Pérez por
estar al pendiente de mi formación académica y motivarme a enfrentar esta nueva etapa.
A mis amigos, Nataly Duarte, Sebastián Hernández, Regino Pérez, Alan Garćıa,
Oscar Garduño, Anel Otero, Enrique Hernández, Abraham Montoya, Pablo Obeso, Abel
Murillo, Juan T. Higuera, Ricardo Cárdenas, Diana Gamboa, Nataly Medina, Andrés
Cuevas, Reinier Arbelo, Lester Oropesa, Andrés Calvillo, Katherine Montoya, Luis
Montoya, Antonio de Jesús Obeso, Alejandro Galaviz, Jorge Dı́az, Daniel Espinoza, Luis
Zamudio, Luis Cantera, Carlos Villar, Carlos Magaña, Fabiola Hernández y Bernardo
Garnica, por los inolvidables momentos que compartimos y las atenciones brindadas.
Al Instituto Politécnico Nacional (IPN) y al Consejo Nacional de Ciencia y Tecnoloǵıa
(CONACYT) por el apoyo económico brindado.
-
Diseño y construcción de un sistema
mecánico subactuado
Resumen
En esta tesis se presenta el diseño y la construcción de un prototipo de un sistema
mecánico subactuado, espećıficamente un péndulo con rueda inercial. Se obtiene el modelo
dinámico del péndulo con rueda inercial mediante las ecuaciones de Euler-Lagrange. El
modelo dinámico considera un modelo de fricción que consiste en la fricción viscosa y la
fricción de Coulomb.
Posteriormente se realiza la identificación paramétrica del prototipo del péndulo con
rueda inercial mediante el algoritmo de mı́nimos cuadrados y utilizando el modelo dinámi-
co filtrado. El modelo dinámico es validado mediante resultados experimentales y de si-
mulación.
Utilizando los parámetros estimados, se diseña un controlador basado en la técnica de
linealización por retroalimentación que compensa las fricciones presentes en el sistema.
Finalmente se realizan experimentos para llevar a cabo la comparación del desempeño
experimental entre el controlador propuesto y un controlador reportado en la literatura.
Palabras Clave: Péndulo con rueda inercial, modelo dinámico, modelo dinámico
filtrado, identificación paramétrica, algoritmo de mı́nimos cuadrados, control basado en
linealización por retroalimentación.
-
Design and construction of an
underactuated mechanical system
Abstract
In this thesis, the design and construction of an underactuated mechanical system is
presented, particularly an inertia wheel pendulum. The dynamic model of the system
through the Euler-Lagrange equations is obtained. In the dynamic model, the terms of
viscous friction and Coulomb friction are considered.
Besides, the parametric identification of the inertia wheel pendulum test-bed is obtai-
ned by least squares algorithm and using the filtered dynamic model. The dynamic model
is validated by means of simulations and experimental results.
Using the estimated parameters of the system, a feedback linearization based controller
that compensates the friction forces is designed.
Finally, an experimental performance comparison is carried out using the proposed
controller and a known feedback linearization based controller.
Keywords: Inertia wheel pendulum, dynamic model, filtered dynamic model, para-
metric identification, least squares algorithm, feedback linearization control.
-
Contenido
1. Introducción 1
1.1. Antecedentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2. Objetivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1. Objetivo general . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2. Objetivos espećıficos . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3. Aportaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4. Organización del contenido por caṕıtulo . . . . . . . . . . . . . . . . . . . 5
2. Diseño y construcción de la plataforma experimental 7
2.1. Prototipo en CAD del péndulo con rueda inercial . . . . . . . . . . . . . . 7
2.2. Construcción de la plataforma experimental . . . . . . . . . . . . . . . . . 7
2.2.1. Tarjeta de adquisición de datos . . . . . . . . . . . . . . . . . . . . 9
2.2.2. Servoamplificador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.3. Codificador óptico para la medición de q1 . . . . . . . . . . . . . . . 11
2.2.4. Actuador con codificador óptico para la medición de q2 . . . . . . . 11
2.2.5. Rodamientos del eje de rotación del péndulo . . . . . . . . . . . . . 12
2.2.6. Estructura del prototipo . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.7. Plataforma experimental . . . . . . . . . . . . . . . . . . . . . . . . 12
3. Modelo dinámico 14
3.1. Enerǵıa total del sistema . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3.2. Enerǵıa potencial total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
3.2.1. Enerǵıa potencial del péndulo . . . . . . . . . . . . . . . . . . . . . 16
3.2.2. Enerǵıa potencial de la rueda . . . . . . . . . . . . . . . . . . . . . 17
3.3. Enerǵıa cinética total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.1. Enerǵıa cinética del péndulo . . . . . . . . . . . . . . . . . . . . . . 17
3.3.2. Enerǵıa cinética de la rueda . . . . . . . . . . . . . . . . . . . . . . 18
3.4. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange . . . . . . . . 19
i
-
CONTENIDO ii
3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-Lagrange del
péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . . . . 20
3.5. Modelo de fricción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.5.1. Modelo de fricción viscosa . . . . . . . . . . . . . . . . . . . . . . . 21
3.5.2. Modelo de fricción de Coulomb asimétrica . . . . . . . . . . . . . . 22
3.6. Modelo del péndulo con rueda inercial . . . . . . . . . . . . . . . . . . . . 23
3.7. Representación de estados del péndulo con rueda inercial . . . . . . . . . . 24
4. Identificación paramétrica 26
4.1. Modelo de regresión lineal . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2. Algoritmo de mı́nimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . 28
4.3. Linealidad en los parámetros . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4. Parametrización del modelo dinámico del péndulo con rueda inercial . . . . 29
4.5. Modelo dinámico filtrado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial . . . . . . . 32
4.6. Selección del filtro f(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado . . . . . . . 33
4.6.2. Método de diferencias hacia atrás . . . . . . . . . . . . . . . . . . . 34
4.7. Filtro digital pasa bajas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.7.1. Filtrado de la posición q . . . . . . . . . . . . . . . . . . . . . . . . 35
4.7.2. Algoritmo de diferenciación central . . . . . . . . . . . . . . . . . . 36
4.8. Filtrado discreto del modelo dinámico . . . . . . . . . . . . . . . . . . . . . 37
4.9. Control PD para excitación del sistema . . . . . . . . . . . . . . . . . . . . 38
4.10. Resultados experimentales de identificación paramétrica . . . . . . . . . . . 40
4.10.1. Validación del modelo dinámico . . . . . . . . . . . . . . . . . . . . 41
4.10.2. Discusión de resultados de identificación paramétrica . . . . . . . . 44
5. Control del péndulo con rueda inercial 47
5.1. Objetivo de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
5.2. Swing Up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
5.2.1. Modelo del péndulo con rueda inercial sin fricción . . . . . . . . . . 48
5.2.2. Linealización por retroalimentación parcial colocada . . . . . . . . . 49
5.2.3. Controlador de Swing Up . . . . . . . . . . . . . . . . . . . . . . . . 49
5.3. Control basado en linealización por retroalimentación . . . . . . . . . . . . 51
5.3.1. Derivadas de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
5.3.2. Linealización por retroalimentación . . . . . . . . . . . . . . . . . . 52
5.3.3. Controlador propuesto basado en linealización por retroalimentación 53
-
CONTENIDO iii
5.3.4. Controlador de Spong, Corke y Lozano (2001) . . . . . . . . . . . . 56
5.3.5. Diseño de experimentos de control . . . . . . . . . . . . . . . . . . . 57
5.4. Resultados experimentales de control . . . . . . . . . . . . . . . . . . . . . 59
5.4.1. Caso 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
5.4.2. Caso 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4.3. Caso 3 - Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . 60
5.4.4. Evaluación del desempeño de los controladores . . . . . . . . . . . . 63
5.4.5. Discusión de resultados de control . . . . . . . . . . . . . . . . . . . 65
6. Conclusiones y trabajo futuro 67
Referencias 71
A. Identificación paramétrica de un Acrobot 72
A.1. Modelo del Acrobot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
A.2. Parametrización del modelo dinámico del Acrobot . . . . . . . . . . . . . . 75
A.3. Modelo dinámico filtrado del Acrobot . . . . . . . . . . . . . . . . . . . . . 76
A.4. Control PD para excitación del sistema (Acrobot) . . . . . . . . . . . . . . 78
A.5. Resultados experimentales de identificación paramétrica del Acrobot . . . . 78
A.5.1. Validación del modelo dinámico del Acrobot . . . . . . . . . . . . . 80
B. Publicaciones 85
-
Índice de figuras
1.1. Péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2.1. Prototipo en CAD. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Vista lateral del prototipo del péndulo con rueda inercial. . . . . . . . . . . 8
2.3. Servoamplificador 16A20AC. . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.4. Codificador óptico de la empresa USDigitalr. . . . . . . . . . . . . . . . . 11
2.5. Motor de corriente directa con codificador óptico. . . . . . . . . . . . . . . 11
2.6. Rodamientos SKF 6201 2Z. . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.7. Estructura del prototipo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.8. Integración de la plataforma experimental. . . . . . . . . . . . . . . . . . . 13
3.1. Parámetros del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . . 15
3.2. Vista frontal del péndulo con rueda inercial. . . . . . . . . . . . . . . . . . 16
3.3. Función signo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4. Tangente hiperbólica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1. Filtro f(s) y f(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2. Filtro h(s) y h(z) con λ = 8. . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.3. Trayectoria deseada qd(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.4. Esquema de identificación. . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.5. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.6. Comparación entre q1(t) simulación y q1(t) experimento. . . . . . . . . . . 43
4.7. Error de predicción eq1(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.8. Comparación entre q2(t) simulación y q2(t) experimento. . . . . . . . . . . 44
4.9. Error de predicción eq2(t). . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4.10. Comparación entre τ(t) simulación y τ(t) experimento. . . . . . . . . . . . 45
4.11. Error de predicción eτ (t). . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
5.1. Esquema de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
iv
-
ÍNDICE DE FIGURAS v
5.2. Comportamiento del sistema en el caso 1. . . . . . . . . . . . . . . . . . . . 59
5.3. Entrada de control τ(t) del sistema en el caso 1. . . . . . . . . . . . . . . . 60
5.4. Comportamiento del sistema en el caso 2. . . . . . . . . . . . . . . . . . . . 61
5.5. Entrada de control τ(t) del sistema en el caso 2. . . . . . . . . . . . . . . . 62
5.6. Perturbación τd(t) aplicada a los controladores de regulación. . . . . . . . . 63
5.7. Comportamiento del sistema en el caso 3 - Perturbado. . . . . . . . . . . . 64
5.8. Entrada de control τ(t) del sistema en el caso 3 - Perturbado. . . . . . . . 65
A.1. Plataforma experimental en configuración de Acrobot. . . . . . . . . . . . . 73
A.2. Vista frontal del Acrobot y sus parámetros. . . . . . . . . . . . . . . . . . 73
A.3. Trayectoria deseada qd(t) en la articulación 2 del Acrobot. . . . . . . . . . 79
A.4. Parámetros estimados θ̂ (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 80
A.5. Comparación entre q1(t) simulación y q1(t) experimento (Acrobot). . . . . 81
A.6. Error de predicción eq1(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 81
A.7. Comparación entre q2(t) simulación y q2(t) experimento (Acrobot). . . . . 82
A.8. Error de predicción eq2(t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . 82
A.9. Comparación entre τ(t) simulación y τ(t) experimento (Acrobot). . . . . . 83
A.10.Error de predicción eτ (t) (Acrobot). . . . . . . . . . . . . . . . . . . . . . . 83
-
Índice de tablas
3.1. Parámetros del modelo dinámico. . . . . . . . . . . . . . . . . . . . . . . . 15
4.1. Parámetros θ. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.2. Caracteŕısticas del filtro diseñado por el método de ventanas. . . . . . . . . 36
4.3. Caracteŕısticas del experimento de identificación. . . . . . . . . . . . . . . 40
4.4. Parámetros estimados θ̂. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.5. Valor cuadrático medio (RMS). . . . . . . . . . . . . . . . . . . . . . . . . 46
5.1. Ganancias de los controladores basados en linealización por retroalimenta-
ción y duración de los casos experimentales. . . . . . . . . . . . . . . . . . 57
5.2. Caso 1. Porcentaje significa la mejora con respecto al controlador de Spong,
Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 65
5.3. Caso 2. Porcentaje significa la mejora con respecto al controlador de Spong,
Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66
5.4. Caso 3. Porcentaje significa la mejora con respecto al controlador de Spong,
Corke y Lozano (2001) (Spong et al.). . . . . . . . . . . . . . . . . . . . . . 66
A.1. Parámetros del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
A.2. Parámetros θ del Acrobot. . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
A.3. Parámetros estimados θ̂ del Acrobot. . . . . . . . . . . . . . . . . . . . . . 79
A.4. Valor cuadrático medio (RMS) (Acrobot). . . . . . . . . . . . . . . . . . . 84
vi
-
Caṕıtulo 1
Introducción
Los sistemas subactuados son aquellos que poseen menos actuadores que grados de
libertad [1]. El control de sistemas subactuados es un campo de investigación muy popular,
ya que existen muchas aplicaciones de los sistemas subactuados en la robótica, veh́ıculos
marinos y aeroespaciales [2]. El caso de estudio de este proyecto de investigación es el
péndulo con rueda inercial que fue introducido por M. W. Spong en [3] y consiste en un
péndulo que en un extremo está acoplado a un eje rotatorio y en el otro extremo tiene
una rueda con un actuador acoplado. En la figura 1.1 se muestra el péndulo con rueda
inercial.
Los parámetros del sistema son requeridos para la implementación de esquemas de
control basados en el modelo y pueden ser obtenidos por mediciones directas o por métodos
de identificación [4].
1.1. Antecedentes
El péndulo con rueda inercial pertenece a la familia de sistemas mecánicos subactua-
dos de tipo péndulo invertido. Entre otros sistemas de este tipo se encuentran el péndulo
de Furuta presentado en [5], el Acrobot reportado en [1], el pendubot y el carro péndulo,
ambos estudiados a detalle en [2]. Por otro lado, helicópteros, veh́ıculos acuáticos y qua-
drotores son otros ejemplos de sistemas mecánicos subactuados. El estudio de los sistemas
mecánicos subactuados ha incrementado en los últimos años y el estado del arte se ha
enriquecido bastante.
La subactuación se debe a una de las siguientes razones [6]:
1. Puede ser natural debido a la dinámica de los sistemas tal como aeronaves, he-
licópteros y veh́ıculos submarinos.
1
-
1.1 Antecedentes 2
Figura 1.1: Péndulo con rueda inercial.
2. Puede ser impuesto por diseño para reducir costos y peso tal como satélites con dos
propulsores.
3. Puede ser debido a fallas de los actuadores en un sistema.
4. La subactuación puede ser impuesta artificialmente para generar sistemas complejos
no lineales de bajo orden con el fin de obtener un visión sobre el control de sistemas
mecánicos subactuados de más alto orden.
En algunos sentidos, las caracteŕısticas de subactuación son aún más dif́ıciles de ma-
nipular que las propias caracteŕısticas no lineales de un sistema. Dominar el control de
estos sistemas puede transformar sus deficiencias en ventajas. Por ejemplo para la misma
configuración espacial, un sistema completamente actuado requiere más controles que si
fuera subactuado y como consecuencia se incrementa el costo y el peso del sistema [6].
Adicionalmente la subactuación proporciona una solución de control para la seguridad
de sistemas. Por ejemplo, si un sistema completamente actuado presenta una falla en uno
de sus actuadores pero se cuenta con un sistema de control subactuado, entonces este
-
1.1 Antecedentes 3
último puede ser usado en situaciones cŕıticas (como por ejemplo en la falla de uno de
los propulsores de un aeroplano o un cohete) con el fin de evitar la falla completa del
sistema [6].
Preguntas frecuentes sobre los sistemas mecánicos subactuados espećıficamente del
péndulo con rueda inercial es para qué sirve o qué tarea realiza. El péndulo con rueda
inercial es un banco de pruebas utilizado en teoŕıas de control lineal, control no lineal,
identificación paramétrica, modelado dinámico de sistemas, entre otras áreas de la inves-
tigación.
Antecedentes sobre el diseño, la construcción, la identificación paramétrica y el control
del péndulo con rueda inercial se mencionan a continuación. En lo que respecta al diseño
y la construcción de prototipos, en [7] se describe a detalle la construcción de un prototipo
de péndulo con rueda inercial y se obtiene el modelo dinámico, posteriormente se realizan
pruebas experimentales para la validación del modelo. En [8] de igual manera se construye
un péndulo con rueda inercial y se realizan experimentos de control.
El péndulo con rueda inercial ha sido identificado fuera de ĺınea en [9] mediante el
algoritmo de mı́nimos cuadrados, donde las velocidades y aceleraciones articulares se
obtienen con la simple diferenciación numérica de las posiciones articulares. Por otro
lado, en [10] se aborda la identificación paramétrica en ĺınea de un péndulo con rueda
inercial mediante el enfoque algebraico.
En cuanto a control, en el péndulo con rueda inercial y otros sistemas mecánicos
subactuados, se estudian tres principales objetivos de control: el Swing Up, la regulación
y la inducción de oscilaciones.
En lo que respecta al Swing Up del péndulo con rueda inercial, en [3] se presenta un
controlador de Swing Up basado en las propiedades de pasividad del sistema, en donde
previamente se implementa en el sistema la técnica de linealización por retroalimentación
parcial colocada. En [11] se detalla el procedimiento para la obtención de un controlador
de Swing Up mediante las propiedades de pasividad del sistema. En [2] se proponen dos
controladores de Swing Up para el péndulo con rueda inercial, ambos basados en la enerǵıa
del sistema.
En [12] se diseña e implementa un controlador de seguimiento de trayectoria mediante
la técnica de linealización por retroalimentación.
Además del Swing Up y la regulación, existen otros objetivos de control tal como
en [13], donde se propone un controlador por doble relevador para generar oscilaciones de
frecuencia y amplitud deseada sin la necesidad de implementar un control de seguimiento
de trayectoria.
La fricción está presente en todos los sistemas mecánicos y tiene un impacto signi-
-
1.2 Objetivos 4
ficativo en el control. Para el diseño exitóso de sistemas mecatrónicos se requiere de la
comprensión de los efectos de la fricción aśı como de técnicas para la compensación. Los
fenómenos de fricción son complicados porque son causados por diferentes mecanismos
f́ısicos [14].
A pesar de la complejidad del fenómeno de la fricción, varios modelos de fricción sim-
ples suelen ser adoptados por la comunidad de robótica. El modelo de fricción compuesto
por la fricción viscosa y de Coulomb es por lejos el más popular [15].
Para los ingenieros de control es importante entender los fenómenos de fricción y saber
como lidiar con ellos [16]. También es importante entender este fenómeno para mejorar el
comportamiento de los sistemas [14].
Antecedentes sobre estudios de los efectos de la compensación de fricción en sistemas
mecánicos subactuados se describen a continuación.
En [17] se muestran resultados experimentales del control de un péndulo con rueda
inercial mediante la técnica de linealización por retroalimentación. Para el diseño del
controlador se considera fricción viscosa y de Coulomb solo en el péndulo. El controlador
con la salida propuesta es de grado relativo 2.
Para el péndulo de Furuta, en [18] un controlador que considera fricción dinámica fue
diseñado mediante el método IDA-PBC. Para caracterizar la fricción dinámica se utiliza
el modelo de Dahl y con la finalidad de mostrar la efectividad de la compensación de
fricción, se realizan dos experimentos para comparar el desempeño del controlador cuando
la fricción es compensada y cuando no es compensada. Por otro lado, en [19] se estudian
los efectos de la compensación de la fricción en un Pendubot a través de experimentos
que consisten en el Swing Up y regulación del sistema en su punto de equilibrio inestable
(arriba-arriba).
1.2. Objetivos
1.2.1. Objetivo general
Llevar a cabo el diseño, la construcción, la identificación paramétrica y el control de
un sistema mecánico subactuado de dos grados de libertad.
1.2.2. Objetivos espećıficos
Los objetivos espećıficos de este proyecto de investigación son:
Modelar un sistema mecánico subactuado de péndulo con rueda inercial utilizando
-
1.3 Aportaciones 5
las ecuaciones de Euler-Lagrange.
Diseñar y construir un prototipo de péndulo con rueda inercial.
Identificar los parámetros del péndulo con rueda inercial mediante el algoritmo de
mı́nimos cuadrados.
Controlar el péndulo con rueda inercial.
Obtener resultados experimentales de identificación paramétrica y de control.
1.3. Aportaciones
Las principales aportaciones de este proyecto de tesis son:
El diseño y la construcción de un péndulo con rueda inercial.
La obtención del modelo dinámico del sistema en donde se considera un modelo
suave de fricción de Coulomb asimétrica.
La identificación paramétrica del péndulo con rueda inercial mediante el algoritmo
de mı́nimos cuadrados.
La propuesta de un controlador de regulación que compensa la fricción viscosa y la
fricción de Coulomb y que se basa en la técnica de linealización por retroalimenta-
ción.
La comparación entre el desempeño del controlador propuesto y el desempeño de un
controlador reportado en la literatura y que está basado en la técnica de linealización
por retroalimentación.
1.4. Organización del contenido por caṕıtulo
El presente documento de tesis está organizado como sigue.
En el caṕıtulo 2 se presenta el diseño en CAD y la estructura del prototipo del péndulo
con rueda inercial. En este caṕıtulo se realiza una descripción de los dispositivos que
conforman la plataforma experimental del péndulo con rueda inercial. En el caṕıtulo 3 se
muestra a detalle el proceso de la obtención del modelo dinámico del péndulo con rueda
inercial mediante las ecuaciones de Euler-Lagrange.
-
1.4 Organización del contenido por caṕıtulo 6
En el caṕıtulo 4 se presenta un procedimiento de identificación paramétrica fuera
de ĺınea utilizando el algoritmo de mı́nimos cuadrados y el modelo dinámico filtrado.
Posteriormente, se obtienen resultados experimentales de la identificación paramétrica
del péndulo con rueda inercial.
En el caṕıtulo 5 se presenta el control del péndulo con rueda inercial. En este caṕıtulo
se define el objetivo de control y se abordan los controladores necesarios para cumplirlo.
En términos generales el objetivo de control consiste en hacer rotar el péndulo de su
posición vertical hacia abajo a una región cercana a su posición vertical hacia arriba y
después conmutar a un controlador que regule el péndulo en su posición vertical hacia
arriba. Posteriormente, se diseña un controlador basado en la técnica de linealización por
retroalimentación y se realiza la evaluación del desempeño entre el controlador propuesto
y un controlador reportado en la literatura.
En el caṕıtulo 6 se dan las conclusiones del proyecto de tesis y los posibles trabajos
futuros.
-
Caṕıtulo 2
Diseño y construcción de la
plataforma experimental
2.1. Prototipo en CAD del péndulo con rueda iner-
cial
Hoy en d́ıa herramientas de diseño asisitido por computadora (CAD) como
SolidWorksr, permiten diseñar cada uno de los componentes de una estructura y cal-
cular los parámetros tales como masa, momento de inercia, longitud y densidad de cada
una de las piezas que la conforman. SolidWorksr también permite visualizar el com-
portamiento de mecanismos ensamblados con la finalidad de evitar colisiones entre sus
componentes. Existen también herramientas que permiten realizar animaciones en 3D de
sistemas mecánicos tal es el caso de SimMechanicsr de MATLAB Simulinkr.
En la figura 2.1 se aprecia el prototipo en CAD en una vista isométrica aśı como
sus componentes. Por otro lado, en la figura 2.2 se muestra la vista lateral del prototipo
diseñado.
2.2. Construcción de la plataforma experimental
En la actualidad compañias como Quanserr Inc. y B&R Automationr comercializan el
péndulo con rueda inercial instrumentado y listo para su uso en experimentos de tiempo
real. Los fabricantes en ocasiones propocionan el modelo del sistema y el valor de sus
parámetros, en otros casos el usuario debe calcularlos mediante herramientas de medición
u otros medios.
Para diseñar, construir un prototipo y llevar a cabo su instrumentación, se requiere
7
-
2.2 Construcción de la plataforma experimental 8
Figura 2.1: Prototipo en CAD.
Figura 2.2: Vista lateral del prototipo del péndulo con rueda inercial.
-
2.2 Construcción de la plataforma experimental 9
de una selección adecuada de la tarjeta de adquisición de datos, de codificadores ópticos,
del actuador, del tipo de material de la estructura, de la etapa de potencia, el equipo de
cómputo para el procesamiento de los datos, los cables de alimentación y herramientas
de maquinado. En el caso de prototipos de gran tamaño y gran inercia, los rodamientos
o baleros juegan un rol importante para el soporte de los ejes no actuados.
Regularmente las plataformas experimentales cuentan únicamente con sensores de po-
sición articular. Sin embargo, las velocidades articulares pueden ser estimadas mediante
la diferenciación discreta de las posiciones articulares. Por otro lado, ante la ausencia de
sensores de torque, una solución para estimar el torque aplicado es utilizar la constante
de torque del motor proporcionada por el fabricante multiplicada por la corriente medida
con un sensor apropiado.
En esta sección se presenta un nuevo prototipo de péndulo con rueda inercial donde se
describen detalladamente los componentes necesarios para su correcto funcionamiento en
experimentos de tiempo real. Antecedentes sobre la construcción de prototipos de péndulo
con rueda inercial se han reportado en [7] y [8].
Una plataforma experimental de un sistema mecánico subactuado para su correcto y
completo funcionamiento debe estar compuesta de las siguientes etapas:
1. Procesamiento y adquisición de datos: Se leen las señales provenientes de dispositi-
vos, se procesan y se toman decisiones de acuerdo a alguna regla o ley.
2. Etapa de potencia: Las señales que se reciben son amplificadas con la finalidad de
energizar un actuador o actuadores acoplados en las articulaciones de un prototipo
y producir movimiento.
3. Retroalimentación de señales: Las señales de salida (posición, velocidad, corriente,
etc.) del sistema medidas en tiempo real mediante dispositivos de instrumentación,
retornan a la etapa inicial de procesamiento y adquisición de datos.
A continuación se presentan los dispositivos seleccionados y se describen las carac-
teŕısticas más importantes. También se muestra esquemáticamente la integración de la
plataforma experimental y la conexión entre sus etapas.
2.2.1. Tarjeta de adquisición de datos
La adquisición de los datos se realiza mediante una tarjeta Sensorayr 626 y el proce-
samiento de los datos con una PC a través de Real Time Windows Target de MATLABr.
La tarjeta de adquisición de datos es encargada de la lectura de los codificadores ópticos
-
2.2 Construcción de la plataforma experimental 10
Figura 2.3: Servoamplificador 16A20AC.
y de proporcionar las señales de control. El sistema operativo empleado es Windowsr XP
con la versión de MATLABr 2007a con una frecuencia de muestreo de 1 [Khz].
2.2.2. Servoamplificador
El servoamplificador es primordial pues se encarga de amplificar las señales prove-
nientes de la tarjeta de adquisición de datos. El servoamplificador es el 16A20AC de la
empresa Advanced Motion Controlsr y puede ser configurado en modo voltaje o modo
corriente. En este proyecto de investigación se configura el servoamplificador en modo
corriente, es decir,
im = Ksav ,
donde im es la corriente entregada por el servo amplificador, Ksa = 1 [A/V] es una
ganancia ajustable de amplificación y v es el voltaje de entrada al servoamplificador. La
entrada de control al sistema mecánico es
τ = Kmim ,
donde Km = 0.0551 [Nm/A] es la constante de torque del motor de corriente directa
modelo DCM50202-02D-1000 que se describirá más adelante.
-
2.2 Construcción de la plataforma experimental 11
2.2.3. Codificador óptico para la medición de q1
El codificador óptico para la medición de la posición articular del péndulo es de la em-
presa USDigitalr modelo HB5M-1000-250-IE-D-H con carcasa de aluminio. La resolución
del codificador óptico es de 1000 pulsos por revolución, resaltando que cada pulso puede
proporcionar 1, 2 o 4 conteos dependiendo de la decodificación o multiplicación externa
(x1, x2 o x4). En la figura 2.4 se aprecia el codificador óptico HB5M en tres diferentes
vistas.
Figura 2.4: Codificador óptico de la empresa USDigitalr.
2.2.4. Actuador con codificador óptico para la medición de q2
El actuador utilizado en la rueda es un motor de corriente directa modelo DCM50202-
02D-1000 de la empresa Leadshine Technologyr. El motor cuenta con un codificador
óptico cuya resolución es de 1000 pulsos por revolución. La constante de torque del motor
es Km = 0.0551 [Nm/A] y es de utilidad para estimar el torque aplicado al sistema. En
la figura 2.5 se muestra el motor de corriente directa en una vista frontal y una vista
isométrica.
Codificador
óptico
Figura 2.5: Motor de corriente directa con codificador óptico.
-
2.2 Construcción de la plataforma experimental 12
2.2.5. Rodamientos del eje de rotación del péndulo
Los rodamientos son cruciales ya que soportan el péndulo, la rueda y el actuador,
además facilitan la medición de la posición del péndulo, pues evitan que el codificador
óptico soporte peso. El modelo usado es el 6201 2Z de la empresa SKFr. En la figura 2.6
se aprecian dichos rodamientos.
Figura 2.6: Rodamientos SKF 6201 2Z.
2.2.6. Estructura del prototipo
En la figura 2.7 se presenta la estructura del péndulo con rueda inercial en donde el
péndulo, la rueda, la base inferior y la base superior son de aleación de aluminio 6061.
Por otro lado las patas y el perno son de acero estirado en fŕıo ya que son componentes de
soporte. El maquinado se realizó mediante máquinas herramientas para dar un acabado
fino a los componentes de la estructura.
2.2.7. Plataforma experimental
En la figura 2.8 se muestra de forma esquemática la plataforma experimental. La
plataforma permite implementar en tiempo real técnicas de control lineal y no lineal.
También permite recolectar información del sistema para la aplicación de algoritmos de
identificación paramétrica, con la finalidad de construir un modelo que represente el com-
portamiento del sistema de una manera aproximada.
-
2.2 Construcción de la plataforma experimental 13
Figura 2.7: Estructura del prototipo.
Posición del péndulo y
posición de la rueda
ServoamplificadorSensoray 626
Windows
XP
Figura 2.8: Integración de la plataforma experimental.
-
Caṕıtulo 3
Modelo dinámico
En el presente caṕıtulo se muestra a detalle el proceso para la obtención del modelo
dinámico del péndulo con rueda inercial. El modelo dinámico es obtenido por medio de
las ecuaciones de movimiento de Euler-Lagrange. Posteriormente, en el modelo dinámico
se adiciona un modelo de fricción, conformado por la fricción viscosa y una aproximación
continua de la fricción de Coulomb.
En la literatura se han presentado modelos con diferentes sistemas de referencia, con
distintos modelos de fricción y en algunos casos considerando la dinámica del actuador. Es
común que la fricción no sea considerada en los modelos con la finalidad de simplificarlos
y facilitar su estudio, sin embargo, la calidad en la predicción del comportamiento del
sistema experimental disminuye considerablemente.
Primeramente se aborda la enerǵıa total del sistema, que consiste en la suma de la
enerǵıa cinética total y la enerǵıa potencial total. Posteriormente se obtiene el lagrangiano
pues es requerido en las ecuaciones de movimiento de Euler-Lagrange. En la figura 3.1 se
muestra el péndulo con rueda inercial con los parámetros del sistema y en la tabla 3.1 se
muestra el significado de cada uno de ellos.
3.1. Enerǵıa total del sistema
La enerǵıa total del sistema es dada por
E(q, q̇) = K(q, q̇) + U(q) ,
donde q = [q1 q2]T , K(q, q̇) es la enerǵıa cinética total y U(q) es la enerǵıa potencial total
del sistema.
14
-
3.1 Enerǵıa total del sistema 15
Figura 3.1: Parámetros del péndulo con rueda inercial.
Tabla 3.1: Parámetros del modelo dinámico.
Parámetro Descripción
m1 Masa del péndulom2 Masa de la ruedal1 Largo del péndulolc1 Distancia del eje de rotación
al centro de masa del pénduloI1 Momento de inercia del pénduloI2 Momento de inercia de la ruedafv1 Fricción viscosa del péndulofv2 Fricción viscosa de la ruedacf1 Coeficiente de fricción de Coulomb 1cf2 Coeficiente de fricción de Coulomb 2g Aceleración de la gravedad
-
3.2 Enerǵıa potencial total 16
Figura 3.2: Vista frontal del péndulo con rueda inercial.
3.2. Enerǵıa potencial total
La enerǵıa potencial total del sistema es dada por
U(q) = U1(q) + U2(q) ,
donde U1(q) es la enerǵıa potencial del péndulo y U2(q) es la enerǵıa potencial de la rueda.La figura 3.2 es de utilidad para la deducción de la enerǵıa potencial total del sistema.
3.2.1. Enerǵıa potencial del péndulo
La enerǵıa potencial del péndulo con respecto a su centro de masa lc1 se expresa como
U1(q) = h− [lc1 cos(π − q1)m1g] ,
usando la identidad trigonométrica
cos(a− b) = cos(a) cos(b) + sin(a) sin(b) , (3.1)
-
3.3 Enerǵıa cinética total 17
se obtiene
U1(q) = h− lc1 [cos(π) cos(q1) + sin(π) sin(q1)]m1g ,
= h− lc1 [− cos(q1)]m1g ,
= h+ lc1 cos(q1)m1g.
3.2.2. Enerǵıa potencial de la rueda
La enerǵıa potencial de la rueda se define como
U2(q) = h− [l1 cos(π − q1)m2g] .
Usando la identidad trigonométrica de la ecuación (3.1) se obtiene
U2(q) = h− l1 [cos(π) cos(q1) + sin(π) sin(q1)]m2g ,
= h− l1 [− cos(q1)]m2g ,
= h+ l1 cos(q1)m2g.
3.3. Enerǵıa cinética total
La enerǵıa cinética total del sistema es la suma de la enerǵıa cinética total del péndulo
K1(q, q̇) y la enerǵıa cinética total de la rueda K2(q, q̇), esto es,
K(q, q̇) = K1(q, q̇) +K2(q, q̇).
3.3.1. Enerǵıa cinética del péndulo
La enerǵıa cinética total del péndulo es dada por la suma de la enerǵıa cinética rota-
cional y la enerǵıa cinética traslacional es decir
K1(q, q̇) =1
2I1q̇1
2 +1
2m1V
21 ,
=1
2I1q̇1
2 +1
2m1l
2c1q̇
21 ,
donde V1 es la rapidez del centro de masa del péndulo.
Se debe aclarar que la rapidez es un escalar y representa la magnitud de la velocidad la
cual tiene carácter vectorial. La obtención de V1 se muestra detalladamente a continuación.
-
3.3 Enerǵıa cinética total 18
Las coordenadas del centro de masa del péndulo expresadas en las coordenadas del
plano x− y son
x1 = lc1 sin(π − q1) ,
y1 = −lc1 cos(π − q1) ,
por lo tanto vector de velocidad v1 del centro de masa del péndulo es
v1 =
[ẋ1
ẏ1
]=
[−lc1 cos(π − q1)q̇1−lc1 sin(π − q1)q̇1
]. (3.2)
Para obtener la rapidez al cuadrado V 21 únicamente se eleva al cuadrado la norma del
vector de velocidad expresado en la ecuación (3.2), es decir,
V 21 = ‖v1‖2 ,
= v1Tv1 ,
= (−lc1)2 cos(π − q1)2q̇21 + (−lc1)2 sin(π − q1)2q̇21 ,
= l2c1q̇21 ,
donde se ha utilizado la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.
3.3.2. Enerǵıa cinética de la rueda
De igual manera la enerǵıa cinética total de la rueda es dada por la suma de la enerǵıa
cinética rotacional y la enerǵıa cinética traslacional, es decir,
K2(q, q̇) =1
2I2(q̇1 + q̇2)
2 +1
2m2V
22 ,
=1
2I2(q̇1 + q̇2)
2 +1
2m2l
21q̇
21 ,
donde V2 es la rapidez del centro de masa de la rueda.
La obtención de V2 se muestra a continuación. Las coordenadas del centro de masa de
la rueda en el plano x− y son
x2 = l1 sin(π − q1) ,
y2 = −l1 cos(π − q1) ,
-
3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 19
por lo tanto el vector de velocidad v2 es dado por
v2 =
[ẋ2
ẏ2
]=
[−l1 cos(π − q1)q̇1−l1 sin(π − q1)q̇1
]. (3.3)
Se procede a obtener la rapidez V 22 elevando al cuadrado la norma del vector v2
expresado en la ecuación (3.3), es decir,
V 22 = ‖v2‖2 ,
= v2Tv2 ,
= (−l1)2 cos(π − q1)2q̇21 + (−l1)2 sin(π − q1)2q̇21 ,
= l21q̇21 ,
donde se utiliza la identidad trigonométrica sin(π − q1)2 + cos(π − q1)2 = 1.
3.4. Lagrangiano y ecuaciones de movimiento de
Euler-Lagrange
El lagrangiano L(q, q̇) es la diferencia entre la enerǵıa cinética K y la enerǵıa potencialU , esto es,
L(q, q̇) = K(q, q̇)− U(q).
Las ecuaciones de movimiento de Euler-Lagrange son dadas por
d
dt
[∂L(q, q̇)∂q̇
]− ∂L(q, q̇)
∂q= τ ,
o de manera equivalente
d
dt
[∂L(q, q̇)∂q̇i
]− ∂L(q, q̇)
∂qi= τi , i = 1, 2. (3.4)
donde τi corresponde a los torques entregados por los actuadores.
-
3.4 Lagrangiano y ecuaciones de movimiento de Euler-Lagrange 20
3.4.1. Lagrangiano y ecuaciones de movimiento de Euler-
Lagrange del péndulo con rueda inercial
El lagrangiano L(q, q̇) del péndulo con rueda inercial es dado por
L(q, q̇) = 12I1q̇1
2 +1
2m1l
2c1q̇
21 +
1
2I2(q̇1 + q̇2)
2 +1
2m2l
21q̇
21
−[h+ lc1 cos(q1)m1g + h+ l1 cos(q1)m2g].
Se procede ahora a calcular algunas derivadas requeridas para la obtención de la ecuación
de movimiento del péndulo, esto es,
∂L∂q̇1
= I1q̇1 +m1l2c1q̇1 + I2q̇1 + I2q̇2 +m2l
21q̇1 ,
d
dt
[∂L∂q̇1
]= I1q̈1 +m1l
2c1q̈1 + I2q̈1 + I2q̈2 +m2l
21q̈1 ,
∂L∂q1
= m1glc1 sin(q1) +m2gl1 sin(q1) ,
por lo tanto desarrollando la ecuación (3.4) para la articulación 1 (péndulo), es decir,
d
dt
[∂L(q, q̇)∂q̇1
]− ∂L(q, q̇)
∂q1= τ1 ,
se obtiene la ecuación de movimiento del péndulo
I1q̈1 +m1l2c1q̈1 + I2q̈1 + I2q̈2 +m2l
21q̈1 − [m1glc1 sin(q1) +m2gl1 sin(q1)] = 0 ,
y mediante la factorización de términos se reduce a
[I1 + I2 +m1l
2c1 +m2l
21
]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) = 0 , (3.5)
donde el torque τ1 = 0 porque el péndulo no es actuado.
De igual manera para la obtención de la ecuación de movimiento de la rueda se desa-
rrollan las siguientes derivadas
∂L∂q̇2
= I2q̇1 + I2q̇2 ,
d
dt
[∂L∂q̇2
]= I2q̈1 + I2q̈2 ,
∂L∂q2
= 0 ,
-
3.5 Modelo de fricción 21
por lo tanto desarrollando la ecuación (3.4) para la articulación 2 (rueda), es decir,
d
dt
[∂L(q, q̇)∂q̇2
]− ∂L(q, q̇)
∂q2= τ2 ,
se obtiene la ecuación de movimiento de la rueda y es dada por
I2q̈1 + I2q̈2 = τ2 , (3.6)
donde τ2 es el torque aplicado a la rueda. Se define τ = τ2 ya que es el único torque
aplicado al sistema.
3.5. Modelo de fricción
Es común que el sistema sea estudiado únicamente con el modelo obtenido con las
ecuaciones de movimiento de Euler-Lagrange, sin embargo, el modelo no predice con pre-
cisión el comportamiento del sistema experimental. Esto se debe a que en la práctica
existen fenómenos tales como la fricción viscosa, la fricción de Coulomb y la fricción
estática que se oponen al movimiento de las articulaciones. Para modelar con precisión un
sistema experimental es crucial tomar en cuenta estas fuerzas no conservativas presentes
en el sistema. El modelo de fricción utilizado en el presente proyecto de investigación es
un modelo que considera fricción viscosa y fricción de Coulomb. La fricción de Coulomb
es aproximada mediante una tangente hiperbólica y debido a la naturaleza del actua-
dor presenta un comportamiento asimétrico. Por lo tanto, la fricción de Coulomb tiene
una estructura particular y en este trabajo será denominada como fricción de Coulomb
asimétrica.
3.5.1. Modelo de fricción viscosa
El modelo de fricción viscosa está dado por
Fvq̇ =
[fv1 0
0 fv2
][q̇1
q̇2
]=
[fv1q̇1
fv2q̇2
], (3.7)
donde Fv ∈ IR2×2 es la matriz de fricción viscosa. En la ecuación (3.7) se aprecia que lafricción viscosa es considerada en las articulaciones del péndulo y de la rueda.
-
3.5 Modelo de fricción 22
3.5.2. Modelo de fricción de Coulomb asimétrica
La fricción de Coulomb es modelada mediante una función signo. La función signo es
una función con naturaleza discontinua considerada como una no linealidad “dura” y es
dada por
sign(q̇) =
1 si q̇ > 0 ,
0 si q̇ = 0 ,
−1 si q̇ < 0.(3.8)
En la figura 3.3 se muestra la función signo expresada en la ecuación (3.8).
−1 −0.5 0 0.5 1
−1
−0.5
0
0.5
1
q̇
sign(q̇)
Figura 3.3: Función signo.
La función signo puede ser aproximada con una tangente hiperbólica que es una función
continua, esto es,
sign(q̇) ≈ tanh(βq̇) ,
donde β > 0. En la figura 3.4 se muestra la función tangente hiperbólica con distintos
valores de β.
En este proyecto de investigación el modelo de fricción de Coulomb utilizado es la
aproximación continua de la función signo mediante la tangente hiperbólica. Los actua-
dores como los motores de corriente directa pueden comportarse de manera asimétrica en
-
3.6 Modelo del péndulo con rueda inercial 23
−1 −0.5 0 0.5 1
−1
−0.5
0
0.5
1
q̇
tanh(β
q̇)
β = 100β = 45β = 20β = 7
Figura 3.4: Tangente hiperbólica.
cuanto a la fricción de Coulomb, esto es, cuando la velocidad es positiva se tiene un valor
para el coeficiente de fricción cf1 y cuando es negativa se tiene otro valor de coeficiente
de fricción cf2. Para modelar este comportamiento asimétrico en los actuadores, se utiliza
la tangente hiperbólica estructurada de una manera particular. La estructura del modelo
de fricción de Coulomb asimétrica viene dada por
fc(q̇) =
[0
cf1[12
+ 12
tanh(βq̇2)]
+ cf2[−1
2− 1
2tanh(−βq̇2)
]] , (3.9)donde β = 100. Como se aprecia en la ecuación (3.9) este tipo de fricción es únicamente
adicionada en la articulación actuada.
3.6. Modelo del péndulo con rueda inercial
Finalmente el modelo del péndulo con rueda inercial que considera fricción es repre-
sentado mediante las ecuaciones (3.5), (3.6), (3.7) y (3.9) de la siguiente manera
[I1 + I2 +m1l
2c1 +m2l
21
]q̈1 + I2q̈2 − [m1lc1 +m2l1] g sin(q1) + fv1q̇1 = 0 ,
I2q̈1 + I2q̈2 + fv2q̇2 + cf1
[1
2+
1
2tanh(βq̇2)
]+ cf2
[−1
2− 1
2tanh(−βq̇2)
]= τ.
-
3.7 Representación de estados del péndulo con rueda inercial 24
Usualmente los modelos dinámicos se expresan en su forma compacta como
M q̈ + gm(q) + Fvq̇ + fc(q̇) = u , (3.10)
siendo
M =
[I1 + I2 +m1l
2c1 +m2l
21 I2
I2 I2
],
gm(q) =
[− [m1lc1 +m2l1] g sin(q1)
0
],
Fv =
[fv1 0
0 fv2
],
fc(q̇) =
[0
cf1[12
+ 12
tanh(βq̇2)]
+ cf2[−1
2− 1
2tanh(−βq̇2)
]] ,u =
[0
τ
],
donde q, q̇, q̈ ∈ IR2 son los vectores de posición articular, velocidad articular y aceleraciónarticular, respectivamente, M ∈ IR2×2 es la matriz de inercia y es una matriz simétricay positiva definida, gm(q) ∈ IR2 es el vector de pares gravitacionales, Fv ∈ IR2×2 es unamatriz diagonal que contiene los coeficientes de fricción viscosa, u ∈ IR2 es el vector deentrada, fc(q̇) ∈ IR2 es el vector de aproximación continua de la fricción de Coulombasimétrica y β = 100 es parte del argumento de la tangente hiperbólica. Es importante
mencionar que u = [0 τ ]T , donde τ ∈ IR es el torque aplicado a la rueda.
3.7. Representación de estados del péndulo con rue-
da inercial
Un modelo es la correlación entre las variables del sistema y la solución de esta corre-
lación son los estados que describen el comportamiento del sistema.
A continuación se obtiene la representación de estados del péndulo con rueda inercial
dado por la ecuación (3.10). Primeramente, se despejan las aceleraciones articulares, esto
es,
q̈ = M−1 [u− gm(q)− Fvq̇ − fc(q̇)] ,
-
3.7 Representación de estados del péndulo con rueda inercial 25
donde
M−1 =1
det(M)adj(M) ,
det(M) = M11M22 −M21M12 ,
adj(M) =
[M22 −M12−M21 M11
],
M11 = I1 + I2 +m1l2c1 +m2l
21 ,
M12 = I2 ,
M21 = I2 ,
M22 = I2 ,
y en donde
u− gm(q)− Fvq̇ − fc(q̇) =
[z1
z2
],
con
z1 = [m1lc1 +m2l1] g sin(q1)− fv1q̇1 ,
z2 = τ − fv2q̇2 − cf1[
1
2+
1
2tanh(βq̇2)
]− cf2
[−1
2− 1
2tanh(−βq̇2)
].
Por lo tanto y partiendo del sistema de ecuaciones dado por
q̈ =
[q̈1
q̈2
]=
1
det(M)
[M22 −M12−M21 M11
][z1
z2
],
se obtiene entonces la representación de estados y es dada por
d
dt
q1
q2
q̇1
q̇2
=
q̇1
q̇2M22z1 −M12z2
det(M)−M21z1 +M11z2
det(M)
.
-
Caṕıtulo 4
Identificación paramétrica
Para caracterizar el comportamiento de un sistema mecánico se requiere en parte del
conocimiento del valor de los parámetros relacionados al modelo dinámico. En sistemas
mecánicos como robots, motores, péndulos, etc., existen tres principales métodos para
estimar los parámetros que forman parte del modelo y son [20]:
1. Experimentos f́ısicos: Se requiere desmontar las piezas y calcular los parámetros
directamente, como ejemplo, pesar las piezas para calcular las masas. Este método
es tedioso y debe ser realizado por el fabricante antes de ensamblar el mecanismo.
2. Usando herramientas CAD/CAM: Herramientas CAD/CAM facilitan el cálculo de
los parámetros introduciendo el tipo de material de las piezas. Este método tiene un
grado de error debido a que se consideran despreciables ciertos componentes como
rodamientos y tornillos.
3. Identificación: Este enfoque es basado en el análisis del comportamiento entrada/-
salida sobre algún movimiento planificado.
En este proyecto de investigación se opta por el método de identificación para estimar
los parámetros del péndulo con rueda inercial. Identificación es el enfoque experimental
en el proceso del modelado y es un proceso iterativo en el que intervienen los siguientes
pasos [21]:
1. Adquisición de datos.
2. Selección de la estructura del modelo.
3. Estimación de parámetros.
4. Validación del modelo.
26
-
4.1 Modelo de regresión lineal 27
En el presente caṕıtulo se abordan cada uno de los pasos de la identificación enfocada
al caso de estudio del péndulo con rueda inercial. Primeramente se introduce el concepto
de modelo de regresión lineal como punto de partida en la selección de la estructura
del modelo. Además, se presenta la deducción del algoritmo de mı́nimos cuadrados y
del modelo dinámico filtrado. Posteriormente se describe la función de transferencia del
filtro utilizado y el experimento diseñado para la identificación paramétrica. Finalmente
se muestran los resultados experimentales de la identificación de parámetros y se realiza
la validación del modelo por medio de experimentos y simulaciones.
4.1. Modelo de regresión lineal
En [22] se aborda el concepto de modelo de regresión lineal para sistemas de n salidas
y se presenta a continuación. Un sistema del cual se han obtenido N muestras, puede ser
descrito por sus entradas x ∈ IRm y salidas y ∈ IRn mediante un modelo de regresiónlineal de la forma
y(k) = A(k)θ ,
donde k = 0, . . . , N − 1 es el instante de muestreo en el tiempo t = kT , donde T es elperiodo de muestreo, y(k) ∈ IRn es el vector de salidas, θ ∈ IRp es un vector de parámetrosconstantes desconocidos del sistema y es dado por
θ = [θ1 θ2 . . . θp]T ,
y A(k) ∈ IRn×p es la matriz de regresión lineal donde su componentes son funciones delas entradas medidas x(k) ∈ IRm.
Asumiendo que se tiene un vector de parámetros estimados θ̂(k) en el instante k y se
cuenta con la matriz de regresión A(k) es posible estimar las salidas del sistema, es decir,
ŷ(k) = A(k)θ̂ ,
o de manera equivalente
y(k) = A(k)θ̂(k) + e(k) , (4.1)
donde θ̂(k) ∈ IRp es el vector de parámetros estimados del sistema y e(k) ∈ IRn es elvector de error [21,22].
-
4.2 Algoritmo de mı́nimos cuadrados 28
4.2. Algoritmo de mı́nimos cuadrados
El vector de parámetros desconocidos es estimado mediante el algoritmo de mı́nimos
cuadrados presentado en [21]. A continuación se muestra a detalle la deducción del algo-
ritmo de mı́nimos cuadrados para sistemas de n salidas tal y como es reportado en [22].
Para que el modelo dado por (4.1) represente fielmente el sistema debe tener un vector
de parámetros θ̂(k) donde el error esperado sea
E{eT (k)e(k)
}=
k∑i=0
1
2eT (i)e(i) ,
=k∑i=0
1
2[y(i)− A(i)θ̂(k)]T [y(i)− A(i)θ̂(k)] , (4.2)
tal que satisfaga el criterio de mı́nimos cuadrados
θ̂(k) = argmı́nθ̂E{eT (k)e(k)
}.
Dado que E{eT (k)e(k)
}es cuadrático en θ̂, se puede obtener el mı́nimo derivando la
ecuación (4.2) e igualando a cero el resultado de la derivación, de tal manera que
∂
∂θE{eT (k)e(k)
}= −
k∑i=0
AT (i)[y(i)− A(i)θ̂(k)] = 0 ,
de donde se obtiene
k∑i=0
AT (i)A(i)θ̂(k) =k∑i=0
AT (i)y(i) , (4.3)
de donde se despeja θ̂(k) para obtener la expresión del algoritmo de mı́nimos cuadrados
θ̂(k) =
[k∑i=0
A(i)TA(i)
]−1 [ k∑i=0
A(i)Ty(i)
]. (4.4)
El método de mı́nimos cuadrados es esencial en sistemas de ingenieŕıa de control ya
que brinda una herramienta simple para la estimación de parámetros de un sistema [21].
Cabe señalar que el algoritmo de mı́nimos cuadrados se implementa fuera de ĺınea.
-
4.3 Linealidad en los parámetros 29
4.3. Linealidad en los parámetros
En el modelo dinámico del péndulo con rueda inercial dado por
M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,
las matrices M ∈ IR2×2 y Fv ∈ IR2×2 aśı como los vectores gm(q) ∈ IR2 y fc(q̇) ∈ IR2, nosolo dependen de la geometŕıa del sistema [23], también dependen de diversos parámetros
inerciales y de constantes de fricción. El modelo dinámico expresado expĺıcitamente en
función de los parámetros es dado por
M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) = u , (4.5)
donde los parámetros son denotados por θ ∈ IRp. Es importante resaltar que cada elementodel vector θ no necesariamente corresponde a parámetros f́ısicos individuales del sistema
[23].
El modelo de la ecuación (4.5) posee la propiedad de linealidad en los parámetros si
puede ser expresado en términos lineales de θ, es decir,
Y (q, q̇, q̈)θ = u , (4.6)
donde Y (q, q̇, q̈) ∈ IR2×p, θ ∈ IRp y u ∈ IR2. La ecuación (4.6) es una estructura deregresión lineal donde
Y (q, q̇, q̈)θ = M(θ)q̈ + gm(q,θ) + Fv(θ)q̇ + fc(q̇,θ) , (4.7)
es una matriz de regresión cuyos elementos son funciones no lineales de las posiciones,
velocidades y aceleraciones articulares. El vector de θ IRp será definido expĺıcitamente en
la siguiente sección.
4.4. Parametrización del modelo dinámico del
péndulo con rueda inercial
En este proyecto de investigación se realiza la estimación de un vector de parámetros
θ ∈ IR7 cuyos elementos se aprecian en la tabla 4.1. Se muestra que los parámetros θi, i =1, 2, ..., 7, no necesariamente corresponden a los parámetros individuales del sistema.
El modelo parametrizado en forma compacta del péndulo con rueda inercial es dado
-
4.5 Modelo dinámico filtrado 30
Tabla 4.1: Parámetros θ.
Parámetro θ Valor
θ1 I1 + I2 +m1l2c1 +m2l
21
θ2 I2θ3 [m1lc1 +m2l1]θ4 fv1θ5 fv2θ6 cf1θ7 cf2
por
M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,
siendo
M =
[θ1 θ2
θ2 θ2
],
gm(q) =
[−θ3g sin(q1)
0
],
Fv =
[θ4 0
0 θ5
],
fc(q̇) =
[0
θ6[12
+ 12
tanh(βq̇2)]
+ θ7[−1
2− 1
2tanh(−βq̇2)
]] ,u =
[0
τ
],
donde M ∈ IR2×2, gm(q) ∈ IR2, Fv ∈ IR2×2, fc(q̇) ∈ IR2 y u ∈ IR2. A partir de esta repre-sentación parametrizada es posible obtener el modelo dinámico filtrado y posteriormente
implementar la metodoloǵıa de identificación para estimar el vector de parámetros θ ∈IR7.
4.5. Modelo dinámico filtrado
La mayoŕıa de los sistemas dinámicos (péndulos, robots, etc.) poseen sensores de po-
sición, pero pocos cuentan con sensores de velocidad y aceleración. En estos casos, para
-
4.5 Modelo dinámico filtrado 31
identificar los parámetros del sistema, se aborda el modelo dinámico filtrado presentado
en [20] y [24], que permite obtener un modelo regresión que no depende de las acelera-
ciones articulares. La identificación se realiza fuera de ĺınea, por lo tanto, las velocidades
articulares pueden ser estimadas con el algoritmo de diferenciación central directamen-
te de las posiciones articulares medidas con los codificadores ópticos. A continuación se
muestra a detalle el procedimiento para la obtención del modelo dinámico filtrado del
péndulo con rueda inercial. El modelo dinámico del péndulo con rueda inercial es dado
por
M q̈ + gm(q) + Fvq̇ + fc(q̇) = u ,
donde M ∈ IR2×2 es la matriz de inercia, gm(q) ∈ IR2 es el vector de pares gravitacionales,Fv ∈ IR2×2 es la matriz de fricción viscosa, fc(q̇) ∈ IR2 es el vector de fricción de Coulomby u ∈ IR2 es el vector de entrada, es posible reacomodarlo de manera equivalente como
M q̈ + Ṁ q̇ − Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u , (4.8)
donde se aprecia que la suma y cancelación de una parte en la ecuación (4.8) no altera el
modelo, pero permite realizar una separación de la parte del modelo que depende de la
aceleración de la que no, esto mediante la factorización
d
dt[M q̇] = M q̈ + Ṁ q̇ ,
que sustituida en (4.8), es decir,
d
dt[M q̇]− Ṁ q̇ + gm(q) + Fvq̇ + fc(q̇) = u ,
permite separar el modelo en dos nuevas matrices Ya(q, q̇) y Yb(q, q̇) que no dependen de
la aceleración q̈, es decir,
Ya(q, q̇)θ = M q̇ ,
Yb(q, q̇)θ = gm(q) + Fvq̇ + fc(q̇) ,
obteniéndose una ecuación diferencial de primer orden
d
dt[Ya(q, q̇)θ] + Yb(q, q̇)θ = u , (4.9)
-
4.5 Modelo dinámico filtrado 32
donde θ es el vector de parámetros. Finalmente multiplicando la ecuación (4.9) por un
filtro pasa bajas con función de transferencia f(s) donde el operador diferencial ddt
es
reemplazado por s
sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u , (4.10)
se obtiene el modelo dinámico filtrado
Yafθ + Ybfθ = uf . (4.11)
Ahora realizando la factorización
[Yaf + Ybf ]θ = uf ,
se obtiene el modelo de regresión que se utiliza para estimar el vector de parámetros θ
sin la necesidad de calcular la aceleración articular q̈ ∈ IR2.
4.5.1. Modelo dinámico filtrado del péndulo con rueda inercial
Para obtener el modelo dinámico filtrado del péndulo con rueda inercial primeramente
se estructura el modelo como una ecuación diferencial de primer orden tal y como se
indica en la ecuación (4.9). Entonces, para el caso del péndulo con rueda inercial
Ya(q, q̇) =
[q̇1 q̇2 0 0 0 0 0
0 q̇1 + q̇2 0 0 0 0 0
],
Yb(q, q̇) =
[0 0 −g sin(q1) q̇1 0 0 00 0 0 0 q̇2
12
+ 12
tanh(βq̇2) −12 −12
tanh(−βq̇2)
],
θ =[θ1 θ2 θ3 θ4 θ5 θ6 θ7
]T.
Multiplicando por una función de transferencia f(s) ambos lados de la ecuación (4.9) se
tiene que
sf(s) [Ya(q, q̇)θ] + f(s)Yb(q, q̇)θ = f(s)u ,
lo que representa el modelo dinámico filtrado del péndulo con rueda inercial, que compac-
tado es expresado como
Yfθ = uf ,
-
4.6 Selección del filtro f(s) 33
donde Yf = Yaf + Ybf , con
Yaf = sf(s)Ya(q, q̇) ,
Ybf = f(s)Yb(q, q̇) ,
uf = f(s)u.
4.6. Selección del filtro f (s)
La selección del filtro f(s) es de vital importancia para la implementación del modelo
dinámico filtrado, aśı como también, la determinación de la frecuencia de corte la cual
debe ser seleccionada de manera que no afecte las frecuencias que determinan la dinámica
del sistema. El filtro f(s) se encuentra en el dominio de la frecuencia pero es continuo, por
lo tanto debido a que se pretende identificar un sistema real, se debe hacer un mapeo del
plano s al plano z. En esta sección se selecciona la función de transferencia del filtro f(s)
y también el método de mapeo del plano s a z para obtener la función de transferencia
discreta f(z).
4.6.1. Diseño del filtro f(s) para el modelo dinámico filtrado
El filtro a implementar para evitar el cálculo de la aceleración articular q̈ viene dado
por la función de transferencia
f(s) =λ2
(s+ λ)2, (4.12)
donde el filtro está conformado por dos polos repetidos situados en el parte izquierda del
plano s para garantizar estabilidad, donde λ es la frecuencia de corte del filtro y a su
vez la ganancia del filtro debido a que cada polo produce una atenuación proporcional a
la frecuencia de corte. El análisis del comportamiento del filtro se realiza en el dominio
de la frecuencia utilizando diagramas de Bode, que son una representación gráfica que
sirve para visualizar la respuesta en frecuencia de un sistema. Una vez diseñado el filtro
es necesario su transformación a tiempo discreto, esto es posible utilizando un método de
mapeo del plano s al plano z. El filtro dado por la ecuación (4.12) se menciona en [20]
para la identificación de robots manipuladores.
-
4.6 Selección del filtro f(s) 34
4.6.2. Método de diferencias hacia atrás
Existen métodos comunes para realizar el mapeo del dominio s al dominio z y son:
el método de diferencias hacia atrás y el método de transformación bilineal [25]. En este
trabajo se utiliza el método de diferencias hacia atrás por su sencillez. El método de
diferencias hacia atrás utiliza la relación
s =1− z−1
T,
que multiplicado por zz
equivale a
s =z − 1Tz
, (4.13)
donde T es el periodo de muestreo. El método de diferencias hacia atrás es sencillo de im-
plementar debido a que el derivador puro s es reemplazado por la derivada de primer ordenddt
, la cual es aproximada mediante la diferencia entre muestras consecutivas (diferencias
finitas). Es evidente que entre más pequeño sea el intervalo T aumentará la precisión de
la aproximación. El motivo para discretizar el filtro f(s) es porque en experimentación se
trabaja con señales muestreadas a un periodo T = 1 [ms].
Definiendo el filtro h(s) = sf(s) e implementando la ecuación (4.13) en h(s) y f(s),
se obtienen los filtros pasa bajas discretos
h(z) =
[z − 1Tz
]f(z) ,
=λ2 − λ2z−1
T (T−1 + λ)2 − 2(T−1 + λ)z−1 + T−1z−2, (4.14)
y
f(z) =λ2z2
(T−1 + λ)2z2 − 2(T−1 + λ)T−1z + T−2,
=λ2
(T−1 + λ)2 − 2(T−1 + λ)T−1z−1 + T−2z−2, (4.15)
donde λ > 0 es constante y es la frecuencia de corte y T = 1 [ms] es el periodo de
muestreo. La frecuencia de corte λ puede ser seleccionada con el análisis de las señales en
el dominio de la frecuencia, de tal manera que las componentes de alta frecuencia (debido
al error de cuantización) sean atenuadas. Los filtros discretos f(z) y h(z) se implementan
en MATLABr con el comando filter(b,a,x), donde b y a son los vectores que contienen los
coeficientes del numerador y denominador respectivamente de cada filtro y x es la señal
-
4.7 Filtro digital pasa bajas 35
a ser filtrada.
Diagrama de Bode
Frecuencia (rad/s)
−100
−80
−60
−40
−20
0
Mag
nitu
d (d
B)
f(s) f(z)
10−1
100
101
102
103
−180
−135
−90
−45
0
Fas
e (d
eg)
f(s) f(z)
Figura 4.1: Filtro f(s) y f(z) con λ = 8.
En la figura 4.1 se aprecia el comportamiento del filtro f(s) y también su versión
discreta f(z) obtenida por medio del método de diferencias hacia atrás. Por otro lado, en la
figura 4.2 se muestra el comportamiento del filtro h(s) y su versión discreta h(z) obtenido
mediante el mismo método de discretización. La razón de graficar la versión continua de
cada filtro contra su versión discreta es para corroborar el método de diferencias hacia
atrás.
4.7. Filtro digital pasa bajas
4.7.1. Filtrado de la posición q
El objetivo de la identificación paramétrica es estimar el vector de parámetros θ del
sistema con las señales obtenidas del experimento. Los codificadores ópticos introducen
error de cuantización en las mediciones del vector de posiciones q ∈ IR2, como consecuen-cia, el vector de velocidades q̇ ∈ IR2 obtenido en ĺınea mediante diferenciación numéricaamplifica dicho error de cuantización. Para mejorar la calidad en la estimación de los
parámetros del sistema, se diseña un filtro digital pasa bajas con el propósito de atenuar
-
4.7 Filtro digital pasa bajas 36
Diagrama de Bode
Frecuencia (rad/s)
−30
−20
−10
0
10
20
Mag
nitu
d (d
B)
h(s) h(z)
10−1
100
101
102
103
−90
−45
0
45
90
Fas
e (d
eg)
h(s) h(z)
Figura 4.2: Filtro h(s) y h(z) con λ = 8.
las frecuencias no deseadas presentes en las mediciones del vector de posiciones q ∈ IR2.Una vez diseñado el filtro, es implementado fuera de ĺınea con el comando “filtfilt” de
MATLABr, que es un filtrado en ambas direcciones “adelante-atrás” no causal de fase
cero que evita la distorsión de las muestras de la posición articular.
Las caracteŕısticas del filtro digital y el tipo de ventana utilizada para el cálculo de
los coeficientes del filtro se muestran en la tabla 4.2.
Tabla 4.2: Caracteŕısticas del filtro diseñado por el método de ventanas.
Tipo de respuesta Pasa bajasMétodo de diseño Ventanas
Orden 30Tipo de ventana Nutall
4.7.2. Algoritmo de diferenciación central
El vector resultante de posiciones filtradas es dado por qf ∈ IR2 y por medio de éste,es posible estimar las velocidades articulares. La estimación de las velocidades articulares
-
4.8 Filtrado discreto del modelo dinámico 37
se realiza mediante el algoritmo de diferenciación central
q̇f (k) =qf (k + 1)− qf (k − 1)
2T,
que evita el desplazamiento de fase y donde q̇f ∈ IR2 es el vector de velocidades articularesfiltradas, k es el instante de muestreo y T = 1 [ms] es el periodo de muestreo.
4.8. Filtrado discreto del modelo dinámico
Los vectores qf , q̇f ∈ IR2 y los filtros h(z) y f(z) en las ecuaciones (4.14) y (4.15)permiten obtener el modelo dinámico filtrado en su versión discreta dado por
h(z)Ya(qf , q̇f )θ + f(z)Yb(qf , q̇f )θ = f(z)u ,
que puede ser reescrito como
Yfzθ = ufz , (4.16)
donde Yfz ∈ IR2×7 es la matriz de regresión filtrada en su versión discreta, ufz ∈ IR2 elvector de entradas filtrado discreto y θ ∈ IR7 el vector de parámetros.
Por lo tanto el algoritmo de mı́nimos cuadrados es implementado en el péndulo con
rueda inercial mediante la expresión
θ̂(k) =
[k∑i=0
Yfz(i)TYfz(i)
]−1 [ k∑i=0
Yfz(i)Tufz(i)
], (4.17)
donde ufz(k) = [0 τfz(k)]T es el vector de entradas filtrado discreto, Yfz(k) ∈ IR2×7 la
matriz de regresión filtrada discreta, θ̂(k) ∈ IR7 el vector de parámetros estimados y con0 ≤ k ≤ N − 1 siendo el instante de muestreo y N el número de muestras.
En términos generales para que todos los parámetros sean estimados, la matriz dada
por
Φ =
[k∑i=0
Yfz(i)TYfz(i)
], (4.18)
debe ser positiva definida [21]. La matriz Φ ∈ IR7×7 es simétrica, esto es, Φ = ΦT yserá positiva definida si todos sus eigenvalores son positivos, es decir, si y sólo si λi {Φ} > 0
-
4.9 Control PD para excitación del sistema 38
donde i = 1, 2, · · · , 7 [23]. Si la matriz dada por la ecuación (4.18) es positiva definidaimplica que el vector de entrada en cierta manera satisface la condición de excitación
persistente. El concepto de excitación persistente es ampliamente aborbado en el área de
identificación, con el fin de garantizar que las entradas exciten debidamente la dinámica
de los sistemas.
4.9. Control PD para excitación del sistema
Una estimación fiable de los parámetros puede ser obtenida con un procedimiento
apropiado de identificación, en el cual se debe involucrar una selección de la entrada τ
que excite toda la dinámica del sistema. Para identificar los parámetros del sistema, en
este trabajo de investigación se diseña un experimento en lazo cerrado que involucra un
controlador PD para el seguimiento de trayectoria
τ = Kpq̃2 +Kd ˙̃q2 , (4.19)
aplicado en la rueda y donde
Kp = 0.551 [Nm/rad] ,
Kd = 0.00551 [Nm s/rad] ,
q̃2 = qd − q2 ,˙̃q2 = q̇d − q̇2 ,
siendo Kp la ganancia de control proporcional, Kd la ganancia derivativa, q̃2 el error de
seguimiento de posición de la rueda y ˙̃q2 la derivada del error de seguimiento de la rueda.
La trayectoria deseada qd(t) es una señal que crece en amplitud al transcurrir el tiempo t
y es dada por
qd(t) = at sin(ωt) , (4.20)
donde at = 0.6t [rad] es la amplitud y ω = 7.8 [rad/s] es la frecuencia.
En la figura 4.3 se muestra la trayectoria deseada a seguir por la rueda durante 10 [s].
Ante la ausencia de sensores de velocidad, las velocidades articulares q̇1 y q̇2 se estiman en
-
4.9 Control PD para excitación del sistema 39
ĺınea empleando la diferenciación discreta. Las condiciones iniciales del experimento son:[q1(0)
q2(0)
]=
[π
0
][rad] ,[
q̇1(0)
q̇2(0)
]=
[0
0
][rad/s].
0 2 4 6 8 10−6
−4
−2
0
2
4
6
Tiempo [s]
Pos
ició
n [r
ad]
qd(t)
Figura 4.3: Trayectoria deseada qd(t).
En [26] se proponen entradas de excitación para identificación de sistemas, espećıfica-
mente se presenta una sección para experimentos en lazo abierto. Entre las señales que se
proponen en tal referencia están las señales que están compuestas de diferentes frecuen-
cias como sumatorias de señales sinusoidales y señales que cambian en frecuencia a través
del tiempo denominadas señales Chirp. Los experimentos en lazo abierto en la mayoŕıa
de los casos son de alto riesgo debido que los sistemas pueden inestabilizarse. En el caso
del péndulo con rueda inercial es posible realizar experimentos en lazo abierto sin ningún
inconveniente.
-
4.10 Resultados experimentales de identificación paramétrica 40
4.10. Resultados experimentales de identificación pa-
ramétrica
Las caracteŕısticas del experimento se muestran en la tabla 4.3. Se aprecia que la
frecuencia de muestreo es de 1 [Khz] y la frecuencia de corte del filtro es λ = 8 [rad/s],
que fue elegida con el análisis de las señales en el dominio de la frecuencia mediante la
Transformada de Fourier Discreta.
Tabla 4.3: Caracteŕısticas del experimento de identificación.
Caracteŕıstica Unidades
Frecuencia de muestreo 1 [Khz]Duración del experimento 10 [s]
Frecuencia de corte λ 8 [rad/s]
En la figura 4.4 se detalla de manera esquemática el procedimiento de identificación
paramétrica del péndulo con rueda inercial. Se puede observar que la identificación de los
parámetros se lleva a cabo fuera de ĺınea.
Control PD
Estimación de la
velocidad
filtfilt
Algoritmo de
diferenciación
central
Algoritmo de
identificación de
mínimos cuadrados
Fuera de líneaEn línea
Péndulo con rueda inercial
Figura 4.4: Esquema de identificación.
Los parámetros estimados mediante el algoritmo de mı́nimos cuadrados se aprecian
en la tabla 4.4 y la evolución de la estimación de los parámteros se muestra en la figura
4.5. En este experimento de identificación todos los eigenvalores de la matriz Φ ∈ IR7×7
resultaron positivos, por lo tanto, se garantiza de cierta manera que la entrada cumple la
condición de excitación persistente.
A continuación se presentan los resultados obtenidos de la comparación entre la simu-
-
4.10 Resultados experimentales de identificación paramétrica 41
Tabla 4.4: Parámetros estimados θ̂.
Parámetro θ Estimado θ̂ Unidades
θ1 4.6244× 10−02 [Kgm2/rad]θ2 6.2758× 10−04 [Kgm2/rad]θ3 2.3588× 10−01 [Kgm2/rad]θ4 2.1919× 10−03 [Nm s/rad]θ5 3.6351× 10−06 [Nm s/rad]θ6 5.0726× 10−03 [Nm]θ7 4.3101× 10−03 [Nm]
lación del modelo con los parámetros estimados mostrados en la tabla 4.4 y el experimento
realizado. Para simular el codificador óptico se introduce un cuantizador en la simulación
del modelo usando 2π/4000 [rad/pulso] como resolución.
La figura 4.6 muestra la comparación entre la posición q1 ∈ IR obtenida en simulacióny q1 ∈ IR medida en el experimento. En la figura 4.7 se observa el error de predicción eq1∈ IR que consiste en la diferencia de la posición q1 ∈ IR obtenida en la simulación delmodelo y la posición q1 ∈ IR medida en el experimento.
Por otro lado, en la figura 4.8 se aprecia la gráfica comparativa entre la posición q2 ∈IR obtenida en simulación y la posición q2 ∈ IR medida del experimento y en la figura 4.9se muestra el error de predicción eq2 ∈ IR, que consiste en la diferencia entre la posiciónq2 ∈ IR obtenida en simulación y la posición q2 ∈ IR obtenida en el experimento.
En la gráfica de la figura 4.10 se aprecia la comparación entre la entrada τ ∈ IR obtenidaen la simulación del modelo y la entrada τ ∈ IR estimada del experimento. Por último enla figura 4.11 se observa el error de predicción eτ ∈ IR que consiste en la diferencia entrela entrada τ ∈ IR obtenida en la simulación del modelo y la entrada τ ∈ IR estimada delexperimento.
4.10.1. Validación del modelo dinámico
El procedimiento de validación del modelo se basa en el análisis del error de predicción
de torque τ ∈ IR aplicado a la rueda del sistema y además del análisis del error depredicción de las posiciones q ∈ IR2 como se realiza en [27]. Los errores de predicciónconsisten en la diferencia del torque τ ∈ IR y de posición q ∈ IR2 obtenidos en la simulacióndel modelo con los parámetros estimados y el torque τ ∈ IR y q ∈ IR2 medidos en elexperimento. En ambos casos, empleando la misma trayectoria deseada (4.20) y el mismo
controlador PD dado por la ecuación (4.19).
-
4.10 Resultados experimentales de identificación paramétrica 42
0 5−0.1
0
0.1
0.2
θ̂1
0 5
0
5
10
15x 10
−4
θ̂2
0 5−0.2
0
0.2
0.4
θ̂3
0 5−0.2
0
0.2
Tiempo [s]
θ̂4
0 5−4
−2
0
2
4x 10
−3
θ̂5
0 5−0.04
−0.02
0
0.02
0.04
Tiempo [s]
θ̂6
0 5−0.04
−0.02
0
0.02
0.04
Tiempo [s]
θ̂7
Figura 4.5: Parámetros estimados θ̂.
Para analizar los errorres de predicción se define el valor cuadrático medio (RMS),
RMS{e} =
√√√√ 1N
N∑i=1
e2(i) , (4.21)
donde e es el error de predicción y N el número de muestras. Se calcula el valor (RMS) de
cada uno de los errores de predicción con el algoritmo de la ecuación (4.21) y los resultados
se muestran en la tabla 4.5.
Se aprecia que el valor (RMS) de cada error de predicción tiene un valor pequeño, esto
indica que el modelo simulado con los parámetros de la tabla 4.4, puede predecir de una
-
4.10 Resultados experimentales de identificación paramétrica 43
0 2 4 6 8 102.6
2.8
3
3.2
3.4
3.6
Tiempo [s]
Pos
ició
n [r
ad]
q1(t) Sim. q1(t) Exp.
Figura 4.6: Comparación entre q1(t) simulación y q1(t) experimento.
0 2 4 6 8 10−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
Tiempo [s]
Pos
ició
n [r
ad]
eq1(t)
Figura 4.7: Error de predicción eq1(t).
manera muy aproximada el comportamiento del sistema experimental.
-
4.10 Resultados experimentales de identificación paramétrica 44
0 2 4 6 8 10−8
−6
−4
−2
0
2
4
6
8
Tiempo [s]
Pos
ició
n [r
ad]
q2(t) Sim. q2(t) Exp.
Figura 4.8: Comparación entre q2(t) simulación y q2(t) experimento.
0 2 4 6 8 10−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
Tiempo [s]
Pos
ició
n [r
ad]
eq2(t)
Figura 4.9: Error de predicción eq2(t).
4.10.2. Discusión de resultados de identificación paramétrica
En este caṕıtulo se ha presentado la identificación paramétrica del péndulo con rueda
inercial. El modelo que considera fricción de Coulomb asimétrica predice de una manera
-
4.10 Resultados experimentales de identificación paramétrica 45
0 2 4 6 8 10
−0.2
−0.1
0
0.1
0.2
Tiempo [s]
Tor
que
[Nm
]
τ(t) Sim. τ(t) Exp.
Figura 4.10: Comparación entre τ(t) simulación y τ(t) experimento.
0 2 4 6 8 10−0.2
−0.15
−0.1
−0.05
0
0.05
0.1
0.15
0.2
Tiempo [s]
Tor
que
[Nm
]
eτ (t)
Figura 4.11: Error de predicción eτ (t).
aceptable el comportamiento del sistema experimental. Los parámetros obtenidos fue-
ron validados comparando los datos experimentales de posición y de entrada de control
con datos obtenidos por medio de simulaciones. En el siguiente caṕıtulo se presenta el
control del péndulo con rueda inercial mediante esquemas de control que requieren del
-
4.10 Resultados experimentales de identificación paramétrica 46
Tabla 4.5: Valor cuadrático medio (RMS).
Índice Valor Unidades
RMS{eq1} 0.0054 [rad]RMS{eq2} 0.0159 [rad]RMS{eτ} 0.0089 [Nm]
conocimiento de los parámetros del sistema, es decir, técnicas de control basadas en el
modelo.
-
Caṕıtulo 5
Control del péndulo con rueda
inercial
En este proyecto de tesis se presentan los resultados experimentales de Swing Up y
de regulación de un péndulo con rueda inercial. Para ello, la plataforma experimental
construida, modelada e identificada con el algoritmo de mı́nimos cuadrados permite la
implementación en tiempo real de los controladores. El presente caṕıtulo es autoconteni-
do y proporciona el procedimiento requerido para la obtención de todos los controladores
implementados en este proyecto de investigación. Cabe señalar que los controladores ci-
tados y que sirvieron de inspiración se expresan con nuestra notación.
5.1. Objetivo de control
El objetivo de control consiste en llevar el péndulo de la posición vertical hacia abajo
q1 = π [rad] a su posición vertical hacia arriba q1 = 0 [rad]. Para ello se utiliza una entrada
de control que conmuta entre un controlador de Swing Up para rotar el péndulo hasta
una región cerca