in Revista Ingeniare
Análisis energético de una plataforma robótica móvil de tipo diferencial
RESUMEN
Durante la última década la robótica móvil ha tenido grandes avances en el desarrollo de equipos, permitiendo realizar labores riesgosas para el ser humano, debido a que sus características brindan la posibilidad de explorar lugares desconocidos. En este artículo se analiza el consumo energético de la plataforma comparando dos estrategias de control: posición y velocidad. La plataforma se expuso a una trayectoria polinómica de quinto orden, en la que ambos casos debían recorrerla y demostrar, a partir de índices de desempeño, su respectiva robustez frente a perturbaciones en las ruedas del dispositivo, así como las modificaciones porcentuales de sus características. Mediante la teoría de la potencia media, al finalizar el recorrido se verificó cuál de los dos casos de control era el más eficiente energéticamente.
Main Text
INTRODUCCIÓN
Actualmente, un reto en el diseño de plataformas robóticas de tipo diferencial es su autonomía energética para aplicaciones enfocadas en vigilancia, rastreo, supervisión de labores militares, agrarias, domésticas, entre otras [1]. Por esta razón, desde la teoría de control por rechazo activo de perturbaciones (ADRC) y la teoría clásica de control (PID), en este artículo se analiza el consumo energético mediante su implementación en una simulación que asemeja las características de un dispositivo robótico, teniendo en cuenta su ancho de banda como parámetro fundamental para la comparación. No obstante, las variaciones energéticas se presentan por las características de los controladores utilizados, que además por su naturaleza tienen diversos tipos de incertidumbres paramétricas, como las imperfecciones en el diseño estructural y en la construcción de los actuadores, entre otros.
La topología de control para el análisis energético propone dos escenarios para cada lazo de control. El lazo interno, o de posición, se basa en una linealización por prealimentación al que se le adicionan dos señales auxiliares. En el primer escenario, estas señales están compuestas por una estimación de términos aditivos tipo GPI [2] y en el segundo escenario, por una estrategia tipo PID [3]. Estas estrategias buscan dar seguimiento a una trayectoria de tipo polinómica. El lazo externo o de velocidad regula las velocidades en los actuadores para seguir la trayectoria planteada en el lazo interno. El primer escenario se basa en una estrategia de control por rechazo activo de perturbaciones (ADRC), con estados extendidos que tienen la capacidad de predecir diferentes tipos de incertidumbres. En el siguiente escenario, al igual que el lazo interno, se recurre a una estrategia de tipo PID [3].
El análisis de los resultados se basó en el planteamiento de los parámetros de la plataforma robótica. En este caso se contempló el modelo cinemático, el radio de las ruedas y la longitud que existe entre ellas. Adicionalmente, se empleó un conjunto de sensores de voltaje y corriente con un par de motores CD, con las características del modelo Maxon 448595, que se simularon con la librería Simulink, una extensión del software Matlab [4]. A partir de la definición de las características del dispositivo y la selección de los controladores, con su respectiva sintonización, basada en el ancho de banda, se estimó el consumo de la potencia media durante el recorrido de dos trayectorias, las cuales están expuestas a perturbaciones externas. Además de estas pruebas se hicieron variaciones paramétricas del dispositivo y en el ancho de banda de los controladores para evaluar los posibles cambios energéticos y la robustez del sistema, proponiendo diferentes tipos de indicadores de desempeño como IAE, ITAE, ISE y ITSE [4], [7].
REVISIÓN DE LA BIBLIOGRAFÍA
Modelo matemático de la plataforma robótica móvil
Las plataformas robóticas son dispositivos que, en su mayoría, están compuestos por dos ruedas posicionadas sobre el mismo eje de rotación, controladas de manera independiente para generar la velocidad de avance y la velocidad angular (Figura 1) [8]. De esta forma, los modelos que mejor describen la dinámica de las plataformas robóticas de tipo diferencial están basados en dos componentes fundamentales: el primero se centra en la cinemática de la plataforma robótica (Figura 1), el segundo corresponde a los sistemas mecánico y eléctrico del motor (Figura 2). En este caso, la cinemática se modeló a partir del sistema de ecuaciones 1 y 2 [8].
Donde la constante de velocidad k w es una aproximación de la división del voltaje inducido Vf em y frecuencia angular ω , la constante de par k i es una aproximación de la corriente de lazo i sobre el par mecánico generado en el eje τ , L es la inductancia, R la resistencia, t m el tiempo mecánico constante, B m el coeficiente de fricción viscosa y J m la inercia del rotor del motor [11], [12].
Estrategia de control
Esta estrategia se basa en dos lazos: el interno corresponde al control de posición y el externo al control de velocidad (Figura 3) [9], [13]. El primero da como resultado una señal de referencia de velocidad angular R w = [r 1 w r 2 w ] T , produciendo un campo potencial eléctrico u w sobre los actuadores en el lazo externo. El problema de control al cual se le quiere dar solución está dado por una trayectoria deseada ( x 1* , x 2* ), que requiere una señal de control u w = [u 1 w u 2 w ] T , donde u 1 w corresponde a la velocidad lineal y u 2 w a la velocidad rotacional del dispositivo.
Control de posición (lazo interno)
Como se evidencia en la ecuación 1, la plataforma robótica es un sistema de tipo no lineal. A partir de lo cual se propone una linealización por prealimentación, como se evidencia en la ecuación 4 [14]. Luego, se parametrizan las variables de control u 1 y u 2 en términos de las coordenadas (x 1 , x 2 ), con lo que se demuestra que es un sistema diferencialmente plano [2], [15].
En la ecuación 4, xn* es la derivada de la referencia de la trayectoria en x e y. A partir de esta premisa se presentan dos controladores para su respectiva comparación: la estrategia proporcional integral generalizada GPI, por sus características en la estimación de términos aditivos, como lo pueden ser endógenos o exógenos en la dinámica presente en la entrada y salida plana en el sistema [2]; y la estrategia de control PID, por sus características predictivas en la estimación del error en la retroalimentación de las variables, además de su rápida respuesta y compensación del error ante posibles perturbaciones [16], [17].
Primera propuesta para el lazo interno, control GPI
Segunda propuesta para el lazo interno, control PID
Añadiendo las señales auxiliares υ n , que corresponden a una ley de control de tipo PID (ecuaciones 7 y 8) [18].
Donde P n es la variable proporcional, D n la variable derivativa, I n la variable integral y N n el coeficiente de filtro. La referencia de velocidad se propone a partir de la ecuación 2, como se muestra a continuación, para ambos casos.
Control de velocidad (lazo externo)
Las estrategias para el lazo de velocidad están compuestas por dos conjuntos de controladores: ADRC y PID, ambos con una entrada y una salida que actúan sobre los motores de la plataforma (Figura 4). Por esta razón, a partir del funcionamiento de los rotores se genera una dinámica sobre la plataforma robótica, formando un acoplamiento cruzado de velocidades que se considera una perturbación [19]. Adicionalmente, se propone una perturbación generada en el eje z, que representa el cambio angular del espacio en el que se moviliza el equipo robótico y altera directamente las velocidades en cada rueda.
Primera propuesta para el lazo externo, control ADRC
De acuerdo con este planteamiento, se propone una estrategia de control de rechazo activo de perturbaciones ADRC (por su sigla en inglés), una metodología de control moderno no lineal que se destaca por tener la capacidad para predecir perturbaciones de tipo aditivo e incertidumbres, sin requerir un modelo matemático detallado [3], [20]. Las características de robustez se logran a partir de una estrategia basada en variables de estado, conocida como observador de estados extendidos (ESO). Sin embargo, es necesario proponer una ley de control para desacoplar el sistema de la perturbación presente sobre la planta; además, se debe tener en cuenta que esta estrategia sólo se aplica a sistemas diferencialmente planos, conociendo el grado relativo del sistema [21], [22].
Partiendo del modelo del motor de corriente continua y su respectiva aproximación a un modelo de segundo orden, en la ecuación 3 [23] se propone un control de segundo orden para seguimiento de referencias constantes (ecuación 10), donde K es una ganancia CD, D es el factor de amortiguamiento y T una constante de tiempo.
Se adiciona una perturbación d(t) en la entrada del proceso, la abreviación y se desliza b buscando representar el sistema b = b n + ∆b , donde b n es parte conocida y ∆b representa el error desconocido del modelado:
Siendo f (t) la perturbación generalizada. La representación del modelo en espacio de estados de la doble integración del proceso perturbado es:
El observador requerido para la estimación se presenta a continuación:
Utilizando las variables estimadas se puede implementar el control por rechazo activo de perturbaciones, junto con un controlador lineal PD para el comportamiento restante del doble integrador con una dinámica ajustable (Figura 5), a partir de esta propuesta se presenta la ley de control (ecuación 14).
La estrategia de control proporciona la retroalimentación de estados con la estimación de Z1(t) = y(t) = y(t), Z2(t) = y(t), Z3(t) = f(t) = f(t) y remplazando la ecuación 14 en la ecuación 11 se obtiene:
En condiciones ideales se obtiene la siguiente dinámica:
Segunda propuesta para el lazo externo, control PID
Contemplando una alternativa que cumpla con los requerimientos del problema de control se propone implementar una estrategia de control PID, por las características de la planta del motor CD y por sus beneficios predictivos ante el error, ya mencionados [16], [18]. La ley de control que se debe implementar es la siguiente:
Donde P n es la variable proporcional, D n la variable derivativa, I n la variable integral y N n el coeficiente de filtro.
Señal de referencia
Para generar la trayectoria se optó por el método determinístico de campos potenciales artificiales, debido a que cuenta con cualidades como la generación de trayectorias suaves y su facilidad para crear un acople con el sistema de control. En esta estrategia de planificación se debe tener en cuenta que el robot se considera una partícula puntual en un campo de potencia artificial. Se debe configurar de tal manera que el robot pueda experimentar una atracción hacia el punto final y repulsión hacia los obstáculos que se le presenten. Sin embargo, no se puede olvidar que es posible caer en una trampa de mínimos locales, lo que podría impedir que el robot logre su objetivo [9], [26].
Indicadores de desempeño
Los indicadores utilizados en este documento se basan en la integral del error, con el fin de obtener una medida cuantitativa del desempeño de cada caso de control presentado. Los índices empleados son la integral del valor absoluto del error (IAE) (ecuación 18), la integral del valor absoluto ponderado en el tiempo (ITAE) (ecuación 19), la integral del error cuadrático (ISE) (ecuación 20) y la integral del error cuadrático ponderado en el tiempo (ITSE) (ecuación 21), ya que permite exponer el error de la trayectoria recorrida respecto a la posición de referencia en términos absolutos y en unidades medibles en metros [7], [27].
METODOLOGÍA
Para analizar el consumo energético de la plataforma robótica se plantea la siguiente estrategia de seis pasos (Figura 6).
En el primer paso se definen las variables del modelo cinemático del robot móvil, como el radio de las ruedas, la longitud existente entre ellas, además se deben tener en cuenta los valores del modelo mecánico y eléctrico del motor CD.
En el segundo, y de acuerdo con la topología de control propuesta, se deben definir los controles para los lazos. Para este trabajo investigativo se propone comparar dos casos: en uno se usa un control tipo GPI en el lazo interno y un control ADRC en el externo; en el otro se aplica la estrategia de control PID para ambos lazos. Estas estrategias se sintonizan a partir del ancho de banda que se obtiene al linealizar todo el sistema. Con base en este parámetro se pretende que la comparación energética sea coherente frente a cualquier escenario posible.
En el tercer paso se propone una trayectoria polinómica con diversos obstáculos, en la que se identifican las coordenadas iniciales y finales.
En el cuarto paso se realizan variaciones porcentuales a los valores de diseño del equipo robótico y se agrega una perturbación a la salida del lazo externo de control que pretende simular cambios en el recorrido de la plataforma, modificando el valor constante del eje z con ramplas de velocidad lineal.
En el quinto paso se obtienen variables como la potencia media, IAE, ITAE, ISE, ITSE, señales de control, ancho de banda de los controladores, gráficas de robustez, entre otras.
En el último paso se analizan los resultados obtenidos mediante gráficos comparativos, como la trayectoria propuesta y el resultado del recorrido de la plataforma robótica, las señales de control, los diagramas de Bode, los diagramas de Nyquist, las tablas comparativas y los diagramas de barras, entre otros.
Incertidumbres y perturbaciones
Para comparar la robustez entre los casos de control, se plantea una perturbación externa a la salida del lazo interno (Figura 7), con el fin de emular el comportamiento de la plataforma frente a cambios angulares del eje z, alterando las velocidades en los rotores.
Otros parámetros con los que se busca evaluar la robustez del sistema se basan en la variación endógena y en el diseño de la plataforma robótica, proponiendo una alteración en el radio de las ruedas y la longitud entre ellas, del -10, -30, -50, 10, 30 y 50% respecto al valor de diseño, manteniendo la perturbación exógena y analizando el consumo energético en cada rotor, de acuerdo con la trayectoria planteada.
Validación del consumo energético
Para validar el consumo energético en el lazo interno se diseñó un circuito en Matlab con la librería de Simscape, de la herramienta de Simulink (Figura 8), en el que se analiza el consumo de la potencia media de los motores durante los recorridos planteados. Este cálculo se realiza mediante la ecuación 22, que representa el consumo en unidades de watios segundo [5], [6].
RESULTADOS Y DISCUSIÓN
Los parámetros de la plataforma robótica diferencial con las que se realizó el diseño y simulación de los controladores son los siguientes (Tabla 1):
Asignación paramétrica. Caso 2 (control PID - control PID)
Para la asignación paramétrica del caso 2 se hizo uso de la herramienta de PID Tuner app, contenida en el software Matlab. Sus valores se presentan a continuación (Tabla 3).
Análisis frecuencial de la asignación paramétrica de los casos de control
La sintonización de los casos de control presentados está direccionada para cumplir un requisito, que consiste en asegurar que ambos tengan el mismo ancho de banda para poder compararlos posteriormente de manera energética, lo cual se consigue a partir de la linealización del sistema y se demuestra con un diagrama de Bode (Figura 9).
Análisis de robustez en el lazo interno
El análisis propuesto en las Figuras 10 y 11 se plantea con el fin de comparar la robustez de ambas estrategias de control, realizando una variación porcentual en los valores que componen el modelo del motor CD, expuesto en la ecuación 3. Los sistemas se alimentaron con una señal de entrada tipo paso, dando como resultado múltiples respuestas en un rango de frecuencia variado, en el que no se identifican altas resonancias, lo cual demuestra la estabilidad de los sistemas en la mayoría de los casos presentados gracias a la implementación de los controladores propuestos.
Asignación paramétrica. Trayectoria 1
Análisis de la trayectoria 1
Como se puede identificar en la Figura 12, la plataforma diferencial completó el recorrido en ambos casos sin presentar una alteración significativa. Para este escenario se presentaron los siguientes índices de desempeño (Tablas 5 y 6).
En las tablas anteriores se puede identificar que el caso 1 tiene una mayor robustez, demostrando índices de desempeño favorables frente al otro escenario. No obstante, los consumos energéticos demuestran lo contrario, siendo un consumo aproximadamente cien veces mayor a los obtenidos en el caso 2.
Como se puede identificar en la anterior figura (Figura 13), las señales de control en los lazos de posición están identificadas como ru 1 y ru 2 , y en el de velocidad como u 1 y u 2 . En el caso 1 (GPI-ADRC), el comportamiento de la velocidad lineal y la velocidad rotacional demuestra que el lazo de velocidad busca mantener una señal constante frente a la proporcionada por el lazo de posición, sin alterar la velocidad requerida para cumplir el objetivo. En el caso 2 (PID-PID), el comportamiento de la velocidad lineal busca dar un mayor seguimiento a la velocidad rotacional; sin embargo, el lazo de velocidad presenta unos sobrepicos que se logran estabilizar cuando la plataforma robótica encuentra la referencia.
Análisis energético con cambios paramétricos
A continuación, se presentan los consumos energéticos expresados en vatios segundo (Ws), junto a las dimensiones de la plataforma robótica expresadas en metros (m) y los anchos de banda de cada par de controladores expresado en rad/s (Tabla 7). Adicionalmente, se muestra un caso de control con las mismas características del primero, sólo que con una modificación en el ancho de banda.
Estos resultados evidencian el consumo de la potencia media, demostrando que supera las incertidumbres paramétricas propuestas, lo que brinda un amplio rango para la variación de parámetros en el diseño de la plataforma. Además, demuestran que el consumo no tiene una variación significativa en los escenarios propuestos. Estas pruebas se expusieron en la misma perturbación utilizada, evidenciando la estabilidad en el recorrido de la trayectoria con variaciones poco significativas.
Durante la investigación se estableció que el primer caso (GPI-ADRC) presenta un amplio rango en su sintonización por medio del ancho de banda, demostrando que al disminuirla se obtienen mejores índices de energía sin afectar la estabilidad del sistema, mientras que en el segundo caso (PID-PID) el ancho de banda no presenta un rango tan amplio, lo cual impide llevarlo a un valor inferior o superior, dado que el sistema se tornaba inestable.
CONCLUSIONES
De acuerdo con los resultados obtenidos en los lazos de control de posición y velocidad, se demuestra la compatibilidad entre las estrategias frente a referencias polinomiales de quinto orden y las diferentes incertidumbres paramétricas.
Se evidencia cómo las estrategias de control GPI-ADRC presentan un amplio margen de sintonización de acuerdo con el ancho de banda, demostrando que los sistemas se pueden optimizar en términos energéticos sin tener que sacrificar su estabilidad.
El resultado de las estrategias de control PID-PID demuestra cómo, a pesar de tener unos índices de consumo ideales, estos sistemas pueden presentar problemas de estabilidad frente a la variación de parámetros y a los índices de desempeño.
Este trabajo comprueba la versatilidad de la plataforma robótica de tipo diferencial, respecto a su construcción y autonomía en un sinfín de espacios que no son accesibles para el ser humano.
RESUMEN
Main Text
INTRODUCCIÓN
REVISIÓN DE LA BIBLIOGRAFÍA
Modelo matemático de la plataforma robótica móvil
Estrategia de control
Control de posición (lazo interno)
Primera propuesta para el lazo interno, control GPI
Segunda propuesta para el lazo interno, control PID
Control de velocidad (lazo externo)
Primera propuesta para el lazo externo, control ADRC
Segunda propuesta para el lazo externo, control PID
Señal de referencia
Indicadores de desempeño
METODOLOGÍA
Incertidumbres y perturbaciones
Validación del consumo energético
RESULTADOS Y DISCUSIÓN
Asignación paramétrica. Caso 2 (control PID - control PID)
Análisis frecuencial de la asignación paramétrica de los casos de control
Análisis de robustez en el lazo interno
Asignación paramétrica. Trayectoria 1
Análisis de la trayectoria 1
Análisis energético con cambios paramétricos
CONCLUSIONES