Scholarly article on topic 'Diseño de Observadores en Modos Cuasi-Deslizantes vía LMIs'

Diseño de Observadores en Modos Cuasi-Deslizantes vía LMIs Academic research paper on "Sociology"

CC BY-NC-ND
0
0
Share paper
Keywords
{Observadores / "Sistemas de control no lineales" / "Control por modos deslizantes" / Invariancia / LMI / Optimización}

Abstract of research paper on Sociology, author of scientific article — Alberto Javier Fraguío, José Luis Mancilla-Aguilar, Aníbal Zanini

Resumen En este trabajo se presenta un observador robusto por modos cuasi-deslizantes para plantas con modelo nominal lineal e incertidumbres/perturbaciones de cierta clase particular. Las señales utilizadas para la estimación del vector de estados se suponen contaminadas con ruido del que sólo se conocen cotas. El diseño del observador se plantea como un problema de factibilidad LMI (Linear Matrix Inequalities) y se encuentran cotas para el error de estimación que pueden ser calculadas a priori. Posteriormente el diseño del observador se reformula como un problema de optimización GEVP (Generalized Eigen Value Problem) con el objeto de minimizar las cotas del error de estimación. El trabajo incluye un ejemplo numérico y simulaciones de un brazo robótico con un eje manejado por un motor de corriente continua.

Academic research paper on topic "Diseño de Observadores en Modos Cuasi-Deslizantes vía LMIs"

comité español de automática

evista

beroamericana de

utomatica e

nformática ndu striai

ISSN: 1697-7912. Vol. 5, Num. 3, Julio 2008, pp. 54-62

http://riai.isa.upv.es

Diseño de Observadores en Modos Cuasi-Deslizantes vía LMIs

Alberto Javier Fraguío * José Luis Mancilla-Aguilar ** Aníbal Zanini ***

* Grupo de Identificación y Control Robusto, Facultad de Ingeniería Universidad de Buenos Aires, Paseo Colon 850, Buenos Aires, Argentina

(e-mail: afraguio@conae.gov.ar) ** Departamento de Físico-Matemática, Instituto Tecnologico de Buenos Aires, Avda. Madero 399, Buenos Aires, Argentina y Facultad de Ingeniería, Universidad de Buenos Aires (e-mail: jmancill@itba.edu.ar) *** Facultad de Ingeniería, Universidad de Buenos Aires, Buenos Aires, Argentina (e-mail: azanini@fi.uba.ar)

Resumen: En este trabajo se presenta un observador robusto por modos cuasi-deslizantes para plantas con modelo nominal lineal e incertidumbres/perturbaciones de cierta clase particular. Las senales utilizadas para la estimation del vector de estados se suponen contaminadas con ruido del que solo se conocen cotas. El diseno del observador se plantea como un problema de factibilidad LMI (Linear Matrix Inequalities) y se encuentran cotas para el error de estimation que pueden ser calculadas a priori. Posteriormente el diseno del observador se reformula como un problema de optimization GEVP (Generalized Eigen Value Problem) con el objeto de minimizar las cotas del error de estimación. El trabajo incluye un ejemplo numerico y simulaciones de un brazo robotico con un eje manejado por un motor de corriente continua. Copyright ©2008 CEA.

Palabras Clave: Observadores, Sistemas de control no lineales, Control por modos deslizantes, Invariancia, LMI, Optimization.

1. INTRODUCCION

Los observadores por modos deslizantes se diseñan de manera que el error de estimacion deslice sobre un subespacio S de menor dimension que la del espacio de estados. Deslizar significa que el error de estimacion converge a S en tiempo finito y permanece allí de ahí en mas. En el subespacio S la dinámica del error de estimacion presenta las características de estabilidad y comportamiento deseadas (Khalil, 1996; Utkin et al., 1999). Edwards y Spurgeon (Edwards & Spurgeon, 1994; Tan & Edwards, 2000) proponen, para una clase particular de plantas, un observador robusto compuesto por un observador de Luenberger y un teírmino adicional no lineal con el que se fuerza deslizamiento en el subespacio S = {y — y = 0}, donde y es la salida de la planta e y es su estimacion. Ese termino no lineal permite rechazar una clase particular de perturbaciones. En Edwards & Spurgeon (1994) y en Tan & Edwards (2000) se propone una forma canónica para el diseño del observador y se da una solucion explícita pero no se aprovechan todos los grados de libertad disponibles. Tan y Edwards (Tan & Edwards, 2000) reformulan el diseno del observador como un problema de optimizacion convexo con restricciones LMI, lo cual permite aprovechar todos los grados de libertad. Con esto, los observadores por modos deslizantes pasan a formar parte de la inmensa lista de problemas de control que pueden ser formulados como problemas LMI (Boyd et al., 1994; Gahinet et al., 1994). En ausencia de perturbaciones la componente no lineal podría anularse, en cuyo caso el observador se reduce a uno de Luemberger. El criterio de optimizacion utilizado en Tan & Edwards (2000) consiste en que, sin la componente no lineal, el observador se aproxime al observador optimo

lineal gaussiano. En esta formulacion los grados de libertad los dan las matrices de covarianza de los ruidos blancos en las ecuaciones de estado y de salida.

En presencia de ruido de medicion no es posible forzar deslizamiento, pero sí es posible mantener el error de estimacion proximo al subespacio S. En este caso decimos que hay una condicion de cuasi-deslizamiento y que el observador en cuestion es un observador por modos cuasi-deslizantes.

En este trabajo consideramos plantas con ruido de medicion acotado y proponemos un observador similar al de Edwards y Spurgeon (Edwards & Spurgeon, 1994; Tan & Edwards, 2000; Edwards & Spurgeon, 1998) pero sustentado en los conceptos de cuasi-deslizamiento (Emelyanov et al., 1995). Planteamos el diseño como un problema de factibilidad LMI y encontramos cotas finales para el error de estimacion. Demostramos que bajo las mismas hipotesis que en Edwards & Spurgeon (1994) y en Tan & Edwards (2000) el error de estimacion converge a un conjunto acotado. Ademas, si el conjunto de posibles condiciones iniciales para el error de estimacion es acotado, entonces es posible garantizar convergencia en tiempo finito. Posteriormente, con el objeto de optimizar las cotas para los errores finales, reformulamos el diseño del observador como un problema de optimizacion GEVP.

La organizacion del trabajo es la siguiente. En la Seccion 2 presentamos la clase de sistemas que consideramos a lo largo del trabajo. En la Seccion 3 se presenta el observador que se propone y en la Seccion 4 se efectua el analisis de convergencia del mismo. En la Seccion 5 se analizan ciertos aspectos prácticos, en particular la optimizacion de las cotas para el error de estimacion obtenidas. En la Seccion 6 se

presenta un ejemplo numérico y la simulación del observador obtenido en un brazo de robot. Finalmente la Seccion 7 incluye las conclusiones.

2. SISTEMAS

L=[ L 0] g R(n—p)xp

con Le R(n-p)x(p-q). Entonces

La notacion a lo largo del trabajo es estandar. En particular <f(A) y a(A) representan, respectivamente, el maximo y mínimo valor singular de una matriz A y ||x|| es la norma euclidiana de x e 1". Al conjunto de autovalores de la matriz A lo representamos por A(A) y a su numero de condicion, definido como a(A)/a(A), mediante k(A).

En este trabajo consideramos sistemas de la forma

X(t) = Ax(t) + Bu(t) + Efx(t, x, u) y(t) = Cx(t) + fy (t)

A = TAT-1

All Ai2

A21 A22

E = TE

C = CT-1 = [0 C2]

donde An e R(n-p)x(n-p), C2 e Rpxp es ortogonal y E2 e Rqxq es no singular. Ademas

1. Los ceros invariantes de (A,E,C) estan incluidos en A(Aii).

2. (A,C) es observable (detectable) (A11,A21) es observable (detectable).

Demostración. Ver Edwards & Spurgeon (1998).

A = TAT-1 =

A11 A12 A21 A22

C = CT

E = TE =

-[0Ip ] 0

donde An g

-p)x(n-p), a12 g R(n—p)xp, A21 G

x(n—p), A22 g Rpxp y E2 g rpxq con

donde las matrices

A e 1"x", B e 1nxm, C e 1pxn y E e 1"x? forman el modelo nominal. Respecto de las funciones fx y fy, que modelan, respectivamente, incertidumbres/perturbaciones y ruidos de medicion, suponemos que

lfx(t,x,u)l < a(t,y,u) (2)

llfy (t)| < n (2)

donde la funcion a(t, y, u) y el escalar n son conocidos, y que fx tiene la regularidad necesaria para garantizar la existencia de soluciones de la ecuacion diferencial.

A lo largo de este trabajo consideraremos las siguientes hipotesis:

(H1) q < p.

(H2) C y E son matrices de rango completo. (H3) Los ceros invariantes de (A, E, C), si tiene alguno, estan en C_.

Es importante destacar que si se verifican (H1) a (H3) entonces el par (A, C) es detectable. Recíprocamente, si (A, C) es detectable, entonces se verifica (H3).

Los siguientes resultados, que son consecuencias de las hipotesis (H1) a (H3), seran utilizados mas adelante. Lema 1. Existe T e 1nxn tal que

A11 = A11 + L A21 -L I

E2 = C2

A12 = [I L] A

Demostración. Ver Edwards & Spurgeon (1998).

Teorema 3. Si se verifican las hipotesis (H1) a (H3) entonces existen 0 < P2 = PT e 1pxp, 0 < Pi = PT e

1(n_p)x(n_p), 0 < Y = YT e 1pxp y 0 < n e 1 tales que

" ATP + PA_ - 2CTYC P P I

P = T1

P1 0 0P2

LT P1 P2 + LT P1L

P2 = CT P2C2.

Demostración. Es consecuencia del Lema 2 y de la formula del complemento de Schur. Ver Teorema 4.1, pagina 99, de Fraguío (2006). □

3. FORMULACION DEL OBSERVADOR El observador que proponemos es el siguiente

x = Ax + Bu — L¡ey + Lnv (ey )

ey = y — y

y = Cx

donde las matrices L¡ y Ln estan dadas por

Lema 2. Sea (A, E, C) la terna del Lema 1. Consideremos la matriz de cambio de coordenadas

1 n—p L

Li = T-1P-1CT Y (10)

Ln = T-1P-1CT P2 (11)

con P, P2 e Y del Teorema 3. La senal v(ey) es una funcion no lineal definida por

v (ey) = -Рф

\\Ptey У + a(P2)S

p > a(E2)a(t, y, u) + \ n + Y

2n + e + S

Y t&ihi -

°(Pt)(n + e)

Y > 0 Yi >

a(Ait)(n + e)ei.

(16) (17)

z = Aoz + Lnv - Efx + Lify Zy = Cz

z = AoZ + Lnv - Efx + Lify

con z = [ zi zy ] y

Z = AoZ + Lnv - Efx + Lify

А22 - P-1Y

donde AAii, Ai2, Á2i y Á22 están definidas en (4).

Demostración. Ver Lema 4.1, pagina 103, de Fraguío (2006).

Utilizando el lema anterior podemos reescribir la ecuacion dinamica (21) como

Zi = A iizi +Ai2zy

zy =Á2iZi + Áo22 zy + v -Z2fx + P2lYfy.

4.2 Sectores

En relación con el observador propuesto en Tan & Edwards (2000), Ln es la misma matriz que allí aparece mientras que la componente no lineal v(ey) es similar pero no la misma. El coeficiente p es una cota superior de las incertidumbres, perturbaciones y ruidos de medicion. El coeficiente ф es un factor de escala que depende de la cota del ruido de medicion. Las condiciones (15) a (17) surgen del analisis de convergencia.

Observamos que el observador esta parametrizado por (3), las LMIs del Teorema 3 y por los escalares e> 0, S > 0 y ei > 1. En lo que sigue veremos que con las matrices del Teorema 3 el error de estimacion x - x converge a un conjunto acotado que contiene al origen.

4. ANÁLISIS DE CONVERGENCIA

4.1 Ecuación Dinámica del Error de estimación Definamos

z(t) = x(t) - x(t) zy (t) 4 Cz(t) = ey (t) + fy (t). (18)

Derivando z(t) y empleando (1) y (9) obtenemos la ecuacion dinamica del error de estimacion

Consideremos P, P1 y P2 en las condiciones del Teorema 3 y definamos las siguientes funciones positivas definidas

V (z) = zT Pz (25)

Vy (zy) 4 zTP2Zy (26)

Vi(Zi) 4 ~ZTPZ (27)

donde z es el error de estimacion en el sistema de coordenadas del Lema 1, zy = Cz = [0 I ] Z y Z1 esta formado por las primeras n - p componentes del error de estimacion en coordenadas del Lema 2. Por (7) resulta

V (z)= Vy (zy) + Vi(Zi). (28)

Definimos tambien los siguientes conjuntos

Q = {У(Z) < u2}

tty 4{Vy (zy ) < U^

Qi = {Vi(Zi) < u2}

u =\! u2 + u2

Uy = ^K(P2)z(P2)(n + e)

K(P2)(n + e)ei

Ao 4 A — LiC

Mediante el cambio de coordenadas z = Tz, con T como en el Lema 1, la ecuacion (19) toma la forma

con 0 < e, ц e R y 1 < ei e R. En Qy el movimiento estaí gobernado por (23) y (29). El lema que presentamos a continuation nos servira para estudiar la evolucion del error de estimacion en Qy

Lema 5.

Lema 4. Mediante el cambio de coordenadas Z = Tz, con T como en el Lema 2, la ecuacion dinamica del error de estimacion (20) toma la forma

AnPi + P1A11 < —1PP — 1 Pi LLT ?!

At022P2 + P2A022 < — -P2P2.

Demostración. Es consecuencia de las ecuaciones (6), (22), y (7), del Lema 2 y del Teorema 3. Ver Lema 4.2, pagina 105, de Fraguío (2006). □

El siguiente teorema describe el movimiento dentro de Qy.

Teorema 6. El conjunto Q es atractivo en tiempo finito e invariante para las soluciones de (21) que evolucionan en Qy. Ademas, si el sistema parte del instante t = t0 y entra en en t = t\, entonces

ti - to < - (\/Vi(Zi(to)) - ui)

con j dado por (32) y

$ = a(Ai2)n(P2)Ja (Pi) (n + e)(ei - 1).

Demostración. Llamemos ^ = U ddonde y d^ son el complemento y la frontera de ü5, respectivamente. Consideremos la funcion V5 definida en (27). Notemos que llzy< K(P2)(n + e) y \\Pi¿i\\ > Utilizando las ecuaciones (24) y (30), junto con el Lema 5, la derivada de V5 en üy n $5 puede ser acotada por

zeQ,y n$i

< -2^Vi(zi)

zeo,y n$1

Demostración. Por (12) y (18)

zTP2 v 11P2 Zy

\lP2Zy ll-v(P2)n

lP2(zy - fy)|| + a(P2)S'

Por (29) z e ücy U düy si y solo si Vy(zy) > J^, pero por Rayleigh lP2zyH2 > g_(P2)Vy(zy). Luego por (31)

llP2zy||jzenyudny > V°(P2)jy = z(P2)(n+e).Por totolo

para z e ücy Udüy el numerador de la cota de zTP2 v es positivo con lo que podemos escribir

zT P2V 11P2 zy ll

llP2zy ll-z(P2)n

11P2zy ll + z(P2)(n + 5) para todo z e ücy U düy .El cociente del lado derecho de esta desigualdad es estrictamente creciente 1 en \P2 zy || loque implica, junto con (14), que

:P2v\,

< -P llP2zy

El teorema que sigue trata sobre la atractividad de üy.

Tiene la forma g(x) = Xx+a con a,b > 0 cuya derivada es g(x) =

a+b (x + b)2

Teorema 8. El sector üy es atractivo en tiempo finito para las soluciones de la ecuacion dinamica del error de estimacion (20).

Demostracion. Sea la funcion positiva definida V(z) definida en (25). Mediante algebra de matrices es posible demostrar que

P L n = CT P2 PL l = C Y PE = CT P2E2. Definamos $ = ücy Udüy donde ücy y düy son el complemento y la frontera de üy, respectivamente. Notemos que por ser C2 ortogonal z(E2) = a(E2). Luego, utilizando las ecuaciones

lo que demuestra la atractividad en tiempo finito y la invariancia de ü5 para las soluciones de (21) que evolucionan en üy. Supongamos que z(t0) e ü y sea t5 > t0 el instante de tiempo en que z ingresa a ü1 por primer vez, es decir, z(t5) e dü5 c $5. Consideremos la ecuacion diferencial escalar

V-(t) = vi(t0) = Vi(t0)

cuya solucion verifica

Vvi(ti) = -$(ti - to) + Vvi(to). Finalmente por el lema de comparacion Khalil (1996) y puesto que, por (27), V5 (z1(t1)) = j2, resulta

Ji < -$(ti - to) + \Jvi(to) t e [to,ti] lo que termina la demostracion. □

En vista del Teorema 6 queda ver bajo que condiciones üy es atractivo en tiempo finito. Para esto necesitamos el siguiente lema

Lema 7. Sean ücy y düy el complemento y la frontera de üy, respectivamente. Entonces

zH P2v\ -zeQy Udüy < -p 11P2 zy ||jZ£Qy UdQy

donde v esta definida en (12) y p en (13).

(2) y (13) y el Lema 7, tenemos que V(z)

< 0, pues

V(z) < V(z)j ze^ - 2ja(P2)(n + e). (34)

La demostracion de que üy es atractivo en tiempo finito es por el absurdo. Si z e 0y Vt e [t0, to), por (34) existe t' e (t0, to)

tal que V(z(t')) = 0 lo que contradice la suposicion inicial.

El Teorema 8 establece la atractividad en tiempo finito de üy pero no asegura que este sea invariante. Como veremos a continuacion no es posible garantizar la invariancia de üy en todo el espacio. Es decir, existe la posibilidad de que el error de estimacion describa una trayectoria zigzagueante en la que esta entre y salga de üy. Por el Teorema 6 sabemos que V5 (z) decrece en üy - ü5. El siguiente lema demuestra que el error, en su movimiento zigzagueante, converge a ü5 n üy. Lema 9. Sean t5 <t2 < to dos instantes de tiempo consecutivos tales que z(t1),z(t2) e düy. Si z(t) e üy Vt e (t5,t2) entonces

Vi(~zi(ti)) >Vi(~zi(t2)) donde V5 es la funcion definida en (27).

Demostracion. Consideremos la funcion positiva definida

V (z) = zT Pz = Vy (t) + Vi(t)

dada en (25) y (28). Sabemos por (34) que V(z(t)) < 0 t e (ti, ^2), ya que por hipotesis z(t) e 0y Udü Vt e (ti,t2). Por lo tanto V(z(t2)) < V(z(t5)). Tambien por hipotesis

Vy (ti) = Vy (t2) = Jy. Luego

0 < V(z(ti)) - V(z(t2)) = Vi(zi(t2)) - Vi(zi(ti)) lo que termina la demostracioin. □

Definamos el conjunto

ri ± {Vi(zi) < y2} . Por (17) y (32) y5 > J-í-, lo que implica que ü5 C ri. Del desarrollo anterior el conjunto üy n r5 es atractivo para las soluciones de (21). En efecto, si el error de estimacion z se encuentra fuera de üy para algun instante de tiempo dado entonces, por el Teorema 8, existe un instante de tiempo finito tal que z entra en üy. Dentro de üy el error z tiende a entrar en r5 ya que por diseno ü5 C r5 y por el Teorema 6, el conjunto ü5 es atractivo para las soluciones de (21) que pertenecen a üy. Si en algún instante z sale de üy, por el Teorema 8 y por el Lema 9, z volvera a entrar en tiempo finito y mas cerca de r5 de lo que estaba cuando dejo üy.

Como veremos a continuacion el conjunto üy n r5 es invariante para las soluciones de (21). Esto nos permite, junto con el

zenyudn

Teorema 6 y el Lema 9, asegurar la convergencia de zz al conjunto Qy nQ 1. El siguiente teorema trata sobre la invariancia

de Qy n r1.

Teorema 10. Qy n r1 es invariante para las soluciones de (21) para todo y en (13) que verifique (15).

Demostracion. Por el absurdo. Supongamos que Qy n r no es invariante. En este caso dado Z(t1) e Qy n r1 existe t2 > t1 tal que Z(t2) e Qy n r1. Pero, por continuidad de las soluciones de (21), esto implica a su vez la existencia de t' e [t1,t2) tal que Z(t') e d(r n Q). Por el Teorema 6 Vi(Zi) definida en (27) es estrictamente decreciente dentro de Qy. Por lo tanto z solo puede salir de Qy n r1 atravezando la frontera de Qy, es decir, Z(t') e (dQy) n ri, con Vy(zy(t')) > 0, donde Vy(zy) es la funcion definida en (26).

Por otro lado, la derivada de Vy sobre las soluciones de (24) es Vy (zy) = 2zTP2zy. Utilizando los Lemas 5 y 7, junto con (2) y (13), la derivada Vy en t = t' puede acotarse por

Vy (zy (t')) < — ±a(P2)Vy (t') r_

—z^PijVyt)^ — ^KP))*(A21.

Por construccion de t' y por (30) y (29) se verifican Vy (zy (t')) = jy y V1(Z1(t')) < y2. Reemplazando estas relaciones y utilizando (31), resulta

Vy (zy (t')) < —2^jP2)Uy x

* P)(n +e)

* (A2i)Yi —

Por (15) el teírmino entre pareíntesis es no negativo y por lo tanto Vy(zy(t')) < 0. Pero esto se contradice con la suposicion inicial. Luego Qy n r es invariante.

4.3 Cotas en el error de estimacion

Por Rayleigh sabemos que si Z e Q1 n Qy entonces

\\zy\\<k(P2)(v + e) Vzi\\<2v*~) k(P2 )(n + e)ei.

*_(Pi)—....................(36)

La desigualdad (35) establece que, en el mejor de los casos, el error en la estimacion de Cx puede acercarse a la magnitud del ruido de medicion n tanto como se quiera. El precio a pagar es en la magnitud de la componente no lineal del observador v, ya que por (14) tiende a x cuando e tiende a 0. Lo deseable es que P2 sea ortogonal, k(P2) = 1, pero no siempre es posible verificar (6) con matrices P2 ortogonales.

Por (28), (31), (32) y (31) tenemos

Z e Q1 n Qy ^ z e Q = {zTPz < J2} .

4.4 Cotas en el tiempo de convergencia

Para simplificar la escritura definamos $ = Qcy U dQy donde Qy y dQy son el complemento y la frontera de Qy, respectivamente. Consideremos la condicion inicial z(t0) e $ y la

funcion V definida en (25), que por (28) resulta V = V1 + Vy, donde las funciones V1 y Vy son las definidas en (26)-(27). Si se cumplen las condiciones del Teorema 8 entonces existe t e [t0, x) tal que z(t1) e dQy c $ y, por (34), la derivada

< 0. Por lo tanto, V(ti)

Vi(ti) + J2 < V (to).

Supongamos que las posibles condiciones iniciales en el error de estimacioín son acotadas, es decir,

z(to) e B(zo) = {\\z\\ < zo}

Por Rayleigh

V(to)= zT(to)Pz(to) < * (P)z2

con lo cual

Vi(ti) <*(P)z2 — Jy. (39)

Notemos que si no se verifica (37), no tiene sentido el problema de acotar el lapso t1 — to ya que en este caso z (to) e

Qy^z(to) e B(zo). En efecto, si zo < jy¡\J*(P) resulta

V(to) < * (P) \\z\\2 < Luego, si

Yi >\° (Pz — <

el error de estimacion z e Qy Vt > to, ya que Z(t1) e Qy n r1 y por el Teorema 10 el conjunto Qy n r1 es invariante. Por lo tanto, para un conjunto acotado de condiciones iniciales siempre podemos asegurar, con y1 suficientemente grande, que el error de estimacion convergerá a Qy en tiempo finito y que una vez allí no saldrá del mismo.

Aplicando el lema de comparacion Khalil (1996) a (34) junto con (38) y el hecho de que por definicion de t1 V(t1) = V1 (t1) + > jy, obtenemos la cota para el tiempo de convergencia

ti — to < *mj±L

\ \ + bY

donde b = 2*(P2)(n + e)/X y A = *(PPor (37) el argumento de la funcion logaritmo es mayor o igual a 1 y estrictamente decreciente2 en y. Por lo tanto, es posible achicar la cota t1 — to tanto como se desee mediante un valor suficientemente grande de y.

Si Z(t1) e Q1 entonces por el Teorema 6, z(t) e Q1 Vt > t1. Cuando Z(t1) e Q1, por el Teorema 6 sabemos que existe t2 e (t1, x) tal que Z(t2) e dQ1. Reemplazando (39) en la cota de t2 — t1 del Teorema 6 resulta

., (P)z2 — — ji

t2 — ti <

con $ definida en (33).

5. ASPECTOS PRACTICOS

En esta seccion reformulamos el diseno del observador como un problema de optimizacion de autovalores generalizados con el objeto de aprovechar los numerosos grados de libertad que tiene el observador propuesto.

La derivada del argumento respecto de 7 es ■

K +bY)

Jy-a(P)z0

5.1 Objetivos

Como objetivo de optimización proponemos minimizar las cotas de las desigualdades (35) y (36). Para minimizar la cota de \\zy || es deseable una matriz P2 con el menor nUmero de condicion posible. Idealmente P2 ortogonal, pero como comentamos anteriormente esto no siempre es posible. Para minimizar la cota de \z1\, ademas de k(P2) mínimo, tambien se desean j/<j(A) y a(Á12) lo mas chicos posible. En general, por (5) la matriz A12 = A12 (L). En el caso particular p = q, por (3) resulta L = 0, lo que implica Á12 = Á12CT. Por lo tanto, cuando p = q, la matriz Á12 no depende de los parámetros de diseno. Por el contrario, cuando p > q es necesario restringir los valores de L para disminuir <(Á12). Una manera simple, pero conservadora, es la siguiente: partiendo de (5) y recordando que C2 es ortogonal, resulta a(A12) < (1 + a(L))2a(A). Si bien se trata de una cota conservadora, acotando <(L) nos aseguramos que al resolver el problema no resulten valores demasiado grandes de a(Á12).

Con respecto a la cota de \z1\, queda considerar el parametro e1. Desde el punto de vista del error de estimacion es deseable que sea lo mas pequeño posible. Sin embargo, la cota (41) en el tiempo de convergencia converge a x cuando e1 ^ 1. Por lo tanto, e1 representa un compromiso entre la cota de \\z1\\ y la cota del tiempo de convergencia.

Para tratar de cumplir con estos objetivos proponemos el siguiente problema de optimizacion. Consideremos las siguientes variables adicionales a > 0 y t. El problema de optimizacion

minimizar t

sujeto a (6)-(8)-(3) y a las siguientes restricciones adicionales

Comencemos con la restriccion (42). Por (46) y por ser C2 ortogonal, esta restriccion es equivalente a

al < P22 - PnPnPu < atl, pero por el complemento de Schur es, a su vez, equivalente a

al < P < atl.

Por lo tanto, minimizar el numero de condicion de P2 es equivalente a minimizar el de P. Por (46) la restriccion (43) no es unaLMI en las variables P11 y P12. Es necesario reformular el problema. Siendo conservadores podemos escribir

HL) < a(P-11)a(P12) = <(P12).

Luego, la minimizacion de <(L) se consigue minimizando <(P12) al mismo tiempo que se maximiza <(P11). La maxi-mizacion de <(P11) ya la formulamos en la restriccion (44). Por lo tanto, para minimizar la cota de <(L) se reemplaza la restriccion (43) por <(P12) < t — 1, o equivalentemente por PT2P12 < (t — 1)2I. Definiendo

In-p 0 0 0

(n-p) x (n-p)

y utilizando el complemento de Schur, esta desigualdad puede reescribirse como

NPM + (NPM)T + tIn — In > 0.

1 (P-11

Por (46) la restriccion (44) es equivalente a a(pii

t — 1 que a su vez es equivalente a P-1 < (t — 1)In

0 < X = XT e R(n-p)x(n-p). Con esta nueva variable podremos reformular la desigualdad anterior como una LMI en X, P11 y t de la siguiente manera

aI <P2 < atI

H<t — 1

a(L) < (t — 1)

<<(P1).

La restriccion (42) fuerza la minimizacion del numero de condicion de la matriz P2. En efecto, por definicion

/ ^ \ &(P2) at

k(P2) = < - = t.

P11 P12 PT2 P22

con P11 e R(n-p)x(n-p), P12 e R(n-p)xp y P22 e Rpxp. La matriz P12 = [ P121 0] con Pm e R(n-p)x(p-q). Igualando con (8) y despejando resultan

P1 P2 L

C2 (P22 — P12

P-11P12

T P-11P12

X< (t — 1)In

P-11 <X.

Por el complemento de Schur la ultima desigualdad es equivalente a

X In-p > 0 In-p P11

Definiendo Q = [In-p 0(n-p)xp] la desigualdad anterior toma la forma

Notemos que (42) implica t > 1 y , por lo tanto, (43) y (44) estan bien planteadas.

5.2 Formulación como Problema de Autovalores Generalizados Reescribamos P como en Tan & Edwards (2000)

5.3 Algoritmo de diseño

El siguiente algoritmo surge del desarrollo anterior.

1- Resolver el problema de optimizacion minimizar t sujeto a

AT P + PA — 2CT YC P

al < P

In-p QPQ

P,X,Y,p,a > 0 In — NPM — (NPM)T < tIn P < atIn ¡j, < t

donde P tiene la estructura de (45).

2- Calcular P2 a partir de (46).

3- Calcular las ganancias del observador L¡ y Ln utilizando las Ecuaciones (10) y (11).

4- Elegir e > 0 resolviendo el compromiso formado por el valor maximo de v en (12)-(14) y la cota en el error de estimacion (35).

5- Diseño de ei, y1 y Y

1. Caso General. Cuando no se conoce la región de las posibles condiciones iniciales en el error de estimacion. En este caso elegir en orden:

a) e1 > 1;

b) y1 sujeto a (17);

c) y > 0 sujeto a (15).

2. Caso Particular. Cuando las condiciones iniciales z (t0) e Q con z0 que satisface (37), el tiempo de convergencia a Q1 n Qy queda acotado por (41). Elegir en orden:

a) e1 > 1 resolviendo el compromiso formado por la cota en el error de estimacion (36) y la cota en el tiempo de convergencia (41);

b) y1 sujeto a (17) y (40);

c) y > 0 sujeto a (15), y de manera que (41) cumpla con las especificaciones.

6- Elegir p de manera que verifique (13).

6. EJEMPLO

6.1 Planta y Modelo

Consideremos un manipulador robotico simple (Figura 1) formado por un unico eslabon y manejado por un motor de corriente continua.

— = —i — dt L

I+1 u L

'e = ^Ni -A-2 e + g + ^d

ml2 ml2 l ml2

donde u(t), i(t), 0(t) y d(t) son respectivamente la tension sobre los bornes del motor, la corriente de armadura del motor,

el ángulo del brazo respecto a la vertical y el torque de perturbación. La mayoría de los parametros fueron tomados de Utkin et al. (1999) y se describen en la Tabla 1.

Tabla 1. Parámetros del manipulador robotico de un eje. Unidades en SI

Parámetro Valor Description

R 0,5 Resistencia de armadura

L 0,001 Inductancia de armadura

ke 0,008 Constante contra electro motriz

kt 0,008 Constante de torque

m 1 Masa del eslabon

l 0,4 Longitud del eslabon

b 0,2 Coeficiente de friccion viscosa

N 100 Relacion del tren de engranes

g 9,8 Aceleracion de la gravedad

El torque de perturbacion es incierto pero acotado por

\d(t)\ < 10Nm Wt. Deseamos estimar la corriente de armadura i(t) midiendo la posicion y velocidad angular del brazo

V1(t) = 0(t) + fy1 (t), V2(t)= 0(t) + fy2 (t)

donde fyi (t) es ruido blanco con distribucion uniforme en el intervalo [-0,0175, +0,0175] 3 de donde resulta

\\fy(t)y <0,0175V2 = n.

Definiendo x1 (t) = i(t), x2(t) = 9(t) y x3(t) = 9(t) resultan

[- R 0 keNl

ktN 0 - ml2 b

"0 1 0 "

0' 0 1

a(y1) = 24,5 (\sin (y1)\ + \cos (y1)\) + 62,5. donde recordemos que \fx(x2,d)\ < a(y1). Evidentemente C, E y CE son de rango completo. La terna (A, E, C) tiene un unico cero invariante en -R/L. Por lo tanto se verifican las hipotesis (H1) a (H3). Notemos que (A, E, C) ya se encuentra en la forma canonica del Lema 1.

6.2 Diseño

Resolviendo el problema de autovalores generalizados (47) resultan

Figura 1. Manipulador robotico de un eje.

El brazo se encuentra contenido en el plano vertical al piso. Para simplificar el modelado suponemos que el eslabon esta formado por una barra de masa despreciable con una masa puntual en su extremo. Bajo estas simplificaciones, el modelo matematico esta dado por

31,4822 0,0000 0

0,0000 31,4591 -0,0000 0 -0,0000 31,4591

0,7007 0,0000 0,0000 1,0088

H = 0,0319, t = 1,0320.

Por (46)

31,4591 -0,0000 0,0000 31,4591

y por (10) y (11)

3 ±0,0175rad ~ ±1°

4 En este ejemplo particular la matriz de cambio de coordenadas del Lema 1

es la identidad

keN ■

—0,0000 —0,0000 2,2274 0,0000 0,0000 3,2066

—0,0000 —0,0000 Ln = 1,0000 0

L 0 1,0000 _

Con e = 0,005 y S = 0,01 resulta ^ = 12,8995. Fijando e1 = 1,125 y tomando ■y1 lo mas pequeño posible, pero que verifique simultáneamente (17) y (40), obtenemos y1 = 16,84. Analogamente, eligmos el y > 0 mas chico posible que verifique (15) resulta y = 0,3176. Finalmente, por (13) p = 24,5 (sin (y1(t))\ + \cos(y1(t))\) + 794.

6.3 Convergencia

En este ejemplo particular, el error de estimacion del vector de

estados es z = x—x = [ Z1 zyi zy2 ] Suponiendo que en t = t0

i-ie-6 6-6

[ —2,5 n/2 n/8]T, x(0)

0 10 10

i — i < 2,5A, 6 — 6 < n/2, 6) — 6 < n/8 resulta una condicion inicial z(t0) e B(3). Luego

1. z(t) e üy = {z2yi + z¡2 < 0,0278} yt1 > to con t1 — to < 9,3mseg;

2. z(t) e ü1 = {\z1\ < 0,0542} yt > t2 > t1 con t2 — t1 < 990mseg.

Por lo tanto, se puede asegurar que dentro de t2 — t0 < 1seg la corriente de armadura se estima con un error menor o igual a

54,2mA.

6.4 Simulaciones

Las condiciones de simulacion son las siguientes x(0) = T ^ =[0 0 0]T, u(t) = 1(t — 0,02) y

t < 0,05 0,05 < t < 0,0625 0,0625 < t < 0,0750 . 0 : t > 0,075

En las Figuras 2 y 3 mostramos los errores de estimacion junto con los sectores ü1, r y üy. Notamos que si bien las cotas halladas apriori se verifican, estas son muy conservadoras. Sin embargo siguen siendo utiles para, por ejemplo, el diseño de sensores de corriente con fines de proteccion contra sobrecarga.

Para evaluar el desempeno del observador (9), comparamos los errores de estimacion cometidos por este observador con los del propuesto en Tan & Edwards (2000). Los resultados se muestran en la Figura 4, en la cual se aprecia el mejor desempeño del observador aquí propuesto, ya que el mismo presenta un mejor rechazo al torque de perturbacion y al ruido de medicion debido a que no requiere de un régimen de deslizamiento como en Tan & Edwards (2000). Como desventaja tenemos que las senales involucradas son de mayor magnitud, lo cual no es problemaítico si, por ejemplo, el observador se utiliza con fines de sensado para monitoreo o proteccion.

7. CONCLUSIONES

En este trabajo presentamos un observador robusto por modos cuasi deslizantes para plantas con modelo nominal lineal afectado por perturbaciones/incerteza y con ruido de medicion.

Figura 2. Error de estimacion z1. La línea de trazo representa el contorno de ^ y la línea punteada el contorno de r1.

Figura 3. Error de estimacion zy.

El diseño del observador se planteo como un problema de factibilidad LMI y se probo, bajo ciertas hipotesis, la convergencia del error de estimacion a un conjunto acotado que contiene al origen de coordenadas. Tambien se proporcionaron cotas a priori para el error de estimacion.

Posteriormente se reformulo el problema de diseño del observador como uno de optimizacion GEVP con el objeto de minimizar las cotas para el error de estimacion.

Finalmente, se presento un ejemplo de simulacion que mostro el buen desempeño del observador propuesto y la verificacion de las cotas obtenidas a priori, aunque las cotas en el tiempo de convergencia resultaron ser muy conservadoras. Comparado con el observador por modos deslizantes propuesto en Tan & Edwards (2000), el observador aquí propuesto presento un mejor rechazo al torque de perturbacion y al ruido de medicion, pero, como desventaja, señales de mayor magnitud.

REFERENCIAS

Boyd, S., L.E. Ghaoui, E. Feron y V. Balakrishnan (1994).

Linear matrix inequalities in system and control theory.

Errores de estimación de corriente de armadura

Torque de perturbación

-15'..........................i

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1

Figura 4. Error de estimación de la corriente de armadura del observador de Tan-Edwards vs. el propuesto en este trabajo.

SIAM Studies in applied and numerical mathematics. SIAM, Philadelphia.

Edwards, C. y S.K. Spurgeon (1994). On the development of discontinuous observers. International Journal of Control 25, pp. 1211-1229. Edwards, C. y S.K. Spurgeon (1998). Sliding mode control:

theory and applications. Taylor and Francis, London. Emelyanov, S.V., S.K. Korovin y I.G. Mamedov (1995). Variable- Structure Control Systems: Discrete and Digital. CRC Press. Boca Raton. Fraguio, A. (2006). Observadores por modos deslizantes. Tesis de grado. Facultad de Ingeniería, Universidad de Buenos Aires. Disponible en http://www.fi.uba.ar/laboratorios/gicor/afraguio/afraguio.html. Gahinet, P., A. Nemirovskii, A.J. Laub y M. Chilali (1994). The LMI control toolbox. In Proceedings of the 33rd IEEE Conference on Decision and Control. pp. 2038 - 2041. IEEE publications, Piscataway, NJ. Khalil, H.K.(1996). Nonlinear systems (3rd ed.). Prentice-Hall.

Englewood Cliffs. Utkin,V., J. Guldner y J. Shijun (1999), Sliding mode control in

electromechanical systems. Taylor and Francis, London. Tan C.P. y C. Edwards (2000), An LMI approach for designing sliding mode observers. In Proceedings of the 39th IEEE onference on Desicion and Control. pp. 2587-2592. IEEE publications, Piscataway, NJ.