comité español de automática
evista
beroamericana de
utomatica e
nformática ndu striai
ISSN: 1697-7912. Vol. 5, Num. 3, Julio 2008, pp. 54-62
http://riai.isa.upv.es
Diseño de Observadores en Modos Cuasi-Deslizantes vía LMIs
Alberto Javier Fraguío * José Luis Mancilla-Aguilar ** Aníbal Zanini ***
* Grupo de Identificación y Control Robusto, Facultad de Ingeniería Universidad de Buenos Aires, Paseo Colon 850, Buenos Aires, Argentina
(e-mail: afraguio@conae.gov.ar) ** Departamento de Físico-Matemática, Instituto Tecnologico de Buenos Aires, Avda. Madero 399, Buenos Aires, Argentina y Facultad de Ingeniería, Universidad de Buenos Aires (e-mail: jmancill@itba.edu.ar) *** Facultad de Ingeniería, Universidad de Buenos Aires, Buenos Aires, Argentina (e-mail: azanini@fi.uba.ar)
Resumen: En este trabajo se presenta un observador robusto por modos cuasi-deslizantes para plantas con modelo nominal lineal e incertidumbres/perturbaciones de cierta clase particular. Las senales utilizadas para la estimation del vector de estados se suponen contaminadas con ruido del que solo se conocen cotas. El diseno del observador se plantea como un problema de factibilidad LMI (Linear Matrix Inequalities) y se encuentran cotas para el error de estimation que pueden ser calculadas a priori. Posteriormente el diseno del observador se reformula como un problema de optimization GEVP (Generalized Eigen Value Problem) con el objeto de minimizar las cotas del error de estimación. El trabajo incluye un ejemplo numerico y simulaciones de un brazo robotico con un eje manejado por un motor de corriente continua. Copyright ©2008 CEA.
Palabras Clave: Observadores, Sistemas de control no lineales, Control por modos deslizantes, Invariancia, LMI, Optimization.
1. INTRODUCCION
Los observadores por modos deslizantes se diseñan de manera que el error de estimacion deslice sobre un subespacio S de menor dimension que la del espacio de estados. Deslizar significa que el error de estimacion converge a S en tiempo finito y permanece allí de ahí en mas. En el subespacio S la dinámica del error de estimacion presenta las características de estabilidad y comportamiento deseadas (Khalil, 1996; Utkin et al., 1999). Edwards y Spurgeon (Edwards & Spurgeon, 1994; Tan & Edwards, 2000) proponen, para una clase particular de plantas, un observador robusto compuesto por un observador de Luenberger y un teírmino adicional no lineal con el que se fuerza deslizamiento en el subespacio S = {y — y = 0}, donde y es la salida de la planta e y es su estimacion. Ese termino no lineal permite rechazar una clase particular de perturbaciones. En Edwards & Spurgeon (1994) y en Tan & Edwards (2000) se propone una forma canónica para el diseño del observador y se da una solucion explícita pero no se aprovechan todos los grados de libertad disponibles. Tan y Edwards (Tan & Edwards, 2000) reformulan el diseno del observador como un problema de optimizacion convexo con restricciones LMI, lo cual permite aprovechar todos los grados de libertad. Con esto, los observadores por modos deslizantes pasan a formar parte de la inmensa lista de problemas de control que pueden ser formulados como problemas LMI (Boyd et al., 1994; Gahinet et al., 1994). En ausencia de perturbaciones la componente no lineal podría anularse, en cuyo caso el observador se reduce a uno de Luemberger. El criterio de optimizacion utilizado en Tan & Edwards (2000) consiste en que, sin la componente no lineal, el observador se aproxime al observador optimo
lineal gaussiano. En esta formulacion los grados de libertad los dan las matrices de covarianza de los ruidos blancos en las ecuaciones de estado y de salida.
En presencia de ruido de medicion no es posible forzar deslizamiento, pero sí es posible mantener el error de estimacion proximo al subespacio S. En este caso decimos que hay una condicion de cuasi-deslizamiento y que el observador en cuestion es un observador por modos cuasi-deslizantes.
En este trabajo consideramos plantas con ruido de medicion acotado y proponemos un observador similar al de Edwards y Spurgeon (Edwards & Spurgeon, 1994; Tan & Edwards, 2000; Edwards & Spurgeon, 1998) pero sustentado en los conceptos de cuasi-deslizamiento (Emelyanov et al., 1995). Planteamos el diseño como un problema de factibilidad LMI y encontramos cotas finales para el error de estimacion. Demostramos que bajo las mismas hipotesis que en Edwards & Spurgeon (1994) y en Tan & Edwards (2000) el error de estimacion converge a un conjunto acotado. Ademas, si el conjunto de posibles condiciones iniciales para el error de estimacion es acotado, entonces es posible garantizar convergencia en tiempo finito. Posteriormente, con el objeto de optimizar las cotas para los errores finales, reformulamos el diseño del observador como un problema de optimizacion GEVP.
La organizacion del trabajo es la siguiente. En la Seccion 2 presentamos la clase de sistemas que consideramos a lo largo del trabajo. En la Seccion 3 se presenta el observador que se propone y en la Seccion 4 se efectua el analisis de convergencia del mismo. En la Seccion 5 se analizan ciertos aspectos prácticos, en particular la optimizacion de las cotas para el error de estimacion obtenidas. En la Seccion 6 se
presenta un ejemplo numérico y la simulación del observador obtenido en un brazo de robot. Finalmente la Seccion 7 incluye las conclusiones.
2. SISTEMAS
L=[ L 0] g R(n—p)xp
con Le R(n-p)x(p-q). Entonces
La notacion a lo largo del trabajo es estandar. En particular <f(A) y a(A) representan, respectivamente, el maximo y mínimo valor singular de una matriz A y ||x|| es la norma euclidiana de x e 1". Al conjunto de autovalores de la matriz A lo representamos por A(A) y a su numero de condicion, definido como a(A)/a(A), mediante k(A).
En este trabajo consideramos sistemas de la forma
X(t) = Ax(t) + Bu(t) + Efx(t, x, u) y(t) = Cx(t) + fy (t)
A = TAT-1
All Ai2
A21 A22
E = TE
C = CT-1 = [0 C2]
donde An e R(n-p)x(n-p), C2 e Rpxp es ortogonal y E2 e Rqxq es no singular. Ademas
1. Los ceros invariantes de (A,E,C) estan incluidos en A(Aii).
2. (A,C) es observable (detectable) (A11,A21) es observable (detectable).
Demostración. Ver Edwards & Spurgeon (1998).
A = TAT-1 =
A11 A12 A21 A22
C = CT
E = TE =
-[0Ip ] 0
donde An g
-p)x(n-p), a12 g R(n—p)xp, A21 G
x(n—p), A22 g Rpxp y E2 g rpxq con
donde las matrices
A e 1"x", B e 1nxm, C e 1pxn y E e 1"x? forman el modelo nominal. Respecto de las funciones fx y fy, que modelan, respectivamente, incertidumbres/perturbaciones y ruidos de medicion, suponemos que
lfx(t,x,u)l < a(t,y,u) (2)
llfy (t)| < n (2)
donde la funcion a(t, y, u) y el escalar n son conocidos, y que fx tiene la regularidad necesaria para garantizar la existencia de soluciones de la ecuacion diferencial.
A lo largo de este trabajo consideraremos las siguientes hipotesis:
(H1) q < p.
(H2) C y E son matrices de rango completo. (H3) Los ceros invariantes de (A, E, C), si tiene alguno, estan en C_.
Es importante destacar que si se verifican (H1) a (H3) entonces el par (A, C) es detectable. Recíprocamente, si (A, C) es detectable, entonces se verifica (H3).
Los siguientes resultados, que son consecuencias de las hipotesis (H1) a (H3), seran utilizados mas adelante. Lema 1. Existe T e 1nxn tal que
A11 = A11 + L A21 -L I
E2 = C2
A12 = [I L] A
Demostración. Ver Edwards & Spurgeon (1998).
Teorema 3. Si se verifican las hipotesis (H1) a (H3) entonces existen 0 < P2 = PT e 1pxp, 0 < Pi = PT e
1(n_p)x(n_p), 0 < Y = YT e 1pxp y 0 < n e 1 tales que
" ATP + PA_ - 2CTYC P P I
P = T1
P1 0 0P2
LT P1 P2 + LT P1L
P2 = CT P2C2.
Demostración. Es consecuencia del Lema 2 y de la formula del complemento de Schur. Ver Teorema 4.1, pagina 99, de Fraguío (2006). □
3. FORMULACION DEL OBSERVADOR El observador que proponemos es el siguiente
x = Ax + Bu — L¡ey + Lnv (ey )
ey = y — y
y = Cx
donde las matrices L¡ y Ln estan dadas por
Lema 2. Sea (A, E, C) la terna del Lema 1. Consideremos la matriz de cambio de coordenadas
1 n—p L
Li = T-1P-1CT Y (10)
Ln = T-1P-1CT P2 (11)
con P, P2 e Y del Teorema 3. La senal v(ey) es una funcion no lineal definida por
v (ey) = -Рф
\\Ptey У + a(P2)S
p > a(E2)a(t, y, u) + \ n + Y
2n + e + S
Y t&ihi -
°(Pt)(n + e)
Y > 0 Yi >
a(Ait)(n + e)ei.
(16) (17)
z = Aoz + Lnv - Efx + Lify Zy = Cz
z = AoZ + Lnv - Efx + Lify
con z = [ zi zy ] y
Z = AoZ + Lnv - Efx + Lify
А22 - P-1Y
donde AAii, Ai2, Á2i y Á22 están definidas en (4).
Demostración. Ver Lema 4.1, pagina 103, de Fraguío (2006).
Utilizando el lema anterior podemos reescribir la ecuacion dinamica (21) como
Zi = A iizi +Ai2zy
zy =Á2iZi + Áo22 zy + v -Z2fx + P2lYfy.
4.2 Sectores
En relación con el observador propuesto en Tan & Edwards (2000), Ln es la misma matriz que allí aparece mientras que la componente no lineal v(ey) es similar pero no la misma. El coeficiente p es una cota superior de las incertidumbres, perturbaciones y ruidos de medicion. El coeficiente ф es un factor de escala que depende de la cota del ruido de medicion. Las condiciones (15) a (17) surgen del analisis de convergencia.
Observamos que el observador esta parametrizado por (3), las LMIs del Teorema 3 y por los escalares e> 0, S > 0 y ei > 1. En lo que sigue veremos que con las matrices del Teorema 3 el error de estimacion x - x converge a un conjunto acotado que contiene al origen.
4. ANÁLISIS DE CONVERGENCIA
4.1 Ecuación Dinámica del Error de estimación Definamos
z(t) = x(t) - x(t) zy (t) 4 Cz(t) = ey (t) + fy (t). (18)
Derivando z(t) y empleando (1) y (9) obtenemos la ecuacion dinamica del error de estimacion
Consideremos P, P1 y P2 en las condiciones del Teorema 3 y definamos las siguientes funciones positivas definidas
V (z) = zT Pz (25)
Vy (zy) 4 zTP2Zy (26)
Vi(Zi) 4 ~ZTPZ (27)
donde z es el error de estimacion en el sistema de coordenadas del Lema 1, zy = Cz = [0 I ] Z y Z1 esta formado por las primeras n - p componentes del error de estimacion en coordenadas del Lema 2. Por (7) resulta
V (z)= Vy (zy) + Vi(Zi). (28)
Definimos tambien los siguientes conjuntos
Q = {У(Z) < u2}
tty 4{Vy (zy ) < U^
Qi = {Vi(Zi) < u2}
u =\! u2 + u2
Uy = ^K(P2)z(P2)(n + e)
K(P2)(n + e)ei
Ao 4 A — LiC
Mediante el cambio de coordenadas z = Tz, con T como en el Lema 1, la ecuacion (19) toma la forma
con 0 < e, ц e R y 1 < ei e R. En Qy el movimiento estaí gobernado por (23) y (29). El lema que presentamos a continuation nos servira para estudiar la evolucion del error de estimacion en Qy
Lema 5.
Lema 4. Mediante el cambio de coordenadas Z = Tz, con T como en el Lema 2, la ecuacion dinamica del error de estimacion (20) toma la forma
AnPi + P1A11 < —1PP — 1 Pi LLT ?!
At022P2 + P2A022 < — -P2P2.
Demostración. Es consecuencia de las ecuaciones (6), (22), y (7), del Lema 2 y del Teorema 3. Ver Lema 4.2, pagina 105, de Fraguío (2006). □
El siguiente teorema describe el movimiento dentro de Qy.
Teorema 6. El conjunto Q es atractivo en tiempo finito e invariante para las soluciones de (21) que evolucionan en Qy. Ademas, si el sistema parte del instante t = t0 y entra en en t = t\, entonces
ti - to < - (\/Vi(Zi(to)) - ui)
con j dado por (32) y
$ = a(Ai2)n(P2)Ja (Pi) (n + e)(ei - 1).
Demostración. Llamemos ^ = U ddonde y d^ son el complemento y la frontera de ü5, respectivamente. Consideremos la funcion V5 definida en (27). Notemos que llzy< K(P2)(n + e) y \\Pi¿i\\ > Utilizando las ecuaciones (24) y (30), junto con el Lema 5, la derivada de V5 en üy n $5 puede ser acotada por
zeQ,y n$i
< -2^Vi(zi)
zeo,y n$1
Demostración. Por (12) y (18)
zTP2 v 11P2 Zy
\lP2Zy ll-v(P2)n
lP2(zy - fy)|| + a(P2)S'
Por (29) z e ücy U düy si y solo si Vy(zy) > J^, pero por Rayleigh lP2zyH2 > g_(P2)Vy(zy). Luego por (31)
llP2zy||jzenyudny > V°(P2)jy = z(P2)(n+e).Por totolo
para z e ücy Udüy el numerador de la cota de zTP2 v es positivo con lo que podemos escribir
zT P2V 11P2 zy ll
llP2zy ll-z(P2)n
11P2zy ll + z(P2)(n + 5) para todo z e ücy U düy .El cociente del lado derecho de esta desigualdad es estrictamente creciente 1 en \P2 zy || loque implica, junto con (14), que
:P2v\,
< -P llP2zy
El teorema que sigue trata sobre la atractividad de üy.
Tiene la forma g(x) = Xx+a con a,b > 0 cuya derivada es g(x) =
a+b (x + b)2
Teorema 8. El sector üy es atractivo en tiempo finito para las soluciones de la ecuacion dinamica del error de estimacion (20).
Demostracion. Sea la funcion positiva definida V(z) definida en (25). Mediante algebra de matrices es posible demostrar que
P L n = CT P2 PL l = C Y PE = CT P2E2. Definamos $ = ücy Udüy donde ücy y düy son el complemento y la frontera de üy, respectivamente. Notemos que por ser C2 ortogonal z(E2) = a(E2). Luego, utilizando las ecuaciones
lo que demuestra la atractividad en tiempo finito y la invariancia de ü5 para las soluciones de (21) que evolucionan en üy. Supongamos que z(t0) e ü y sea t5 > t0 el instante de tiempo en que z ingresa a ü1 por primer vez, es decir, z(t5) e dü5 c $5. Consideremos la ecuacion diferencial escalar
V-(t) = vi(t0) = Vi(t0)
cuya solucion verifica
Vvi(ti) = -$(ti - to) + Vvi(to). Finalmente por el lema de comparacion Khalil (1996) y puesto que, por (27), V5 (z1(t1)) = j2, resulta
Ji < -$(ti - to) + \Jvi(to) t e [to,ti] lo que termina la demostracion. □
En vista del Teorema 6 queda ver bajo que condiciones üy es atractivo en tiempo finito. Para esto necesitamos el siguiente lema
Lema 7. Sean ücy y düy el complemento y la frontera de üy, respectivamente. Entonces
zH P2v\ -zeQy Udüy < -p 11P2 zy ||jZ£Qy UdQy
donde v esta definida en (12) y p en (13).
(2) y (13) y el Lema 7, tenemos que V(z)
< 0, pues
V(z) < V(z)j ze^ - 2ja(P2)(n + e). (34)
La demostracion de que üy es atractivo en tiempo finito es por el absurdo. Si z e 0y Vt e [t0, to), por (34) existe t' e (t0, to)
tal que V(z(t')) = 0 lo que contradice la suposicion inicial.
El Teorema 8 establece la atractividad en tiempo finito de üy pero no asegura que este sea invariante. Como veremos a continuacion no es posible garantizar la invariancia de üy en todo el espacio. Es decir, existe la posibilidad de que el error de estimacion describa una trayectoria zigzagueante en la que esta entre y salga de üy. Por el Teorema 6 sabemos que V5 (z) decrece en üy - ü5. El siguiente lema demuestra que el error, en su movimiento zigzagueante, converge a ü5 n üy. Lema 9. Sean t5 <t2 < to dos instantes de tiempo consecutivos tales que z(t1),z(t2) e düy. Si z(t) e üy Vt e (t5,t2) entonces
Vi(~zi(ti)) >Vi(~zi(t2)) donde V5 es la funcion definida en (27).
Demostracion. Consideremos la funcion positiva definida
V (z) = zT Pz = Vy (t) + Vi(t)
dada en (25) y (28). Sabemos por (34) que V(z(t)) < 0 t e (ti, ^2), ya que por hipotesis z(t) e 0y Udü Vt e (ti,t2). Por lo tanto V(z(t2)) < V(z(t5)). Tambien por hipotesis
Vy (ti) = Vy (t2) = Jy. Luego
0 < V(z(ti)) - V(z(t2)) = Vi(zi(t2)) - Vi(zi(ti)) lo que termina la demostracioin. □
Definamos el conjunto
ri ± {Vi(zi) < y2} . Por (17) y (32) y5 > J-í-, lo que implica que ü5 C ri. Del desarrollo anterior el conjunto üy n r5 es atractivo para las soluciones de (21). En efecto, si el error de estimacion z se encuentra fuera de üy para algun instante de tiempo dado entonces, por el Teorema 8, existe un instante de tiempo finito tal que z entra en üy. Dentro de üy el error z tiende a entrar en r5 ya que por diseno ü5 C r5 y por el Teorema 6, el conjunto ü5 es atractivo para las soluciones de (21) que pertenecen a üy. Si en algún instante z sale de üy, por el Teorema 8 y por el Lema 9, z volvera a entrar en tiempo finito y mas cerca de r5 de lo que estaba cuando dejo üy.
Como veremos a continuacion el conjunto üy n r5 es invariante para las soluciones de (21). Esto nos permite, junto con el
zenyudn
Teorema 6 y el Lema 9, asegurar la convergencia de zz al conjunto Qy nQ 1. El siguiente teorema trata sobre la invariancia
de Qy n r1.
Teorema 10. Qy n r1 es invariante para las soluciones de (21) para todo y en (13) que verifique (15).
Demostracion. Por el absurdo. Supongamos que Qy n r no es invariante. En este caso dado Z(t1) e Qy n r1 existe t2 > t1 tal que Z(t2) e Qy n r1. Pero, por continuidad de las soluciones de (21), esto implica a su vez la existencia de t' e [t1,t2) tal que Z(t') e d(r n Q). Por el Teorema 6 Vi(Zi) definida en (27) es estrictamente decreciente dentro de Qy. Por lo tanto z solo puede salir de Qy n r1 atravezando la frontera de Qy, es decir, Z(t') e (dQy) n ri, con Vy(zy(t')) > 0, donde Vy(zy) es la funcion definida en (26).
Por otro lado, la derivada de Vy sobre las soluciones de (24) es Vy (zy) = 2zTP2zy. Utilizando los Lemas 5 y 7, junto con (2) y (13), la derivada Vy en t = t' puede acotarse por
Vy (zy (t')) < — ±a(P2)Vy (t') r_
—z^PijVyt)^ — ^KP))*(A21.
Por construccion de t' y por (30) y (29) se verifican Vy (zy (t')) = jy y V1(Z1(t')) < y2. Reemplazando estas relaciones y utilizando (31), resulta
Vy (zy (t')) < —2^jP2)Uy x
* P)(n +e)
* (A2i)Yi —
Por (15) el teírmino entre pareíntesis es no negativo y por lo tanto Vy(zy(t')) < 0. Pero esto se contradice con la suposicion inicial. Luego Qy n r es invariante.
4.3 Cotas en el error de estimacion
Por Rayleigh sabemos que si Z e Q1 n Qy entonces
\\zy\\<k(P2)(v + e) Vzi\\<2v*~) k(P2 )(n + e)ei.
*_(Pi)—....................(36)
La desigualdad (35) establece que, en el mejor de los casos, el error en la estimacion de Cx puede acercarse a la magnitud del ruido de medicion n tanto como se quiera. El precio a pagar es en la magnitud de la componente no lineal del observador v, ya que por (14) tiende a x cuando e tiende a 0. Lo deseable es que P2 sea ortogonal, k(P2) = 1, pero no siempre es posible verificar (6) con matrices P2 ortogonales.
Por (28), (31), (32) y (31) tenemos
Z e Q1 n Qy ^ z e Q = {zTPz < J2} .
4.4 Cotas en el tiempo de convergencia
Para simplificar la escritura definamos $ = Qcy U dQy donde Qy y dQy son el complemento y la frontera de Qy, respectivamente. Consideremos la condicion inicial z(t0) e $ y la
funcion V definida en (25), que por (28) resulta V = V1 + Vy, donde las funciones V1 y Vy son las definidas en (26)-(27). Si se cumplen las condiciones del Teorema 8 entonces existe t e [t0, x) tal que z(t1) e dQy c $ y, por (34), la derivada
< 0. Por lo tanto, V(ti)
Vi(ti) + J2 < V (to).
Supongamos que las posibles condiciones iniciales en el error de estimacioín son acotadas, es decir,
z(to) e B(zo) = {\\z\\ < zo}
Por Rayleigh
V(to)= zT(to)Pz(to) < * (P)z2
con lo cual
Vi(ti) <*(P)z2 — Jy. (39)
Notemos que si no se verifica (37), no tiene sentido el problema de acotar el lapso t1 — to ya que en este caso z (to) e
Qy^z(to) e B(zo). En efecto, si zo < jy¡\J*(P) resulta
V(to) < * (P) \\z\\2 < Luego, si
Yi >\° (Pz — <
el error de estimacion z e Qy Vt > to, ya que Z(t1) e Qy n r1 y por el Teorema 10 el conjunto Qy n r1 es invariante. Por lo tanto, para un conjunto acotado de condiciones iniciales siempre podemos asegurar, con y1 suficientemente grande, que el error de estimacion convergerá a Qy en tiempo finito y que una vez allí no saldrá del mismo.
Aplicando el lema de comparacion Khalil (1996) a (34) junto con (38) y el hecho de que por definicion de t1 V(t1) = V1 (t1) + > jy, obtenemos la cota para el tiempo de convergencia
ti — to < *mj±L
\ \ + bY
donde b = 2*(P2)(n + e)/X y A = *(PPor (37) el argumento de la funcion logaritmo es mayor o igual a 1 y estrictamente decreciente2 en y. Por lo tanto, es posible achicar la cota t1 — to tanto como se desee mediante un valor suficientemente grande de y.
Si Z(t1) e Q1 entonces por el Teorema 6, z(t) e Q1 Vt > t1. Cuando Z(t1) e Q1, por el Teorema 6 sabemos que existe t2 e (t1, x) tal que Z(t2) e dQ1. Reemplazando (39) en la cota de t2 — t1 del Teorema 6 resulta
., (P)z2 — — ji
t2 — ti <
con $ definida en (33).
5. ASPECTOS PRACTICOS
En esta seccion reformulamos el diseno del observador como un problema de optimizacion de autovalores generalizados con el objeto de aprovechar los numerosos grados de libertad que tiene el observador propuesto.
La derivada del argumento respecto de 7 es ■
K +bY)
Jy-a(P)z0
5.1 Objetivos
Como objetivo de optimización proponemos minimizar las cotas de las desigualdades (35) y (36). Para minimizar la cota de \\zy || es deseable una matriz P2 con el menor nUmero de condicion posible. Idealmente P2 ortogonal, pero como comentamos anteriormente esto no siempre es posible. Para minimizar la cota de \z1\, ademas de k(P2) mínimo, tambien se desean j/<j(A) y a(Á12) lo mas chicos posible. En general, por (5) la matriz A12 = A12 (L). En el caso particular p = q, por (3) resulta L = 0, lo que implica Á12 = Á12CT. Por lo tanto, cuando p = q, la matriz Á12 no depende de los parámetros de diseno. Por el contrario, cuando p > q es necesario restringir los valores de L para disminuir <(Á12). Una manera simple, pero conservadora, es la siguiente: partiendo de (5) y recordando que C2 es ortogonal, resulta a(A12) < (1 + a(L))2a(A). Si bien se trata de una cota conservadora, acotando <(L) nos aseguramos que al resolver el problema no resulten valores demasiado grandes de a(Á12).
Con respecto a la cota de \z1\, queda considerar el parametro e1. Desde el punto de vista del error de estimacion es deseable que sea lo mas pequeño posible. Sin embargo, la cota (41) en el tiempo de convergencia converge a x cuando e1 ^ 1. Por lo tanto, e1 representa un compromiso entre la cota de \\z1\\ y la cota del tiempo de convergencia.
Para tratar de cumplir con estos objetivos proponemos el siguiente problema de optimizacion. Consideremos las siguientes variables adicionales a > 0 y t. El problema de optimizacion
minimizar t
sujeto a (6)-(8)-(3) y a las siguientes restricciones adicionales
Comencemos con la restriccion (42). Por (46) y por ser C2 ortogonal, esta restriccion es equivalente a
al < P22 - PnPnPu < atl, pero por el complemento de Schur es, a su vez, equivalente a
al < P < atl.
Por lo tanto, minimizar el numero de condicion de P2 es equivalente a minimizar el de P. Por (46) la restriccion (43) no es unaLMI en las variables P11 y P12. Es necesario reformular el problema. Siendo conservadores podemos escribir
HL) < a(P-11)a(P12) = <(P12).
Luego, la minimizacion de <(L) se consigue minimizando <(P12) al mismo tiempo que se maximiza <(P11). La maxi-mizacion de <(P11) ya la formulamos en la restriccion (44). Por lo tanto, para minimizar la cota de <(L) se reemplaza la restriccion (43) por <(P12) < t — 1, o equivalentemente por PT2P12 < (t — 1)2I. Definiendo
In-p 0 0 0
(n-p) x (n-p)
y utilizando el complemento de Schur, esta desigualdad puede reescribirse como
NPM + (NPM)T + tIn — In > 0.
1 (P-11
Por (46) la restriccion (44) es equivalente a a(pii
t — 1 que a su vez es equivalente a P-1 < (t — 1)In
0 < X = XT e R(n-p)x(n-p). Con esta nueva variable podremos reformular la desigualdad anterior como una LMI en X, P11 y t de la siguiente manera
aI <P2 < atI
H<t — 1
a(L) < (t — 1)
<<(P1).
La restriccion (42) fuerza la minimizacion del numero de condicion de la matriz P2. En efecto, por definicion
/ ^ \ &(P2) at
k(P2) = < - = t.
P11 P12 PT2 P22
con P11 e R(n-p)x(n-p), P12 e R(n-p)xp y P22 e Rpxp. La matriz P12 = [ P121 0] con Pm e R(n-p)x(p-q). Igualando con (8) y despejando resultan
P1 P2 L
C2 (P22 — P12
P-11P12
T P-11P12
X< (t — 1)In
P-11 <X.
Por el complemento de Schur la ultima desigualdad es equivalente a
X In-p > 0 In-p P11
Definiendo Q = [In-p 0(n-p)xp] la desigualdad anterior toma la forma
Notemos que (42) implica t > 1 y , por lo tanto, (43) y (44) estan bien planteadas.
5.2 Formulación como Problema de Autovalores Generalizados Reescribamos P como en Tan & Edwards (2000)
5.3 Algoritmo de diseño
El siguiente algoritmo surge del desarrollo anterior.
1- Resolver el problema de optimizacion minimizar t sujeto a
AT P + PA — 2CT YC P
al < P
In-p QPQ
P,X,Y,p,a > 0 In — NPM — (NPM)T < tIn P < atIn ¡j, < t
donde P tiene la estructura de (45).
2- Calcular P2 a partir de (46).
3- Calcular las ganancias del observador L¡ y Ln utilizando las Ecuaciones (10) y (11).
4- Elegir e > 0 resolviendo el compromiso formado por el valor maximo de v en (12)-(14) y la cota en el error de estimacion (35).
5- Diseño de ei, y1 y Y
1. Caso General. Cuando no se conoce la región de las posibles condiciones iniciales en el error de estimacion. En este caso elegir en orden:
a) e1 > 1;
b) y1 sujeto a (17);
c) y > 0 sujeto a (15).
2. Caso Particular. Cuando las condiciones iniciales z (t0) e Q con z0 que satisface (37), el tiempo de convergencia a Q1 n Qy queda acotado por (41). Elegir en orden:
a) e1 > 1 resolviendo el compromiso formado por la cota en el error de estimacion (36) y la cota en el tiempo de convergencia (41);
b) y1 sujeto a (17) y (40);
c) y > 0 sujeto a (15), y de manera que (41) cumpla con las especificaciones.
6- Elegir p de manera que verifique (13).
6. EJEMPLO
6.1 Planta y Modelo
Consideremos un manipulador robotico simple (Figura 1) formado por un unico eslabon y manejado por un motor de corriente continua.
— = —i — dt L
I+1 u L
'e = ^Ni -A-2 e + g + ^d
ml2 ml2 l ml2
donde u(t), i(t), 0(t) y d(t) son respectivamente la tension sobre los bornes del motor, la corriente de armadura del motor,
el ángulo del brazo respecto a la vertical y el torque de perturbación. La mayoría de los parametros fueron tomados de Utkin et al. (1999) y se describen en la Tabla 1.
Tabla 1. Parámetros del manipulador robotico de un eje. Unidades en SI
Parámetro Valor Description
R 0,5 Resistencia de armadura
L 0,001 Inductancia de armadura
ke 0,008 Constante contra electro motriz
kt 0,008 Constante de torque
m 1 Masa del eslabon
l 0,4 Longitud del eslabon
b 0,2 Coeficiente de friccion viscosa
N 100 Relacion del tren de engranes
g 9,8 Aceleracion de la gravedad
El torque de perturbacion es incierto pero acotado por
\d(t)\ < 10Nm Wt. Deseamos estimar la corriente de armadura i(t) midiendo la posicion y velocidad angular del brazo
V1(t) = 0(t) + fy1 (t), V2(t)= 0(t) + fy2 (t)
donde fyi (t) es ruido blanco con distribucion uniforme en el intervalo [-0,0175, +0,0175] 3 de donde resulta
\\fy(t)y <0,0175V2 = n.
Definiendo x1 (t) = i(t), x2(t) = 9(t) y x3(t) = 9(t) resultan
[- R 0 keNl
ktN 0 - ml2 b
"0 1 0 "
0' 0 1
a(y1) = 24,5 (\sin (y1)\ + \cos (y1)\) + 62,5. donde recordemos que \fx(x2,d)\ < a(y1). Evidentemente C, E y CE son de rango completo. La terna (A, E, C) tiene un unico cero invariante en -R/L. Por lo tanto se verifican las hipotesis (H1) a (H3). Notemos que (A, E, C) ya se encuentra en la forma canonica del Lema 1.
6.2 Diseño
Resolviendo el problema de autovalores generalizados (47) resultan
Figura 1. Manipulador robotico de un eje.
El brazo se encuentra contenido en el plano vertical al piso. Para simplificar el modelado suponemos que el eslabon esta formado por una barra de masa despreciable con una masa puntual en su extremo. Bajo estas simplificaciones, el modelo matematico esta dado por
31,4822 0,0000 0
0,0000 31,4591 -0,0000 0 -0,0000 31,4591
0,7007 0,0000 0,0000 1,0088
H = 0,0319, t = 1,0320.
Por (46)
31,4591 -0,0000 0,0000 31,4591
y por (10) y (11)
3 ±0,0175rad ~ ±1°
4 En este ejemplo particular la matriz de cambio de coordenadas del Lema 1
es la identidad
keN ■
—0,0000 —0,0000 2,2274 0,0000 0,0000 3,2066
—0,0000 —0,0000 Ln = 1,0000 0
L 0 1,0000 _
Con e = 0,005 y S = 0,01 resulta ^ = 12,8995. Fijando e1 = 1,125 y tomando ■y1 lo mas pequeño posible, pero que verifique simultáneamente (17) y (40), obtenemos y1 = 16,84. Analogamente, eligmos el y > 0 mas chico posible que verifique (15) resulta y = 0,3176. Finalmente, por (13) p = 24,5 (sin (y1(t))\ + \cos(y1(t))\) + 794.
6.3 Convergencia
En este ejemplo particular, el error de estimacion del vector de
estados es z = x—x = [ Z1 zyi zy2 ] Suponiendo que en t = t0
i-ie-6 6-6
[ —2,5 n/2 n/8]T, x(0)
0 10 10
i — i < 2,5A, 6 — 6 < n/2, 6) — 6 < n/8 resulta una condicion inicial z(t0) e B(3). Luego
1. z(t) e üy = {z2yi + z¡2 < 0,0278} yt1 > to con t1 — to < 9,3mseg;
2. z(t) e ü1 = {\z1\ < 0,0542} yt > t2 > t1 con t2 — t1 < 990mseg.
Por lo tanto, se puede asegurar que dentro de t2 — t0 < 1seg la corriente de armadura se estima con un error menor o igual a
54,2mA.
6.4 Simulaciones
Las condiciones de simulacion son las siguientes x(0) = T ^ =[0 0 0]T, u(t) = 1(t — 0,02) y
t < 0,05 0,05 < t < 0,0625 0,0625 < t < 0,0750 . 0 : t > 0,075
En las Figuras 2 y 3 mostramos los errores de estimacion junto con los sectores ü1, r y üy. Notamos que si bien las cotas halladas apriori se verifican, estas son muy conservadoras. Sin embargo siguen siendo utiles para, por ejemplo, el diseño de sensores de corriente con fines de proteccion contra sobrecarga.
Para evaluar el desempeno del observador (9), comparamos los errores de estimacion cometidos por este observador con los del propuesto en Tan & Edwards (2000). Los resultados se muestran en la Figura 4, en la cual se aprecia el mejor desempeño del observador aquí propuesto, ya que el mismo presenta un mejor rechazo al torque de perturbacion y al ruido de medicion debido a que no requiere de un régimen de deslizamiento como en Tan & Edwards (2000). Como desventaja tenemos que las senales involucradas son de mayor magnitud, lo cual no es problemaítico si, por ejemplo, el observador se utiliza con fines de sensado para monitoreo o proteccion.
7. CONCLUSIONES
En este trabajo presentamos un observador robusto por modos cuasi deslizantes para plantas con modelo nominal lineal afectado por perturbaciones/incerteza y con ruido de medicion.
Figura 2. Error de estimacion z1. La línea de trazo representa el contorno de ^ y la línea punteada el contorno de r1.
Figura 3. Error de estimacion zy.
El diseño del observador se planteo como un problema de factibilidad LMI y se probo, bajo ciertas hipotesis, la convergencia del error de estimacion a un conjunto acotado que contiene al origen de coordenadas. Tambien se proporcionaron cotas a priori para el error de estimacion.
Posteriormente se reformulo el problema de diseño del observador como uno de optimizacion GEVP con el objeto de minimizar las cotas para el error de estimacion.
Finalmente, se presento un ejemplo de simulacion que mostro el buen desempeño del observador propuesto y la verificacion de las cotas obtenidas a priori, aunque las cotas en el tiempo de convergencia resultaron ser muy conservadoras. Comparado con el observador por modos deslizantes propuesto en Tan & Edwards (2000), el observador aquí propuesto presento un mejor rechazo al torque de perturbacion y al ruido de medicion, pero, como desventaja, señales de mayor magnitud.
REFERENCIAS
Boyd, S., L.E. Ghaoui, E. Feron y V. Balakrishnan (1994).
Linear matrix inequalities in system and control theory.
Errores de estimación de corriente de armadura
Torque de perturbación
-15'..........................i
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.1
Figura 4. Error de estimación de la corriente de armadura del observador de Tan-Edwards vs. el propuesto en este trabajo.
SIAM Studies in applied and numerical mathematics. SIAM, Philadelphia.
Edwards, C. y S.K. Spurgeon (1994). On the development of discontinuous observers. International Journal of Control 25, pp. 1211-1229. Edwards, C. y S.K. Spurgeon (1998). Sliding mode control:
theory and applications. Taylor and Francis, London. Emelyanov, S.V., S.K. Korovin y I.G. Mamedov (1995). Variable- Structure Control Systems: Discrete and Digital. CRC Press. Boca Raton. Fraguio, A. (2006). Observadores por modos deslizantes. Tesis de grado. Facultad de Ingeniería, Universidad de Buenos Aires. Disponible en http://www.fi.uba.ar/laboratorios/gicor/afraguio/afraguio.html. Gahinet, P., A. Nemirovskii, A.J. Laub y M. Chilali (1994). The LMI control toolbox. In Proceedings of the 33rd IEEE Conference on Decision and Control. pp. 2038 - 2041. IEEE publications, Piscataway, NJ. Khalil, H.K.(1996). Nonlinear systems (3rd ed.). Prentice-Hall.
Englewood Cliffs. Utkin,V., J. Guldner y J. Shijun (1999), Sliding mode control in
electromechanical systems. Taylor and Francis, London. Tan C.P. y C. Edwards (2000), An LMI approach for designing sliding mode observers. In Proceedings of the 39th IEEE onference on Desicion and Control. pp. 2587-2592. IEEE publications, Piscataway, NJ.