Scholarly article on topic 'Agrupaciones de modelos locales con descripción externa. Aplicación a una planta de frío solar'

Agrupaciones de modelos locales con descripción externa. Aplicación a una planta de frío solar Academic research paper on "Educational sciences"

CC BY-NC-ND
0
0
Share paper
Keywords
{"agrupaciones de modelos locales" / identificación / "planta solar de producción de frío"}

Abstract of research paper on Educational sciences, author of scientific article — Manuel R. Arahal, Amparo Núñez-Reyes, Ignacio Alvarado Aldea, Francisco Rodríguez

Resumen En este artículo se presenta y analiza un método de creación de modelos formados por agrupaciones de submodelos locales lineales. La principal novedad es que la ponderación empleada con los submodelos no es la habitual, basada en el estado o parte del mismo sino que se toman exclusivamente señales instantáneas de entrada y salida del sistema. Esta elección simplifica algunos aspectos de la creación del modelo, manteniendo intacta la capacidad de representación, siendo ésta comparada con otras técnicas. La simplificación aludida es importante pues acerca el método a la práctica industrial del control de procesos. La técnica de identificación resultante se ilustra mediante dos casos prácticos: un sistema simulado propuesto por Narendra y el sistema de captación de una planta real de producción de frío a partir de energía solar. En ambos casos se muestran los errores de generalización para la predicción a un paso y para la simulación usando gran cantidad de situaciones. Los resultados indican que es factible el uso del método propuesto como técnica simplificada aplicable en la industria.

Academic research paper on topic "Agrupaciones de modelos locales con descripción externa. Aplicación a una planta de frío solar"

comité español de automática

evista

beroamericana de

utomatica e

nformática ndu striai

ISSN: 1697-7912. Vol. 6, Núm. 1, Enero 2009, pp. 51-62

http://www.revista-riai.org

Agrupaciones de modelos locales con descripción externa. Aplicacion a una planta de frío solar

Manuel R. Arahal * Amparo NUnez-Reyes * Ignacio Alvarado Aldea * Francisco Rodríguez **

' Dpto. Ingeniería de Sistemas y Automática, Universidad de Sevilla, Camino

de los Descubrimientos, s/n, 41092, España, (dt: arahal@esi.us.es) ** Dpto. de Lenguajes y Computación, Universidad de Almería, La Canada de San Urbano, 04120, España.

Resumen: En este artículo se presenta y analiza un método de creación de modelos formados por agrupaciones de submodelos locales lineales. La principal novedad es que la ponderacion empleada con los submodelos no es la habitual, basada en el estado o parte del mismo sino que se toman exclusivamente señales instantáneas de entrada y salida del sistema. Esta eleccion simplifica algunos aspectos de la creacion del modelo, manteniendo intacta la capacidad de representacion, siendo esta comparada con otras tecnicas. La simplificacion aludida es importante pues acerca el metodo a la practica industrial del control de procesos. La tecnica de identificacion resultante se ilustra mediante dos casos prácticos: un sistema simulado propuesto por Narendra y el sistema de captacion de una planta real de produccion de frío a partir de energía solar. En ambos casos se muestran los errores de generalizacion para la prediccion a un paso y para la simulacion usando gran cantidad de situaciones. Los resultados indican que es factible el uso del meítodo propuesto como teícnica simplificada aplicable en la industria. Copyright © 2009 CEA.

Palabras Clave: agrupaciones de modelos locales, identificacion, planta solar de produccion de frío

1. INTRODUCCION

Las agrupaciones de modelos locales lineales (en adelante AMLL) aparecen por primera vez en (Johansen and Foss, 1993) como un medio para describir dinaímicas no lineales mediante el uso de un conjunto de submodelos lineales. La idea del metodo es interpolar entre submodelos en funcion del punto de operacion del sistema. La salida proporcionada por el modelo es una suma ponderada de las salidas de cada submodelo. Los pesos de ponderacion no son fijos sino que varían en funcion del punto de funcionamiento. La funcioí n que proporciona el valor de los pesos en cada instante es estatica, pero no lineal, por lo que el modelo resultante tampoco lo es. Los submodelos lineales representan el comportamiento del sistema con cierta bondad en torno a un punto de funcionamiento y por ello se les llama modelos locales lineales (MLL). El modelo que resulta de la ponderacion de los MLL es global, queriendo con esto decir que tiene validez en todos los puntos de operacioí n.

Las AMLL han sido aplicadas a procesos (Foss et al., 1995; lohansen et al., 2000; Hunt et al., 2000) utilizandose en la mayoría de los casos la ponderacion de submodelos en funcion del estado o de algunas componentes de este (lohansen and Foss, 1995; Murray and lohansen, 1997) (el lector interesado puede acceder a una biblioteca de funciones para MATLAB que ayudan en el diseño de este tipo de modelos (Johansen and Foss, 1998)). El uso de AMLL mediante descripciones externas no esta tan extendido existiendo algun trabajo de corte teorico como (Bontempi and Birattari, 2005). En este artículo se mostrara que el uso de la descripcion externa conforma un entorno mas cercano a la idea de identificacion automatica, permitiendo la creacion de un algoritmo para ser usado en la

practica industrial. Otra ventaja del metodo propuesto es que sistematiza la seleccion de regiones de operacion. La tecnica de identificacion resultante se ilustra mediante dos ejemplos, uno de ellos es un sistema propuesto por Narendra (Narendra and Parthasarathy, 1990), monovariable y simulado, el otro es el sistema de captacion de una planta real de produccion de frío a partir de energía solar con una salida y varias entradas. En ambos casos la dinamica observada depende en gran medida del punto de funcionamiento por lo que demuestran la posibilidad de usar el meítodo como teícnica simplificada aplicable en la industria de procesos.

Existen evidentes conexiones entre las AMLL y otros medios de identificacion como los conjuntos borrosos. Esta cuestion se trata brevemente en el siguiente resumen del estado del arte.

1.1 MotivaciOn y estado del arte

Los modelos lineales son ampliamente usados en la industria debido, entre otras razones, a la facilidad de obtencion a partir de datos experimentales. Cuando se controla un proceso en torno a un punto de funcionamiento la aproximacion ofrecida por el modelo lineal puede ser suficiente para los propositos prácticos de control. Esta eleccion conlleva un menor tiempo de puesta en marcha del lazo de control, proporcionando ademaís resultados aceptables en muchos casos.

Hay situaciones en las que las desviaciones del modelo lineal con respecto a la dinamica observada no son desdeñables. En tales casos puede ser conveniente una mayor inversion en modelado, pasando del simple modelo lineal a otro tipo de modelo mas complejo en la esperanza de poder diseñar mejores con-troladores. Una opcion atractiva en estos casos es la de usar un

controlador basado en modelo como los controladores predic-tivos (CPBM) (Camacho and Bordons, 2004), en particular en entornos donde se pretende llevar a cabo la automatización total (de Prada, 2004), (Rivera, 2007), (Sarabia et al., 2006), (Rodríguez et al., 2007), (Ghraizi et al., 2007) pues los beneficios obtenibles mediante optimizacion justifican el gasto adicional invertido en modelado.

En el camino que lleva de los modelos lineales a los que no lo son hay un primer paso que consiste en añadir no linea-lidades estaticas como saturaciones, zonas muertas etc. Los modelos resultantes son llamados modelos con no linealidades concentradas y tienen la ventaja de aunar la simplicidad de los modelos lineales con la validez global de los modelos obtenidos a partir de leyes fundamentales. Su campo de aplicacion es muy amplio, requiriendo un pequeño esfuerzo adicional con respecto al modelado lineal. El analisis de este tipo de modelos ha dado lugar a numerosos estudios (Alamo et al., 2006) que proporcionan fundamentos teoricos solidos para su aplicacion. La principal desventaja es que son modelos poco flexibles en el sentido de que no son capaces de acomodar distintas dinámicas como tiempos característicos de respuesta, tiempos muertos, etc. en funcion del punto de operacion.

El siguiente paso en complejidad son las AMLL. Su funcionamiento consiste en combinar las salidas de varios submodelos lineales locales. Estas agrupaciones de submodelos dan lugar a modelos globales, es decir, con validez en un espacio de trabajo amplio, no solo en torno a un punto de trabajo particular. Ademas el modelo resultante es no lineal pues la combinacion de los submodelos lineales se basa en funciones de ponderacion que no son lineales. Los modelos que integran la agrupacioín son obtenidos mediante identificacion en torno a puntos de trabajo; es decir, cada modelo es local pues constituye una aproximacioí n adecuada en torno a un punto de trabajo particular. De este modo las tecnicas de seleccion e identificacion para modelos lineales pueden aplicarse por lo que el incremento de complejidad praíctico no es elevado, de hecho se incrementa linealmente con el numero de submodelos. Ademas, el orden de los submodelos lineales afecta de una manera suave a los requisitos prácticos de la identificacion (excitacion y numero de datos) y no se produce la temida explosion dimensional (Bellman, 1957) que afecta a las series de funciones como por ejemplo las redes de neuronas de una capa oculta (Moody and Darken, 1989). Finalmente es de señalar que el modelo global resultante admite hasta cierto punto un anaílisis frecuencial. Analisis que puede obtenerse de manera mas simple que en el caso de modelos con no linealidades concentradas y muchísimo más que en el caso de redes de neuronas.

La formulacion presentada en este artículo consiste en agrupaciones de submodelos que usan la descripcion externa del sistema y que usan exclusivamente valores instantáneos de entrada y de salida. En el apartado siguiente, se presentan las ideas de los MLL que sirven de base para diseñar un algoritmo de creacion de AMLL mostrado en el punto tercero. Este algoritmo o metodo sistematico requiere unicamente datos medidos experimentalmente del sistema aunque permite igualmente la incorporacion de conocimiento previo. Se mostrara además que las capacidades representativas de las AMLL son superiores a las de los modelos con no linealidades concentradas y similares a las de las redes de neuronas artificiales y los modelos borrosos. En el punto cuarto se presentan resultados praícticos obtenidos al aplicar el algoritmo a dos plantas.

2. AMLL EN EL ESPACIO DE ENTRADA-SALIDA

Los modelos locales usados habitualmente consisten en descripciones internas. Este tipo de descripcion no siempre es de facil utilizacion debido a la posible existencia de componentes del estado no medibles. En este trabajo se utilizan exclusivamente las señales de entrada y de salida, las cuales se suponen accesibles. Se persigue de este modo poner a disposicion de la practica industrial un algoritmo capaz de proporcionar modelos de sistemas con posible comportamiento no lineal a partir de datos obtenidos de ensayos experimentales.

A fin de presentar el metodo se considera un sistema monovariable que exhibe un comportamiento alejado de la lineali-dad cuya entrada es una señal escalar us y la salida es otra señal escalar ys. No existe problema alguno para extender los resultados al caso de multiples entradas y salidas aparte del aumento de complejidad de la notacioí n. Para cada punto de funcionamiento dado por el par z = (u£ , y£) se va a considerar un modelo de entrada salida en las variables y = ys - y£ y u = us - u£ que representan variaciones en torno al punto de funcionamiento. Se esta suponiendo aquí que para una entrada dada u£ existe un unico valor de régimen permanente y¿ tal que | yS |< ro, los casos en que esto no se cumple son los comportamiento integradores y con histeresis y se trataran en el punto tercero.

Como modelo correspondiente al punto de funcionamiento se propone una expresion de tiempo discreto en la forma:

y(k) = mf(k - 1)0 (1)

que contiene un vector de medidas m(k - 1) = (y(k -1), ••• y(k - na), u(k - d - 1) ••• u(k - d - nb))4, donde d representa el retardo puro en ese punto de funcionamiento y 6 = (ai, ••• , ana, bi, ••• , bnb)1 un vector de parámetros que contiene los coeficientes a¿ e IR i G {1, ••• , na} y bj e IR, j G {1, ••• , nb} del modelo de ordenes na e IN y nb e IN.

Si se enumeran los puntos de funcionamiento mediante p variando en [1, np] se tiene que cada modelo local corresponde a un valor del índice p. De este modo la ecuacion (1) puede particularizarse para cada punto de funcionamiento. A fin de marcar la diferencia entre la salida del sistema y la salida de cada modelo se denotará a estas mediante yp. La prediccion a un paso dada por cada submodelo queda descrita mediante

yp(k) = mp(k - 1)6p, p = 1, ••• , np (2)

Obseírvese que se contempla la posibilidad de que cada sub-modelo local tenga retardos dp y ordenes nap y nbp diferentes a los otros submodelos. El caso mas simple consiste en que nap = nbp = 1Vp. Este caso corresponde a usar modelos locales lineales de primer orden mas tiempo muerto. Como es sabido este tipo de modelos son habitualmente usados en la praíctica industrial entre otros motivos por la sencillez de identificacion usando la curva de reaccion (Camacho and Bordons, 2004). Para este caso simple se tiene ademas que los distintos vectores mp para p = 1, ••• ,np colapsan en el mismo vector m(k - 1) = (y(k - 1), u(k - 1 - d)).

La ecuacion (2) puede usarse para realizar la prediccion local a un paso y de este modo obtener ys,p(k) = yp(k) + y£ p. Por otra parte, la prediccion a un paso para el modelo global se

denota mediante ys y se obtiene como media ponderada de las predicciones locales, de manera que

ys(k) = Y1 ^py'sp(k) p=i

Los pesos de ponderacion se calculan a partir del punto de operacion usando unas funciones de pertenencia (notese la analogía con los conjuntos borrosos). Las funciones de pertenencia p(z) se evaluan en el espacio (Z) de los puntos de funcionamiento z = (u¿, y£) segun la expresion:

p(z) = П aj(z)

siendo u(z) una funcion meseta que vale uno si z esta en el interior de un conjunto R que contiene al punto de funcionamiento zf y que cae suavemente al valor cero a medida que z se aleja de dicha region. En notacion matematica se tiene que

{1, si z < Zj <z

ip(zj — z), si zj < z ip(zj — z), si zj > z

siendo z = zf - Aj,z = zf + Aj.El tamaño de la meseta la cual la función a vale uno viene dado por 2 ALa función

■ (x) =

= e-ßx2

cae suavemente hacia cero con una pendiente

que depende del parámetro ß.

A partir de las funciones de pertenencia para cada punto de operacion se obtienen los pesos de ponderacion wp simplemente normalizando las funciones de pertenencia mediante

Áz) =

En= i ph(z)

de este modo se cumple que (z) < 1 para todo z y para todo p = 1, • •• , np, ademas la suma de las funciones de ponderación vale J2np= i wp(z) = 1 para todo z.

Una vez obtenidos los parametros de los submodelos mediante identificacion en torno a cada punto de operacion considerado, se puede utilizar las ecuaciones (1)-(6) para obtener la prediccion a un paso ys(k). Observese que basta con conocer la entrada y la salida de la planta en algunos instantes anteriores dependiendo de los ordenes nap, nbp y los retardos puros dp. Debido a la eleccion de la funcion de ponderacion la salida de cada submodelo p tiene un peso mayor sobre una region del espacio Rp c Z proxima al punto de operacion zf.

La prediccion multipaso con horizonte H implica obtener las predicciones del modelo global ys(k + j) con j = 1 hasta j = H usando las predicciones anteriores en lugar de los valores futuros, y por tanto desconocidos, de y.

3. ALGORITMO DE CREACION DE AMLL

A continuation se presenta el algoritmo propuesto para la creacion de AMLL. La version que se muestra contempla el caso mas general posible que es el que requiere menor intervention por parte del usuario. Hay que tener presente que algunos de los pasos del algoritmo pueden realizarse de forma diferente a la indicada si se dispone de information previa. Surgen de este modo atajos que pueden ahorrar tiempo al usuario y que permiten ademas la incorporation de conocimiento a priori.

3.1 Algoritmo básico

Se supone que se dispone de un conjunto de medidas realizadas sobre el sistema que se quiere modelar. Sean estas medidas los puntos (us(t), ys(t)) con t = 1, ••• , nm. Aunque resulte obvio conviene recordar que es preciso asegurarse de que el numero de medidas nm es suficientemente alto comparado con el numero de parametros que se van a identificar. En un apartado posterior se discutirá la influencia de las señales de entrada aplicadas al sistema. En particular interesa realizar un tratamiento de las mismas para eliminar falsas medidas, para acondicionar la media y varianza de las distintas señales, etc. Una vez satisfechos estos requisitos se puede utilizar el algoritmo que consta de los siguientes pasos:

Definir el espacio de los puntos de funcionamiento. En el caso simplificado que se esta presentando z = (y, u). En el caso de sistemas multivariable con ne entradas y ns salidas es preciso construir ns modelos de una sola salida teniendo cada uno de ellos un espacio zj (k) =

(yj,ui, • • •u„e),para j = 1, ••• ,ns.

■ Decidir el número de puntos de operación np.

■ Fijar los valores correspondientes a los puntos de operacion y sus regiones asociadas. De este modo se obtienen zf = (up ,yf) para p = 1, ••• , np. Es interesante hacer notar que los puntos zf deben caer sobre la característica estatica ye = f (ue) del sistema.

■ Construir las funciones de pertenencia. Estas funciones tendrán la forma general dada por la ecuacion (4). Los detalles particulares dependen de la forma en que se dividan las regiones del espacio Z. Por ahora se va a indicar un metodo simple dejando para mas adelante las posibles variaciones. La division en regiones se realiza indicando para cada una un centro y la anchura de la region asociada (parametros A de las funciones a). Conviene definir las siguientes variables auxiliares:

• Anchura de las regiones. A partir de la localizacion de los centros se pueden obtener los incrementos posibles Au,p y Ayp aceptables para cada region asociada a cada punto de operacion. Una vez hecho esto la region puede representarse mediante la caja

[up — Au,p, up + Au,p] x [yf — Ay,p, yf + Ay,p]

• Parámetro fi. Este parámetro permite que la funcion de pertenencia decrezca con mayor o menor rapidez a medida que el punto de trabajo se aleja del punto considerado para derivar el submodelo local. Es conveniente que exista cierto solape entre funciones de pertenencia de regiones adyacentes pues de este modo se consigue una interpolacion suave entre modelos.

■ Fijar los órdenes de los submodelos locales.

■ Calcular los retardos para cada submodelo. La forma más adecuada consiste en realizar experimentos especiales destinados a obtener estos valores como por ejemplo ensayos en escalon. En algunos casos los retrasos debidos al transporte pueden ser estimados mediante consideraciones físicas calculando el tiempo de residencia de fluidos. En ultimo lugar, esta tarea puede realizarse a partir de los datos usando tecnicas de correlacion. Sea cual sea el meítodo empleado el resultado de este paso es el conjunto de retardos para cada modelo local dp.

■ Identificar los submodelos locales obteniendo los vectores de parámetros 0p correspondientes a cada submodelo.

Mediante este algoritmo quedan fijados todos los paraímetros de la AMLL. Por otra parte el algoritmo necesita ciertos valores que el usuario debe proporcionar. Estos valores son llamados hiperparatmetros o parametros del algoritmo como np y El resto de valores pueden obtenerse a partir de los datos aunque tambieín existe la posibilidad de que el usuario desee fijar alguno de ellos como se comenta a continuacion.

3.2 Variantes del algoritmo

Ya se indico anteriormente que el algoritmo admite variaciones en algunos de sus pasos incluyendo entre estas la posibilidad de usar atajos. Se van a comentar en este punto algunas de las mas interesantes.

■ Numero de puntos de funcionamiento. En lugar de fijar np es posible determinar el error maíximo admisible para el modelo global y a partir de ahí obtener np mediante aproximaciones sucesivas. Esto es posible en cualquier dispositivo de caílculo numeírico actual. Es conveniente tener en cuenta que dadas unas medidas y un valor de np el error típico obtenido en la prediccion con un modelo formado por agrupacion de MLL es e(np). La funcion e(np) decrece siempre a medida que np aumenta. Por este motivo es preciso fijar un límite al numero de modelos locales. Alternativamente es posible utilizar un conjunto de medidas no usadas por el algoritmo y contrastar el error obtenido por el modelo con este nuevo conjunto con el previsto por e(np). Este procedimiento habitual en el entrenamiento de redes de neuronas es una forma simple de validacion (Reed and Marks, 1998).

■ Selección de regiones. La forma habitualmente usada en identificacion neuronal y borrosa consiste en la particion del espacio en regiones. Esta forma de proceder conlleva un numero excesivamente alto de regiones pues algunas de las particiones nunca son visitadas en la evolucion de la planta.

Con respecto a este problema ha de tenerse en cuenta que la formulacion externa conlleva una disminucion de la dimension del espacio a dividir, lo cual es una ventaja considerable.

El algoritmo presentado es la mas simple de varias opciones posibles. Consiste en dividir el intervalo de variacion de la señal de entrada en segmentos similares, calcular el valor de regimen permanente de la salida que le corresponde a cada extremo del segmento y considerar las regiones resultantes. Cabe indicar que, debido a que la ganancia estatica del sistema no es necesariamente constante en el espacio de trabajo, el procedimiento indicado puede dar lugar a regiones muy disimilares. Esto da lugar a la primera variante que pretende dividir mas finamente las zonas en las que la ganancia estatica varía mas acusadamente. Una forma de solucionar el problema consiste en dividir directamente la característica estatica en np regiones similares del espacio Z, asignando los centros de tales regiones a los valores zf.

Esta variante reduce ademas en cierta medida el problema de considerar regiones en las que nunca hay muestras. En efecto, al disponer las regiones sobre la característica estatica se esta favoreciendo las regiones donde hay mas densidad de muestras. El problema sin embargo no desaparece del todo y queda abierta la puerta a nuevas mejoras. En particular, las tecnicas de agrupamiento permiten seleccionar un numero predeterminado np de pun-

tos del espacio Z tales que representen la distribucion observada en las medidas (Principe et al., 1998). Estos puntos seleccionados pueden utilizarse como puntos de funcionamiento zf, la division en regiones se lleva a cabo posteriormente por crecimiento de regiones de Voronoi (Fritzke, 1994) tomando como centros los puntos de funcionamiento.

La figura 1 ilustra los tres procedimientos considerados. Se ha utilizado como ejemplo un hipotetico sistema dinamico de una entrada y una salida. En cada grafica el eje horizontal corresponde a la entrada (e) y el eje vertical a la salida (s). Se ha trazado con línea discontinua la característica estatica obtenida de observaciones experimentales. Para cada metodo de seleccion de regiones se muestra la frontera de cada region. Dicha frontera se ha calculado de forma que la zona interior produzca un valor mayor o igual al 90% para la funcion de pertenencia. De arriba a abajo se tienen los resultados obtenidos por division homogenea, por division basada en la característica estaítica y mediante regiones de Voronoi obtenidas por tecnicas de agrupamiento y realizadas mediante politopos. Tengase en cuenta que al numero de regiones mostrado no es indicativo de los meíritos relativos de cada meítodo. En general cabe esperar que los metodos mas elaborados produzcan menor numero de regiones proporcionando la misma capacidad de representacion, pues eviten las zonas no visitadas del espacio Z. En el ejemplo mostrado no se aprecia bien este hecho pues se trata de un caso con dimension mímima.

■ Forma de las regiones. En el algoritmo se ha considerado que las regiones son cajas en el espacio de puntos de funcionamiento. No existe ninguna restriccion para considerar otro tipo de forma para las regiones, como elipsoides o politopos. Tales regiones vendrían descritas por ||(z -zf )TM(z - zf )||n < A siendo n el índice de la norma utilizada n e [1, ro) y M una matriz de transformacion definida positiva.

■ Funciones de ponderación. El valor de ¡3 afecta a la forma de la funcion de pertenencia. Interesa que las funciones de pertenencia correspondientes a regiones adyacentes tengan cierto grado de solape. Solamente de este modo es posible producir ponderaciones de los submodelos locales que por un lado tengan en cuenta el punto de operacion y por otro lado consigan un cambio suave de las contribuciones de cada submodelo a medida que el punto de funcionamiento varía. Los resultados obtenidos por el algoritmo no cambian significativamente siempre y cuando los valores fijados para ^ no se acerquen a valores extremos que den como resultado regiones que no solapan o que solapan totalmente.

■ Identificación. La identificación de los submodelos locales puede llevarse a cabo utilizando cualquiera de las tecnicas que se emplean normalmente en aplicaciones industriales: curva de reaccion ante escalon o impulso, mínimos cuadrados, o estadísticamente mas elaborados como la identificacion con regularizadores (Tikhonov and Arsenin, 1977). De hecho cada uno de los modelos locales puede diseñarse con criterios distintos y luego agruparse con los demas en la forma ya indicada.

Otra posibilidad consiste en la identificacion simultanea de todos los parametros de los modelos de forma similar a los sistemas neuroborrosos.

(Ordenes de los modelos locales. Estos ordenes pueden fijarse de varios modos: si se dispone de conocimiento a priori es conveniente utilizarlo, por ejemplo, en la industria de procesos es frecuente que la dinamica se pueda describir mediante un modelo de primer orden mas retardo. En un caso general la mejor opcion es realizar la seleccion de ordenes al mismo tiempo que la identificacion usando para ello un criterio como el AIC de Akaike (Akaike, 1974). En cualquier caso es aconsejable fijar un valor maximo omax para los ordenes para evitar en lo posible problemas de sobrepárametrizaciOn. Este límite se convierte entonces en un nuevo hiperparametro del algoritmo.

Figura 1. Resultados típicos al aplicar diversos metodos de seleccion de regiones a un sistema de una entrada y una salida.

3.3 Capacidad de representación de las AMLL

Resulta interesante comparar las capacidades representativas de las AMLL frente a otro tipo de modelos.

Modelos con no linealidades concentradas Los modelos de Hammerstein, de Wiener y de Volterra son casos particulares de estos modelos de no linealidades concentradas, los cuales se componen de bloques lineales unidos a no linealidades concentradas en determinados puntos del modelo (entrada, salida, realimentacion) y es comun que puedan caracterizarse por funciones lineales a trozos. Por ello conviene analizar cada tipo de no linealidad de forma separada.

Zona muerta La zona muerta se representa facilmente mediante un punto de operacion cuyo modelo asociado tiene ganancia nula. La amplitud de la zona muerta se hace corresponder con la extension en el eje zu de la region asociada al modelo. Surge el problema de calcular la extension segun el eje zy de dicha region. Por un lado la salida en régimen permanente vale cero para valores de la entrada dentro de la zona muerta, este valor sin embargo conduciría a Ayp = 0 ya una region con volumen cero lo cual produciría una ponderacion

nula. Es preciso modificar el algoritmo de construccion de modelos para tener en cuenta este caso de forma separada y proporcionar un valor adecuado para Ay p, por ejemplo Ay p =

0,5(max(y)- mín(y)).

Saturacion La saturacion se representa tambien con facilidad si se escogen las regiones de modo que el valor de u que marca el comienzo de la saturacion sea el punto de separacion entre dos submodelos locales, uno de ellos previo a la saturacioín es un submodelo normal mientras que el otro tiene una region asociada infinita (no acotada por uno de los extremos) y representable por un modelo con ganancia nula. Es preciso nuevamente elegir un valor de Ay p = 0 para evitar que la regioí n tenga un volumen nulo. Para tratar adecuadamente las regiones infinitas es preciso modificar la forma de las funciones de pertenencia de modo que contemplen condiciones asimeítri-cas por encima o por debajo del punto de operacioí n.

Cambios de pendiente Si la no linealidad se representa mediante una funcion lineal a trozos con cambios bruscos de pendiente es posible obtener un submodelo lineal local cuya region asociada coincida con cada uno de los trozos lineales. De este modo la agrupacion de modelos locales puede representar con bastante exactitud modelos de este tipo. Es conveniente sin embargo modificar las funciones de pertenencia para que el cambio entre modelos sea abrupto, reflejando de este modo el cambio abrupto de pendiente. Para ello el solape entre regiones ha de tener un valor nulo lo cual se consigue con un valor de ^ infinito.

Transformaciones de Volterra Los modelos de Volterra usan no linealidades en la entrada (Gruber and Bordons, 2007). Es habitual que estas no linealidades sean funciones polinomi-cas como productos de variables, cuadrados, cubos, raíces cuadradas y sus combinaciones lineales. En ambos casos el tipo de no linealidad y su situacion (entrada, salida, realimentacion) viene sugerido por el conocimiento de los procesos que tienen lugar en la planta. Por ejemplo si se sabe que la salida y depende del cuadrado de la entrada entonces conviene introducir u2 como variable de entrada del modelo.

Este tipo de modelos pueden reproducirse mediante AMLL utilizando submodelos lineales en los paraímetros, como los representados por la ecuacion (1), e incorporando en el vector regresor m variables que son valores pasados de la entrada y la salida y tambieín productos de ellos como por ejemplo y(k -1) • u(k - 1), (u(k - 3))2, etc.

Histéresis Para poder representar correctamente los sistemas con histeresis es preciso usar una variable w que indique cual de las varias ramas marca la evolucion del sistema en un instante dado. Esta variable que depende de la historia pasada de la planta ha de ser identificada convenientemente mediante experimentos diseñados a tal efecto. La variacion de esta variable puede expresarse mediante condiciones del tipo:

- 1), si H(x(k - 1))=0 H(x(k - 1)), en caso contrario

siendo la función H discontinua dependiendo de un vector x que contiene un numero de valores pasados de u e y adecuado. La histeresis mas simple queda descrita de este modo utilizando la variable x = y y la funcion

( +1 si x > ymáx H(x) = < -1 si x < ymín

1 0 en caso contrario

Una vez obtenida, la variable w puede incorporarse al vector que define el punto de operacion de modo que z(k) = (u(k),y(k),w(k)). Conviene ademas modificar las funciones de pertenencia para dar cabida a regiones infinitas. Para ello basta con considerar condiciones asimetricas por encima o por debajo del punto de operacion.

Gracias a la inclusion de la variable w los modelos locales se pueden desarrollar de forma independiente para cada una de las ramas de la histeíresis.

Aproximadores estaticos Las representaciones neuronales estaticas y las proporcionadas por los conjuntos borrosos son equivalentes y por tanto pueden considerarse como dos formas distintas de formular y usar una clase superior dada por series truncadas de funciones base. Desde este punto de vista existen semejanzas entre las AMLL y dichas series que conviene analizar. La diferencia fundamental estriba en que las AMLL combinan la salida de elementos dinamicos como son los submodelos locales, mientras que las representaciones neu-roñales y borrosas se obtienen como combinacion de elementos estaticos actuando sobre el estado o sobre un vector de entrada que permite reconstruir la dinamica (Weigend and Gershenfeld, 1994).

Las series utilizan el mismo vector de entrada para realizar dos funciones diferentes: como regresor y como vector que define el punto de funcionamiento. Esta diferencia no es baladí pues el vector de entrada, como regresor que es, debe acomodar na + nb señales. Este numero es la dimension del espacio que se divide en regiones lo cual conduce a un numero potencial de regiones muy alto lo cual hace necesario introducir mecanismos simplificadores para la creacion de funciones de pertenencia en los conjuntos borrosos y de seleccion de bases en las redes de neuronas.

Las ventajas de las AMLL son varias: en primer lugar una mayor sencillez de uso pues incorporan muy pocas modificaciones al caso del modelado lineal ejemplificado por el modelo de primer orden mas tiempo muerto obtenido a partir de la curva de reaccion. Como consecuencia de lo anterior las AMLL plantean menores requisitos en terminos de cantidad de datos necesarios. La posibilidad de incorporar con facilidad conocimiento a priori sobre la planta es otra gran ventaja, conviene resaltar que este conocimiento a priori en un ambiente industrial puede referirse a ganancias, tiempos de respuesta, tipos de amortiguacion de la respuesta, etc. que son faícilmente interpretables en teírminos de los paraímetros de los MLL.

Ademas de estas ventajas obvias las AMLL sobresalen en un aspecto: su capacidad para utilizar submodelos de distintos (ordenes y retardos para cada punto de funcionamiento. El paradigma neuronal/borroso en estos casos postula la necesidad de incluir como entradas potenciales del modelo todos los valores pasados que puedan ser necesarios para todos los puntos de funcionamiento. En el caso de plantas que exhiben cambios en la dinamica (retardos, tiempos característicos, etc.) se necesita que el vector de entrada del sistema neuronal o borroso tenga mas de na + nb variables. Para justificar esta afirmacion baste pensar en un modelo que deba tener en cuenta un retardo variable entre 1y5 periodos de muestreo, las señales

a tener en cuenta en tal caso son na + nb + 4. El numero de parametros ajustables es proporcional al producto del numero de entradas por el numero de bases (Yuan and Fine, 1998), por lo que dicho numero resulta ser tambien elevado y de ahí la necesidad de un gran numero de datos para el entrenamiento. En el caso de las AMLL cada submodelo local puede ser tan simple como la situacion permita, utilizando ordenes y retardos propios, de este modo la agrupacion no se complica innecesariamente. Ademas cada submodelo puede identificarse de forma separada utilizando una cantidad de datos moderada.

La comparacion no sería justa si no se indicasen algunas desventajas de las AMLL. Es por ello preciso indicar que en situaciones donde la abundancia de datos no es un problema, las AMLL producen resultados inferiores a los aproximadores neuronales y borrosos. Esto es debido a que los grados de libertad que ponen a disposicion del usuario son usualmente y conscientemente desaprovechados: por un lado para intentar escapar del fenomeno de la sobrepárámetrizaciOn y por otro para facilitar la inclusion de conocimiento a priori y mantener cierta relacion entre los parametros ajustables y características de la planta como retardos, ganancias, etc. Los sistemas con aprendizaje por su parte prescinden de mantener dicha relacion y optimizan durante el entrenamiento todos los paraímetros ajustables de forma que se produzca un mejor acuerdo entre observaciones y las salidas del modelo en el conjunto de entrenamiento.

Redes recurrentes Las redes de neuronas artificiales que contienen lazos internos de realimentacioon son sistemas dinamicos en sí mismos. Por este motivo la capacidad para representar dinaímica es excelente y no sufren los inconvenientes citados en el punto anterior para las redes acíclicas (estaticas). La gran flexibilidad que poseen para representar dinaímicas diversas es sin duda superior a la de cualquiera de los meítodos anteriormente descritos, incluyendo las AMLL. Pero no todo son ventajas, como inconvenientes cabe citar que el entrenamiento requiere una mayor cantidad de datos y que no es faícil incorporar conocimiento a priorístico como: valores conocidos de ganancias, tiempos de residencia, constantes de tiempos, etc.

3.4 Consideraciones practicas

A la hora de utilizar el algoritmo de identificacion propuesto es preciso tener en cuenta algunos factores que pueden tener gran influencia en el resultado.

Integradores. Si se sospecha que la dinamica que liga u e y contiene integradores puros en serie con el bloque que contiene la dinamica no lineal conviene eliminarlos en primer lugar. Para ello basta con tomar como salida la señal ^ en lugar de y, siendo v el numero de integradores puros colocados en serie. Retardos puros. Los retardos puros son tenidos en cuenta por los modelos locales lineales, pero han de ser identificados previamente. Existe la posibilidad de usar el algoritmo repetidamente variando en cada prueba el retardo puro y seleccionando el valor que proporciona mejores resultados. Esta practica no se recomienda pues puede dar lugar a que se obtengan modelos demasiado ajustados a unos datos concretos y con escasa capacidad de generalizacion. Modelos multivariables. Los modelos multivariables pueden agruparse del mismo modo que los que constan de una sola entrada y una sola salida. La mayor complejidad proviene de la gestion de las regiones de operacion cuyo numero se

multiplica al incrementarse la dimensión de los espacios de entrada y/o salida. Para evitar que el nUmero de regiones de operacion sea excesivo se puede utilizar un algoritmo de agrupamiento. Este algoritmo proporciona los centros de las regiones a partir de datos tomados de la planta. Estos centros se situan cerca de los datos observados, de forma que las zonas sin datos no reciben ningun centro. De este modo se reduce bastante el numero de regiones.

Selección de órdenes. El criterio de Akaike permite seleccionar automaticamente los (ordenes de los MLL a partir de datos observados de la planta. Es conveniente sin embargo poner límite superior a los ordenes pues la seleccion hecha por el algoritmo que usa el criterio de Akaike depende de los datos suministrados. En ocasiones estos datos son poco variados por lo que el criterio se ve empujado a seleccionar ordenes altos para ajustarse a la realizacion particular del ruido presente en dichos datos.

Sóbreparametrización. Ademas de los ordenes de los MLL es preciso tener en cuenta el numero de modelos que forman la agrupacion. Un gran numero de modelos puede dar como resultado una agrupacion sobreparametrizada cuya capacidad de generalizacion es pobre a pesar de que representa bien el comportamiento de la planta con los datos usados para identificar.

Excitación de las señales. El desarrollo de los modelos agregados conlleva una identificacion en torno a un punto de trabajo para cada submodelo local. Esta identificacion utiliza datos obtenidos, en el mejor de los casos, en bucle abierto con una señal suficientemente excitadora. El contenido en frecuencia de esta señal afecta a los resultados obtenidos en la identificacion. De este hecho se derivan dos problemas potenciales: el primero consiste en garantizar que la excitacion es suficiente para los submodelos locales, el segundo surge en el uso posterior de los modelos que puede producirse en situaciones distintas, posiblemente en bucle cerrado, por lo que se ven sometidos a señales de un contenido en frecuencia diferente.

Regularización. La regularizacion es una forma de introducir un sesgo en la identificacion. Frecuentemente se utiliza como una forma de evitar la sobreparametrizacion penalizando la complejidad de los modelos (Reed and Marks, 1998). En el contexto del control de procesos industriales la regu-larizacion puede tambien usarse para obtener modelos que proporcionan buenos resultados en la prediccion multipaso o en simulacion. Tengase en cuenta que la tecnica habitual de identificacion consiste en seleccionar los parámetros que minimizan el error a un paso. Este error en muchos casos es minimizado dando gran peso al teírmino autorregresivo. Esto ocurre por ejemplo cuando los datos tienen poca variabilidad, o cuando el tiempo de muestreo es bajo respecto a los tiempos característicos de la planta. Como consecuencia los modelos resultantes pueden ser poco adecuados para la prediccion multipaso. En tales casos la adicion de terminos regularizadores permite obtener submodelos mas adecuados al uso posterior. Alternativamente se puede presentar este problema como un prefiltrado de los datos con relevancia para control (Rivera et al., 1992), (Schwartz and Rivera, 2006).

Estas consideraciones han sido tenidas en cuenta a la hora de

realizar las aplicaciones del meítodo de creacioín de AMLL que

se muestran a continuacion.

4. CASOS PRACTICOS

A fin de ilustrar la aplicacioín del meítodo propuesto y de analizar los resultados que produce se han seleccionado dos casos praícticos: un sistema simulado mediante una ecuacioín en diferencias y el sistema de captacion de una planta real de produccion de frío a partir de energía solar. Estos dos ejemplos prueban la posibilidad de usar el metodo como tecnica simplificada aplicable en la industria.

4.1 Planta de Narendra

La llamada planta de Narendra ha sido usada como banco de pruebas de metodos de identificacion y control desde su publicacion en (Narendra and Parthasarathy, 1990). La dinamica es determinista y marcadamente alejada del caso lineal y viene dada por

ykVk-íVk-2Uk-i(yk-2 - 1) + Uk

Vk+1 =-T-—ñ-;—Ô- (7)

1+ y2-i + yk-2

donde y representa la salida del sistema y u la entrada.

Como ilustración del comportamiento no lineal de esta planta vease la figura 2 que muestra la respuesta de la planta ante cambios en escalon en la entrada. Puede observarse que de un punto de funcionamiento a otro hay cambios en la ganancia estatica, en la rapidez de la respuesta y en la amortiguacion de la misma.

JV»--» u

ir8—1

20 40 60 80 100 120 140 160 18 muestras

Figura 2. Entrada y salida de la planta de Narendra para un experimento en bucle abierto en el que se visitan distintos puntos de funcionamiento.

Señales de entrada Se utilizan señales del tipo u(t) = Aidsen(widt) una onda sinusoidal con una amplitud y frecuencia dada por la pareja (AidUn experimento de identificacion consistirá en someter al sistema a varias señales de este tipo tomando las parejas (Aid, mediante muestreo aleatorio con reemplazamiento del intervalo [0,1] x [0,20]. De este modo se asegura el barrido en frecuencia y amplitud que permite cubrir las posibles zonas de trabajo.

Puntos de operación y regiones Para las pruebas se utiliza el algoritmo baísico siendo el espacio de los puntos de funcionamiento es z = (u, y). Se va a considerar un numero np variable a fin de mostrar su efecto sobre el modelo obtenido. A partir de un np dado se empleara el metodo de seleccion de

regiones mas simple posible consistente en la division a partir de la característica estatica.

A fin de ilustrar el proceso, en la figura 3 se muestra la superficie de pmax(z) = máx pi(z). Las mesetas que se observan corresponden a las regiones asociadas Rp de cada punto de operacion. Dichos puntos coinciden con los centros de las mesetas y se situan sobre la característica estática de la planta.

de la salida, de manera que las sucesivas predicciones se van apoyando en predicciones pasadas.

El conjunto de datos no utilizados previamente se ha seleccionado de forma que se visitan amplias zonas del espacio de trabajo y en particular zonas diferentes a las usadas en la identificacion. En la grafica superior de la figura 4 se muestra el error en la prediccion a un paso. Puede verse que el menor error se obtiene para modelos generados por el algoritmo al utilizar omax=3. En la parte inferior se muestra el error en simulacion. En este caso el fenomeno de sobreparametrizacion se hace patente pues a partir de np = 13 las AMLL que usan modelos de orden mayor producen un error mayor.

Figura 3. Superficie correspondientes a pmax (z) obtenidas por el algoritmo de creacion de AMLL para np = 3 y np = 7 en la planta de Narendra.

8 10 12 14

Puntos de operación

Identificación Por un procedimiento simple de mínimos cuadrados y utilizando datos obtenidos de la simulacion de la planta mediante la ecuacion (7) se obtienen modelos locales para distintos puntos de operacion. En cada caso los datos proporcionados se dividen en dos conjuntos: de entrenamiento (CE) y de prueba (CP). Se ha tomado d = 0 y np variable a fin de estudiar la influencia de este hiperparametro. Los valores na y nb que definen los ordenes de los submodelos se han estimado a partir de los datos usando el criterio de Akaike, aunque se ha impuesto la limitacion de un orden maximo (omOx).

Resultados Para cada pareja de hiperparametros (np, omáx) el algoritmo ha dado como resultado una coleccion de MLL. A fin de poner a prueba la validez de la AMLL resultante se ha medido el error de generalizacion en la prediccion a un paso y en simulacion. Este error es la media cuadratica de los errores obtenidos en un conjunto de datos no usado previamente. La diferencia entre error de prediccion y simulacion es que en el primer caso se usan las medidas reales de la salida disponibles hasta k - 1 para producir la prediccion para el instante k. En el caso de la simulacion solamente se usan los valores iniciales

Figura 4. Error de generalizacion de las AMLL obtenidas con el algoritmo propuesto para la planta de Narendra en prediccion a un paso (grafica superior) y en simulacion (gráfica inferior). Los valores de los hiperparametros se indican en el eje horizontal (np) y en las distintas curvas (omáx).

Puede observarse la mejor adecuacion de los modelos locales para valores altos de np = 5 respecto a valores menores, como era de esperar debido a que la region en la que operan es menor cuanto mayor es el numero de modelos locales.

4.2 Aplicacion a una planta de frío solar

La planta de production de frío mediante energía solar se encuentra situada en los laboratorios de la Escuela Superior de Ingenieros de la Universidad de Sevilla. Actualmente esta siendo utilizada como banco de pruebas para investigaciones sobre control híbrido dentro del marco de la Red de Excelencia HyCon. Ademas ha sido objeto de estudios en diferentes investigaciones: (Ntíüez-Reyes et al., 2005; Niíñez-Reyes, 2007; Zambrano, 2007).

irr tex

Figura 5. Fotografía y diagrama simplificado de la planta de produccion de frío mediante energía solar incluyendo los captadores (C1 a c4), los depositos auxiliares (D1 y D2) y la maquina de absorcion (MA). En el recuadro de línea de trazos se ha enmarcado el circuito de captacion.

La planta solar se puede analizar como una instalacion de aire acondicionado que usa energía termica para producir aire frío. Los principales componentes son los siguientes:

■ Sistema solar o de captacion de baja temperatura, compuesto por un conjunto de colectores solares (C1 a C4), con una superficie de captacion de 151 m2 y una potencia nominal de 50 kW.

■ Sistema de almacenamiento, compuesto por dos depósitos acumuladores (D1, D2) de 2,500 m3 cada uno interconec-tados entre sí.

■ Sistema de aporte auxiliar de energía, consistente en una caldera de gas natural (CGN).

■ Sistema de refrigeración, compuesto por una máquina de absorcion (MA) de BrLi con una potencia de 35 kW

La planta solar permite diferentes configuraciones en las que los sistemas que la componen pueden funcionar de manera independiente. A efectos de modelado puede dividirse en varios subsistemas: captacion, almacenamiento, aporte auxiliar de energía, maquina de absorcion y carga. Cada subsistema puede modelarse separadamente pues se dispone de medidas de muchas variables intermedias: temperaturas y caudales fundamentalmente. De esta forma cada subsistema es tratado como un modulo independiente cuyo modelo puede ser creado y validado con mayor facilidad. Para las pruebas de las AMLL se va a considerar el sistema de captacion de energía solar.

Es de resaltar que la construccion de modelos para este tipo de plantas tiene un gran interés pues mediante un control adecuado

se pueden lograr mejoras en el rendimiento energético de las mismas (Rubio et al., 2006). Una de las estrategias de control que mejor se adaptan a esta situación es el control predicti-vo (Camacho and Bordons, 2004; Francisco and Vega, 2006; García-Nieto et al., 2008) pues permite optimizar las señales de control o las consignas para los controladores locales (Cirre et al., 2004) de forma que se mejore el rendimiento final teniendo en cuenta al mismo tiempo restricciones de operacioín.

Descripción La figura 5 muestra un diagrama simplificado de la planta de produccion de frío. La zona dentro del recuadro es el circuito de captacion de calor, para el cual se han indicado las variables de interés:

■ Caudal de agua que circula por los colectores en l/h. Se utilizaraí un valor normalizado obtenido dividiendo por 8000. Se emplea la abreviatura cau.

■ Irradiación solar en kW¡m2. Se utilizará un valor normalizado obtenido dividiendo por 1000. Se emplea la abreviatura irr.

■ Temperatura exterior en °C. Se utilizará un valor normalizado obtenido dividiendo por 100. Para nominar a este valor normalizado se utilizara la abreviatura tex.

■ Temperatura de entrada de colectores en °C. Nuevamente se normaliza dividiendo por 100, empleaíndose la abreviatura tec.

■ Temperatura de salida de colectores en °C. También se divide por 100 para normalizar y la abreviatura empleada es tsc.

■ Incremento de temperatura en los colectores en °C. Esta variable no se mide directamente sino que ha de calcularse a partir de las temperaturas de entrada y salida de colectores. Se usara un valor normalizado obtenido como itc(k) = 3(tsc(k) — tec(k — d)) siendo d el numero de periodos de muestreo que tarda el agua en recorrer los colectores para un caudal medio.

Datos Los datos consisten en la evolucion de las variables de interés tomadas en ensayos realizados durante la operacion normal de la planta mas algun otro realizado a proposito para la identificacion. Estos ensayos incluyen condiciones de operacion diversas: en lazo abierto y cerrado y con la planta funcionando en distintos modos: recirculacion, produccion directa, produccion con deposito, etc. Los datos han sido normalizados, tratados para eliminar falsas medidas y remuestreados a 20s. La figura 6 muestra la evolucion típica de las variables en un día sin nubes correspondiente al 20 de Marzo de 2006.

En total se ha contado con datos correspondientes a 42 días de Marzo a Octubre de 2006. Los días se han repartido de manera aproximadamente uniforme para dar lugar a tres conjuntos de datos habitualmente usados en identificacion. El conjunto de entrenamiento (CE) se utiliza para adaptar los modelos. El conjunto de prueba (CP) se utiliza para elegir los hiperparaímetros. Finalmente el conjunto de validacion (CV) no es usado en modo alguno durante la construccion de modelos y sirve para calcular la capacidad de generalizacion de la AMLL resultante.

Puntos de operación y regiones En primer lugar se procede a estimar los puntos de régimen permanente. Esta tarea no puede realizarse con experimentos de manera faícil pues algunas variables no son manipulables como la irradiacion. En lugar de eso se ha utilizado un metodo para hallar puntos de régimen estacionario o cuasi-estacionario a partir de experimentos realizados en distintas condiciones de operacion. El metodo consiste

15 16 hora local

0.4 0.5 cau

Figura 6. Evolución típica de las variables del captador de la planta de frío solar. Se representan datos normalizados tomados el 20 de Marzo de 2006.

simplemente en buscar en los archivos intervalos temporales donde las variables apenas modifican sus valores.

A partir de los valores de régimen permanente se eligen los puntos de funcionamiento que dan lugar a los MLL. El espacio considerado es z = (cau, irr, itc) El metodo de seleccion de regiones consiste en la division homogenea del intervalo de variacion de las señales de entrada, colocando un punto de funcionamiento tínicamente en las regiones que contengan datos. A modo de ejemplo se incluye la figura 7 que ha sido realizada para un numero de submodelos np = 17.

Identificación La identificacion se lleva a cabo varias veces variando los hiperparametros del algoritmo para de este modo poder extraer resultados comparativos. En todos los casos se ha utilizado solamente el CE para la identificacion y el CP para dirigir la busqueda de los mejores hiperparametros.

Antes de proceder a la identificacion ha sido necesario calcular unos valores adecuados para los retardos puros para cada sub-modelo local. Se ha elegido para ello un procedimiento simple consistente en la inspeccion visual de los datos disponibles. En algunos de los experimentos se han hallado cambios bruscos en variables de entrada que producen un efecto en la salida cierto tiempo despues. De este modo se ha llegado a establecer unos retardos que dependen fundamentalmente del caudal.

Los (ordenes na, nb y nc de los submodelos locales han sido obtenidos a partir de los datos, pero fijando un valor maximo omax a fin de poder realizar comparaciones.

Resultados En primer lugar se presentan los resultados obtenidos en prediccion a un paso y en simulacion para el caso np = 17 y omax= 2, tomando los datos de un día perteneciente al CV. En la figura 8 se muestra, en la parte superior la evolucion de las entradas, en la parte central la salida real y la salida dada por la AMLL, finalmente, en la parte inferior se ha dibujado la evolucion de los errores. Puede verse que el error en simulacion de la AMLL raras veces supera los 5 grados Celsius y cuando lo hace es de forma puntual. Tengase en cuenta que el uso de estos modelos no suele ser la simulacion sino la prediccion en un horizonte de 1 a varias decenas de instantes de muestreo. En tales casos el error es bastante menor y totalmente adecuado para los requisitos de control de la planta de produccion de frío.

1;. O

' : v X ■:;; ■ x ■ :: ' tí xJ"

0 - V '' N ° xx x JA & i

* * .. K

X X yO X p :s O

5 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0. cau

0 -0.2 -0.4

- :-.:■

.........:......O X'.....

0.6 0.8

Figura 7. Puntos de funcionamiento seleccionados (círculos) y algunos valores medidos en régimen cuasi-estacionario sobre la planta (cruces) mostrados en las tres proyecciones bidimensionales del espacio (cau, irr, itc).

Tabla 1 Error cuadrático medio de simulación obtenido por las AMLL con np y omáx fijados con el CP

np omáx ECMqe ECMgp ECMqv 12 3 2.5241 2.8670 2.8443 17 3 2.1563 2.5730 2.6918 26 5 2.1464 2.6056 2.6466 36 1 2.3732 2.7267 2.9941

A fin de comprobar la influencia de los hiperparametros en el resultado de la identificacion se han realizado pruebas exhaustivas variando el numero de submodelos np y del orden maximo omax. En ellas se han dividido los datos disponibles en particiones de 200 muestras. Sobre cada particion se ha medido el error en simulacion proporcionado por la AMLL. Finalmente se ha calculado el error cuadratico medio para todas las particiones. En la tabla 1 se muestran los resultados obtenidos.

Puede observarse que incluso para un numero de puntos de funcionamiento moderado se obtienen resultados adecuados para el control de la planta pues una desviacion de dos o tres

hora local

Figura 8. Resultados obtenidos en prediccion a un paso y en

simulacion en un día del CV. grados en la prediccion a largo plazo no es significativa. La capacidad de generalizacion queda tambien patente al observar que los errores en CV no son muy diferentes a los obtenidos para el CP.

5. CONCLUSIONES

El algoritmo propuesto para la creacion de AMLL utiliza exclusivamente señales instantáneas de entrada y salida del sistema. Se ha mostrado que esta eleccion simplifica algunos aspectos de la creacion del modelo, manteniendo intacta la capacidad de representacion. El analisis realizado en cuanto a capacidad de representacion revela que las AMLL pueden usarse para modelar plantas como otros metodos como las series de Volterra o los modelos de Hammerstein. La comparacion realizada con las redes de neuronas artificiales y los modelos basados en conjuntos borrosos permite discernir en queí situaciones pueden esperarse mejores resultados por uno u otro metodo. En particular se ha

argumentado que para la práctica industrial las AMLL plantean menores requisitos prácticos al tiempo que facilitan la inclusion de conocimiento apriorístico.

Finalmente el metodo propuesto ha sido probado en dos escenarios: una planta simulada monovariable y una planta real con varias entradas. En este segundo caso se ha presentado la dificultad añadida de tratarse de una planta con retrasos variables en función del punto de operación. Los resultados mostrados indican que las AMLL son una posibilidad a tener en cuenta.

AGRADECIMIENTOS

Este trabajo ha sido financiado parcialmente por la Comision de la Comunidad Europea a traves del proyecto de investigation HYCON FP6-511368.

REFERENCIAS

Akaike, H. (1974). A new look at the statistical model identification. IEEE Trans. on Automatic Control AC-19(5), 716723.

Alamo, T., A. Cepeda, D. Limon and E. F. Camacho (2006). A new concept of invariance for saturated systems. Automatica 42(9), 1515-1521. Bellman, R. E. (1957). Dynamic Programming. Princeton University Press,. Princeton. Bontempi, G. and M. Birattari (2005). From linearization to lazy learning: A survey of divide-and-conquer techniques for nonlinear control. International Journal of Computational Cognition 3(1), 56-73. Camacho, E. F. and C. Bordons (2004). Control predictivo: Pasado, presente y futuro. Revista Iberoamericana de Automatica e Informática Industrial 1(3), 5-28. Cirre, Cristina M., Loreto Valenzuela, Manuel Berenguel and Eduardo Camacho (2004). Control de plantas solares con generation automatica de consignas. Revista Iberoamericana de Automatica e Informatica Industrial 1(1), 50-56. de Prada, C. (2004). El futuro del control de procesos. Revista Iberoamericana de Automatica e Informatica Industrial 1(1), 5-14.

Foss, B. A., T. A. Johansen and A. V. Sorenson (1995). Nonlinear predictive control using local models - applied to a batch fermentation process. Control Engineering Practice 3(3), 389-396.

Francisco, M. and P. Vega (2006). Diseño integrado de procesos de depuracion de aguas utilizando control predictivo basado en modelos. Revista Iberoamericana de Automatica e Informatica Industrial 3(4), 88-98. Fritzke, B. (1994). Growing cell structures - a self-organizing network for unsupervised and supervised learning. Neural Networks 7(9), 1441-1460. García-Nieto, S., M. Martínez, X. Blasco and J. Sanchis (2008). Nonlinear predictive control based on local model networks for air management in diesel engines. Control Engineering Practice.

Ghraizi, R. A., E. Martínez, C. de Prada, F. Cifuentes and J.L. Martinez (2007). Performance monitoring of industrial controllers based on the predictability of controller behavior. Computers and Chemical Engineering 31, 477-486. Gruber, J. K. and C. Bordons (2007). Control predictivo no lineal basado en modelos de volterra. aplicacion a una planta piloto. Revista Iberoamericana de Automatica e Informatica Industrial 4(3), 56-73.

Hunt, K. J., T. A. Johansen, J. Kalkkuhl, H. Fritz and Th. Gottsche (2000). Nonlinear speed control for an experimental vehicle using a generalized gain scheduling approach. IEEE Transactions on Control Systems Technology 8(3), 381-395.

Johansen, T. A. and B. A. Foss (1993). Constructing narmax models using armax models. International Journal of Control 58(5), 1125-1153.

Johansen, T. A. and B. A. Foss (1995). Identification of nonlinear system structure and parameters using regime decomposition. Automatica 31(2), 321-326.

Johansen, T. A. and B. A. Foss (1998). ORBIT-operating regime based modelling and identification toolkit. Control Engineering Practice 6(10), 1277-1286.

Johansen, T. A., K. J. Hunt and I. Petersen (2000). Gain-scheduled control of a solar power plant. Control Engineering Practice 8(9), 1011-1022.

Moody, J. and C. Darken (1989). Fast learning in networks of locally-tuned processing units. Neural Computation 1, 281294.

Murray, R. and T. Johansen (1997). Multiple Model Approaches to Modelling and Control. Taylor and Francis. UK.

Narendra, K. S. and K. Parthasarathy (1990). Identification and control of dynamical systems using neural networks. IEEE Transactions on Neural Networks 1, 4-27.

Nunez-Reyes, A. (2007). Contribuciones al Control de Plantas de Production de Frío Mediante Energía Solar. PhD thesis. Departamento de Ingeniería de Sistemas y Automatica. Escuela Superior de Ingenieros. Universidad de Sevilla.

Nunez-Reyes, A., J.E. Normey-Rico, C. Bordons and E.F. Camacho (2005). A smith predictive based MPC in a solar air conditioning plant. Journal of Process control 15-1, 1-10.

Principe, J. C., L. Wang and M. A. Motter (1998). Local dynamic modeling with self-organizing maps and applications to nonlinear system identification and control. Proceedings ofthe IEEE 86(11), 2240-2257.

Reed, R. D. and R. J. Marks (1998). Neural smithing. MIT press,. Cambridge.

Rivera, D. E. (2007). Una metodología para la identification integrada con el diseño de controladores imc-pid. Revista Iberoamericana de Automatica e Informatica Industrial 4(4), 5-18.

Rivera, D. E., J. F. Pollard and C. E. Garcia (1992). Control-relevant prefiltering: a systematic design approach and case study. IEEE Transactions on automatic control 37(7), 964974.

Rodriguez, M., D. Sarabia and C. de Prada (2007). Hybrid predictive control of a simulated chemical plant. In: Taming Heterogeneity and Complexity of Embedded Control (F. Lamnabhi-Lagarrigue, S. Laghrouche, A. Loria and E. Panteley, Eds.). pp. 617-634. ISTE.

Rubio, F. R., E. F. Camacho and M. Berenguel (2006). Control de campos de colectores solares. Revista Iberoamericana de Automatica e Informatica Industrial 3(4), 26-45.

Sarabia, D., C. De Prada, S. Cristea and R. Mazaeda (2006). Hybrid model predictive control of a sugar end section. Computer Aided Chemical Engineering 21-12, 1269-1274.

Schwartz, J. D. and D. E. Rivera (2006). Control-relevant demand modeling for supply chain management. In: Proceedings of the 14th Annual IFAC Symposium on System Identification. Newcastle, Australia. pp. 267-272.

Tikhonov, A.N. and V. Y. Arsenin (1977). Solutions of ill-posed problems. V.H. Winston and sons,. Washington.

Weigend, A.S. and N.A. Gershenfeld (1994). Time Series Prediction. Addison-Wesley.

Yuan, J.L. and T.L. Fine (1998). Neural network design for small training sets of high dimension. IEEE Transactions on Neural Networks 9, 266-380.

Zambrano, D. (2007). Modelado y control predictivo híbrido de una planta de refrigeration solar. PhD thesis. Departamento de Ingeniería de Sistemas y Automatica. Escuela Superior de Ingenieros. Universidad de Sevilla.