• Nem Talált Eredményt

A csúszó id®horizont módszer

In document Optimális irányítások (Pldal 166-173)

5. Optimalitás és stabilitás kapcsolata 143

5.4. A csúszó id®horizont módszer

Model predictive control is the only advanced control technology that has made substantial impact on industrial control problems."

D.Q. Mayne, European J. Control, 2001 Ebben a pontban egy rövid áttekintést adunk egy, rendszerek stabilizá-lására szolgáló módszerr®l, ami kb. az utolsó 20 évben alakult ki, és napja-inkban is intenzív kutatás tárgya. Ezt a módszert szokás csúszó id®horizont módszernek vagy model pedictive control-ak is nevezni. Az el®z®ekben lát-tuk, hogy egy végtelen id®horizonton tekintett megfelel® optimális irányítási feladat megoldása lehet®séget ad stabilizáló visszacsatolás kiszámítására. A gyakorlati megvalósítás során azonban több nehézség is felmerülhet:

Nemlineáris rendszerek esetén a stacionárius HJB egyenletet kellett meg-oldani, ami egy nemlineáris parciális dierenciálegyenlet. Ennek megoldása (még közelít® numerikus eljárással is) nehéz, s®t a sima megoldás létezése is problematikus.

Lineáris id®invariáns rendszerek esetén az LQ feladat megoldása teljesen rutin jelleg¶, ha azU =Rm, de nem alkalmazható, haU valódi részhalmaza Rm-nek. A nehézségek fokozottan jelentkeznek, ha a rendszer nemlineáris, és X ⊂Rn, U ⊂Rm valódi részhalmazok. A csúszó id®horizont módszer annak köszönheti széleskör¶ alkalmazását, hogy képes az állapotra és a vezérlésre vonatkozó korlátozások kezelésére, ami a gyakorlatban nagyon fontos.

Gyakorlati alkalmazás szempontjából szintén nehezebb a dolgunk, ha a rendszer lineáris ugyan, de az együtthatók id®t®l függ®ek.

A csúszó id®horizont módszer (erre az NMPC bet¶szóval szoktak hivat-kozni, ami a Nonlinear Model Predictiv Control rövidítése) lényege abban áll, hogy egy darab végtelen id®intervallumon tekintett optimalizálási feladat he-lyett véges id®intervallumon tekintett optimalizálási feladatok egy sorozatát oldjuk meg.

Az alapgondolathoz az ötletet az emberi színjáték adja, amelynek sze-repl®i a következ®k:

- cél, - korlátok,

- el®re megtervezett optimális stratégia, - tervezési id®horizont (Tp),

- lépésköz, miel®tt a dolgokat felülvizsgálnánk, vagyis egy kontroll hori-zont (Tc).

Fogalmazzuk ezt meg matematikai terminológiával!

Tekintsük az alábbi rendszert:

x(t) =. f(x(t), u(t)), x(0) =x0, t ∈[0,∞)⊂R (5.28) vagy

x(t+ 1) =f(x(t), u(t)), x(0) = x0, t∈[0,∞)∩Z (5.29) ahol f :Rn×Rm 7→Rn ésf(0,0) = 0.

x(t)∈ X, u(t)∈ U, t≥0, (5.30) 0∈intX, 0∈intU.

Itt intY azY bels® pontjainak halmazát jelöli.

A korábbiakhoz hasonlóan az (5.28) vagy (5.29) egyenlet egy adott u(.) megengedett vezérléshez és x(t0) =x0 kezdeti feltételhez tartozó megoldását jelölje ξ(.) =x(.;t0, x0, u). Tekintsük a

J(t0, t1, u, x0) = G(ξ(t1)) +Q(t0, t1,u, x0), (5.31)

Q(t0, t1,u, x0) =

t1

Z

t0

f0(ξ(t), u(t))dt (5.32)

Q(t0, t1,u, x0) =

t1−1

X

t=t0

f0(ξ(t), u(t)) (5.33) célfüggvényt, ahol

f0 :Rn×Rm 7→R+, G:Rn 7→R+,

f0(0,0) = 0, G(0) = 0, továbbá van olyan α1 ∈ K, hogy f0(x, u)> α1(kxk) minden(x, u)6= (0,0)esetén (ez a kikötés enyhíthet®), és az összes el®forduló függvények elegend®en simák. LegyenM1 =Xf ⊂Rnadott halmaz, amelyre 0∈ Xf, és vegyük hozzá a feladat kit¶zéséhez a

ξ(t1)∈ Xf (5.34)

végállapotra vonatkozó korlátozást.

Hivatkozzunk P (t0, t1, x0) problémaként aJ célfüggvény (5.28), illetve (5.29), valamint (5.30) és (5.34) feltételek melletti minimalizálásának felada-tára.

A csúszó id®horizont módszer esetén ilyen feladatok sorozatát fogjuk meg-oldani a következ® módon.

Legyent az aktuális id®pont, x=x(t) az aktuális állapot.

Válasszunk egyTp tervezési id®horizontot ésTc lépésközt.

Megoldandó aP(t, t+Tp, x) probléma.

Az algoritmust sematikusan az 5.3 ábra szemlélteti.

jövo

aktuális idopont" aktuális idopont"

állapot x ( ) vez

érlés u( )

5.3. ábra. Csúszó id®horizont módszer sémája

Minthogy a P(t, t+Tp, x) probléma id®invariáns, helyette minden egyes t id®pillanatban tekinthetjük a P(0, Tp, x) problémát. Észrevesszük azt is, hogy u(.) függ az x(t)-tól, így az alkalmazott vezérlés (tágabb értelemben) egy visszacsatolt vezérlés.

Ahhoz, hogy ez az eljárás olyan rendszert eredményezzen, ami (legalább lokálisan) aszimptotikusan stabilis az origó körül (röviden (LAS)), a feladat paraméterei nem választhatók akárhogy. Mit tudunk befolyásolni? A Tp és Tc id®tartamok mellett a

Xf - végállapot korlátozást, G - megválasztható függvényt, f0 - megválasztható függvényt.

A választástól függ®en a csúszó id®horizont módszer különböz® változataihoz jutunk.

Ismerkedjünk meg el®ször a diszkrét idej¶ esetre a módszer egy változa-tával!

Bolza-típusú csúszó id®horizont módszer diszkrét idej¶ rendszerek-re

Foglalkozzunk az (5.29) és az (5.31), (5.33) összefüggésekkel meghatározott feladattal.

Válasszuk a Tc = 1 értéket a kontroll horizontnak és a Tp = T ∈ N egész számot tervezési horizontnak. A rögzítettT > 0 mellett at aktuális id®pillanatban azx=x(t) állapotra megoldjuk a

P(0, T, x)

problémát, amelynek a megoldására a következ® jelölést alkalmazzuk: u(.) = ˆ

u(.;x); legyen

u(t) = ˆu(0;x) és v(x) = ˆu(0;x).

Eredményül kapjuk az

x(t+ 1) =f(x(t), v(x(t))), t∈N (5.35) zárt rendszert. Az f0 függvényre tett kikötésb®l következik, hogy v(0) = 0, így az origó az (5.35) egyensúlyi helyzete.

A feladat megfogalmazásában szerepl® kikötéseken túlmen®en elvárjuk az alábbi feltételek teljesülését.

5.3. Feltétel.Létezik olyanη >0, hogy

Gη ={x∈Rn: G(x)< η} ⊂ X és mindenx∈ Gη esetén van olyanκ(x)∈ U, hogy

G(x)≥f0(x, κ(x)) +G(f(x, κ(x))).

Válasszuk a végállapotok korlátozó halmazát Xf =Gη összefüggés szerint!

5.3. Megjegyzés. Az5.3. Feltétel miatt aXf =Gηhalmaz pozitívan invariáns, hiszen ha x ∈ Gη, akkor f(x, κ(x)) ∈ Gη, mivel f0(x, κ(x)) ≥ 0 minden x∈ Gη-ra teljesül.

5.5. Definíció.A[t1, t2)intervallumon azxállapothoz eredményes vezérlé-sek halmazát az alábbi egyenl ˝oséggel értelmezzük:

e(t1, t2, x) ={u(.) : u(i)∈ U, ξ(i)∈ X, ésξ(t2)∈ Gη}.

JelöljeN(T) a

N(T) = {x∈ X : ∆e(0, T, x)6=}

halmazt. Az 5.3. Megjegyzés alapján világos, hogy N(T)⊃ Gη.

5.4. Feltétel.Mindenx∈ N(T)kezd ˝oállapot esetén aP(0, T, x)problémának létezik egyetlen u(., x)ˆ megoldása, és a Vˆ(x) = J(0, T, x,u)ˆ függvényhez létezik egy olyanα2 ∈ K, hogyVˆ(x)≤α2(kxk).

5.8. Tétel. Tegyük fel, hogy az5.3. és5.4. Feltétel teljesül. Ekkor az (5.35) egyenlet x(t) ≡ 0 megoldása lokálisan aszimptotikusan stabilis egy olyan A attraktivitási tartománnyal, amelyre A ⊇ N(T)⊃ Gη.

Bizonyítás. Lássuk be el®ször, hogy az N(T) halmaz pozitívan invariáns.

Legyen x ∈ N(T), és {u(0, x), ...,ˆ u(Tˆ −1, x)} a megfelel® optimális vezér-léssorozat, ξ(.)ˆ a megfelel® optimális trajektória. Mivel v(x) = ˆu(0, x), az ξ(1) =ˆ f(x, v(x)) egyenl®ség is igaz. Mivel pedig ξ(Tˆ )∈ Gη és az 5.3. Felté-tel Felté-teljesül, azu(.)˜ vezérlés, amelyet azu(t) = ˆ˜ u(t+ 1, x), ha t= 0, ..., T −2, és u(T˜ − 1) = κ( ˆξ(T)) összefüggések deniálnak, eredményes lesz, tehát

˜

u∈∆e(0, T,ξ(1))ˆ , ígyf(x, v(x))∈ N(T).

Mutassuk meg, hogy a Vˆ függvény eleget tesz az 5.3. Tétel (b) feltéte-lének. Mivel Vˆ(x) = J(0, T, x,u)ˆ ≥ f0(x,u(1, x))ˆ ≥ α1(kxk), az (5.4) bal oldali egyenl®tlensége teljesül. Az 5.4. Feltételben kikötöttük a jobb oldali egyenl®tlenség teljesülését is, így csak azt kell belátni, hogy egy alkalmas α3 ∈ K függvénnyel a

Vˆ(f(x, v(x))−Vˆ(x)≤α3(kxk) (5.36)

egyenl®ség is teljesül. Mivel u˜∈∆e(0, T,ξ(1))ˆ , ezért Vˆ(f(x, v(x)))≤J(0, T,ξ(1),ˆ u(.)) =˜

=

T−2

X

i=0

f0( ˆξ(i+ 1),u(iˆ + 1, x)) +f0( ˆξ(T), κ( ˆξ(T))) + +G(f( ˆξ(T), κ( ˆξ(T)))±G( ˆξ(T))±f0(x,u(0, x)) =ˆ

= ˆV(x) +G(f( ˆξ(T), κ( ˆξ(T)))−G( ˆξ(T)) + +f0( ˆξ(T), κ( ˆξ(T)))−f0(x,u(0, x)).ˆ

Átrendezve és felhasználva az 5.3. Feltételt (x helyettξ(Tˆ )-re), azt kapjuk, hogy Vˆ(f(x, v(x))−Vˆ(x)≤ −f0(x,u(0, x)),ˆ

amib®l látható, hogy α3 = α1 választással az (5.36) teljesül. Ez azt jelenti, hogy Vˆ Lyapunov függvény x+ = f(x, v(x))-re egy A ⊃ N(T) tartomá-nyon.

Bolza-típusú csúszó id®horizont módszer folytonos idej¶ rendsze-rekre

Foglalkozzunk az (5.28) és az (5.31), (5.32) összefüggések által meghatározott feladattal.

Válasszuk a Tc= 0 értéket a kontroll horizontnak. Ez annak az idealizált esetnek felel meg, amikor minden egyes id®pillatban újra kiszámoljuk az opti-mális vezérlést és annak a kezd® id®pillanathoz tartozó értékét alkalmazzuk.

A Tp =T ∈R számot pedig tekintsük a tervezési horizontnak. A rögzített T >0 mellett at aktuális id®pillanatban azx=x(t) állapotra megoldjuk a

P(0, T, x)

problémát, amelynek a megoldására a következ® jelölést alkalmazzuk:

u(.) = ˆu(.;x); legyen

u(t) = ˆu(0;x) és v(x) = ˆu(0;x).

Eredményül kapjuk az

x(t) =. f(x(t), v(x(t))) (5.37) zárt rendszert. Az f0-ra tett kikötésb®l most is következik, hogy az origó az (5.37) egyensúlyi helyzete.

A G, f0 ésf függvényekr®l feltesszük, hogy kielégítik az alábbi feltételt.

5.5. Feltétel.Létezik olyanη >0, hogy

Gη ={x∈Rn : G(x)< η} ⊂ X mindenx∈ Gη esetén van olyanκ(x)∈ U , hogy

0≥ {f0(x, κ(x)) +∇G(x)f(x, κ(x))}.

Válasszuk a végállapotok korlátozó halmazátXf =Gη összefüggés szerint!

5.6. Definíció.A[t1, t2)intervallumon azxállapothoz eredményes vezérlé-sek halmazát az alábbi egyenl ˝oséggel értelmezzük:

e(t1, t2, x) = {u(.) : u(t)∈ U, ξ(t)∈ X, ésξ(t2)∈ Gη}.

JelöljeN(T) a

N(T) = {x∈ X : ∆e(0, T, x)6=} halmazt.

5.6. Feltétel.Minden x ∈ N(T) esetén a P(0, T, x) problémának létezik egyetlen u(., x)ˆ optimális megoldása, a probléma V : [0, T]× N(T) → R Bellman függvénye folytonosan differenciálható az u(., x)ˆ jobbról folytonos a t= 0-ban ésu(0, x)ˆ szintén folytonos.

5.9. Tétel. Tegyük fel, hogy az 5.5.5.6. Feltételek teljesülnek. Ekkor az (5.37) egyenlet x(t) ≡ 0 megoldása lokálisan aszimptotikusan stabilis egy olyan A attraktivitási tartománnyal, amelyre egy alkalmas η0 > 0-val A ⊃ {x: V(0, x)< η0} ⊃ Gη.

5.4. Megjegyzés. Globális aszimptoikus stabilitás biztosítása is lehetséges to-vábbi feltételek kikötésével.

5.5. Megjegyzés. A módszernek számos különböz® változata létezik, amelyek az optimalizálási feladat adatainak megválasztásában különböznek.

In document Optimális irányítások (Pldal 166-173)