VARIÁCIÓSZÁMÍTÁS ÉS OPTIMÁLIS
IRÁNYÍTÁS
Algoritmuselmélet
Algoritmusok bonyolultsága
Analitikus módszerek a pénzügyben és a közgazdaságtanban Analízis feladatgyűjtemény I
Analízis feladatgyűjtemény II Bevezetés az analízisbe Complexity of Algorithms Differential Geometry
Diszkrét matematikai feladatok Diszkrét optimalizálás
Geometria
Igazságos elosztások
Introductory Course in Analysis Mathematical Analysis – Exercises I
Mathematical Analysis – Problems and Exercises II Mértékelmélet és dinamikus programozás
Numerikus funkcionálanalízis Operációkutatás
Operációkutatási példatár Parciális differenciálegyenletek Példatár az analízishez Pénzügyi matematika Szimmetrikus struktúrák Többváltozós adatelemzés
Variációszámítás és optimális irányítás
Kánnai Zoltán Szabó Imre
Tallos Péter
VARIÁCIÓSZÁMÍTÁS ÉS OPTIMÁLIS
IRÁNYÍTÁS
Budapesti Corvinus Egyetem Typotex
2014
Lektorálta : Varga Zoltán, Szent István Egyetem
Creative Commons NonCommercial-NoDerivs 3.0 (CC BY-NC-ND 3.0) A szerző nevének feltüntetése mellett nem kereskedelmi céllal szabadon másolható, terjeszthető, megjelentethető és előadható, de nem módosítható.
ISBN 978 963 279 237 8
Készült a Typotex Kiadó (http://www.typotex.hu) gondozásában Felelős vezető : Votisky Zsuzsa
Műszaki szerkesztő : Gerner József
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0045 számú,
„Jegyzetek és példatárak a matematika egyetemi oktatásához” című projekt keretében.
KULCSSZAVAK : Hilbert-tér, lineáris rendszer, irányíthatóság, Pontrjagin- féle maximumelv, időoptimum-feladat, differenciálszámítás, Euler–Lagrange- egyenlet, inverzfüggvény-tétel, Ljuszternik-tétel, nemlineáris Pontrjagin-féle maximumelv.
ÖSSZEFOGLALÁS : Az első rész a lineáris rendszerek irányíthatóságát és optimalizálását tárgyalja. Csak négyzetesen integrálható irányításokra szo- rítkozunk, így a Pontrjagin-féle maximumelvet egy igen szemléletes abszt- rakt elvből, a Hilbert-terek ortogonalitási tételéből vezetjük le. A második rész nemlineáris rendszerek optimalizálásával foglalkozik. Itt a Pontrjagin-féle maximumelvet ugyancsak az ortogonalitási tételből és a Ljuszternik-tételből vezetjük le. Mindkét részben az optimalitási kritériumokat bőséges, elsődle- gesen közgazdaságtanilag releváns példaanyaggal illusztráljuk.
Tartalomjegyzék
Előszó 1
I. Globális optimalizálás : lineáris rendszerek 3
1. Hilbert-terek geometriája 5
1.1. Variációs egyenlőtlenségek . . . 5
1.2. Riesz-reprezentáció . . . 8
1.3. Gyenge konvergencia . . . 9
1.4. Gyenge kompaktság . . . 11
1.5. Extremális pontok . . . 14
1.6. Az ortogonalitási tétel . . . 15
1.7. Egy optimális irányítási feladat . . . 16
1.8. Gyakorlatok . . . 18
2. Lineáris rendszerek 21 2.1. Lineáris irányítási rendszerek . . . 21
2.2. Irányíthatóság . . . 22
2.3. Autonóm rendszerek irányíthatósága . . . 24
2.4. Gyakorlatok . . . 27
3. A Pontrjagin-féle maximumelv 29 3.1. A minimális norma feladat . . . 29
3.2. Az időoptimum-feladat . . . 34
3.3. Elégséges feltétel optimalitásra . . . 37
3.4. Példa időoptimális irányításra . . . 39
3.5. Gyakorlatok . . . 41
4. A bang-bang-elv 43 4.1. Bevezetés . . . 43
4.2. Mérhető halmazértékű leképezések . . . 44 i
4.5. Bang-bang elv . . . 50
4.6. Gyakorlatok . . . 54
II. Lokális optimalizálás : nemlineáris rendszerek 55
5. Differenciálszámítás normált terekben 57 5.1. Differenciálhatóság . . . 575.2. Iránymenti deriváltak . . . 60
5.3. Folytonos differenciálhatóság . . . 61
5.4. Példák differenciálhatóságra . . . 62
5.5. Szélsőérték . . . 65
5.6. Monotonitás és konvexitás . . . 65
5.7. Gyakorlatok . . . 68
6. Variációszámítás 69 6.1. A Lagrange-feladat . . . 69
6.2. Az Euler–Lagrange-egyenlet . . . 70
6.3. Elégséges feltétel . . . 72
6.4. Szabad végpontú feladatok . . . 74
6.5. A haszonmaximalizálási feladat . . . 77
6.6. A Ramsey-féle növekedési modell . . . 78
6.7. Monopólium árazási problémája . . . 82
6.8. Gyakorlatok . . . 84
7. Lagrange-multiplikátorok 87 7.1. Faktorterek . . . 87
7.2. Az általánosított inverzfüggény-tétel . . . 89
7.3. Az ortogonalitási tétel . . . 92
7.4. A Lagrange-elv . . . 93
7.5. Az izoperimetrikus probléma . . . 95
7.6. Gyakorlatok . . . 96
8. Optimális irányítás 97 8.1. Az irányítási feladat . . . 97
8.2. Az irányíthatósági feltétel . . . 98
8.3. A Pontrjagin-féle maximumelv . . . 100
8.4. A transzverzalitási feltétel . . . 103
8.5. A jövedelemallokációs probléma . . . 108
8.6. Gyakorlatok . . . 110 ii
9. A maximumelv elégségessége 111
9.1. A maximumelv egységes végpontfeltétellel . . . 111
9.2. A Mangasarian-féle elégséges feltétel . . . 113
9.3. Az Arrow-féle elégséges feltétel . . . 115
9.4. Gyakorlatok . . . 116
10.Optimális irányítási modellek 119 10.1. Az Atkinson-féle haszonmaximalizálási feladat . . . 119
10.2. Monopólium befektetési problémája . . . 123
10.3. A Shell-féle növekedési modell . . . 125
10.4. A Hotelling-szabály . . . 128
10.5. Egy makroökonómiai beruházási modell . . . 131
11.Többszektoros irányítási modellek 135 11.1. Kétszektoros makroökonómiai modell . . . 135
11.2. Egy környezetgazdaságtani probléma . . . 139
11.3. Gyakorlatok . . . 141
iii
Előszó
Ez a kézikönyv matematikai bevezetésként kíván szolgálni a variációszámítás és az optimális irányítások elméletének tanulmányozásához, és elsősorban a közgazdasági mesterképzésben, illetve a doktori képzésben részt vevő hall- gatók számára készült. Ennek megfelelően tárgyalja a legegyszerűbb lineáris irányítási rendszerek tulajdonságait, az alapvető variációs feladatokat és a nemlineáris rendszerekre vonatkozó Pontrjagin-féle maximumelvet.
A közgazdaságtan nemzetközi szakirodalmában számos olyan monográfia létezik, amely ezzel a területtel foglalkozik : a teljesség igénye nélkül utalunk Aoki, illetveSydsaeter, Hammond, Seierstad, vagyKamien, Schwartz, továb- báSethi, Thompson munkáira (lásd az irodalomjegyzéket). Ezek a könyvek azonban a tételek megfogalmazására, azok interpretációjára és példákon ke- resztüli illusztrációira szorítkoznak. Nem adnak viszont képet az eredmények matematikai hátteréről. Számtalanszor szembesültünk azzal, hogy hallgató- ink igénylik ennek tárgyalását is.
Igyekeztünk egy olyan könyvet az olvasó kezébe adni, amely rávilágít arra, hogy ezek a sokszor nagyon bonyolult dinamikus optimalizálási feladatok va- lójában roppant szemléletes és rendkívül egyszerű geometriai elveken nyug- szanak. Ilyenek például a lineáris rendszerek esetében a legközelebbi pont elve és az ortogonalitási tétel Hilbert-terekben, illetve nemlineáris rendsze- rek esetében az érintősík fogalma és az ortogonalitási tétel normált terekben.
Alapvető koncepciónk volt, hogy a dinamikus optimalizálás eredményeit ezen szemléletes geometriai elvek köré csoportosítsuk.
Úgy látjuk, hogy egy ilyen anyag hiánypótló lehet a közgazdaságtani szak- irodalomban. Ezzel együtt bátorítjuk az olvasót az említett szakkönyvek na- gyon igényes példaanyagának tanulmányozására is. A szükséges analízisisme- retek megtalálhatókKánnai ésMagyarkuti jegyzeteiben. Dinamikus optima- lizálási feladatok egy szélesebb körének tárgyalását olvashatjuk Kósa köny- veiben.
A könyv anyaga az évek során a Budapesti Corvinus Egyetem gazdaság- matematika szakán és a közgazdaságtani doktori iskola keretében tartott elő- adásaink rendszerezését tartalmazza. Nagyon bízunk azonban abban, hogy haszonnal forgathatják a természettudományi és műszaki képzésekben részt vevő hallgatók is.
Ezúton is szeretnénk köszönetet mondani hallgatóinknak, akik órai vagy órán kívüli megjegyzéseikkel segítettek érthetőbbé tenni az anyagot. Hálásak vagyunk Varga Zoltánnak, akitől nagyon sok segítséget kaptunk munkánk során.
Budapest, 2013. június
Kánnai Zoltán, Szabó Imre, Tallos Péter
I. rész
Globális optimalizálás : lineáris rendszerek
3
1. fejezet
Hilbert-terek geometriája
Ebben a fejezetben megismerkedünk a Hilbert-terek geometriájának alapja- ival, a gyenge konvergenciával és egy igen általános globális optimalizálási elvvel. Ez az elv módszert is szolgáltat néhány érdekes optimalizálási feladat megoldására.
Az alábbiakban Hilbert-téren mindig a valós test fölötti teret értünk1.
1.1. Variációs egyenlőtlenségek
A most következő absztrakt tétel a globális optimalizálási problémák talán legfontosabb alaptételének tekinthető.
1.1. Tétel. Egy Hilbert-tér nem üres konvex, zárt részhalmazában egyetlen minimális normájú elem van.
Bizonyítás. LegyenK konvex, zárt halmaz és α= inf{kxk:x∈K}.
Válasszunk egy olyanK-belixnsorozatot, amelyreα= limkxnk. A parallelog- ramma-azonosság miatt
1
2(xn−xm)
2
= 1
2 kxnk2+kxmk2
− 1 2xn+1
2xm
2
≤
≤ 1
2 kxnk2+kxmk2
−α2→0,
1A Hilbert-terek elméletének alapjait illetően lásdKánnai : Analitikus módszerek a pénzügyben és a közgazdaságtanban, www.tankonyvtar.hu, 2013.
5
tehátxn Cauchy-sorozat. Mivel a tér teljes és K zárt, azért xn konvergens, ésxn→z∈K. Mivel
0≤
kxnk − kzk
≤ kxn−zk →0,
világos, hogykzk=α. Másrészt, hay∈K is minimális normájú elem lenne, akkor ismét a parallelogramma-azonosság szerint
1 2(z−y)
2
=α2− 1 2z+1
2y
2
≤0, azazz=y.
1.2. Tétel. Legyen K a H Hilbert-tér konvex zárt részhalmaza, és x∈ H. Akkor aK halmazban azxponthoz egyetlen legközelebbi pont van.
Bizonyítás. Alkalmazzuk az előző tételt aK−xhalmazra.
A fenti állításokban csak az optimális elem létezését és egyértelműségét igazoltuk. A következőkben egy karakterizációt is megadunk. Az ilyen típusú állításokat variációs egyenlőtlenségeknek nevezzük.
1.3. Tétel (Tompaszög-tétel). LegyenK aH Hilbert-tér egy nem üres kon- vex, zárt részhalmaza, és x∈H. A z ∈K vektor akkor és csak akkor az x vektorhoz legközelebbi elem, ha
hx−z, z−yi ≥0 (1.1)
mindeny∈K esetén.
Bizonyítás. Legyenz az egyetlen legközelebbi elem. Bármely y ∈K és0 ≤
≤t≤1mellett(1−t)z+ty∈K. Tekintsük a g(t) =kx−(1−t)z−tyk2 másodfokú függvényt. Könnyen ellenőrizhető, hogy
g0(t) = 2hx−(1−t)z−ty, z−yi, illetve
g00(t) = 2hz−y, z−yi= 2kz−yk2.
Haz legközelebbi elem, akkorg0(0)≥0, ami éppen az (1.1) egyenlőtlenség.
Fordítva, ha fennáll az (1.1) egyenlőtlenség valamelyz∈Kvektorra, akkor egyrésztg0(0)≥0, másrésztg00(t)≥0mindent-re. Ez azt jelenti, hogyg(0)≤
≤g(1), azaz zvalóban azxvektorhoz legközelebbi elem.
1.1. Variációs egyenlőtlenségek 7 A variációs egyenlőtlenség geometriai interpretációja igen szemléletes. Ezt úgy fogalmazhatjuk meg, hogy a z legközelebbi pontban az x−z vektor bármely aK felé mutatóy−zvektorral tompaszöget zár be.
1.4. Definíció. Legyen K a H Hilbert-tér nem üres konvex, zárt részhal- maza. Tetszőlegesx∈H mellett jelentsePK(x)azxvektorhoz legközelebbi elemetK-ban. Ezt azxprojekciójának nevezzük aK halmazra.
Zárt alterekhez (ilyenek például a véges dimenziós alterek) legközelebbi pont merőleges vetítéssel nyerhető, ezt fogalmazzuk meg az alábbi állításban.
1.5. Tétel. Tekintsük a H Hilbert-tér egy L zárt alterét. Ekkor egy x∈ H vektor projekciója a következőképpen karakterizálható :
hx−PL(x), yi= 0 mindeny∈L vektorra. TovábbáPL lineáris leképezés.
Bizonyítás. Valóban, bármelyy ∈Lés valóstmellettPL(x)−ty∈L, ennél- fogva a
g(t) =kx−PL(x) +tyk2
függvénynek a t= 0 helyen minimuma van. Ezért g0(0) = 0, amiből adódik a karakterizáció.
Fordítva, ha valamelyz∈Lvektorrax−zmerőleges azLminden elemére, akkor tetszőlegesy∈Lvektorra
kx−yk2=kx−zk2+ky−zk2, azazzvalóban az x-hez legközelebbiL-beli elem.
Másrészt nyilvánvaló, hogyPL(αx) =αPL(x), ígyPL homogén. Az addi- tivitás abból adódik, hogy
h(x1+x2)−PL(x1+x2), yi= 0
minden y ∈L esetén, ha ez az x1 és x2 vektorokra egyaránt fennáll. Tehát PL(x1+x2) =PL(x1) +PL(x2), azazPLvalóban lineáris leképezés.
1.6. Tétel. HaLaH Hilbert-tér zárt altere, akkor H =L⊕L⊥. Bizonyítás. Valóban, bármelyx∈H felírható
x=PL(x) + (x−PL(x))
alakban, aholPL(x)∈Lésx−PL(x)∈L⊥. Ez a felbontás egyértelmű is az előző tételünk alapján.
1.2. Riesz-reprezentáció
Haa∈H adott vektor aH Hilbert-térben, akkor aH-n értelmezett f(x) =hx, ai
lineáris függvény folytonos is, hiszen|f(x)−f(y)| ≤ kak · kx−yka Cauchy–
Schwarz-egyenlőtlenség szerint. Az alábbiakban megmutatjuk, hogy ez a pél- da tipikus, azaz egy Hilbert-tér minden folytonos lineáris funkcionálja meg- adható ilyen alakban.
1.7. Állítás. Az f lineáris függvény a H Hilbert-téren akkor és csak akkor folytonos, ha van olyanαpozitív szám, amelyre
|f(x)| ≤α· kxk mindenx∈H vektorra.
Bizonyítás. Az elégségesség nyilvánvaló, ha ugyanisxn→x, akkor
|f(xn)−f(x)|=|f(xn−x)| ≤α· kxn−xk →0.
A szükségességhez elég belátni, hogy α= sup
|f(x)|
kxk :x6= 0
véges. Ha ugyanis ez végtelen lenne, akkor találhatnánk olyanxn sorozatot, amelyre
yn= xn
|f(xn)| →0,
jóllehet|f(yn)|= 1mindennmellett, ellentmondva a folytonosságnak.
1.8. Tétel(Riesz-féle reprezentációs tétel). AH Hilbert-tér bármelyf foly- tonos lineáris funkcionáljához egyértelműen található olyan a ∈ H vektor, hogy
f(x) =hx, ai mindenx∈H mellett.
Bizonyítás. Föltehető, hogyfnem azonosan nulla. Válasszunk egyyvektort, amelyre f(y) 6= 0. Jelölje z az y projekcióját a kerf zárt altérre, és legyen b=y−z. Ekkor b merőleges a kerf altérre, továbbáf(b) =f(y). Bármely x∈H vektor esetén
x−f(x) f(b)b
1.3. Gyenge konvergencia 9 a kerf altérben fekszik, és így merőleges ab vektorra, azaz
hx, bi= f(x) f(b)hb, bi.
Ezt az
a= f(b) kbk2b
jelölés bevezetésével úgy is írhatjuk, hogyf(x) =hx, aimindenx∈Hesetén.
Az is nyilvánvaló, hogy ez aza vektor egyértelmű. Ha ugyanis b is ilyen tulajdonságú, akkorhx, a−bi= 0mindenx∈H vektorra, azaza=b.
1.9. Példa. Tekintsük az L2[0, T] Hilbert-teret. Riesz tétele értelmében e téren bármely folytonos lineáris funkcionál
ϕ7→
Z T 0
ϕ(t)ψ(t)dt
alakban adható meg, aholψ∈L2[0, T]alkalmas függvény.
Ellentétben a véges dimenziós esettel, egy végtelen dimenziós Hilbert-téren egy lineáris függvény nem feltétlenül folytonos.
1.3. Gyenge konvergencia
Egy végtelen dimenziós normált térben egy korlátos zárt halmaz nem feltétle- nül kompakt. Ez azt is jelenti, hogy egy korlátos sorozatnak nem feltétlenül lé- tezik konvergens részsorozata. Hilbert-terekben azonban megfogalmazhatunk Bolzano–Weierstrass típusú tételt, ha a konvergencia fogalmát gyengítjük.
1.10. Definíció. Azt mondjuk, hogy aH Hilbert-térben azxn sorozat gyen- gén tartx-hez, ha
hxn, yi → hx, yi mindeny∈H mellett.
1.11. Állítás. Haxn→xnormában, akkorxn →xgyengén is.
Bizonyítás. Valóban, bármelyy∈H esetén
|hxn, yi − hx, yi|=|hxn−x, yi| ≤ kxn−xk · kyk →0.
1.12. Tétel. Egy Hilbert-térben bármely korlátos sorozatnak van gyengén konvergens részsorozata.
Bizonyítás. Tekintsük a H Hilbert-tér valamely korlátos sorozatát, kxnk ≤
≤β. JelöljeM az xn elemek által generált zárt alteret, és jelentse M⊥ az ortogonális komplementerét. Mivel αn = hx1, xni korlátos számsorozat, így kiválasztható belőle egy
α1n=hx1, x1ni
konvergens részsorozat. Hasonlóan,hx2, x1niis korlátos számsorozat, így ebből is kiválasztható egy
α2n=hx2, x2ni
konvergens részsorozat. Az eljárást folytatva tekintsük az így keletkező xnn átlós sorozatot. Ekkor bármely k indexre hxk, xnni konvergens, hiszen n > k mellett éppen azαkn konvergens sorozat részsorozatával van dolgunk. Meg- mutatjuk, hogyxnn gyengén konvergens.
Vezessük be az
f(x) = lim
n→∞hx, xnni
függvényt, hacsak a limesz létezik. Ez a határérték nyilván létezik azxn so- rozat elemeiből alkotott véges lineáris kombinációkra, amelyek sűrű halmazt alkotnak az M altérben. Ebből következik, hogy f az egész M altéren ér- telmezhető, ha ugyanis y ∈ M tetszőleges, akkor található az xn lineáris kombinációinak olyanymsorozata, amelyre ym→y. Ezekre létezik az
f(ym) = lim
n→∞hym, xnni határérték. Továbbá az
|hyk−ym, xnni| ≤βkyk−ymk (1.2) egyenlőtlenség folytán f(ym) Cauchy-sorozat, tehát konvergens is, azaz f(ym) → α valamilyen α valós számra. Ez azt jelenti, hogy adott ε pozi- tív számhoz találhatók olyanmésN (azm-től függő) indexek, hogy bármely n≥N mellett
|α− hy, xnni| ≤ |α−f(ym)|+|f(ym)− hym, xnni|+
+|hym, xnni − hy, xnni| ≤ ε 3 +ε
3+ε 3 =ε
az (1.2) reláció alapján. Ez pontosan azt jelenti, hogy hy, xnni konvergens, következésképpenf(y) =α.
Legyen ezenkívül f azonosan nulla az M⊥ altéren, így nyilvánvalóan f értelmezve van az egészH téren. Továbbá f lineáris és folytonos is, hiszen haym→y, akkor
|f(ym−y)|= lim
n→∞|hym−y, xnni| ≤βkym−yk →0.
Riesz tétele folytán van olyana∈H vektor, amelyref(x) =hx, ai. Azonnal látható, hogyxnn→agyengén.
1.4. Gyenge kompaktság 11 1.13. Példa. Tekintsünk egy olyanϕnsorozatot azL2X[0, T]térben, amelyre létezik olyanλ∈L2[0, T]valós függvény, hogy
kϕn(t)k ≤λ(t)
minden nés majdnem minden t ∈[0, T]mellett. Ez a sorozat korlátos, így szükségképpen van gyengén konvergens részsorozta. Ez azt jelenti, hogy ta- lálható olyanϕnk részsorozat és olyanϕ∈L2X[0, T]függvény, hogy
Z T 0
hϕnk(t), ψ(t)idt→ Z T
0
hϕ(t), ψ(t)idt mindenψ∈L2X[0, T]mellett.
A következő állításban azt látjuk, hogy a gyenge konvergenciából milyen további feltétel mellett következik a norma szerinti konvergencia.
1.14. Tétel. Ha xn → x gyengén és kxnk → kxk, akkor xn tart x-hez normában is.
Bizonyítás. Valóban,
kx−xnk2=kxk2−2hx, xni+kxnk2→ kxk2−2kxk2+kxk2= 0, hiszenhx, xni → kxk2a gyenge konvergencia miatt.
1.4. Gyenge kompaktság
Ebben a szakaszban egy Hilbert-tér konvex zárt részhalmazairól látjuk be, hogy zártak a gyenge konvergenciára. Megvizsgáljuk a gyenge kompaktságot is.
1.15. Tétel. Haxn→xgyengén aH Hilbert-térben, akkor x∈cl co{x1, x2, . . .},
azazxa sorozat elemei által kifeszített konvex zárt halmazban fekszik.
Bizonyítás. Jelentse K = cl co{x1, x2, . . .} a sorozat elemeinek zárt konvex burkát. Indirekt módon tegyük fel, hogyx6∈K, és jelentsezazxprojekcióját aKhalmazra, azazz=PK(x). Mivelxn−zis gyengén tart azx−zvektorhoz, azért az 1.3. Tétel szerint
0≥ hxn−z, x−zi → kx−zk2. Ez azt jelenti, hogyx=z, azazx∈K.
1.16. Tétel (Mazur tétele). Ha xn → x gyengén, akkor található az xn
elemek konvex kombinációiból álló olyan
ym=
km
X
j=1
αmjxmj
sorozat, amelyreym→xnormában.
Bizonyítás. JelentseC={x1, x2, . . .}a sorozat elemeinek halmazát. Mivel az előző állításunk szerintx∈cl coC=K, azért mindenmtermészetes számra
x+ 1
mB∩coC6=∅.
Válasszunk tetszőlegesen egyym elemet a metszetből, az így nyert sorozat nyilván eleget tesz a tétel kívánalmának.
1.17. Definíció. AzHHilbert-tér valamelyKrészhalmazátgyengén zártnak nevezzük, ha bármely gyengén konvergensK-beli sorozat határértéke is aK halmazban fekszik.
Azt mondjuk továbbá, hogyKgyengén kompakt, ha bármelyK-beli soro- zatból kiválasztható aK-ban gyengén konvergens részsorozat.
Világos, hogy minden gyengén zárt halmaz egyúttal zárt is. Ennek megfor- dítása általában nem érvényes, tekintsük például azt azl2-beliK={x1, x2, ...}
halmazt, ahol az xn sorozat elemeire ξnn = 1, illetve ξkn = 0, ha k 6=n. Ez a halmaz zárt, hiszen nincs is torlódási pontja, ugyanis kxn −xmk = √
2 bármely két különböző indexre. Azonban nem gyengén zárt, hiszen könnyű ellenőrizni, hogyxn→0 gyengén, de06∈K. (Lásd a 4. gyakorlatot.)
Az is világos, hogy a norma szerint kompakt halmazok egyúttal gyengén kompaktak is, hiszen bármely konvergens sorozat gyengén is konvergens. A megfordítás azonban már nem érvényes, tekintsük példaként az előző be- kezdésxn vektorainak halmazát a zérussal kiegészítve. Az így nyert halmaz gyengén kompakt (hiszen egy gyengén konvergens sorozat a limesszel kiegé- szítve), de normában nem lehet kompakt, ugyanis az eredeti sorozatnak nincs Cauchy-részsorozata.
1.18. Állítás. Minden konvex zárt halmaz gyengén is zárt.
Bizonyítás. Valóban, haKkonvex zárt halmaz ésxnaKelemeinek gyengén konvergens sorozata, akkor az 1.15. Tétel szerint a limesz is aK halmazban fekszik.
Az 1.12. Tételt is figyelembe véve az alábbi következményt fogalmazhatjuk meg.
1.4. Gyenge kompaktság 13 1.19. Következmény. Egy Hilbert-tér bármely korlátos konvex zárt részhal- maza gyengén kompakt.
1.20. Példa. Tekintsük a [0, T] intervallumon olyan xn abszolút folytonos függvények sorozatát, amelyekre xn(0) = x0, x0n ∈ L2[0, T], és van olyan λ∈L2[0, T]függvény, amelyre
kx0n(t)k ≤λ(t)
majdnem mindenütt minden n indexre. Ekkor található olyan xnk részso- rozat és olyan x abszolút folytonos függvény a [0, T] intervallumon, hogy xnk(t)→x(t)a[0, T]intervallumon, továbbá
x0(t)∈
∞
\
k=1
cl co
∞
[
n=k
{x0n(t)}. (1.3)
Valóban, a fenti következmény szerint kiválaszthatunk olyan xnk részsoro- zatot, amelyre x0n
k gyengén konvergens L[0, T]-ben, nevezetesen x0n
k → u.
Másrészt Mazur tétele szerint található e részsorozat elemeinek konvex kom- binációiból állóymsorozat, amely normában tart u-hoz. Riesz tétele szerint ez utóbbi sorozatnak is van olyan részsorozata, amely majdnem mindenütt pontonként tart azufüggvényhez. Ez azt jelenti, hogy mindenktermészetes számra
u(t)∈cl co
∞
[
n=k
{x0n(t)}
majdnem mindenütt. Vezessük be ezután az x(t) =x0+
Z t 0
u(s)ds
függvényt a[0, T]intervallumon. Világos, hogy erre érvényes az (1.3) reláció.
A pontonkénti konvergencia abból adódik, hogy kx(t)−xnk(t)k ≤
Z t 0
(x0(s)−x0n
k(s))ds
→0 a gyenge konvergencia miatt.
Hilbert-téren egy folytonos függvény nem feltétlenül folytonos a gyenge konvergenciára nézve, így egy gyengén kompakt halmazon nem feltétlenül veszi fel a minimumát. Konvex függvényekről azonban többet állíthatunk.
Legyen tehátH Hilbert-tér és tekintsünk egyf :H →Rfüggvényt.
1.21. Tétel. Ha K a H korlátos konvex zárt részhalmaza, és f folytonos konvex függvény, akkorf felveszi a minimumát a K halmazon.
Bizonyítás. Legyenα= inf{f(x) :x∈K}, és tetszőlegesntermészetes szám mellett válasszunk egy olyanxn∈K elemet, amelyre
f(xn)≤α+1 n.
Az 1.19. Következmény szerint azxn sorozatból kiválasztható egyxnk gyen- gén konvergens részsorozat, jelölje x0 e sorozat határértékét. Minden n ter- mészetes szám esetén vezessük be a
Kn=K∩
x∈H:f(x)≤α+1 n
halmazt. Mivel egy konvex függvény alsó nívóhalmazai konvexek, ésf folyto- nos, azért aKnhalmazok mindegyike konvex, korlátos és zárt, tehát gyengén is zárt. Ez azt jelenti, hogyx0∈Kn, azaz
f(x0)≤α+1 n
mindennindexre. Ez csak úgy lehetséges, hogyf(x0) =α.
1.5. Extremális pontok
Ebben a szakaszban a gyenge konvergencia egy alkalmazását mutatjuk be az extremális pontok létezésének igazolására. Ez az állításunk az úgynevezett Krein–Milman-tétel speciális esete.
1.22. Definíció. LegyenK egy Hilbert-tér konvex részhalmaza. Azt mond- juk, hogyE ⊂K aK extremális részhalmaza, ha bármely0≤α≤1esetén az αx+ (1−α)y ∈ E relációból következik, hogy x, y ∈ E. Az egyelemű extremális részhalmazok elemeitextremális pontoknak nevezzük.
1.23. Lemma. HaK egy Hilbert-tér nem üres korlátos, konvex zárt részhal- maza, akkor mindenntermészetes számhoz van olyanEn extremális részhal- maz, amelyrediamEn<1/n.
Bizonyítás. Legyenα= sup{kxk:x∈K}, és legyen adottε >0. Válasszunk egy olyanx0∈K vektort, amelyrekx0k> α−ε, és tekintsük a
K0={x∈K:hx−x0, x0i ≥0}
halmazt. Az 1.21. Tétel szerint azx→ hx−x0, x0ifüggvény felveszi a maxi- mumát aK halmazon. Világos, hogy a maximumhelyek halmaza olyan zárt extremális részhalmaz, amely aK0 halmazban fekszik.
1.6. Az ortogonalitási tétel 15 Ezután becslést adunk aK0 átmérőjére. Tetszőlegesx∈K0 esetén
kxk2=kx−x0k2+kx0k2+ 2hx−x0, x0i ≥
≥ kx−x0k2+kx0k2. Ebből következik, hogy
kx−x0k2≤ kxk2− kx0k2≤α2−(α−ε)2≤2αε.
Tehát aK0halmaz xésy pontjaira
kx−yk ≤ kx−x0k+ky−x0k ≤2√
2αε→0, haε→0, és éppen ezt kellett bizonyítani.
1.24. Tétel(Krein–Milman-tétel). HaK egy Hilbert-tér nem üres korlátos, konvex, zárt részhalmaza, akkor van extremális pontja.
Bizonyítás. Tekintsük aK halmaz zárt extremális részhalmazainak egy mo- noton fogyó olyanEn sorozatát, amelyekre diamEn<1/n. Az előző lemma szerint ilyen sorozat választható. A Cantor-féle metszettétel szerint e sorozat metszete
∞
\
n=1
En={¯x}
egyetlen elemből áll. Könnyű ellenőrizni, hogy ekkorx¯aKhalmaz extremális pontja.
1.6. Az ortogonalitási tétel
Legyen a továbbiakbanH valós Hilbert-tér, ésΛ a H téren értelmezett, va- lamelyY Hilbert-térre képező folytonos lineáris leképezés.
1.25. Tétel. HaΛ ráképezés, akkor (kerΛ)⊥=imΛ∗.
Bizonyítás. Haa∈imΛ∗, akkor van olyany∈Y, amelyrea= Λ∗y. Ha most v∈kerΛ tetszőleges, akkorha, vi=hΛ∗y, vi=hy,Λvi= 0.
Fordítva, ha a ∈ (kerΛ)⊥, akkor minden v ∈ kerΛ esetén ha, vi = 0.
Tekintsük az alábbig:Y →Rfüggvényt : g(y) =ha,Λ−1(y)i.
Ekkor a g függvény jól definiált, hiszen bármely x1, x2 ∈ Λ−1(y) esetén x1−x2 ∈ kerΛ, és így ha, x1−x2i = 0. Másrészt könnyen látható, hogy gfolytonos és lineáris, azaz g∈Y∗.
A Riesz-féle reprezentációs tétel szerint ezért található olyanb∈Y vektor, amelyrehb, yi=ha,Λ−1(y)imindeny∈Y mellett. Bármely adotty∈Y vek- torhoz a feltételünk szerint választható olyan x∈X vektor, amelyreΛx=y.
Ekkor
ha, xi=hb,Λxi=hΛ∗b, xi mindenx∈X esetén. Teháta= Λ∗b, azaz a∈imA∗.
A tételünk fontos folyománya, hogy ilyenkor imΛ∗zárt altér (ez a ráképe- zési feltétel nélkül általában nem igaz), hiszen az ortogonális komplementer mindig zárt alteret eredményez. Érdemes megjegyezni, hogy a
kerΛ = (imΛ∗)⊥
reláció a ráképezési feltétel nélkül is érvényes. Ennek ellenőrzését az olvasóra bízzuk (lásd a 14. gyakorlatot).
Tekintsük ezután aH ésX Hilbert-tereket. AdottΛ∈L(H, X)folytonos, azX térre képező lineáris leképezés ésx¯∈X vektor mellett keressük a
K={u∈H : Λu= ¯x} (1.4)
halmaz minimális normájú elemét.
1.26. Állítás. Hau∈K megoldás, akkor u∈im Λ∗.
Bizonyítás. Hau∈Kminimális normájú elem, akkor a tompaszög-tétel (1.3.
Tétel) szerintumerőleges aK= Λ−1(¯x)affin halmazra, azaz a kerΛaltérre is. Ezértu∈(kerΛ)⊥=imΛ∗.
1.7. Egy optimális irányítási feladat
A fejezetünk eredményeit összefoglalva egy egyszerű optimális irányítási fel- adatra mutatunk példát ebben a szakaszban. Az ilyen jellegű feladatok tipi- kusak a makroökonómiában.
LegyenX euklideszi tér, amelyben adott azx0 pont. Keressük az F(x, u) =
Z T 0
kx(t)k2+ku(t)k2 dt
integrál minimumát, ahol
x0(t) =u(t), x(0) =x0, (1.5) továbbá
ku(t)k ≤λ majdnem mindenütt (1.6)
1.7. Egy optimális irányítási feladat 17 valamelyλpozitív szám mellett. A feladat úgy interpretálható, hogy azuirá- nyítás segítségével kívánjuk minimalizálni a kvadratikus veszteségfüggvényt olyan módon, hogy közben az irányítás energiája korlátozott.
Azx ésufüggvényeket egyaránt az L2X[0, T]térből választjuk, így az F leképezés értelmezési tartománya a
H =L2X[0, T]×L2X[0, T]
szorzattér egy részhalmaza, amelyen a skaláris szorzatot az h(x1, u1),(x2, u2)i=
Z T 0
(hx1(t), x2(t)i+hu1(t), u2(t)i)dt egyenlőséggel értelmezzük. Világos, hogyH így Hilbert-tér. Ekkor
F(x, u) =k(x, u)k2 aH-beli skaláris szorzatra nézve.
Jelentse ezután K mindazon (x, u) párok halmazát a H Hilbert-térből, amelyek kielégítik az (1.5) és az (1.6) korlátozó feltételeket. A feladatunk absztrakt módon úgy fogalmazható meg, hogy keresendő a K halmazban minimális normájú elem. Az 1.1. Tétel szerint ilyen elem egyértelműen létezik, haK konvex zárt halmaz.
Egyszerűen ellenőrizhetjük, hogyKkonvex halmaz. A zártság belátásához tegyük fel, hogy (xn, un) olyan K halmazbeli sorozat, amelyre (xn, un) → (x, u)∈H. Azt kell megmutatnunk, hogy(x, u)∈K. Vezessük be az
y(t) =x0+ Z t
0
u(s)ds
jelölést a[0, T]intervallumon. Mivel azunsorozatnak van olyan részsorozata, amely majdnem mindenütt tart az ufüggvényhez, azért (1.6) fennáll. Elég tehát igazolni, hogy x=y. A Cauchy–Schwarz-egyenlőtlenséget alkalmazva az 1 és azu−un függvényekre azt kapjuk, hogy
ky(t)−xn(t)k2≤t· Z t
0
ku(s)−un(s)k2ds≤T · ku−unk22. Tehát mindkét oldalt integrálva a[0, T]intervallumon
Z T 0
ky(t)−xn(t)k2dt≤T2· ku−unk22,
majd mindkét oldalból négyzetgyököt vonvaky−xnk ≤T· ku−unkadódik.
Ebből következik, hogy
ky−xk2≤ ky−xnk2+kxn−xk2≤T· ku−unk2+kx−xnk2. Mivel a jobb oldalon mindkét tag nullához tart, han → ∞, innen valóban következik, hogyx=y.
1.8. Gyakorlatok
1. Adjunk példát egy Hilbert-téren olyan folytonos függvényre, amely az egységgömbön nem veszi fel a maximumát.
2. Keressünk példát normált térben olyanKkonvex zárt halmazra, amely- nek az origóhoz legközelebbi pontja nem egyértelmű. Keressünk olyat is, amelyben nincs is legközelebbi pont. (Útmutatás : Az utóbbi példához vizsgáljuk meg aC[0,1]térben az
(
x∈C[0,1] : Z 1/2
0
x(t)dt− Z 1
1/2
x(t)dt=α )
hipersíkot.)
3. Mutassuk meg, hogy egy Hilbert-tér bármely folytonos lineáris funkcio- nálja pontosan egy pontban veszi fel az abszolút értéke maximumát az egységgömbön. (Ez Banach-térben már nem feltétlenül érvényes, lásd az előző példát.)
4. Tekintsük azl2 térben azt az xn sorozatot, amelyreξnn = 1és ξkn = 0 mindenk6=nesetén. Mutassuk meg, hogyxn→0gyengén, de persze xn normában nem konvergens.
5. Bizonyítsuk be, hogy egy Hilbert-téren azf(x) =kxkfüggvény az origó kivételével mindenütt differenciálható. Keressünk példát arra, hogy ez általában normált terekben (már véges dimenzióban sem) nem érvényes.
6. Adjunk példát Hilbert-térben olyanxn sorozatra, amelyrekxnk →α, xn→xgyengén, de kxk 6=α.
7. Adjunk példát Hilbert-térben olyan korlátos, konvex és zárt halmazra, amelynek az origótól nincs legtávolabbi pontja. (Útmutatás : JelöljeB azL2[0,1]zárt egységgömbjét, és tekintsük azy(t) =t·x(t)függvények halmazát, midőnx∈B.)
8. Ellenőrizzük, hogy alterek esetében a projekció fogalma egybeesik a merőleges vetítéssel. Nevezetesen, haLaHHilbert-tér tér altere, akkor x−PL(x)merőleges azLaltérre.
9. Bizonyítsuk be, hogy haK a H Hilbert-tér konvex, zárt részhalmaza, akkor aPK(x)vektor éppen a
hPK(x)−x, PK(x)−yi ≤0 ∀y∈K variációs egyenlőtlenség egyetlen megoldása.
1.8. Gyakorlatok 19 10. Mutassuk meg, hogy ha K a H Hilbert-tér konvex, zárt részhalmaza,
akkor aPK leképezés mindenx, y∈H mellett kielégíti a kPK(x)−PK(y)k ≤ kx−yk egyenlőtlenséget.
11. Igazoljuk, hogy ha K aH Hilbert-tér konvex, zárt részhalmaza, akkor PK úgynevezettmonoton leképezés, azaz
hPK(x)−PK(y), x−yi ≥0 bármelyx, y∈H mellett.
12. Ha K a H Hilbert-tér konvex, zárt kúpja, akkor érvényesek az alábbi relációk :
hx−PK(x), PK(x)i= 0, továbbá
PK(λx) =λPK(x) mindenx∈H, illetveλ >0 mellett.
13. Legyen K a H Hilbert-tér nem üres konvex, zárt részhalmaza, és te- kintsük a
g(x) = inf{kx−yk2:y ∈K}
függvényt. Igazoljuk, hogyg folytonosan differenciálható, és g0(x) = 2(x−PK(x))
mindenx∈H pontban.
14. Mutassuk meg, hogy haΛfolytonos lineáris leképezés valamely Hilbert- térről egy másik Hilbert-térbe, akkor
kerΛ = (imΛ∗)⊥
2. fejezet
Lineáris rendszerek
Ebben a fejezetben lineáris rendszerek alapvető tulajdonságaival foglalko- zunk.
2.1. Lineáris irányítási rendszerek
Legyenek X és Y n, illetve m dimenziós euklideszi terek és x0 ∈ X adott vektor. Tekintsük azA: [0, T]→L(X)ésB : [0, T]→L(Y, X)négyzetesen integrálható függvényeket, ahol tehátA(t)n×n, B(t)pedig n×mméretű mátrix. A négyzetesen integrálhatóságon azt értjük, hogyAésBmérhetőek, továbbá a t 7→ kA(t)k, valamint a t 7→ kB(t)k függvények az L2[0, T] tér elemei.
Lineáris irányítási rendszeren az
x0=A(t)x+B(t)u, x(0) =x0
lineáris rendszert értjük. Itt azu∈L2Y[0, T]függvények az irányítások, azX tér a rendszer állapottere,Y az irányítási tér. Azuirányítás megválasztása a rendszer pályáját már egyértelműen meghatározza. A rendszer megoldásain Caratheodory-értelemben vett megoldásokat értünk.
A fenti kezdeti érték feladat megoldása a Cauchy-formula szerint ϕ(t) = Φ(t,0)
x0+
Z t 0
Φ(0, s)B(s)u(s)ds
,
aholΦa homogén rendszer mátrix-megoldása, amelyreΦ(0,0) =Eazn×n-es egységmátrix.
21
Vezessük be aΛ :L2[0, T]→X, Λu=
Z T 0
Φ(0, s)B(s)u(s)ds folytonos lineáris leképezést. Ezzel a jelöléssel
ϕ(T) = Φ(T,0) (x0+ Λu).
A továbbiakban szükségünk lesz aΛ leképezésΛ∗ adjungáltjára1.
2.1. Állítás. A Λ∗ : X → L2[0, T] leképezésre bármely x∈ X és t ∈[0, T] mellett
(Λ∗x)(t) =B(t)∗Φ(0, t)∗x.
Bizonyítás. Valóban, bármelyu∈L2[0, T]esetén hΛ∗x, ui=hx,Λui=
* x,
Z T 0
Φ(0, s)B(s)u(s)ds +
=
= Z T
0
hx,Φ(0, s)B(s)u(s)ids= Z T
0
hB(s)∗Φ(0, s)∗x, u(s)ids=
=hB(.)∗Φ(0, .)∗x, ui,
amiből adódik az állítás. (Figyelem, az integrálok mögöttX-beli skaláris szor- zat áll !)
2.2. Irányíthatóság
Tekintsük az alábbi irányítási rendszert
x0=A(t)x+B(t)u, (2.1)
x(0) =x0
a[0, T]időintervallumon.
2.2. Definíció. Azt mondjuk, hogy a (2.1) rendszerirányítható a [0, T] in- tervallumon, ha bármelyx0, xT ∈X állapotokhoz található olyanuirányítás, hogy a megfelelőϕtrajektóriáraϕ(0) =x0, ésϕ(T) =xT, azaz
xT = Φ(T,0) x0+ Z T
0
Φ(0, s)B(s)u(s)ds
! .
teljesül.
1Az adjungált leképezések tulajdonságait illetően lásdKánnai : Analitikus módszerek a pénzügyben és a közgazdaságtanban, www.tankonyvtar.hu, 2013.
2.2. Irányíthatóság 23 A mátrix-megoldás tulajdonságai alapján az irányíthatósági feltétel a kö- vetkező ekvivalens alakban írható fel :
xT = Φ(T,0)x0+ Z T
0
Φ(T, s)B(s)u(s)ds.
Ez úgy is írható, hogy
Φ(0, T)xT−x0= Z T
0
Φ(0, s)B(s)u(s)ds= Λu.
Világos, hogy a (2.1) rendszer pontosan akkor irányítható, ha aΛ leképezés képtere az egészX tér, azazim Λ =X.
2.3. Definíció. Az alábbiΛΛ∗ n×nméretű mátrixot ΛΛ∗=
Z T 0
Φ(0, t)B(t)B(t)∗Φ(0, t)∗dt a (2.1) rendszerGram-féle irányíthatósági mátrixának nevezzük.
Könnyen látható, hogyΛΛ∗ szimmetrikus, pozitív szemidefinit mátrix.
2.4. Tétel. im Λ = im ΛΛ∗.
Bizonyítás. Az világos, hogyim Λ⊃im ΛΛ∗.
Fordítva, először belátjuk, hogyker Λ∗= ker ΛΛ∗. Valóban, egyrészt nyil- vánvaló, hogyker Λ∗⊂ker ΛΛ∗. Másrészt, hax∈ker ΛΛ∗, akkor
0 =hx,ΛΛ∗xi=hΛ∗x,Λ∗xi=kΛ∗xk2, tehátΛ∗x= 0, azazx∈ker Λ∗.
Innen az 1.25. ortogonalitási tétel és a Gram-mátrix szimmetriája folytán im Λ⊂(ker Λ∗)⊥ = (ker ΛΛ∗)⊥= im ΛΛ∗,
ami a tételünket igazolja.
Az előző tételünk nyilvánvaló következményeként adódik az alábbi irányít- hatósági kritérium. A tétel jelentősége abban áll, hogy a végtelen dimenziós L2[0, T]Hilbert-téren értelmezettΛleképezés képterének meghatározása he- lyett egyn×n-es mátrix invertálhatóságát kell csak ellenőriznünk.
2.5. Tétel. A(2.1)rendszer akkor és csak akkor irányítható, ha aΛΛ∗Gram- féle irányíthatósági mátrixa nemszinguláris.
A tétel használatát a következő példán illusztráljuk.
2.6. Példa. Tekintsük azt az irányítási rendszert, ahol A(t) =
0 α
−α 0
, B(t) = 0
1
.
Könnyen látható, hogy
Φ(t,0) =
cosαt sinαt
−sinαt cosαt
, és így nem nehéz ellenőrizni, hogy
ΛΛ∗=
" T
2 −sin 2αT4α cos 2αT4α −1
cos 2αT−1 4α
T
2 +sin 2αT4α
# .
Megmutatjuk, hogy ez a mátrix nemszinguláris. Valóban, a determinánsa T2
4 −sin22αT
16α2 −cos22αT−2 cos 2αT + 1
16α2 ,
ami pontosan akkor nulla, ha
4α2T2+ 2 cos 2αT −2 = 0.
Ha bevezetjük aβ= 2αT >0helyettesítést, akkor a fenti egyenlet ekvivalens a
cosβ = 1−β2 2
egyenlettel. Ennek azonban nyilván nincs megoldása, hiszen a g(β) = cosβ−1 + β2
2
függvény deriváltjag0(β) =−sinβ+β >0minden pozitívβ mellett, tehátg szigorúan monoton növő. Másrésztg(0) = 0, ezért agfüggvénynek nem lehet zérushelye a pozitív félegyenesen. TehátΛΛ∗ valóban nemszinguláris, és így a rendszer irányítható.
2.3. Autonóm rendszerek irányíthatósága
Ebben a szakaszban olyan irányítási rendszerekkel foglalkozunk, aholAésB állandó mátrixok. Tekintsük tehát az
x0=Ax+Bu, (2.2)
x(0) =x0
2.3. Autonóm rendszerek irányíthatósága 25 rendszert, aholA n×n, ésB n×m méretű mátrixok.
Jól ismert, hogy autonóm rendszerek esetében a mátrix-megoldás invari- áns az időeltolásra, ezértΦ(t,0) helyett a rövidebb Φ(t)jelölést használjuk.
Ilyenkor
Φ(t) =eAt és Φ(t)−1= Φ(−t) =e−At, és ezért
Λu= Z T
0
Φ(−t)B(t)u(t)dt.
Mivel a mátrixok az időtől függetlenek, egy erősebb irányíthatósági fogalmat vezetünk be.
2.7. Definíció. Azt mondjuk, hogy a (2.2) rendszer teljesen irányítható, ha bármely x0, xT ∈ X állapotokhoz és bármely T > 0 időponthoz van olyanuirányítás a [0, T]intervallumon, hogy a megfelelő kezdeti feltételűϕ trajektóriáraϕ(0) =x0,ϕ(T) =xT.
2.8. Definíció. Tekintsük az alábbin×nmméretű mátrixot : K=
B, AB, A2B, . . . , An−1B .
Ezt a mátrixot a (2.2) rendszerKalman-féle irányíthatóságimátrixának2ne- vezzük.
2.9. Állítás. BármelyT >0 időpontraim ΛΛ∗= imKK∗.
Bizonyítás. Mivel ΛΛ∗ és KK∗ egyaránt szimmetrikus mátrixok, elegendő megmutatni, hogyker ΛΛ∗ = kerKK∗, hiszen a képterek és a magterek az egymás ortogonális komplementerei azX térben.
Először tegyük föl, hogyv∈kerΛΛ∗, ekkor 0 =hv,ΛΛ∗vi=
Z T 0
hv,Φ(−t)BB∗Φ(−t)∗vidt=
= Z T
0
kB∗Φ(−t)∗vk2 dt,
aholΦaz autonóm rendszer mátrixmegoldása, amelyreΦ0(t) =AΦ(t)a szám- egyenesen. Innen az adódik, hogy
B∗Φ(−t)∗v= 0
mindent∈[0, T]esetén. Tekintsük ezt az egyenletet, illetve(n−1)-edrendig bezárólag a deriváltjait a t = 0 pontban, akkor a Φ(0) = E egyenlőségre tekintettel azt kapjuk, hogy
B∗v=B∗A∗v=· · ·=B∗(A∗)n−1v= 0. (2.3)
2Kálmán Rudolf magyar származású amerikai mérnök és matematikus, a modern rendszerelmélet egyik megalkotója.
Ez éppen azt jelenti, hogyK∗v= 0, és így perszeKK∗v= 0.
Fordítva, tegyük föl, hogyv∈kerKK∗. EkkorK∗v= 0, hiszen 0 =hv, KK∗vi=hK∗v, K∗vi=kK∗vk2,
és így fennállnak a (2.3) egyenlőségek. Mivel az A mátrix (n−1)-nél ma- gasabb hatványai mind kifejezhetők azE, A, A2, . . . , An−1 mátrixok lineáris kombinációjaként,
B∗(A∗)kv= 0, k= 0,1,2, . . . Ez azt jelenti, hogy
B∗eA∗tv=B∗Φ(t)∗v= 0 mindentidőpillanatban. Innen ugyanúgy, mint fent
Z T 0
hv,Φ(−t)BB∗Φ(−t)∗vidt=hv,ΛΛ∗vi= 0.
MivelΛΛ∗ szimmetrikus pozitív szemidefinit mátrix, ez csak úgy lehetséges, hogyΛΛ∗v= 0, azazv∈kerΛΛ∗.
2.10. Tétel(Kalman-féle irányíthatósági feltétel). A(2.2)rendszer akkor és csak akkor teljesen irányítható, ha a Kalman-féleK mátrix rangjan.
Bizonyítás. Egyrészt már láttuk, hogy kerKK∗=kerK∗, ezért ezen alterek ortogonális komplementerei is megegyeznek, azaz
imKK∗=imK.
Másrészt az előző állítás alapján bármelyT >0 esetén imΛΛ∗=imKK∗,
tehátΛΛ∗ pontosan akkor nemszinguláris, haK rangjan.
Érdemes megjegyezni, hogy a fentiek szerint ha egy autonóm rendszer irányítható valamely[0, T]intervallumon, akkor teljesen irányítható.
2.11. Példa. Tekintsük újra a 2.6. Példát, ahol a rendszer irányíthatóságát a Gram-mátrixával igazoltuk. Vizsgáljuk most meg a Kalman-féle irányítha- tósági mátrixot. Kétdimenziós rendszerről van szó, így esetünkben
K= [B, AB] =
0 α 1 0
.
Világos, hogyα6= 0 eseténKrangja 2, azaz a rendszer teljesen irányítható.
Autonóm rendszerekre természetesen a Kalman-féle feltétel ellenőrzése ál- talában sokkal egyszerűbb, mint a Gram-mátrix vizsgálata.
2.4. Gyakorlatok 27
2.4. Gyakorlatok
1. Vizsgáljuk meg a Kalman-feltétel alkalmazásával, hogy az x0=
1 1 2 2
x+
1 0
u
teljesen irányítható-e ?
2. LegyenU azXnormált tér olyan konvex zárt részhalmaza, amely szim- metrikus, azazU =−U, továbbá0∈intU. Tekintsük az
kxk= inf{t >0 :x∈tU}
úgynevezett Minkowski-normát. Igazoljuk, hogy ez valóban normát de- finiál azXtéren. Vajon hogyan karakterizálható azu(t)∈U irányítás ? 3. Tekintsük a következő autonóm rendszert :
x0 =
0 1 0
0 −1 1
0 0 −1
x+b·u.
Vajon milyenb∈R3 vektor esetén lesz a rendszer teljesen irányítható ? 4. Döntsük el, hogy az
x0= 2 1
0 2
x+ 1
1
u
autonóm lineáris rendszer teljesen irányítható-e ? Keressünk olyan irá- nyítást, amelyx0= (0,0),x1= (1,1) mellett megoldása az
inf{kuk: Λu= ¯x}
optimális irányítási feladatnak a[0,1]intervallumon.
3. fejezet
A Pontrjagin-féle maximumelv
Ebben a fejezetben megfogalmazzuk a Pontrjagin-féle maximumelvet néhány lineáris rendszerekre vonatkozó optimalizálási feladatban. Tételeinket példák- kal illusztráljuk.
3.1. A minimális norma feladat
Vizsgáljuk meg a következő optimális irányítási feladatot. Tekintsük a[0, T] intervallumon a (2.1) alatti lineáris rendszert :
x0(t) =A(t)x(t) +B(t)u(t), (3.1) aholAésB, illetve azuirányítás kielégítik a (2.1) rendszer feltételeit.
Legyenek adottak azx0 ésxT állapotok azX térben. Keresendő olyan u négyzetesen integrálható irányítás, hogy a rendszerx(0) =x0kezdeti feltételű xmegoldására
x(T) =xT, (3.2)
és amelyre
Z T 0
ku(t)k2dt→min, (3.3) azaz az integrál minimális.
3.1. Definíció. Azt mondjuk, hogy az (x, u)pármegengedett folyamat, ha uolyan irányítás, amelyre a rendszerx(0) =x0kezdeti feltételűxmegoldása kielégíti a (3.2) feltételt.
29
Azt mondjuk továbbá, hogy (x, u) optimális folyamat, ha olyan megen- gedett folyamat, amelyre a (3.3) integrál minimális. Ilyenkor u-t optimális irányításnak nevezzük.
Az eddigi jelöléseinkkel élve a (3.2) egyenlőség azt jelenti, hogy xT = Φ(T,0) x0+
Z T 0
Φ(0, t)B(t)u(t)dt
! ,
azaz
Φ(0, T)xT −x0= Z T
0
Φ(0, t)B(t)u(t)dt= Λu.
Ha bevezetjük az x¯ = Φ(0, T)xT −x0 jelölést, akkor a fenti egyenlőség a Λu= ¯xalakba írható át.
3.2. Tétel. Ha a (3.1) rendszer irányítható a [0, T] intervallumon, akkor a fenti normaminimalizálási feladatnak pontosan egy megoldása van.
Bizonyítás. Világos, hogy valamely(x, u)∈WX2[0, T]×L2Y[0, T]akkor és csak akkor megengedett folyamat, haΛu= ¯x. Tekintsük a következő halmazt :
K={v∈L2Y[0, T] : Λv= ¯x}.
Az irányíthatósági feltétel miatt egyrésztKnem üres, másrészt könnyen lát- ható, hogy konvex és zárt halmaz. Azuirányítás pontosan akkor megoldása a feladatnak, ha aKhalmaz minimális normájú eleme. Az 1.1. Tétel szerint pontosan egy ilyen elem létezik, és ez éppen az optimális irányítás.
Ezután rátérünk az optimalitás szükséges feltételének megfogalmazására.
A (3.1) lineáris rendszer adjungált rendszerén az y0(t) =−A(t)∗y(t)
homogén lineáris rendszert értjük. Az adjungált rendszer mátrix-megoldása Φ(t,0)−1∗
= Φ(0, t)∗
Jól ismert, hogy az adjungált rendszer trajektóriái ortogonálisak az eredeti homogén rendszer trajektóriáira1.
3.3. Tétel(Pontrjagin-féle maximumelv). Ha(x, u)optimális folyamat, ak- kor
• található olyanp∈X, amelyreu= Λ∗p,
1Az adjungált rendszerről bővebben lásd :Tallos : Dinamikai rendszerek alapjai, Au- la, 1999.
3.1. A minimális norma feladat 31
• azy0(t) =−A(t)∗y(t)adjungált rendszernek létezik olyan ψmegoldása, hogy
hψ(t), B(t)u(t)i= max
kvk≤ku(t)khψ(t), B(t)vi m.m.t∈[0, T]esetén. Ha ittu6= 0, akkor ψ6= 0.
Bizonyítás. Az első állítás közvetlenül adódik az 1.26. Állításból. Ekkor va- lamelyp∈X mellettu= Λ∗p, és ezértΛΛ∗p= ¯x.
Ha valamely másikq∈X mellett ugyancsakΛΛ∗q= ¯x, akkor p−q∈ker ΛΛ∗= ker Λ∗,
ezértΛ∗q=u.
Térjünk rá a második állítás igazolására. Legyen a[0, T]intervallumon ψ(t) = Φ(0, t)∗p.
Ekkor egyrésztψ megoldása az adjungált rendszernek, másrészt az u(t) = (Λ∗p)(t) =B(t)∗Φ(0, t)∗p
egyenlőség folytánu(t) =B(t)∗ψ(t), innen adódik, hogyψ6= 0, hau6= 0.
Legyen mostv ∈Y tetszőleges vektor. Ekkor a [0, T]intervallum m.m. t pontjában
1
2 kvk2+ku(t)k2
≥ ku(t)k · kvk ≥ hu(t), vi.
Mindkét oldalbólku(t)k2-et kivonva 1
2 kvk2− ku(t)k2
≥ hu(t), v−u(t)i=hB(t)∗ψ(t), v−u(t)i=
=hψ(t), B(t)v−B(t)u(t)i.
Az egyenlőtlenséget átrendezve azt kapjuk, hogy
−1
2ku(t)k2+hψ(t), B(t)u(t)i ≥ −1
2kvk2+hψ(t), B(t)vi.
Dekvk ≤ ku(t)kesetén1/2ku(t)k2≥1/2kvk2. E két utóbbi egyenlőtlenséget összeadva adódik a tétel állítása.
Amaximumelv elnevezés a tétel második állításában szereplő maximum- tulajdonságból ered. Ezt a tulajdonságot egy egyszerű formalizmussal még könnyebben megjegyezhetővé tehetjük.
3.4. Definíció. A (3.1), (3.2), (3.3) alatti lineáris optimális irányítási feladat Hamilton-függvényén a[0, T]×X×Y ×X halmazon értelmezett
H(t, x, u, p) =−1
2kuk2+hp, A(t)x+B(t)ui függvényt értjük.
Ezzel a formalizmussal a maximumelv a következő egyszerű alakba írható át.
3.5. Tétel(Pontrjagin-féle maximumelv, Hamilton-formalizmus). Ha(x, u) optimális folyamat, akkor az
y0(t) =−∂2H(t, x(t), u(t), y(t)) adjungált rendszernek létezik olyanψ megoldása, amelyre
H(t, x(t), u(t), ψ(t)) = max
v∈Y H(t, x(t), v, ψ(t)) majdnem mindent∈[0, T]pontban.
Tételünk szemléletesen azt jelenti, hogy a Hamilton-függvény a maximu- mát az optimális irányítás mentén veszi fel. Ez esetünkben azt jelenti, hogy
∂3H(t, x(t), u(t), ψ(t)) = 0 a[0, T]intervallum majdnem minden pontjában.
3.6. Példa. Oldjuk meg a[0,2]időintervallumon a következő normaminima- lizálási feladatot :
x01= π 4x2, x02=−π
4x1+u.
Állítsuk elő az optimális irányítást, ha a kezdő és végállapotok x0=
1 1
és x2= 0
0
és amelyre az alábbi integrál minimális : Z 2
0
|u(t)|2dt→min. Esetünkben
A=
0 π4
−π4 0
és B= 0
1
,
3.1. A minimális norma feladat 33 és ezért
[B, AB] =
0 π4 1 0
,
tehát a rendszer a Kalman-feltétel szerint teljesen irányítható. Másrészt erre az autonóm rendszerre
Φ(t) =eAt=
cosπ4t sinπ4t
−sinπ4t cosπ4t
,
és innen
Φ(t)−1B=e−AtB =
−sinπ4t cosπ4t
.
Ebből egyszerű integrálással ΛΛ∗=
Z 2 0
e−AtBB∗e−A∗tdt=
= Z 2
0
=
"
sin2π4t 12sinπ2t
−12sinπ2t cos2π4t
#
=
1 −π2
−2π 1
.
Könnyen ellenőrizhető, hogy
¯
x=e−2Ax2−x0= −1
−1
,
ezért aΛΛ∗p= ¯xegyenlet az alábbi alakot ölti : 1 −π2
−π2 1
·p= −1
−1
.
Innen azonnal
p=− π π−2
1 1
. Végül az optimális irányítás az
u(t) = (Λ∗p)(t) =B∗e−A∗tp=− π π−2
h−sinπ 4t,cosπ
4ti
· 1
1
=
= π
π−2 sinπ
4t−cosπ 4t formulával adható meg(t∈[0,2]).
3.2. Az időoptimum-feladat
Most egy olyan feladatot vizsgálunk meg, amelyben a[0, T]intervallum nem rögzített. Legyen U az Y térnek olyan adott konvex részhalmaza, amelyre 0∈U. Csak olyan irányításokat tekintünk megengedettnek, amelyek az aláb- bi halmazhoz tartoznak :
Uˆ ={u∈L2Y[0, T] :u(t)∈U m.m.}.
Legyen adott azx0∈X kezdeti állapot, és tekintsük az x0(t) =Ax(t) +Bu(t) autonóm lineáris irányítási rendszert az
x(0) =x0 és x(T) = 0
peremfeltételek mellett. Keresendő olyanu∈Uˆmegengedett irányítás, amely- re teljesülnek a fenti peremfeltételek, és amelyre aT időpont minimális. Ezt a problémátidőoptimum-feladatnak nevezzük.
3.7. Definíció. Adottt >0időpillanat mellett jelöljeEtazonx0∈Xpontok összességét, amelyekre vannak olyan x(0) = x0 tulajdonságú x∈ WX2 [0, T] ésu∈Uˆ függvények, hogy a[0, t]intervallumonx0 =Ax+Bu, ésx(t) = 0.
(TehátEta rendszer azon kezdőállapotainak halmaza, amelyekből az origót idő alatt elérhető.) Legyen továbbá
Et0= [
0<s<t
Es.
Az alábbi állítás teljesen nyilvánvaló a definíció és a0∈U feltétel alapján.
3.8. Állítás. Bármely0< s < t időpontokraEs⊂Et.
3.9. Állítás. Bármelyt >0 időpontra azEt ésEt0 halmazok konvexek.
Bizonyítás. Hax, y∈Et, akkor jelöljeuésvazokat az irányításokat, amelyek azx, illetveyállapotokat az origóba irányítjáktidő alatt. Ekkor tetszőleges 0< α <1skalárra azαu+ (1−α)v irányítás azαx+ (1−α)ykezdőállapotot tidő alatt az origóba viszi. Tehátαx+ (1−α)y∈Et.
Az E0t halmaz konvexitása abból adódik, hogy előáll monoton növekedő konvex halmazok egyesítéseként.
3.10. Állítás. Tegyük fel, hogy(x, u)megengedett folyamat a[0, T]interval- lumon, és legyenψaz
y0(t) =−A∗y(t)