Variációszámítás és optimális irányítás

(1)

VARIÁCIÓSZÁMÍTÁS ÉS OPTIMÁLIS

IRÁNYÍTÁS

(2)

Algoritmuselmélet

Algoritmusok bonyolultsága

Analitikus módszerek a pénzügyben és a közgazdaságtanban Analízis feladatgyűjtemény I

Analízis feladatgyűjtemény II Bevezetés az analízisbe Complexity of Algorithms Differential Geometry

Diszkrét matematikai feladatok Diszkrét optimalizálás

Geometria

Igazságos elosztások

Introductory Course in Analysis Mathematical Analysis – Exercises I

Mathematical Analysis – Problems and Exercises II Mértékelmélet és dinamikus programozás

Numerikus funkcionálanalízis Operációkutatás

Operációkutatási példatár Parciális differenciálegyenletek Példatár az analízishez Pénzügyi matematika Szimmetrikus struktúrák Többváltozós adatelemzés

Variációszámítás és optimális irányítás

(3)

Kánnai Zoltán Szabó Imre

Tallos Péter

VARIÁCIÓSZÁMÍTÁS ÉS OPTIMÁLIS

IRÁNYÍTÁS

Budapesti Corvinus Egyetem Typotex

2014

(4)

Lektorálta : Varga Zoltán, Szent István Egyetem

Creative Commons NonCommercial-NoDerivs 3.0 (CC BY-NC-ND 3.0) A szerző nevének feltüntetése mellett nem kereskedelmi céllal szabadon másolható, terjeszthető, megjelentethető és előadható, de nem módosítható.

ISBN 978 963 279 237 8

Készült a Typotex Kiadó (http://www.typotex.hu) gondozásában Felelős vezető : Votisky Zsuzsa

Műszaki szerkesztő : Gerner József

Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0045 számú,

„Jegyzetek és példatárak a matematika egyetemi oktatásához” című projekt keretében.

KULCSSZAVAK : Hilbert-tér, lineáris rendszer, irányíthatóság, Pontrjagin- féle maximumelv, időoptimum-feladat, differenciálszámítás, Euler–Lagrange- egyenlet, inverzfüggvény-tétel, Ljuszternik-tétel, nemlineáris Pontrjagin-féle maximumelv.

ÖSSZEFOGLALÁS : Az első rész a lineáris rendszerek irányíthatóságát és optimalizálását tárgyalja. Csak négyzetesen integrálható irányításokra szo- rítkozunk, így a Pontrjagin-féle maximumelvet egy igen szemléletes absztrakt elvből, a Hilbert-terek ortogonalitási tételéből vezetjük le. A második rész nemlineáris rendszerek optimalizálásával foglalkozik. Itt a Pontrjagin-féle maximumelvet ugyancsak az ortogonalitási tételből és a Ljuszternik-tételből vezetjük le. Mindkét részben az optimalitási kritériumokat bőséges, elsődle- gesen közgazdaságtanilag releváns példaanyaggal illusztráljuk.

(5)

Tartalomjegyzék

Előszó 1

I. Globális optimalizálás : lineáris rendszerek 3

1. Hilbert-terek geometriája 5

1.1. Variációs egyenlőtlenségek . . . 5

1.2. Riesz-reprezentáció . . . 8

1.3. Gyenge konvergencia . . . 9

1.4. Gyenge kompaktság . . . 11

1.5. Extremális pontok . . . 14

1.6. Az ortogonalitási tétel . . . 15

1.7. Egy optimális irányítási feladat . . . 16

1.8. Gyakorlatok . . . 18

2. Lineáris rendszerek 21 2.1. Lineáris irányítási rendszerek . . . 21

2.2. Irányíthatóság . . . 22

2.3. Autonóm rendszerek irányíthatósága . . . 24

3. A Pontrjagin-féle maximumelv 29 3.1. A minimális norma feladat . . . 29

3.2. Az időoptimum-feladat . . . 34

3.3. Elégséges feltétel optimalitásra . . . 37

3.4. Példa időoptimális irányításra . . . 39

4. A bang-bang-elv 43 4.1. Bevezetés . . . 43

4.2. Mérhető halmazértékű leképezések . . . 44 i

(6)

4.5. Bang-bang elv . . . 50

II. Lokális optimalizálás : nemlineáris rendszerek 55

5. Differenciálszámítás normált terekben 57 5.1. Differenciálhatóság . . . 57

5.2. Iránymenti deriváltak . . . 60

5.3. Folytonos differenciálhatóság . . . 61

5.4. Példák differenciálhatóságra . . . 62

5.5. Szélsőérték . . . 65

5.6. Monotonitás és konvexitás . . . 65

6. Variációszámítás 69 6.1. A Lagrange-feladat . . . 69

6.2. Az Euler–Lagrange-egyenlet . . . 70

6.3. Elégséges feltétel . . . 72

6.4. Szabad végpontú feladatok . . . 74

6.5. A haszonmaximalizálási feladat . . . 77

6.6. A Ramsey-féle növekedési modell . . . 78

6.7. Monopólium árazási problémája . . . 82

7. Lagrange-multiplikátorok 87 7.1. Faktorterek . . . 87

7.2. Az általánosított inverzfüggény-tétel . . . 89

7.3. Az ortogonalitási tétel . . . 92

7.4. A Lagrange-elv . . . 93

7.5. Az izoperimetrikus probléma . . . 95

8. Optimális irányítás 97 8.1. Az irányítási feladat . . . 97

8.2. Az irányíthatósági feltétel . . . 98

8.3. A Pontrjagin-féle maximumelv . . . 100

8.4. A transzverzalitási feltétel . . . 103

8.5. A jövedelemallokációs probléma . . . 108

8.6. Gyakorlatok . . . 110 ii

(7)

9. A maximumelv elégségessége 111

9.1. A maximumelv egységes végpontfeltétellel . . . 111

9.2. A Mangasarian-féle elégséges feltétel . . . 113

9.3. Az Arrow-féle elégséges feltétel . . . 115

10.Optimális irányítási modellek 119 10.1. Az Atkinson-féle haszonmaximalizálási feladat . . . 119

10.2. Monopólium befektetési problémája . . . 123

10.3. A Shell-féle növekedési modell . . . 125

10.4. A Hotelling-szabály . . . 128

10.5. Egy makroökonómiai beruházási modell . . . 131

11.Többszektoros irányítási modellek 135 11.1. Kétszektoros makroökonómiai modell . . . 135

11.2. Egy környezetgazdaságtani probléma . . . 139

iii

(8)

(9)

Előszó

Ez a kézikönyv matematikai bevezetésként kíván szolgálni a variációszámítás és az optimális irányítások elméletének tanulmányozásához, és elsősorban a közgazdasági mesterképzésben, illetve a doktori képzésben részt vevő hall- gatók számára készült. Ennek megfelelően tárgyalja a legegyszerűbb lineáris irányítási rendszerek tulajdonságait, az alapvető variációs feladatokat és a nemlineáris rendszerekre vonatkozó Pontrjagin-féle maximumelvet.

A közgazdaságtan nemzetközi szakirodalmában számos olyan monográfia létezik, amely ezzel a területtel foglalkozik : a teljesség igénye nélkül utalunk Aoki, illetveSydsaeter, Hammond, Seierstad, vagyKamien, Schwartz, továb- báSethi, Thompson munkáira (lásd az irodalomjegyzéket). Ezek a könyvek azonban a tételek megfogalmazására, azok interpretációjára és példákon ke- resztüli illusztrációira szorítkoznak. Nem adnak viszont képet az eredmények matematikai hátteréről. Számtalanszor szembesültünk azzal, hogy hallgató- ink igénylik ennek tárgyalását is.

Igyekeztünk egy olyan könyvet az olvasó kezébe adni, amely rávilágít arra, hogy ezek a sokszor nagyon bonyolult dinamikus optimalizálási feladatok va- lójában roppant szemléletes és rendkívül egyszerű geometriai elveken nyug- szanak. Ilyenek például a lineáris rendszerek esetében a legközelebbi pont elve és az ortogonalitási tétel Hilbert-terekben, illetve nemlineáris rendszerek esetében az érintősík fogalma és az ortogonalitási tétel normált terekben.

Alapvető koncepciónk volt, hogy a dinamikus optimalizálás eredményeit ezen szemléletes geometriai elvek köré csoportosítsuk.

Úgy látjuk, hogy egy ilyen anyag hiánypótló lehet a közgazdaságtani szak- irodalomban. Ezzel együtt bátorítjuk az olvasót az említett szakkönyvek nagyon igényes példaanyagának tanulmányozására is. A szükséges analízisisme- retek megtalálhatókKánnai ésMagyarkuti jegyzeteiben. Dinamikus optima- lizálási feladatok egy szélesebb körének tárgyalását olvashatjuk Kósa köny- veiben.

A könyv anyaga az évek során a Budapesti Corvinus Egyetem gazdaság- matematika szakán és a közgazdaságtani doktori iskola keretében tartott elő- adásaink rendszerezését tartalmazza. Nagyon bízunk azonban abban, hogy haszonnal forgathatják a természettudományi és műszaki képzésekben részt vevő hallgatók is.

Ezúton is szeretnénk köszönetet mondani hallgatóinknak, akik órai vagy órán kívüli megjegyzéseikkel segítettek érthetőbbé tenni az anyagot. Hálásak vagyunk Varga Zoltánnak, akitől nagyon sok segítséget kaptunk munkánk során.

Budapest, 2013. június

Kánnai Zoltán, Szabó Imre, Tallos Péter

(10)

(11)

I. rész

Globális optimalizálás : lineáris rendszerek

3

(12)

(13)

1. fejezet

Hilbert-terek geometriája

Ebben a fejezetben megismerkedünk a Hilbert-terek geometriájának alapja- ival, a gyenge konvergenciával és egy igen általános globális optimalizálási elvvel. Ez az elv módszert is szolgáltat néhány érdekes optimalizálási feladat megoldására.

Az alábbiakban Hilbert-téren mindig a valós test fölötti teret értünk¹.

1.1. Variációs egyenlőtlenségek

A most következő absztrakt tétel a globális optimalizálási problémák talán legfontosabb alaptételének tekinthető.

1.1. Tétel. Egy Hilbert-tér nem üres konvex, zárt részhalmazában egyetlen minimális normájú elem van.

Bizonyítás. LegyenK konvex, zárt halmaz és α= inf{kxk:x∈K}.

Válasszunk egy olyanK-belix_nsorozatot, amelyreα= limkx_nk. A parallelogramma-azonosság miatt

1

2(xn−xm)

2

= 1

2 kxnk²+kxmk²

− 1 2xn+1

2xm

2

≤

≤ 1

2 kxnk²+kxmk²

−α²→0,

1A Hilbert-terek elméletének alapjait illetően lásdKánnai : Analitikus módszerek a pénzügyben és a közgazdaságtanban, www.tankonyvtar.hu, 2013.

5

(14)

tehátxn Cauchy-sorozat. Mivel a tér teljes és K zárt, azért xn konvergens, ésxn→z∈K. Mivel

0≤

kx_nk − kzk

≤ kx_n−zk →0,

világos, hogykzk=α. Másrészt, hay∈K is minimális normájú elem lenne, akkor ismét a parallelogramma-azonosság szerint

1 2(z−y)

2

=α²− 1 2z+1

2y

2

≤0, azazz=y.

1.2. Tétel. Legyen K a H Hilbert-tér konvex zárt részhalmaza, és x∈ H. Akkor aK halmazban azxponthoz egyetlen legközelebbi pont van.

Bizonyítás. Alkalmazzuk az előző tételt aK−xhalmazra.

A fenti állításokban csak az optimális elem létezését és egyértelműségét igazoltuk. A következőkben egy karakterizációt is megadunk. Az ilyen típusú állításokat variációs egyenlőtlenségeknek nevezzük.

1.3. Tétel (Tompaszög-tétel). LegyenK aH Hilbert-tér egy nem üres konvex, zárt részhalmaza, és x∈H. A z ∈K vektor akkor és csak akkor az x vektorhoz legközelebbi elem, ha

hx−z, z−yi ≥0 (1.1)

mindeny∈K esetén.

Bizonyítás. Legyenz az egyetlen legközelebbi elem. Bármely y ∈K és0 ≤

≤t≤1mellett(1−t)z+ty∈K. Tekintsük a g(t) =kx−(1−t)z−tyk² másodfokú függvényt. Könnyen ellenőrizhető, hogy

g⁰(t) = 2hx−(1−t)z−ty, z−yi, illetve

g⁰⁰(t) = 2hz−y, z−yi= 2kz−yk².

Haz legközelebbi elem, akkorg⁰(0)≥0, ami éppen az (1.1) egyenlőtlenség.

Fordítva, ha fennáll az (1.1) egyenlőtlenség valamelyz∈Kvektorra, akkor egyrésztg⁰(0)≥0, másrésztg⁰⁰(t)≥0mindent-re. Ez azt jelenti, hogyg(0)≤

≤g(1), azaz zvalóban azxvektorhoz legközelebbi elem.

(15)

1.1. Variációs egyenlőtlenségek 7 A variációs egyenlőtlenség geometriai interpretációja igen szemléletes. Ezt úgy fogalmazhatjuk meg, hogy a z legközelebbi pontban az x−z vektor bármely aK felé mutatóy−zvektorral tompaszöget zár be.

1.4. Definíció. Legyen K a H Hilbert-tér nem üres konvex, zárt részhal- maza. Tetszőlegesx∈H mellett jelentsePK(x)azxvektorhoz legközelebbi elemetK-ban. Ezt azxprojekciójának nevezzük aK halmazra.

Zárt alterekhez (ilyenek például a véges dimenziós alterek) legközelebbi pont merőleges vetítéssel nyerhető, ezt fogalmazzuk meg az alábbi állításban.

1.5. Tétel. Tekintsük a H Hilbert-tér egy L zárt alterét. Ekkor egy x∈ H vektor projekciója a következőképpen karakterizálható :

hx−PL(x), yi= 0 mindeny∈L vektorra. TovábbáP_L lineáris leképezés.

Bizonyítás. Valóban, bármelyy ∈Lés valóstmellettPL(x)−ty∈L, ennél- fogva a

g(t) =kx−P_L(x) +tyk²

függvénynek a t= 0 helyen minimuma van. Ezért g⁰(0) = 0, amiből adódik a karakterizáció.

Fordítva, ha valamelyz∈Lvektorrax−zmerőleges azLminden elemére, akkor tetszőlegesy∈Lvektorra

kx−yk²=kx−zk²+ky−zk², azazzvalóban az x-hez legközelebbiL-beli elem.

Másrészt nyilvánvaló, hogyPL(αx) =αPL(x), ígyPL homogén. Az addi- tivitás abból adódik, hogy

h(x1+x2)−PL(x1+x2), yi= 0

minden y ∈L esetén, ha ez az x₁ és x₂ vektorokra egyaránt fennáll. Tehát P_L(x₁+x₂) =P_L(x₁) +P_L(x₂), azazP_Lvalóban lineáris leképezés.

1.6. Tétel. HaLaH Hilbert-tér zárt altere, akkor H =L⊕L^⊥. Bizonyítás. Valóban, bármelyx∈H felírható

x=PL(x) + (x−PL(x))

alakban, aholP_L(x)∈Lésx−P_L(x)∈L^⊥. Ez a felbontás egyértelmű is az előző tételünk alapján.

(16)

1.2. Riesz-reprezentáció

Haa∈H adott vektor aH Hilbert-térben, akkor aH-n értelmezett f(x) =hx, ai

lineáris függvény folytonos is, hiszen|f(x)−f(y)| ≤ kak · kx−yka Cauchy–

Schwarz-egyenlőtlenség szerint. Az alábbiakban megmutatjuk, hogy ez a pél- da tipikus, azaz egy Hilbert-tér minden folytonos lineáris funkcionálja meg- adható ilyen alakban.

1.7. Állítás. Az f lineáris függvény a H Hilbert-téren akkor és csak akkor folytonos, ha van olyanαpozitív szám, amelyre

|f(x)| ≤α· kxk mindenx∈H vektorra.

Bizonyítás. Az elégségesség nyilvánvaló, ha ugyanisxn→x, akkor

|f(xn)−f(x)|=|f(xn−x)| ≤α· kxn−xk →0.

A szükségességhez elég belátni, hogy α= sup

|f(x)|

kxk :x6= 0

véges. Ha ugyanis ez végtelen lenne, akkor találhatnánk olyanx_n sorozatot, amelyre

yn= x_n

|f(xn)| →0,

jóllehet|f(yn)|= 1mindennmellett, ellentmondva a folytonosságnak.

1.8. Tétel(Riesz-féle reprezentációs tétel). AH Hilbert-tér bármelyf folytonos lineáris funkcionáljához egyértelműen található olyan a ∈ H vektor, hogy

f(x) =hx, ai mindenx∈H mellett.

Bizonyítás. Föltehető, hogyfnem azonosan nulla. Válasszunk egyyvektort, amelyre f(y) 6= 0. Jelölje z az y projekcióját a kerf zárt altérre, és legyen b=y−z. Ekkor b merőleges a kerf altérre, továbbáf(b) =f(y). Bármely x∈H vektor esetén

x−f(x) f(b)b

(17)

1.3. Gyenge konvergencia 9 a kerf altérben fekszik, és így merőleges ab vektorra, azaz

hx, bi= f(x) f(b)hb, bi.

Ezt az

a= f(b) kbk²b

jelölés bevezetésével úgy is írhatjuk, hogyf(x) =hx, aimindenx∈Hesetén.

Az is nyilvánvaló, hogy ez aza vektor egyértelmű. Ha ugyanis b is ilyen tulajdonságú, akkorhx, a−bi= 0mindenx∈H vektorra, azaza=b.

1.9. Példa. Tekintsük az L²[0, T] Hilbert-teret. Riesz tétele értelmében e téren bármely folytonos lineáris funkcionál

ϕ7→

Z T 0

ϕ(t)ψ(t)dt

alakban adható meg, aholψ∈L²[0, T]alkalmas függvény.

Ellentétben a véges dimenziós esettel, egy végtelen dimenziós Hilbert-téren egy lineáris függvény nem feltétlenül folytonos.

1.3. Gyenge konvergencia

Egy végtelen dimenziós normált térben egy korlátos zárt halmaz nem feltétle- nül kompakt. Ez azt is jelenti, hogy egy korlátos sorozatnak nem feltétlenül lé- tezik konvergens részsorozata. Hilbert-terekben azonban megfogalmazhatunk Bolzano–Weierstrass típusú tételt, ha a konvergencia fogalmát gyengítjük.

1.10. Definíció. Azt mondjuk, hogy aH Hilbert-térben azxn sorozat gyen- gén tartx-hez, ha

hxn, yi → hx, yi mindeny∈H mellett.

1.11. Állítás. Haxn→xnormában, akkorxn →xgyengén is.

Bizonyítás. Valóban, bármelyy∈H esetén

|hxn, yi − hx, yi|=|hxn−x, yi| ≤ kxn−xk · kyk →0.

1.12. Tétel. Egy Hilbert-térben bármely korlátos sorozatnak van gyengén konvergens részsorozata.

(18)

Bizonyítás. Tekintsük a H Hilbert-tér valamely korlátos sorozatát, kxnk ≤

≤β. JelöljeM az xn elemek által generált zárt alteret, és jelentse M^⊥ az ortogonális komplementerét. Mivel αn = hx1, xni korlátos számsorozat, így kiválasztható belőle egy

α¹_n=hx1, x¹_ni

konvergens részsorozat. Hasonlóan,hx₂, x¹_niis korlátos számsorozat, így ebből is kiválasztható egy

α²_n=hx2, x²_ni

konvergens részsorozat. Az eljárást folytatva tekintsük az így keletkező xⁿ_n átlós sorozatot. Ekkor bármely k indexre hxk, xⁿ_ni konvergens, hiszen n > k mellett éppen azα^k_n konvergens sorozat részsorozatával van dolgunk. Meg- mutatjuk, hogyxⁿ_n gyengén konvergens.

Vezessük be az

f(x) = lim

n→∞hx, xⁿ_ni

függvényt, hacsak a limesz létezik. Ez a határérték nyilván létezik azxn sorozat elemeiből alkotott véges lineáris kombinációkra, amelyek sűrű halmazt alkotnak az M altérben. Ebből következik, hogy f az egész M altéren ér- telmezhető, ha ugyanis y ∈ M tetszőleges, akkor található az xn lineáris kombinációinak olyanymsorozata, amelyre ym→y. Ezekre létezik az

f(ym) = lim

n→∞hym, xⁿ_ni határérték. Továbbá az

|hy_k−y_m, xⁿ_ni| ≤βky_k−y_mk (1.2) egyenlőtlenség folytán f(y_m) Cauchy-sorozat, tehát konvergens is, azaz f(y_m) → α valamilyen α valós számra. Ez azt jelenti, hogy adott ε pozi- tív számhoz találhatók olyanmésN (azm-től függő) indexek, hogy bármely n≥N mellett

|α− hy, xⁿ_ni| ≤ |α−f(y_m)|+|f(y_m)− hy_m, xⁿ_ni|+

+|hym, xⁿ_ni − hy, xⁿ_ni| ≤ ε 3 +ε

3+ε 3 =ε

az (1.2) reláció alapján. Ez pontosan azt jelenti, hogy hy, xⁿ_ni konvergens, következésképpenf(y) =α.

Legyen ezenkívül f azonosan nulla az M^⊥ altéren, így nyilvánvalóan f értelmezve van az egészH téren. Továbbá f lineáris és folytonos is, hiszen haym→y, akkor

|f(ym−y)|= lim

n→∞|hym−y, xⁿ_ni| ≤βkym−yk →0.

Riesz tétele folytán van olyana∈H vektor, amelyref(x) =hx, ai. Azonnal látható, hogyxⁿ_n→agyengén.

(19)

1.4. Gyenge kompaktság 11 1.13. Példa. Tekintsünk egy olyanϕnsorozatot azL²_X[0, T]térben, amelyre létezik olyanλ∈L²[0, T]valós függvény, hogy

kϕn(t)k ≤λ(t)

minden nés majdnem minden t ∈[0, T]mellett. Ez a sorozat korlátos, így szükségképpen van gyengén konvergens részsorozta. Ez azt jelenti, hogy ta- lálható olyanϕ_n_k részsorozat és olyanϕ∈L²_X[0, T]függvény, hogy

Z T 0

hϕ_n_k(t), ψ(t)idt→ Z T

0

hϕ(t), ψ(t)idt mindenψ∈L²_X[0, T]mellett.

A következő állításban azt látjuk, hogy a gyenge konvergenciából milyen további feltétel mellett következik a norma szerinti konvergencia.

1.14. Tétel. Ha xn → x gyengén és kxnk → kxk, akkor xn tart x-hez normában is.

Bizonyítás. Valóban,

kx−xnk²=kxk²−2hx, xni+kxnk²→ kxk²−2kxk²+kxk²= 0, hiszenhx, x_ni → kxk²a gyenge konvergencia miatt.

1.4. Gyenge kompaktság

Ebben a szakaszban egy Hilbert-tér konvex zárt részhalmazairól látjuk be, hogy zártak a gyenge konvergenciára. Megvizsgáljuk a gyenge kompaktságot is.

1.15. Tétel. Haxn→xgyengén aH Hilbert-térben, akkor x∈cl co{x1, x2, . . .},

azazxa sorozat elemei által kifeszített konvex zárt halmazban fekszik.

Bizonyítás. Jelentse K = cl co{x₁, x₂, . . .} a sorozat elemeinek zárt konvex burkát. Indirekt módon tegyük fel, hogyx6∈K, és jelentsezazxprojekcióját aKhalmazra, azazz=PK(x). Mivelxn−zis gyengén tart azx−zvektorhoz, azért az 1.3. Tétel szerint

0≥ hxn−z, x−zi → kx−zk². Ez azt jelenti, hogyx=z, azazx∈K.

(20)

1.16. Tétel (Mazur tétele). Ha xn → x gyengén, akkor található az xn

elemek konvex kombinációiból álló olyan

ym=

k_m

X

j=1

αm_jxm_j

sorozat, amelyreym→xnormában.

Bizonyítás. JelentseC={x1, x2, . . .}a sorozat elemeinek halmazát. Mivel az előző állításunk szerintx∈cl coC=K, azért mindenmtermészetes számra

x+ 1

mB∩coC6=∅.

Válasszunk tetszőlegesen egyy_m elemet a metszetből, az így nyert sorozat nyilván eleget tesz a tétel kívánalmának.

1.17. Definíció. AzHHilbert-tér valamelyKrészhalmazátgyengén zártnak nevezzük, ha bármely gyengén konvergensK-beli sorozat határértéke is aK halmazban fekszik.

Azt mondjuk továbbá, hogyKgyengén kompakt, ha bármelyK-beli soro- zatból kiválasztható aK-ban gyengén konvergens részsorozat.

Világos, hogy minden gyengén zárt halmaz egyúttal zárt is. Ennek megfor- dítása általában nem érvényes, tekintsük például azt azl²-beliK={x1, x2, ...}

halmazt, ahol az xn sorozat elemeire ξⁿ_n = 1, illetve ξ_kⁿ = 0, ha k 6=n. Ez a halmaz zárt, hiszen nincs is torlódási pontja, ugyanis kxn −xmk = √

2 bármely két különböző indexre. Azonban nem gyengén zárt, hiszen könnyű ellenőrizni, hogyxn→0 gyengén, de06∈K. (Lásd a 4. gyakorlatot.)

Az is világos, hogy a norma szerint kompakt halmazok egyúttal gyengén kompaktak is, hiszen bármely konvergens sorozat gyengén is konvergens. A megfordítás azonban már nem érvényes, tekintsük példaként az előző be- kezdésx_n vektorainak halmazát a zérussal kiegészítve. Az így nyert halmaz gyengén kompakt (hiszen egy gyengén konvergens sorozat a limesszel kiegé- szítve), de normában nem lehet kompakt, ugyanis az eredeti sorozatnak nincs Cauchy-részsorozata.

1.18. Állítás. Minden konvex zárt halmaz gyengén is zárt.

Bizonyítás. Valóban, haKkonvex zárt halmaz ésx_naKelemeinek gyengén konvergens sorozata, akkor az 1.15. Tétel szerint a limesz is aK halmazban fekszik.

Az 1.12. Tételt is figyelembe véve az alábbi következményt fogalmazhatjuk meg.

(21)

1.4. Gyenge kompaktság 13 1.19. Következmény. Egy Hilbert-tér bármely korlátos konvex zárt részhal- maza gyengén kompakt.

1.20. Példa. Tekintsük a [0, T] intervallumon olyan x_n abszolút folytonos függvények sorozatát, amelyekre xn(0) = x0, x⁰_n ∈ L²[0, T], és van olyan λ∈L²[0, T]függvény, amelyre

kx⁰_n(t)k ≤λ(t)

majdnem mindenütt minden n indexre. Ekkor található olyan x_n_k részso- rozat és olyan x abszolút folytonos függvény a [0, T] intervallumon, hogy x_n_k(t)→x(t)a[0, T]intervallumon, továbbá

x⁰(t)∈

∞

\

k=1

cl co

∞

[

n=k

{x⁰_n(t)}. (1.3)

Valóban, a fenti következmény szerint kiválaszthatunk olyan x_n_k részsoro- zatot, amelyre x⁰_n

k gyengén konvergens L^[0, T]-ben, nevezetesen x⁰_n

k → u.

Másrészt Mazur tétele szerint található e részsorozat elemeinek konvex kom- binációiból állóymsorozat, amely normában tart u-hoz. Riesz tétele szerint ez utóbbi sorozatnak is van olyan részsorozata, amely majdnem mindenütt pontonként tart azufüggvényhez. Ez azt jelenti, hogy mindenktermészetes számra

u(t)∈cl co

∞

[

n=k

{x⁰_n(t)}

majdnem mindenütt. Vezessük be ezután az x(t) =x₀+

Z t 0

u(s)ds

függvényt a[0, T]intervallumon. Világos, hogy erre érvényes az (1.3) reláció.

A pontonkénti konvergencia abból adódik, hogy kx(t)−x_n_k(t)k ≤

Z t 0

(x⁰(s)−x⁰_n

k(s))ds

→0 a gyenge konvergencia miatt.

Hilbert-téren egy folytonos függvény nem feltétlenül folytonos a gyenge konvergenciára nézve, így egy gyengén kompakt halmazon nem feltétlenül veszi fel a minimumát. Konvex függvényekről azonban többet állíthatunk.

Legyen tehátH Hilbert-tér és tekintsünk egyf :H →Rfüggvényt.

1.21. Tétel. Ha K a H korlátos konvex zárt részhalmaza, és f folytonos konvex függvény, akkorf felveszi a minimumát a K halmazon.

(22)

Bizonyítás. Legyenα= inf{f(x) :x∈K}, és tetszőlegesntermészetes szám mellett válasszunk egy olyanxn∈K elemet, amelyre

f(xn)≤α+1 n.

Az 1.19. Következmény szerint azx_n sorozatból kiválasztható egyx_n_k gyen- gén konvergens részsorozat, jelölje x0 e sorozat határértékét. Minden n ter- mészetes szám esetén vezessük be a

Kn=K∩

x∈H:f(x)≤α+1 n

halmazt. Mivel egy konvex függvény alsó nívóhalmazai konvexek, ésf folytonos, azért aK_nhalmazok mindegyike konvex, korlátos és zárt, tehát gyengén is zárt. Ez azt jelenti, hogyx0∈Kn, azaz

f(x0)≤α+1 n

mindennindexre. Ez csak úgy lehetséges, hogyf(x₀) =α.

1.5. Extremális pontok

Ebben a szakaszban a gyenge konvergencia egy alkalmazását mutatjuk be az extremális pontok létezésének igazolására. Ez az állításunk az úgynevezett Krein–Milman-tétel speciális esete.

1.22. Definíció. LegyenK egy Hilbert-tér konvex részhalmaza. Azt mondjuk, hogyE ⊂K aK extremális részhalmaza, ha bármely0≤α≤1esetén az αx+ (1−α)y ∈ E relációból következik, hogy x, y ∈ E. Az egyelemű extremális részhalmazok elemeitextremális pontoknak nevezzük.

1.23. Lemma. HaK egy Hilbert-tér nem üres korlátos, konvex zárt részhal- maza, akkor mindenntermészetes számhoz van olyanE_n extremális részhal- maz, amelyrediamEn<1/n.

Bizonyítás. Legyenα= sup{kxk:x∈K}, és legyen adottε >0. Válasszunk egy olyanx0∈K vektort, amelyrekx0k> α−ε, és tekintsük a

K0={x∈K:hx−x0, x0i ≥0}

halmazt. Az 1.21. Tétel szerint azx→ hx−x₀, x₀ifüggvény felveszi a maxi- mumát aK halmazon. Világos, hogy a maximumhelyek halmaza olyan zárt extremális részhalmaz, amely aK₀ halmazban fekszik.

(23)

1.6. Az ortogonalitási tétel 15 Ezután becslést adunk aK0 átmérőjére. Tetszőlegesx∈K0 esetén

kxk²=kx−x₀k²+kx0k²+ 2hx−x₀, x₀i ≥

≥ kx−x0k²+kx0k². Ebből következik, hogy

kx−x₀k²≤ kxk²− kx0k²≤α²−(α−ε)²≤2αε.

Tehát aK0halmaz xésy pontjaira

kx−yk ≤ kx−x0k+ky−x0k ≤2√

2αε→0, haε→0, és éppen ezt kellett bizonyítani.

1.24. Tétel(Krein–Milman-tétel). HaK egy Hilbert-tér nem üres korlátos, konvex, zárt részhalmaza, akkor van extremális pontja.

Bizonyítás. Tekintsük aK halmaz zárt extremális részhalmazainak egy monoton fogyó olyanEn sorozatát, amelyekre diamEn<1/n. Az előző lemma szerint ilyen sorozat választható. A Cantor-féle metszettétel szerint e sorozat metszete

∞

\

n=1

En={¯x}

egyetlen elemből áll. Könnyű ellenőrizni, hogy ekkorx¯aKhalmaz extremális pontja.

1.6. Az ortogonalitási tétel

Legyen a továbbiakbanH valós Hilbert-tér, ésΛ a H téren értelmezett, va- lamelyY Hilbert-térre képező folytonos lineáris leképezés.

1.25. Tétel. HaΛ ráképezés, akkor (kerΛ)^⊥=imΛ^∗.

Bizonyítás. Haa∈imΛ^∗, akkor van olyany∈Y, amelyrea= Λ^∗y. Ha most v∈kerΛ tetszőleges, akkorha, vi=hΛ^∗y, vi=hy,Λvi= 0.

Fordítva, ha a ∈ (kerΛ)^⊥, akkor minden v ∈ kerΛ esetén ha, vi = 0.

Tekintsük az alábbig:Y →Rfüggvényt : g(y) =ha,Λ⁻¹(y)i.

Ekkor a g függvény jól definiált, hiszen bármely x₁, x₂ ∈ Λ⁻¹(y) esetén x₁−x₂ ∈ kerΛ, és így ha, x₁−x₂i = 0. Másrészt könnyen látható, hogy gfolytonos és lineáris, azaz g∈Y^∗.

(24)

A Riesz-féle reprezentációs tétel szerint ezért található olyanb∈Y vektor, amelyrehb, yi=ha,Λ⁻¹(y)imindeny∈Y mellett. Bármely adotty∈Y vektorhoz a feltételünk szerint választható olyan x∈X vektor, amelyreΛx=y.

Ekkor

ha, xi=hb,Λxi=hΛ^∗b, xi mindenx∈X esetén. Teháta= Λ^∗b, azaz a∈imA^∗.

A tételünk fontos folyománya, hogy ilyenkor imΛ^∗zárt altér (ez a ráképe- zési feltétel nélkül általában nem igaz), hiszen az ortogonális komplementer mindig zárt alteret eredményez. Érdemes megjegyezni, hogy a

kerΛ = (imΛ^∗)^⊥

reláció a ráképezési feltétel nélkül is érvényes. Ennek ellenőrzését az olvasóra bízzuk (lásd a 14. gyakorlatot).

Tekintsük ezután aH ésX Hilbert-tereket. AdottΛ∈L(H, X)folytonos, azX térre képező lineáris leképezés ésx¯∈X vektor mellett keressük a

K={u∈H : Λu= ¯x} (1.4)

halmaz minimális normájú elemét.

1.26. Állítás. Hau∈K megoldás, akkor u∈im Λ^∗.

Bizonyítás. Hau∈Kminimális normájú elem, akkor a tompaszög-tétel (1.3.

Tétel) szerintumerőleges aK= Λ⁻¹(¯x)affin halmazra, azaz a kerΛaltérre is. Ezértu∈(kerΛ)^⊥=imΛ^∗.

1.7. Egy optimális irányítási feladat

A fejezetünk eredményeit összefoglalva egy egyszerű optimális irányítási fel- adatra mutatunk példát ebben a szakaszban. Az ilyen jellegű feladatok tipi- kusak a makroökonómiában.

LegyenX euklideszi tér, amelyben adott azx0 pont. Keressük az F(x, u) =

Z T 0

kx(t)k²+ku(t)k² dt

integrál minimumát, ahol

x⁰(t) =u(t), x(0) =x0, (1.5) továbbá

ku(t)k ≤λ majdnem mindenütt (1.6)

(25)

1.7. Egy optimális irányítási feladat 17 valamelyλpozitív szám mellett. A feladat úgy interpretálható, hogy azuirá- nyítás segítségével kívánjuk minimalizálni a kvadratikus veszteségfüggvényt olyan módon, hogy közben az irányítás energiája korlátozott.

Azx ésufüggvényeket egyaránt az L²_X[0, T]térből választjuk, így az F leképezés értelmezési tartománya a

H =L²_X[0, T]×L²_X[0, T]

szorzattér egy részhalmaza, amelyen a skaláris szorzatot az h(x1, u1),(x2, u2)i=

Z T 0

(hx1(t), x2(t)i+hu1(t), u2(t)i)dt egyenlőséggel értelmezzük. Világos, hogyH így Hilbert-tér. Ekkor

F(x, u) =k(x, u)k² aH-beli skaláris szorzatra nézve.

Jelentse ezután K mindazon (x, u) párok halmazát a H Hilbert-térből, amelyek kielégítik az (1.5) és az (1.6) korlátozó feltételeket. A feladatunk absztrakt módon úgy fogalmazható meg, hogy keresendő a K halmazban minimális normájú elem. Az 1.1. Tétel szerint ilyen elem egyértelműen létezik, haK konvex zárt halmaz.

Egyszerűen ellenőrizhetjük, hogyKkonvex halmaz. A zártság belátásához tegyük fel, hogy (xn, un) olyan K halmazbeli sorozat, amelyre (xn, un) → (x, u)∈H. Azt kell megmutatnunk, hogy(x, u)∈K. Vezessük be az

y(t) =x0+ Z t

0

u(s)ds

jelölést a[0, T]intervallumon. Mivel azunsorozatnak van olyan részsorozata, amely majdnem mindenütt tart az ufüggvényhez, azért (1.6) fennáll. Elég tehát igazolni, hogy x=y. A Cauchy–Schwarz-egyenlőtlenséget alkalmazva az 1 és azu−u_n függvényekre azt kapjuk, hogy

ky(t)−x_n(t)k²≤t· Z t

0

ku(s)−u_n(s)k²ds≤T · ku−u_nk²₂. Tehát mindkét oldalt integrálva a[0, T]intervallumon

Z T 0

ky(t)−x_n(t)k²dt≤T²· ku−u_nk²₂,

majd mindkét oldalból négyzetgyököt vonvaky−xnk ≤T· ku−unkadódik.

Ebből következik, hogy

ky−xk2≤ ky−xnk2+kxn−xk2≤T· ku−unk2+kx−xnk2. Mivel a jobb oldalon mindkét tag nullához tart, han → ∞, innen valóban következik, hogyx=y.

(26)

1.8. Gyakorlatok

1. Adjunk példát egy Hilbert-téren olyan folytonos függvényre, amely az egységgömbön nem veszi fel a maximumát.

2. Keressünk példát normált térben olyanKkonvex zárt halmazra, amelynek az origóhoz legközelebbi pontja nem egyértelmű. Keressünk olyat is, amelyben nincs is legközelebbi pont. (Útmutatás : Az utóbbi példához vizsgáljuk meg aC[0,1]térben az

(

x∈C[0,1] : Z 1/2

0

x(t)dt− Z 1

1/2

x(t)dt=α )

hipersíkot.)

3. Mutassuk meg, hogy egy Hilbert-tér bármely folytonos lineáris funkcio- nálja pontosan egy pontban veszi fel az abszolút értéke maximumát az egységgömbön. (Ez Banach-térben már nem feltétlenül érvényes, lásd az előző példát.)

4. Tekintsük azl² térben azt az xn sorozatot, amelyreξⁿ_n = 1és ξ_kⁿ = 0 mindenk6=nesetén. Mutassuk meg, hogyxn→0gyengén, de persze x_n normában nem konvergens.

5. Bizonyítsuk be, hogy egy Hilbert-téren azf(x) =kxkfüggvény az origó kivételével mindenütt differenciálható. Keressünk példát arra, hogy ez általában normált terekben (már véges dimenzióban sem) nem érvényes.

6. Adjunk példát Hilbert-térben olyanx_n sorozatra, amelyrekx_nk →α, x_n→xgyengén, de kxk 6=α.

7. Adjunk példát Hilbert-térben olyan korlátos, konvex és zárt halmazra, amelynek az origótól nincs legtávolabbi pontja. (Útmutatás : JelöljeB azL²[0,1]zárt egységgömbjét, és tekintsük azy(t) =t·x(t)függvények halmazát, midőnx∈B.)

8. Ellenőrizzük, hogy alterek esetében a projekció fogalma egybeesik a merőleges vetítéssel. Nevezetesen, haLaHHilbert-tér tér altere, akkor x−PL(x)merőleges azLaltérre.

9. Bizonyítsuk be, hogy haK a H Hilbert-tér konvex, zárt részhalmaza, akkor aP_K(x)vektor éppen a

hP_K(x)−x, P_K(x)−yi ≤0 ∀y∈K variációs egyenlőtlenség egyetlen megoldása.

(27)

1.8. Gyakorlatok 19 10. Mutassuk meg, hogy ha K a H Hilbert-tér konvex, zárt részhalmaza,

akkor aPK leképezés mindenx, y∈H mellett kielégíti a kPK(x)−PK(y)k ≤ kx−yk egyenlőtlenséget.

11. Igazoljuk, hogy ha K aH Hilbert-tér konvex, zárt részhalmaza, akkor PK úgynevezettmonoton leképezés, azaz

hPK(x)−P_K(y), x−yi ≥0 bármelyx, y∈H mellett.

12. Ha K a H Hilbert-tér konvex, zárt kúpja, akkor érvényesek az alábbi relációk :

hx−PK(x), PK(x)i= 0, továbbá

PK(λx) =λPK(x) mindenx∈H, illetveλ >0 mellett.

13. Legyen K a H Hilbert-tér nem üres konvex, zárt részhalmaza, és te- kintsük a

g(x) = inf{kx−yk²:y ∈K}

függvényt. Igazoljuk, hogyg folytonosan differenciálható, és g⁰(x) = 2(x−P_K(x))

mindenx∈H pontban.

14. Mutassuk meg, hogy haΛfolytonos lineáris leképezés valamely Hilbert- térről egy másik Hilbert-térbe, akkor

kerΛ = (imΛ^∗)^⊥

(28)

(29)

2. fejezet

Lineáris rendszerek

Ebben a fejezetben lineáris rendszerek alapvető tulajdonságaival foglalkozunk.

2.1. Lineáris irányítási rendszerek

Legyenek X és Y n, illetve m dimenziós euklideszi terek és x₀ ∈ X adott vektor. Tekintsük azA: [0, T]→L(X)ésB : [0, T]→L(Y, X)négyzetesen integrálható függvényeket, ahol tehátA(t)n×n, B(t)pedig n×mméretű mátrix. A négyzetesen integrálhatóságon azt értjük, hogyAésBmérhetőek, továbbá a t 7→ kA(t)k, valamint a t 7→ kB(t)k függvények az L²[0, T] tér elemei.

Lineáris irányítási rendszeren az

x⁰=A(t)x+B(t)u, x(0) =x0

lineáris rendszert értjük. Itt azu∈L²_Y[0, T]függvények az irányítások, azX tér a rendszer állapottere,Y az irányítási tér. Azuirányítás megválasztása a rendszer pályáját már egyértelműen meghatározza. A rendszer megoldásain Caratheodory-értelemben vett megoldásokat értünk.

A fenti kezdeti érték feladat megoldása a Cauchy-formula szerint ϕ(t) = Φ(t,0)

x0+

Z t 0

Φ(0, s)B(s)u(s)ds

,

aholΦa homogén rendszer mátrix-megoldása, amelyreΦ(0,0) =Eazn×n-es egységmátrix.

21

(30)

Vezessük be aΛ :L²[0, T]→X, Λu=

Z T 0

Φ(0, s)B(s)u(s)ds folytonos lineáris leképezést. Ezzel a jelöléssel

ϕ(T) = Φ(T,0) (x0+ Λu).

A továbbiakban szükségünk lesz aΛ leképezésΛ^∗ adjungáltjára¹.

2.1. Állítás. A Λ^∗ : X → L²[0, T] leképezésre bármely x∈ X és t ∈[0, T] mellett

(Λ^∗x)(t) =B(t)^∗Φ(0, t)^∗x.

Bizonyítás. Valóban, bármelyu∈L²[0, T]esetén hΛ^∗x, ui=hx,Λui=

* x,

Z T 0

Φ(0, s)B(s)u(s)ds +

=

= Z T

0

hx,Φ(0, s)B(s)u(s)ids= Z T

0

hB(s)^∗Φ(0, s)^∗x, u(s)ids=

=hB(.)^∗Φ(0, .)^∗x, ui,

amiből adódik az állítás. (Figyelem, az integrálok mögöttX-beli skaláris szor- zat áll !)

2.2. Irányíthatóság

Tekintsük az alábbi irányítási rendszert

x⁰=A(t)x+B(t)u, (2.1)

x(0) =x0

a[0, T]időintervallumon.

2.2. Definíció. Azt mondjuk, hogy a (2.1) rendszerirányítható a [0, T] intervallumon, ha bármelyx₀, x_T ∈X állapotokhoz található olyanuirányítás, hogy a megfelelőϕtrajektóriáraϕ(0) =x₀, ésϕ(T) =x_T, azaz

x_T = Φ(T,0) x₀+ Z T

0

Φ(0, s)B(s)u(s)ds

! .

teljesül.

1Az adjungált leképezések tulajdonságait illetően lásdKánnai : Analitikus módszerek a pénzügyben és a közgazdaságtanban, www.tankonyvtar.hu, 2013.

(31)

2.2. Irányíthatóság 23 A mátrix-megoldás tulajdonságai alapján az irányíthatósági feltétel a kö- vetkező ekvivalens alakban írható fel :

xT = Φ(T,0)x0+ Z T

0

Φ(T, s)B(s)u(s)ds.

Ez úgy is írható, hogy

Φ(0, T)xT−x0= Z T

0

Φ(0, s)B(s)u(s)ds= Λu.

Világos, hogy a (2.1) rendszer pontosan akkor irányítható, ha aΛ leképezés képtere az egészX tér, azazim Λ =X.

2.3. Definíció. Az alábbiΛΛ^∗ n×nméretű mátrixot ΛΛ^∗=

Z T 0

Φ(0, t)B(t)B(t)^∗Φ(0, t)^∗dt a (2.1) rendszerGram-féle irányíthatósági mátrixának nevezzük.

Könnyen látható, hogyΛΛ^∗ szimmetrikus, pozitív szemidefinit mátrix.

2.4. Tétel. im Λ = im ΛΛ^∗.

Bizonyítás. Az világos, hogyim Λ⊃im ΛΛ^∗.

Fordítva, először belátjuk, hogyker Λ^∗= ker ΛΛ^∗. Valóban, egyrészt nyil- vánvaló, hogyker Λ^∗⊂ker ΛΛ^∗. Másrészt, hax∈ker ΛΛ^∗, akkor

0 =hx,ΛΛ^∗xi=hΛ^∗x,Λ^∗xi=kΛ^∗xk², tehátΛ^∗x= 0, azazx∈ker Λ^∗.

Innen az 1.25. ortogonalitási tétel és a Gram-mátrix szimmetriája folytán im Λ⊂(ker Λ^∗)^⊥ = (ker ΛΛ^∗)^⊥= im ΛΛ^∗,

ami a tételünket igazolja.

Az előző tételünk nyilvánvaló következményeként adódik az alábbi irányít- hatósági kritérium. A tétel jelentősége abban áll, hogy a végtelen dimenziós L²[0, T]Hilbert-téren értelmezettΛleképezés képterének meghatározása helyett egyn×n-es mátrix invertálhatóságát kell csak ellenőriznünk.

2.5. Tétel. A(2.1)rendszer akkor és csak akkor irányítható, ha aΛΛ^∗Gram- féle irányíthatósági mátrixa nemszinguláris.

A tétel használatát a következő példán illusztráljuk.

(32)

2.6. Példa. Tekintsük azt az irányítási rendszert, ahol A(t) =

0 α

−α 0

, B(t) = 0

1

.

Könnyen látható, hogy

Φ(t,0) =

cosαt sinαt

−sinαt cosαt

, és így nem nehéz ellenőrizni, hogy

ΛΛ^∗=

" _T

2 −^{sin 2αT}_4α ^{cos 2αT}_4α ⁻¹

cos 2αT−1 4α

T

2 +^{sin 2αT}_4α

# .

Megmutatjuk, hogy ez a mátrix nemszinguláris. Valóban, a determinánsa T²

4 −sin²2αT

16α² −cos²2αT−2 cos 2αT + 1

16α² ,

ami pontosan akkor nulla, ha

4α²T²+ 2 cos 2αT −2 = 0.

Ha bevezetjük aβ= 2αT >0helyettesítést, akkor a fenti egyenlet ekvivalens a

cosβ = 1−β² 2

egyenlettel. Ennek azonban nyilván nincs megoldása, hiszen a g(β) = cosβ−1 + β²

2

függvény deriváltjag⁰(β) =−sinβ+β >0minden pozitívβ mellett, tehátg szigorúan monoton növő. Másrésztg(0) = 0, ezért agfüggvénynek nem lehet zérushelye a pozitív félegyenesen. TehátΛΛ^∗ valóban nemszinguláris, és így a rendszer irányítható.

2.3. Autonóm rendszerek irányíthatósága

Ebben a szakaszban olyan irányítási rendszerekkel foglalkozunk, aholAésB állandó mátrixok. Tekintsük tehát az

x⁰=Ax+Bu, (2.2)

x(0) =x0

(33)

2.3. Autonóm rendszerek irányíthatósága 25 rendszert, aholA n×n, ésB n×m méretű mátrixok.

Jól ismert, hogy autonóm rendszerek esetében a mátrix-megoldás invari- áns az időeltolásra, ezértΦ(t,0) helyett a rövidebb Φ(t)jelölést használjuk.

Ilyenkor

Φ(t) =e^At és Φ(t)⁻¹= Φ(−t) =e^−At, és ezért

Λu= Z T

0

Φ(−t)B(t)u(t)dt.

Mivel a mátrixok az időtől függetlenek, egy erősebb irányíthatósági fogalmat vezetünk be.

2.7. Definíció. Azt mondjuk, hogy a (2.2) rendszer teljesen irányítható, ha bármely x0, xT ∈ X állapotokhoz és bármely T > 0 időponthoz van olyanuirányítás a [0, T]intervallumon, hogy a megfelelő kezdeti feltételűϕ trajektóriáraϕ(0) =x₀,ϕ(T) =x_T.

2.8. Definíció. Tekintsük az alábbin×nmméretű mátrixot : K=

B, AB, A²B, . . . , Aⁿ⁻¹B .

Ezt a mátrixot a (2.2) rendszerKalman-féle irányíthatóságimátrixának²ne- vezzük.

2.9. Állítás. BármelyT >0 időpontraim ΛΛ^∗= imKK^∗.

Bizonyítás. Mivel ΛΛ^∗ és KK^∗ egyaránt szimmetrikus mátrixok, elegendő megmutatni, hogyker ΛΛ^∗ = kerKK^∗, hiszen a képterek és a magterek az egymás ortogonális komplementerei azX térben.

Először tegyük föl, hogyv∈kerΛΛ^∗, ekkor 0 =hv,ΛΛ^∗vi=

Z T 0

hv,Φ(−t)BB^∗Φ(−t)^∗vidt=

= Z T

0

kB^∗Φ(−t)^∗vk² dt,

aholΦaz autonóm rendszer mátrixmegoldása, amelyreΦ⁰(t) =AΦ(t)a szám- egyenesen. Innen az adódik, hogy

B^∗Φ(−t)^∗v= 0

mindent∈[0, T]esetén. Tekintsük ezt az egyenletet, illetve(n−1)-edrendig bezárólag a deriváltjait a t = 0 pontban, akkor a Φ(0) = E egyenlőségre tekintettel azt kapjuk, hogy

B^∗v=B^∗A^∗v=· · ·=B^∗(A^∗)ⁿ⁻¹v= 0. (2.3)

2Kálmán Rudolf magyar származású amerikai mérnök és matematikus, a modern rendszerelmélet egyik megalkotója.

(34)

Ez éppen azt jelenti, hogyK^∗v= 0, és így perszeKK^∗v= 0.

Fordítva, tegyük föl, hogyv∈kerKK^∗. EkkorK^∗v= 0, hiszen 0 =hv, KK^∗vi=hK^∗v, K^∗vi=kK^∗vk²,

és így fennállnak a (2.3) egyenlőségek. Mivel az A mátrix (n−1)-nél ma- gasabb hatványai mind kifejezhetők azE, A, A², . . . , Aⁿ⁻¹ mátrixok lineáris kombinációjaként,

B^∗(A^∗)^kv= 0, k= 0,1,2, . . . Ez azt jelenti, hogy

B^∗e^A^∗^tv=B^∗Φ(t)^∗v= 0 mindentidőpillanatban. Innen ugyanúgy, mint fent

Z T 0

hv,Φ(−t)BB^∗Φ(−t)^∗vidt=hv,ΛΛ^∗vi= 0.

MivelΛΛ^∗ szimmetrikus pozitív szemidefinit mátrix, ez csak úgy lehetséges, hogyΛΛ^∗v= 0, azazv∈kerΛΛ^∗.

2.10. Tétel(Kalman-féle irányíthatósági feltétel). A(2.2)rendszer akkor és csak akkor teljesen irányítható, ha a Kalman-féleK mátrix rangjan.

Bizonyítás. Egyrészt már láttuk, hogy kerKK^∗=kerK^∗, ezért ezen alterek ortogonális komplementerei is megegyeznek, azaz

imKK^∗=imK.

Másrészt az előző állítás alapján bármelyT >0 esetén imΛΛ^∗=imKK^∗,

tehátΛΛ^∗ pontosan akkor nemszinguláris, haK rangjan.

Érdemes megjegyezni, hogy a fentiek szerint ha egy autonóm rendszer irányítható valamely[0, T]intervallumon, akkor teljesen irányítható.

2.11. Példa. Tekintsük újra a 2.6. Példát, ahol a rendszer irányíthatóságát a Gram-mátrixával igazoltuk. Vizsgáljuk most meg a Kalman-féle irányítha- tósági mátrixot. Kétdimenziós rendszerről van szó, így esetünkben

K= [B, AB] =

0 α 1 0

.

Világos, hogyα6= 0 eseténKrangja 2, azaz a rendszer teljesen irányítható.

Autonóm rendszerekre természetesen a Kalman-féle feltétel ellenőrzése ál- talában sokkal egyszerűbb, mint a Gram-mátrix vizsgálata.

(35)

2.4. Gyakorlatok 27

2.4. Gyakorlatok

1. Vizsgáljuk meg a Kalman-feltétel alkalmazásával, hogy az x⁰=

1 1 2 2

x+

1 0

u

teljesen irányítható-e ?

2. LegyenU azXnormált tér olyan konvex zárt részhalmaza, amely szimmetrikus, azazU =−U, továbbá0∈intU. Tekintsük az

kxk= inf{t >0 :x∈tU}

úgynevezett Minkowski-normát. Igazoljuk, hogy ez valóban normát de- finiál azXtéren. Vajon hogyan karakterizálható azu(t)∈U irányítás ? 3. Tekintsük a következő autonóm rendszert :

x⁰ =





0 1 0

0 −1 1

0 0 −1



x+b·u.

Vajon milyenb∈R³ vektor esetén lesz a rendszer teljesen irányítható ? 4. Döntsük el, hogy az

x⁰= 2 1

0 2

x+ 1

1

u

autonóm lineáris rendszer teljesen irányítható-e ? Keressünk olyan irá- nyítást, amelyx0= (0,0),x1= (1,1) mellett megoldása az

inf{kuk: Λu= ¯x}

optimális irányítási feladatnak a[0,1]intervallumon.

(36)

(37)

3. fejezet

A Pontrjagin-féle maximumelv

Ebben a fejezetben megfogalmazzuk a Pontrjagin-féle maximumelvet néhány lineáris rendszerekre vonatkozó optimalizálási feladatban. Tételeinket példák- kal illusztráljuk.

3.1. A minimális norma feladat

Vizsgáljuk meg a következő optimális irányítási feladatot. Tekintsük a[0, T] intervallumon a (2.1) alatti lineáris rendszert :

x⁰(t) =A(t)x(t) +B(t)u(t), (3.1) aholAésB, illetve azuirányítás kielégítik a (2.1) rendszer feltételeit.

Legyenek adottak azx₀ ésx_T állapotok azX térben. Keresendő olyan u négyzetesen integrálható irányítás, hogy a rendszerx(0) =x₀kezdeti feltételű xmegoldására

x(T) =xT, (3.2)

és amelyre

Z T 0

ku(t)k²dt→min, (3.3) azaz az integrál minimális.

3.1. Definíció. Azt mondjuk, hogy az (x, u)pármegengedett folyamat, ha uolyan irányítás, amelyre a rendszerx(0) =x₀kezdeti feltételűxmegoldása kielégíti a (3.2) feltételt.

29

(38)

Azt mondjuk továbbá, hogy (x, u) optimális folyamat, ha olyan megengedett folyamat, amelyre a (3.3) integrál minimális. Ilyenkor u-t optimális irányításnak nevezzük.

Az eddigi jelöléseinkkel élve a (3.2) egyenlőség azt jelenti, hogy xT = Φ(T,0) x0+

Z T 0

Φ(0, t)B(t)u(t)dt

! ,

azaz

Φ(0, T)x_T −x₀= Z T

0

Φ(0, t)B(t)u(t)dt= Λu.

Ha bevezetjük az x¯ = Φ(0, T)xT −x0 jelölést, akkor a fenti egyenlőség a Λu= ¯xalakba írható át.

3.2. Tétel. Ha a (3.1) rendszer irányítható a [0, T] intervallumon, akkor a fenti normaminimalizálási feladatnak pontosan egy megoldása van.

Bizonyítás. Világos, hogy valamely(x, u)∈W_X²[0, T]×L²_Y[0, T]akkor és csak akkor megengedett folyamat, haΛu= ¯x. Tekintsük a következő halmazt :

K={v∈L²_Y[0, T] : Λv= ¯x}.

Az irányíthatósági feltétel miatt egyrésztKnem üres, másrészt könnyen lát- ható, hogy konvex és zárt halmaz. Azuirányítás pontosan akkor megoldása a feladatnak, ha aKhalmaz minimális normájú eleme. Az 1.1. Tétel szerint pontosan egy ilyen elem létezik, és ez éppen az optimális irányítás.

Ezután rátérünk az optimalitás szükséges feltételének megfogalmazására.

A (3.1) lineáris rendszer adjungált rendszerén az y⁰(t) =−A(t)^∗y(t)

homogén lineáris rendszert értjük. Az adjungált rendszer mátrix-megoldása Φ(t,0)⁻¹^∗

= Φ(0, t)^∗

Jól ismert, hogy az adjungált rendszer trajektóriái ortogonálisak az eredeti homogén rendszer trajektóriáira¹.

3.3. Tétel(Pontrjagin-féle maximumelv). Ha(x, u)optimális folyamat, akkor

• található olyanp∈X, amelyreu= Λ^∗p,

1Az adjungált rendszerről bővebben lásd :Tallos : Dinamikai rendszerek alapjai, Au- la, 1999.

(39)

3.1. A minimális norma feladat 31

• azy⁰(t) =−A(t)^∗y(t)adjungált rendszernek létezik olyan ψmegoldása, hogy

hψ(t), B(t)u(t)i= max

kvk≤ku(t)khψ(t), B(t)vi m.m.t∈[0, T]esetén. Ha ittu6= 0, akkor ψ6= 0.

Bizonyítás. Az első állítás közvetlenül adódik az 1.26. Állításból. Ekkor va- lamelyp∈X mellettu= Λ^∗p, és ezértΛΛ^∗p= ¯x.

Ha valamely másikq∈X mellett ugyancsakΛΛ^∗q= ¯x, akkor p−q∈ker ΛΛ^∗= ker Λ^∗,

ezértΛ^∗q=u.

Térjünk rá a második állítás igazolására. Legyen a[0, T]intervallumon ψ(t) = Φ(0, t)^∗p.

Ekkor egyrésztψ megoldása az adjungált rendszernek, másrészt az u(t) = (Λ^∗p)(t) =B(t)^∗Φ(0, t)^∗p

egyenlőség folytánu(t) =B(t)^∗ψ(t), innen adódik, hogyψ6= 0, hau6= 0.

Legyen mostv ∈Y tetszőleges vektor. Ekkor a [0, T]intervallum m.m. t pontjában

1

2 kvk²+ku(t)k²

≥ ku(t)k · kvk ≥ hu(t), vi.

Mindkét oldalbólku(t)k²-et kivonva 1

2 kvk²− ku(t)k²

≥ hu(t), v−u(t)i=hB(t)^∗ψ(t), v−u(t)i=

=hψ(t), B(t)v−B(t)u(t)i.

Az egyenlőtlenséget átrendezve azt kapjuk, hogy

−1

2ku(t)k²+hψ(t), B(t)u(t)i ≥ −1

2kvk²+hψ(t), B(t)vi.

Dekvk ≤ ku(t)kesetén1/2ku(t)k²≥1/2kvk². E két utóbbi egyenlőtlenséget összeadva adódik a tétel állítása.

Amaximumelv elnevezés a tétel második állításában szereplő maximum- tulajdonságból ered. Ezt a tulajdonságot egy egyszerű formalizmussal még könnyebben megjegyezhetővé tehetjük.

(40)

3.4. Definíció. A (3.1), (3.2), (3.3) alatti lineáris optimális irányítási feladat Hamilton-függvényén a[0, T]×X×Y ×X halmazon értelmezett

H(t, x, u, p) =−1

2kuk²+hp, A(t)x+B(t)ui függvényt értjük.

Ezzel a formalizmussal a maximumelv a következő egyszerű alakba írható át.

3.5. Tétel(Pontrjagin-féle maximumelv, Hamilton-formalizmus). Ha(x, u) optimális folyamat, akkor az

y⁰(t) =−∂2H(t, x(t), u(t), y(t)) adjungált rendszernek létezik olyanψ megoldása, amelyre

H(t, x(t), u(t), ψ(t)) = max

v∈Y H(t, x(t), v, ψ(t)) majdnem mindent∈[0, T]pontban.

Tételünk szemléletesen azt jelenti, hogy a Hamilton-függvény a maximu- mát az optimális irányítás mentén veszi fel. Ez esetünkben azt jelenti, hogy

∂₃H(t, x(t), u(t), ψ(t)) = 0 a[0, T]intervallum majdnem minden pontjában.

3.6. Példa. Oldjuk meg a[0,2]időintervallumon a következő normaminima- lizálási feladatot :

x⁰₁= π 4x2, x⁰₂=−π

4x1+u.

Állítsuk elő az optimális irányítást, ha a kezdő és végállapotok x0=

1 1

és x2= 0

0

és amelyre az alábbi integrál minimális : Z 2

0

|u(t)|²dt→min. Esetünkben

A=

0 ^π₄

−^π₄ 0

és B= 0

1

,

(41)

3.1. A minimális norma feladat 33 és ezért

[B, AB] =

0 ^π₄ 1 0

,

tehát a rendszer a Kalman-feltétel szerint teljesen irányítható. Másrészt erre az autonóm rendszerre

Φ(t) =e^At=

cos^π₄t sin^π₄t

−sin^π₄t cos^π₄t

,

és innen

Φ(t)⁻¹B=e^−AtB =

−sin^π₄t cos^π₄t

.

Ebből egyszerű integrálással ΛΛ^∗=

Z 2 0

e^−AtBB^∗e^−A^∗^tdt=

= Z 2

0

=

"

sin²^π₄t ¹₂sin^π₂t

−¹₂sin^π₂t cos²^π₄t

#

=

1 −_π²

−²_π 1

.

Könnyen ellenőrizhető, hogy

¯

x=e^−2Ax₂−x₀= −1

−1

,

ezért aΛΛ^∗p= ¯xegyenlet az alábbi alakot ölti : 1 −_π²

−_π² 1

·p= −1

−1

.

Innen azonnal

p=− π π−2

1 1

. Végül az optimális irányítás az

u(t) = (Λ^∗p)(t) =B^∗e^−A^∗^tp=− π π−2

h−sinπ 4t,cosπ

4ti

· 1

1

=

= π

π−2 sinπ

4t−cosπ 4t formulával adható meg(t∈[0,2]).

(42)

3.2. Az időoptimum-feladat

Most egy olyan feladatot vizsgálunk meg, amelyben a[0, T]intervallum nem rögzített. Legyen U az Y térnek olyan adott konvex részhalmaza, amelyre 0∈U. Csak olyan irányításokat tekintünk megengedettnek, amelyek az aláb- bi halmazhoz tartoznak :

Uˆ ={u∈L²_Y[0, T] :u(t)∈U m.m.}.

Legyen adott azx0∈X kezdeti állapot, és tekintsük az x⁰(t) =Ax(t) +Bu(t) autonóm lineáris irányítási rendszert az

x(0) =x0 és x(T) = 0

peremfeltételek mellett. Keresendő olyanu∈Uˆmegengedett irányítás, amelyre teljesülnek a fenti peremfeltételek, és amelyre aT időpont minimális. Ezt a problémátidőoptimum-feladatnak nevezzük.

3.7. Definíció. Adottt >0időpillanat mellett jelöljeEtazonx0∈Xpontok összességét, amelyekre vannak olyan x(0) = x0 tulajdonságú x∈ W_X² [0, T] ésu∈Uˆ függvények, hogy a[0, t]intervallumonx⁰ =Ax+Bu, ésx(t) = 0.

(TehátEta rendszer azon kezdőállapotainak halmaza, amelyekből az origót idő alatt elérhető.) Legyen továbbá

E_t⁰= [

0<s<t

Es.

Az alábbi állítás teljesen nyilvánvaló a definíció és a0∈U feltétel alapján.

3.8. Állítás. Bármely0< s < t időpontokraEs⊂Et.

3.9. Állítás. Bármelyt >0 időpontra azE_t ésE_t⁰ halmazok konvexek.

Bizonyítás. Hax, y∈Et, akkor jelöljeuésvazokat az irányításokat, amelyek azx, illetveyállapotokat az origóba irányítjáktidő alatt. Ekkor tetszőleges 0< α <1skalárra azαu+ (1−α)v irányítás azαx+ (1−α)ykezdőállapotot tidő alatt az origóba viszi. Tehátαx+ (1−α)y∈Et.

Az E⁰_t halmaz konvexitása abból adódik, hogy előáll monoton növekedő konvex halmazok egyesítéseként.

3.10. Állítás. Tegyük fel, hogy(x, u)megengedett folyamat a[0, T]intervallumon, és legyenψaz

y⁰(t) =−A^∗y(t)