Az SRA algoritmus a kétlépcsős feladatra - A kétlépcsős feladat megoldó algoritmusa

6. SRA a sztochasztikus programozásban 99

6.3. A kétlépcsős feladat megoldó algoritmusa

6.3.2. Az SRA algoritmus a kétlépcsős feladatra

A várható pótlás függvényében szereplő várható értéket nehéz kiszámítani. De egy tet-szőleges x pont és a ξ valószínűségi változó tetszőleges ξ_i realizációja esetén ki lehet számítani aqi függvényértéket, amely a következő feladat optimális célfüggvényértéke:

q_i =Q(x,ξ_i) = min_yq⁰y f.h. Tx+Wy = ξ_i,

y ≥ 0.

Itt aq_i érték a Q(x) függvény egy zajos becslésének tekinthető, mivel Eq_i =Q(x). A q_i függvényérték D²(q_i) = σ²(x) szórásnégyzete függ az x ponttól, de a valószínűséggel korlátozott modell kapcsán leírtakhoz hasonlóan feltehetjük, hogy ez a szórás független azx-től, D²(q_i) =σ² a továbbiakban.

Ezek szerint a következő Monte Carlo eljárás adható a várható pótlás Q(x) füg-gvényértékének a meghatározására. Legyenx_iadott és generáljuk aξvalószínűségi változó ξ_ij, j = 1, . . . , M független realizációit. Határozzuk meg a

q_i = 1 M

j=1

Q(x_i,ξ_ij)

értéket, amely Q(x_i) függvényérték egy torzítatlan becslése. Ez az eljárás lehetőséget ad arra, hogy egy adott {x_i}^k−1_i=0 ponthalmaz esetén kiszámítsuk az ezekhez a pontokhoz tartozó zajos q_i függvényértékeket. Így feltehetjük, hogy az SRA algoritmus megkezdése előtt a rendelkezésünkre áll az S_k = {x_i, q_i}^k−1_i=0 pont-függvényérték halmaz. A nehezen meghatározhatóQ(x) függvényt azon

q_k(x) = x⁰D_kx+b⁰_kx+c_k (6.17) alakú kvadratikus függvénnyel közelítjük, amely a

min

Dk,bk,ck

k−1

i=0

[q_i−q_k(x_i)]². (6.18) optimalizálási feladat megoldása Az SRAalgoritmus formális leírása a következő:

Az SRA algoritmus – kétlépcsős feladatra

0. [Előkészítés.] Legyen adott az S_k={x_i, q_i}^k−1_i=0 halmaz és legyen a k iterációs számláló az adott pontok száma.

1. Számítsuk ki a q_k(x) függvény D_k,b_k, c_k együtthatóit az S_k-ból.

2. Helyettesítsük az eredeti (6.16) feladatot a

minx c⁰x+qk(x),

Ax≤b, (6.19)

x≥0,

közelítő feladattal és jelöljük egy optimális megoldását xk-val.

3. Ha x_k „elég jó”, akkor STOP. Egyébként számítsuk ki a q_k∼Q(x_k) zajos függvényértéket, az új x_k pontot és a q_k értéket csatoljuk az S_k halmazhoz: legyen S_k+1 =S_k∪ {x_k, q_k}, növeljük meg az iterációs számlálót k :=k+ 1 és menjünk vissza az 1. lépésre.

A megállási szabály, a Dk mátrix pozitív definitsége, a legkisebb négyzetek módsz-erének alkalmazhatósága, a felfrissítési szabályok tekintetében teljesen ugyanúgy járunk el, mint azt a valószínűségi korlátos modellek esetén már leírtuk.

6.3.3. Számítógépes eredmények

Az itt közölt numerikus példát [De 02] Mayer állította elő, az általa és Kall által kife-jlesztett SLP-IOR [May 92], [May 98] programcsomag segítségével. A feladatot Mayer diszkretizálta: 319 és 522 lehetséges értéket vehettek fel a valószínűségi változók. Az így diszkretizált feladatokon elért eredményeket a következő táblázat első két sora tartal-mazza. A feladatot kis mérete ellenére viszonylag nehéz megoldani, amit az is mutat, hogy egy véletlen realizáció esetén a várható pótlás becslésénekD²[Q((xk,ξ)]∼15² a szórásné-gyzete, hax_k közel van az optimális megoldáshoz. (A 6.7 szakaszban bevezetett nehézségi fok ezen példa esetén 3D[Q((x_k,ξ)]/f(x_k) = 1.7 volt – a függvényérték kiszámításának hibája a függvény értékével egyező nagyságrendű volt.) A számítógépes futások egyéb részleteit és további numerikus példákat az SRA működésére a [De 02] cikkben lehet megtalálni, köztük egy véletlen elemekkel rendelkezőT mátrixot tartalmazó feladatot is.

A numerikus példa a következő:

min (9.0x₁ +8.1x₂ +E(3.6y₁ +7.4y₂ +6.9y₃))

f.h. 2.5x₁ +1.6x₂ ≥ 1.8

9.4x₁ +9.0x₂ ≥ 8.0

6.0x₁ −9.2x₂ −0.9y₁ −0.7y₂ +1.7y₃ = ξ₁

−6.3x₁ −1.2x₂ +3.9y₁ +9.0y₂ −13.0y₃ = ξ₂ x₁, x₂, y₁, y₂, y₃ ≥ 0

x c⁰x+E(q⁰y) ”pontos” M = k= discr₃₁₉ (0.9655, 0.0) 26.9805

discr522 (0.9621, 0.0) 26.9847

SRA₁ (1.0286,0.0) 28.14(±1.41) 27.39(±0.57) 100 100 SRA2 (0.9199,0.0) 26.94(±0.68) 27.27(±0.06) 400 100 SRA₃ (0.9663,0.0) 26.44(±0.53) 27.01(±0.13) 500 500 SRA4 (0.9892,0.0) 26.92(±0.43) 26.95(±0.14) 900 400 SRA₅ (0.9291,0.0) 27.60(±0.32) 27.14(±0.06) 400 1000 SRA₆ (0.9412,0.0) 27.44(±1.35) 26.93(±0.14) 100 8000

6.3. táblázat. Két-lépcsős feladat: Mayer eredményei és az SRA eredményei különböző mintaszám és iterációs számok esetén.

Az első két egyenlőtlenség tartalmazza az első lépcsős feladatot, a harmadik és a negyedik egyenlőtlenség pedig a második lépcső feladatát adja meg. Vegyük észre, hogy a feladat teljes pótlású. A véletlen jobboldali (ξ₁, ξ₂) valószínűségi változók együttes eloszlása normális, (ξ₁, ξ₂) ∈ N((5.8,−8.7),Σ), ahol Σ_1,1 = D²(ξ₁) = 1,Σ_2,2 = D²(ξ₂) = 1,Σ_1,2 =Corr(ξ₁ξ₂) = 0.9.

A 6.3 táblázatban adjuk meg a Mayer által két különböző diszkretizálás esetén kapott eredményeket és az SRA algoritmus által, különböző iterációs számokra, illetőleg külön-böző mintaszámra kapott eredményeket. AzSRAalgoritmusban a várható pótlás értékét egyM mintaszámot használó durva Monte Carlo módszer segítségével számítottuk ki.

A táblázat első oszlopában a használt módszert tüntettük fel, azxoszlopban akszámú iteráció elvégzése után kapott optimális megoldást adtuk meg, ac⁰x+E(q⁰y)feladat alatt az első lépcsős feladat célfüggvényének értéke van az utolsó x pontban. A „pontos” os-zlop tartalmazza a megnövelt mintaszámmal újraszámított célfüggvényértéket (itt 100000 véletlen mintát használtunk), a számadatok mellett álló (±1.41) alakú kifejezések azt mu-tatják, hogy az adott függvényérték kiszámolt értékének mekkora a szórása. Egy (várható pótlás) függvényérték kiszámításáhozM mintát használtunk, ésk az iterációk száma.

A 6.4 táblázatban egyetlen számítógépes futás rész-eredményeit közöljük. Itt x_k a k-adik iterációban kapott közelítő eredmény,c⁰xk+E(q⁰y)az aktuális célfüggvény értéke, valamint a „pontos” (újraszámított) eredmény található, az M mintaszámmal. Végül az x oszlopában a súlypont aktuális értékét adjuk meg (ez lényegesen lassabban konvergál, de nagy ingadozásoktól mentes).

A 6.4 táblázatban megadott eredmények ismételten szemléltetik a valószínűségi ko-rlátos feladat numerikus eredményeinél leírt sejtésünket: a k-adik iteráció után kapott tényleges hiba kisebb mint 3σ_Q = 3σ₁/√

k, hiszen most σ₁ = 1.41, k = 40000,3σ_Q = 3·0.007 = 0.02. A tényleges hibát pedig a következőképpen határozhatjuk meg: jelölje x_opt az optimális megoldást, f(x_opt)a tényleges optimumot, c⁰x_k+E(q⁰y) a közelítő

op-x c⁰x_k+E(q⁰y) ”pontos” x disz₃₁₉ (0.9655, 0.0) 26.9805

disz522 (0.9621, 0.0) 26.9847

k = 1 (1.1479, 0.0) 34.79(±1.41) 32.53(±0.14) (1.056,-0.11) k = 10 (1.0867, 0.0) 29.81(±1.41) 29.67(±0.14) (1.095,-0.05) k= 100 (1.0439, 0.0) 29.40(±1.41) 28.26(±0.14) (1.063,-0.01) k = 1000 (1.0188, 0.0) 29.95(±1.41) 27.68(±0.14) (1.029, 0.00) k = 4000 (1.0042, 0.0) 29.44(±1.41) 27.43(±0.14) (1.015, 0.00) k = 10000 (0.9842, 0.0) 26.93(±1.41) 27.19(±0.14) (1.003, 0.00) k = 40000 (0.9615, 0.0) 27.59(±1.41) 27.09(±0.14) (0.975, 0.00)

6.4. táblázat. Kétlépcsős feladat: az SRA algoritmus egy futás k-adik lépésében kapott eredményei, M = 100, σ₁ = 1.41. A „pontos” függvényérték az utolsó pontban 26.92(±0.02).

timális célfüggvényérték σ_a szórású becslését, akkor az elméleti minimum és az általunk adott közelítésen felvett célfüggvényérték eltérése a

|f(x_opt)−[c⁰x_k+E(q⁰y)]| ≤3σ_a+ 3σ_Q = 3·0.02 + 0.02 = 0.08

egyenlőtlenségnek kell teljesülnie – ami láthatóan fennáll. Jegyezzük meg, hogy ez úgy következett be, hogy csak σ₁ = 1.41szórású függvényértékeket tudtunk számolni, tehát a hiba 4.2 nagyságú is lehetne.

A fentebbi numerikus feladat megoldása M = 100mintaszámmal és k = 100 iterációs számmal egy 133 MHz-es személyi számítógépen mintegy 30 másodpercig tartott.

A kvadratikusq_k(·)közelítés paraméterei az első 500 iteráció után a következők voltak:

D= 49.12 −59.86

−59.86 144.72

, b= −100.3 139.0

, c= 70.38

Az első lépcső (9.0,8.4) költségvektorát ehhez hozzáadva a közelítő célfüggvényg_k(x) = c⁰x+q_k(x), amelynek a (nemnegatívitási feltételek figyelmen kívül hagyásával kapott) minimum pontja ax_min = (0.624,−0.250)pontban van, a közelítő célfüggvényérték pedig g_k(x_min) = 23.5.

Az algoritmussal nehézség nélkül lehet kezelni azt az esetet is, amikor a második lépcsőben szereplő T mátrixban valószínűségi változók vannak. Megváltoztatjuk az előző numerikus példát úgy, hogy a T mátrix elemeihez nulla várható értékű valószínűségi vál-tozókat adunk hozzá. Tegyük fel, hogyu₁, u₂ független, a[0,1]intervallumban egyenletes eloszlású valószínűségi változók, a randomizált Te mátrix álljon a következő elemekből:

x c⁰x+E(q⁰y) ”pontos” M = iter.szám SRA₁ (1.0188,0.0) 29.09(±1.66) 32.07(±0.14) 100 400 SRA2 (0.9355,0.0) 26.03(±1.33) 28.11(±0.14) 100 400

6.5. táblázat. Kétlépcsős feladat véletlen Te mátrixszal, különböző kiindulási halmazok esetén.

u₁, u₂ ∈ U(0,1),

˜t_1,1 =t_1,1+u₁+u₂ −1, ˜t_1,2 =t_1,2+u₂−0.5 t˜_2,1 =t_2,1+u₂−u₁, ˜t_2,2 =t_2,2+u₁−0.5

Eredményeinket a mellékelt 6.5 táblázatban foglaljuk össze.

A következő numerikus példát a Kall és Wallace által írt könyvből vettük [KW 94]. A feladat megadásában az első feltétel az elsőlépcsős feladat, míg a második két sor alkotja a második lépcsős pótlási feladatot.

min(2x₁ + 3x₂ +E(7y₁ +12y₂)

f.h. x₁ + x₂ ≤ 100

(2 +η₁)x₁ + 6x₂ +y₁ ≥ 180 +ζ₁ 3x₁ + (3.4−η₂)x₂ +y₂ ≥ 162 +ζ₂,

Itt a ζ₁, ζ₂ egy-egy csonkolt normális eloszlást követnek, η₁ egyenletes eloszlású, η₂ pedig egy csonkolt exponenciális eloszlású valószínűségi változó

ζ₁ ∈N(0,12), ζ₁ ∈[−30.91,+30.91], ζ₂ ∈N(0,9), ζ₁ ∈[−23.18,+23.18], η₁ ∈U(−0.8,+0.8), η₁ ∈[−0.8,+0.8],

η₂ ∈Exp(λ= 2.5), η₂ ∈(0.0,1.84).

A publikált legáltalánosabb változat az, amikor az összes valószínűségi változó szerepel, és 5×9×7×11 = 3465 diszkretizálást használtak a szerzők a η₁, η₂, ζ₁, ζ₂ valószínűségi változókra. Az általuk adott optimális megoldástx_D-vel jelöljük, és a diszkretizált feladat első lépcsős költségétf(x_D) adja:

x_D = (37.754,23.629), f(x_D) = 150.446, f_{f irst}(x_D) = 146.396.

Az SRAalgoritmus által elért eredményeinket a 6.6 Táblázatban adjuk meg.

x c⁰x+E(q⁰y) ”pontos” M = iter.szám discr₃₄₆₅ (37.75, 23.63) 150.446 151.06(± 0.12)

SRA (37.73, 27.10) 159.3(± 2.0) 157.6(±0.7) 100 100 SRA (42.17, 26.10) 164.0(±0.4) 163.5(±0.1) 100 100 SRA (37.68, 24.88) 150.6(±0.4) 152.5(±0.2) 400 100 SRA (37.73, 27.10) 149.7(±1.6) 151.8(±0.2) 100 400

6.6. táblázat. Az SRA eredményei a Kall-Wallace példára, különböző mintaszámokra, kezdeti halmazokra és iteráció-számra.

A megadott x_D optimális megoldást ellenőriztük azzal, hogy kiszámítottuk ezen a helyen a költségfüggvényt, amelyben a következő numerikus értéket kaptuk:

f(x˜ _D) = 151.06(±0.12) = 146.40 + 4.66(±0.12).

A |f˜(x_D)−f(x_D)|= 0.61 különbség a diszkretizálás hibáját mutatja, hiszen ez szig-nifikánsan nagyobb, mint az eredményünk 0.12 nagyságú szórása (illetőleg ennek három-szorosa.

6.4. Vegyes feladat: kétlépcsős feladat valószínűségi

In document A sztochasztikus programozás Monte Carlo módszereiről Doktori értekezés (Pldal 127-132)