Numerikus stabilitás - A kétlépcsős feladat hatékony numerikus megoldása

6. SRA a sztochasztikus programozásban 99

6.6. A kétlépcsős feladat hatékony numerikus megoldása

6.6.1. Numerikus stabilitás

A számítások numerikus stabilitásának elérése lényegében két, egymásnak ellentmondó cél megvalósítását jelenti. Az egyik cél az, hogy azS_k halmaz „elég széles” legyen azért, hogy az előállítottx_i, i= 0,1, . . . , k pontok (illetőleg az általuk felvett függvényértékek) segít-ségével meghatározandó függvény egy pozitív definit mátrix által megadott kvadratikus függvény alakját vegye fel (kifeszítsen egy konvex függvényt). A másik célunk az, hogy a pontok nagy része lehetőleg az optimális megoldás (megoldások) egy szűk környezetében legyenek, hiszen ezáltal lesz a közelítésünk pontos az optimum környékén. A két cél együttes megvalósításának kulcsa abban rejlik, hogy néhány „messze lévő” pont elég a konvex függvény kifeszítéséhez, míg az összes többi pont lehet az optimum környékén.

A kezdeti ponthalmaz jó megadásának, a pontrendszer adaptív kiszélesítésének és a degeneráció elleni védekezésnek a célja az, hogy a ponthalmaz elég széles legyen (a közelítés stabil legyen), míg a legkisebb négyzetek módszerében alkalmazott súlyok használata azt eredményezi, hogy elég szűk lesz a ponthalmazban szereplő pontok nagy része által alkotott halmaz. Ebben a részben azxelső lépcsős döntési változó dimenzióját egyszerűen n-nel jelöljük.

Kezdeti halmaz

Az algoritmus elindításához egy kezdeti ponthalmazra van szükségünk, ezt a halmazt például a következőképpen lehet előállítani. Tekintjük a kétlépcsős feladat definiálásánál használt determinisztikus alapfeladatot, ahol aξ valószínűségi változót helyettesítettük a várható értékével. Tehát megoldjuk a

min c⁰x +qy

f.h. Ax = b,

Tx +Wy = Eξ, x, y ≥ 0,

feladatot. Jelölje ennek az optimális megoldásátx₀, ezt nevezzük gyökérpontnak. A többi pontot a gyökérpont körül generáljuk véletlenszerűen: xi = x0 +δdi, i = 1, . . . , kin−1, aholδ tetszőleges (de a választás után rögzített), 0.1−0.5értékű volt, a d_i pontok pedig véletlenszerűen +1, vagy -1 értéket tartalmaztak minden komponensükben. Ezt az eljárást addig folytattuk, amíg a megfelelő k_in számú pontot nem állítottuk elő: az eljárás az esetek többségében megfelelő kezdeti halmazt állított elő. Nagyméretű feladataink esetén (6.7 szakasz) a kezdeti pontoknak mintegy 10-20%-nyi részét megengedett megoldásoknak vettük, a többit véletlenszerűen és egymástól függetlenül generáltuk ezek környékén.

A kvadratikus regresszióban szereplő D_k mátrix pozitív definitségét a 6.2.4 alatt leírt módon biztosítottuk – ez még rosszul előállított kezdeti ponthalmazok esetén is működött, csak akkor valamivel több „messze lévő” pontot kellett előállítani (ezek száma a 10-et nem haladta meg). Tehát a kezdeti halmaz jó megadása nem volt annyira fontos, mint kezdet-ben gondoltuk, mert a ponthalmaz alább leírt adaptív kiszélesítése pótolja a hiányossá-gokat.

Pontok adaptív megadása

Mint láttuk a 6.2.4 pontban, a kvadratikus regressziós függvény meghatározása lényegében egyn_q×n_q méretű mátrix invertálását jelenti, aholn_q= 1 +n+n(n+ 1)/2. Az invertálás során néha stabilitási problémák léptek fel, amelyek kezelésére a következő adaptív mech-anizmust használtuk. Az előállított M mátrixot és annak inverzét összeszoroztuk, ha ez a szorzat az egységmátrixtól egy 10⁻³ hibahatárnál jobban tért el, akkor néhány újabb, a pillanatnyi optimális megoldástól egyre távolabb lévő pontot adtunk hozzá a ponthal-mazhoz, addig, amíg az invertálás nem lett sikeres.

Ezeket a pontokat a következő módon állítottuk elő. Generáltunk két, az egységgömb felületén egyenletes eloszlású, egymásra ortogonális u₁,u₂ vektort, és az S_k halmazhoz négy pontot csatoltunk: x_k+1 =x_k+C_su₁,x_k+2 =x_k−C_su₁,x_k+3 = x_k+C_su₂,x_k+4 = x_k−C_su₂, aholC_s egy skálázási konstans volt (kezdetben a C_s értékének 0.05-öt válasz-tottunk). Ha az így kibővített ponthalmazon meghatározott mátrix, illetőleg az inverze megfelelő volt, akkor folytattuk az SRA algoritmust. Ha az MM⁻¹ szorzat még mindig a hibahatárnál jobban különbözött az egységmátrixtól, akkor aCs értékét megdupláztuk, és újabb négy pontot adtunk hozzá az S_k halmazhoz. Ezt addig ismételtük, amíg az in-vertálás nem lett sikeres, aC_skonstans értékét, amely bizonyos értelemben megadta a sta-bilitáshoz szükséges, „elég széles” ponthalmaz sugarát, későbbi felhasználásra megőriztük.

Az SRA algoritmus használatában, az általunk vizsgált példák esetében a ponthalmaz ilyen adaptív szélesítésére általában 2-8 alkalommal volt szükség, az algoritmus első 1000 lépésében – a későbbiekben már nem kellett ezt használni.

Degeneráció elleni védekezés

Az algoritmus végrehajtása során közelítő kvadratikus optimalizálási feladatokat kell megoldani, egy optimális megoldás esetén némely feltételek aktívak, mások pedig nem aktívak lesznek – ezek az aktív feltételek vagy nemnegatívitási, vagy pedig egyenlőtlenséggel megadott feltételek, vagy ezek valamilyen keveréke lesz. Emiatt (hacsak az aktív halmaz az al-goritmus előrehaladása során nem változik nagyon gyakran) a kapott közelítő optimális megoldások egy, az aktív feltételek által meghatározott L lineáris sokaságon fekszenek.

Mivel ezen lineáris sokaság n_L dimenziós (legfeljebb (n − m₁) dimenziós), így a q_k(x) kvadratikus közelítésünk határértékben degenerálttá válik. Ugyan lehetséges lenne egy, aznL-dimenziósLsokaságban előállítani egy kvadratikus függvényt, de előre nem tudjuk

eldönteni, hogy adott esetben mi lesz az aktív halmaz az optimum közelében, illetőleg az hogyan változhat meg, ezért a megoldáshoz más utat követtünk.

Az ilyen, degenerációhoz közeli helyzetek elkerülése érdekében nem csak egyetlen x_k pontot adunk hozzá az Sk halmazhoz az algoritmus 3. lépésében, hanem több pontot.

Ezeket a pontokat az utolsó közelítő optimális megoldás kis környezetében vesszük fel.

Jelölje a hozzáadott pontok számátn_add, ennek értékét a számítógépes futtatások alatt 2 és2n+ 2 közötti értéknek választottuk; az alábbi leírásban n_add = 2n+ 2pontot használ-tunk, bár a gyakorlatban minden n_add ≥ 5 értékre jó eredményeket kaptunk. Ennek a módosításnak egy további számítástechnikai előnye is volt: csökkent az elvégzendő munka mennyisége. Ugyanis nem minden egyes pont esetén határoztuk meg újra a közelítő kvadratikus függvényt, csak mindenn_add-edik pont hozzáadása után.

Az n_add számú {x_l}^k+2n+1_l=k+1 pótpontot a következő módon konstruáltuk meg. Ahogy szokásos, ak-adik iterációs lépésben megoldott közelítő feladat optimális megoldását x_k -val jelöljük. Legyen adva egy véletlen ortonormalizált U ponthalmaz, ahol U={u_i}ⁿ_i=1, U egyenletes az ortogonális rendszerek között, u_iu_j = δ_ij, ahol δ_ii = 1, δ_ij = 0, i 6=

j, i, j = 1,2, . . . , n. Miután az xk pontot hozzáadtuk Sk-hoz, csatoljuk még az xk+j = x_k +γ_ku_j, x_k+n+j = x_k −γ_ku_j pótpontokat is, ahol j = 1, . . . , n, és γ_k ∼ C_s/√

k. Itt γ_k egy olyan változó, amelyet csak lassan engedünk nullához tartani, ennek az értéke kezdetben az előzőleg leírtC_s konstans, vagyis ez az alacsonyabb dimenzióba való eséstől (degenerációtól) óvó állandó. Másrészt az1/√

k faktor azt eredményezi, hogy a pótpontok halmaza egyre közelebb kerül a pillanatnyi optimális megoldáshoz – így nem akadályozza a pontsorozat konvergenciáját.

A tapasztalatok szerint a stabilitást viszonylag könnyen el lehetett érni azzal, hogy a generált ortonormált vektorokat két csoportban állítottuk elő. Az első csoport tartal-mazta af(x) =c⁰x+q_k(x)célfüggvény∇f(x_k)gradiensét és néhány további vektort (itt n−1−n_L darab, az L lineáris sokaságra merőleges vektort választottunk), a második csoportban pedig n_L számú, L-beli vektort választottunk (természetesen a két csoport-ban lévő vektorok egymásra is merőlegesek voltak). Ennek a csoportosításnak az volt az értelme, hogy az első csoportban lévő vektorok a gradiens pontosabb meghatározását segítették elő, míg a második csoportban lévő vektorok segítségével az egymásutáni iterá-ciókban meghatározott közelítő optimum jobban tudott azL sokaságon belül elmozdulni.

Azn_add = 5számú pótpont esetén a gradienst és negatívját választottuk az első csoportba, a második csoportba pedig a két utolsó közelítő optimális megoldást összekötő egyenes irányvektorát + és - előjellel.

Hozzáadhatunk még egy pótpontot a következők szerint. Az algoritmusban állandóan számoltuk a közelítő minimális függvényértéket, az f_appr.min. értékét, amelyet az x_a.min pontban értünk el, ezért ez a pont a rendelkezésünkre áll, és nehézség nélkül csatolható azS_k halmazhoz.

Tehát az n_add = 2n + 2 számú pótpont a következőképpen áll össze: az x_k közelítő megoldás, az ortonormált rendszer vektorjai (mind +, mind - előjellel) és a közelítő min-imum pontja. Minél nagyobb az nadd értéke, annál kevesebb első lépcsős feladatot kell

megoldani, viszont ez lassíthatja a konvergenciát. Ezért érdemes az algoritmus elején csak néhány pontot hozzáadni a ponthalmazhoz, míg a vége felé akár10n−100n számú pótpont is használható.

A közelítő minimum

Az algoritmus működése során könnyen számon tarthatjuk a közelítő minimum értékét – ezt az algoritmus 3. lépésében, közvetlenül az új függvényérték kiszámítása után tesszük meg. Az algoritmusban előállított közelítő optimális megoldások indexét jelöljük K-val, ugyanis az Sk halmazból csak az első lépcsős feladat determinisztikus feltételeinek eleget tevő x_k, k ∈ K pontok függvényértékeit vesszük itt figyelembe. Jelölje az x_k, k ∈ K pontban kiszámított zajos q_k függvényérték szórását σ_k, amelyet a tényleges mintából számított empírikus szórás értékével azonosítunk. Az f_appr.min. közelítő minimum értéke kezdetben legyen egy nagy szám, és utána ennek értékét minden egyesk ∈K index esetén felfrissítjük a

fappr.min. =qk+ 3σk, ha qk+ 3σk≤fappr.min.

egyenlet alapján; ha az egyenletben megadott feltétel nem áll fenn, akkor megnöveljük azf_appr.min. értékét (lásd lentebb). Jelöljex_a.minazt a pontot, amely esetén ezt a közelítő minimum értékét találtuk; azf_appr.min.a tényleges minimum egy felső korlátjának tekinthető.

Egy kis (0.05) valószínűséggel a kiszámított q_k függvényérték hibája nagyobb lehet 3σk-nál is, ha ezt nem vesszük figyelembe, akkor ugyanazt a hibás minimum pontot újra és újra csatolnánk az S_k halmazhoz. Ezért rugalmasabbá tesszük a felfrissítést: ha a jelenlegi közelítő minimumot nem csökkentettük egy k ∈ K értékre, akkor megnöveltük egy kis értékkel az

f_appr.min. =f_appr.min.+ 0.1σ_k

egyenlet alapján, aholk az az index, amely esetén az utolsó alkalommal csökkentettük a közelítő minimum értékét. Ezzel a módosítással előbb, vagy utóbb kimozdulunk az aktuális x_a.min pontból (persze még akkor is, ha ez tényleg a minimum pont volt).

Az SRA viselkedése és a súlypont

Néhány heurisztikus gondolattal világítjuk meg az algoritmus viselkedését. Ez a SUMT eljárásokra emlékeztet – egy korlátot alkot a x_k, k ∈ K pontok számára. Az algoritmus egyx_kközelítő megoldást számít ki, és aztán újra ellenőrzi, aq_k∼ Q(x_k,ξ_k)függvényérték kiszámításával a pont optimalitásának helyességét. Ha q_k kisebb, mint a regressziós füg-gvény értéke ezen a helyen, akkor lefelé módosítja ebben a pontban aq_k(x)függvényt (ha nagyobb, akkor felfelé). Vagyis egy idő után egy többé-kevésbé stabil tálat alakít ki, és a x_k, k ∈K pontok csak ebben tudnak mozogni.

Véletlent használó algoritmusok esetében általában jó ötlet a súlypont vizsgálata.

Jelöléseinkkel ez az M₁ = (1/P λ_i)P

λ_ix_i pontot jelenti, ahol az összegezés az i =

0, . . . , k indexekre történik. A közelítés stabilizálása alatt létrehozott „messze” lévő pon-tok hatása miatt ez a súlypont lényegesen eltérhet az optimális megoldástól, és elég sok időt vehet igénybe ennek a konvergenciája az optimális megoldáshoz. Ezek szerint érdemes egy módosított súlypontot alkotni, amelyben nem szerepeltetjük az algoritmus elején meghatározott, főleg a stabilizálást szolgáló „messze” lévő pontokat, vagyis legyen

s= (1/

A legtöbb esetben ez az s pont jobb eredményeket adott (kisebb célfüggvényértéket), mint az utolsó x_k közelítő megoldás, hiszen az előbbi a tál közepén lassan változtatta a helyét, míg az utóbbi jóval nagyobb ingadozásokkal próbált meg a tál szélének nekimenni.

In document A sztochasztikus programozás Monte Carlo módszereiről Doktori értekezés (Pldal 146-150)