• Nem Talált Eredményt

Iránymenti integrálás – ortonormált becslések

3. Halmazok valószínűsége 29

3.2. Iránymenti integrálás – ortonormált becslések

integrál kiszámítását, ahol f(z) azX halmaz indikátorfüggvénye, azaz f(z) =

( 1, haz∈X, 0, egyébként.

A (3.4) egyenlőség jobboldala alapján a következő Monte Carlo eljárást lehet megadni a P r{X}valószínűség kiszámítására. Legyen aξ valószínűségi változóϕ sűrűségfüggvényű, és jelölje ennek a független mintáitxi, i= 1, . . . , N. Ekkor I egy torzítatlan becslése a

átlag. Ezt a becslést a durva becslésnek, vagy elfogadás-elvetés becslésnek nevezzük, mivel a gyakorlatban ez egy olyan eljárásra vezet, ahol a xi, i = 1, . . . , N vektorok generálása után már csak azX halmazban fekvő vektorok számát kell meghatározni, így a becslés a relatív gyakoriság.

Közismert, hogy egy normális eloszlású ξ vektor felírható

ξ =χnTη (3.6)

alakban, ahol χn egy n szabadságfokú χ-eloszlású skalár valószínűségi változó, T egy felső–háromszög alakú mátrix, amelyre T T0 = R fennáll, továbbá az η valószínűségi vektorváltozó egyenletes eloszlású az egységgömb felületén, az S = {x | Pn

i=1 x2i = 1}

halmazon. A ξ vektor χn „hossza” és az η „iránya” független valószínűségi változók.

Jelölje a χ-eloszlású χn valószínűségi változó eloszlásfüggvényét K(λ), λ ≥ 0 és az η valószínűségi vektorváltozó eloszlásfüggvényét V(y),y ∈ S. Ezekkel a jelölésekkel az integrálunk átírható: Vezessük be a g(y) jelölést a belső integrálra, legyen

g(y) = Z

0

f(λTy)dK(λ). (3.8)

Ez a g(y) függvény egy rögzített y esetén megadja a λTy, λ ≥0 sugár X halmazba eső részének a valószínűségi tartalmát. Tegyük fel most, hogy a λz =λTy egyenes elmetszi

azX konvex halmazt, és definiáljuk az egyenes belépési, illetőleg kilépési pontjait aλLés K(λU | y) jelölésekkel is fogunk élni. (Jegyezzük meg, hogy az egydimenziós K(·) elos-zlásfüggvény könnyen kiszámítható létező szoftverek segítségével.) Bevezetve a λ+L = max{0, λL}, λ+U = max{0, λU} jelöléseket, látható, hogy a g(·) függvény a

g(y) =K(λ+U|y)−K(λ+L|y). (3.10) formába írható. Hasonlóan kapható a λU = min{0, λU}, λL = min{0, λL} jelölések használatával

g(−y) = −K(−λU| −y) +K(−λL| −y),

vagyis a λL, λU állandók meghatározása után aλz=λTyegyenes valószínűségi tartalma is meghatározható:

e(z) =e(Ty) = [g(y) +g(−y)]/2.

A belső integrálra kapott (3.10) kifejezést visszahelyettesítve a (3.7) kettős integrálba írhatjuk, hogy

Az egyenlet alapján a következő Monte Carlo eljárás adható azIkiszámítására: generáljuk az yi, i = 1, . . . , N független mintákat az S-en adott egyenletes eloszlásból és számítsuk ki determinisztikusan (a megfelelő program segítségével) a g értékét minden yi esetén.

Tehát becslésünk I-re a következő: Ez a becslés az I-t a következő módon határozza meg: a (3.8) belső integrált deter-minisztikusan számítjuk, míg a külső integrálra mintavételt hajtunk végre. A becslést hatékonyabbá tudjuk tenni a következő két módosítás segítségével.

Az egyik módosítást arra alapozzuk, hogy a Θ2 szórása viszonylag nagy, mert az yi vektorok „túl véletlenszerűen” vannak szétszórva az egységgömb felületén, így egy olyan elrendezésre van szükségünk, amely a felhasznált vektorok „egyenletességét” növeli. Ez a következő módon érhető el: a független yi vektorok helyett egy ortonormalizált vek-torokból álló rendszert állítunk elő.

Tekintsük a véletlen U rendszert, amely S-ben lévő, ortonormalizált vektorokból áll;

legyen U ={ui, i= 1, . . . , n|ui ∈S,ui0ujij, i, j = 1, . . . , n}, ahol δij = 0, i6=j, δii=

1, és U egyenletes eloszlású az ortonormalizált rendszerek felett. A második módosítás előkészítéseként tekintsük tetszőleges két U-beli vektor összegét és különbségét, vagyis legyen

vi,j,s = 1

√2 s1ui+s2uj

, (3.13)

ahol azi, j indexpár és az s előjelvektor az összes lehetséges értéket felveszi a

J ={(i, j,s)|i= 1, . . . , n−1, j = 2, . . . , n, i < j, s1 = 1, s2 = 1,vagy s1 = 1, s2 =−1}

halmazból. Az ui vektorok normalizált összegét azért használjuk, hogy az egy vek-torra eső számítási munkát csökkentsük. Egy adott U rendszer esetén csak n számú ui vektorunk van, de az U-ból előállítható vi,j,s vektorok száma 2n(n −1) (az előállított egyenesek száma pedign(n−1)).

A másik módosítást a következő, számítástechnikai szempontból fontos megjegyzésre alapozzuk. A Tvi,j,s transzformált vektorok kiszámítása helyett csak azui vektorok Tui transzformált vektorait határozzuk meg, mivel ezek segítségével az előbbiek megadhatók, ugyanis

zi,j,s =Tvi,j,s = 1

√2 s1Tui +s2Tuj ,

tehát n(n − 1) mátrixszorzás helyett csak n mátrixszorzásra lesz szükségünk a Tvi,j,s vektorok előállításához. Így az egy generált vektorra eső számítási munka lényegesen csökkenthető, továbbá a generált vektorok „egyenletessége” is növelhető.

A két módosítás figyelembevételével megadjuk egy teljes U rendszer esetén a becslés formális alakját akkor, ha tetszőleges kétU-beli vektor összegére és különbségére végezzük el a függvényértékek kiszámítását: Ezt a becslést ortonormalizált–2 (ortonormált–2), vagy röviden O2 becslésnek nevez-zük. Természetesen a gyakorlati számítások során N különböző U rendszert generálunk véletlenszerűen, és az eredményül kapott valószínűségek átlagát számítjuk ki.

Két darab, U rendszerből származó vektor összege és különbsége helyett vehetnénk k darab U-beli vektor minden lehetséges előjellel vett normalizált összegét is, ezáltal az Ok becslést kapnánk – ezzel megnövelnénk az egy rendszerből előállítható vektorok számát és csökkentenénk az egy előállított vektorra eső számítási munkát. Az így kapott Ok becslések formális leírása könnyen megkapható a fentiek alapján, így ezek leírását mellőzzük. Az O2 becslések általában számítástechnikailag megfelelőnek bizonyultak (az Ok becslések összehasonlítására vonatkozó numerikus eredmények találhatók például a [De 79], [De 98c] cikkekben).

Az O2 becslés végleges leírásában a λ+L, λ+U és a g függvény helyett az eredeti λL, λU állandókat és az e függvényt használjuk, vagyis egyidejűleg számítjuk a g(y) és g(−y) függvényértékeket – természetesen ez megfelezi azon vektorok számát, amelyekre aλL, λU értékeket ki kell számítani. Az O2 becslést megvalósító algoritmus lényegi lépéseit az alábbiakban adjuk meg.

O2 algoritmus (általános eset, egy U rendszer esetén)

1. Generáljuk az U ={ui} rendszert és számítsuk ki az ui =Tui, i= 1, . . . , n vektorokat.

2. Legyen Sum= 0.

3. Határozzuk meg az összes lehetséges z=zi,j,s=Tvi,j,s = 1

2 s1ui+s2uj , (i, j,s)∈J vektorokat és minden z vektorra végezzük el a 4. lépést.

4. Kezdet: (az e(z) függvény kiszámítása)

kiszámítjuk a λL = min{λ |λz∈X}, λU = max{λ|λz∈X} értékeket, ha nincs metszés, akkor legyen λLU = 0,

ha λU ≥λL ≥0, akkor legyen Sum=Sum+K(λU)−K(λL), ha λU ≥0≥λL, akkor legyen Sum=Sum+K(λU) +K(−λL), ha 0≥λU ≥λL, akkor legyen Sum=Sum+K(−λL)−K(−λU), vége (az e(z) függvény kiszámítása).

5. Adjuk át a keresett valószínűség torzítatlan becsléseként a p=Sum/[2n(n−1)] értéket.

Megjegyezzük, hogy egy teljes algoritmusban az U rendszernek N darab független re-alizációját használjuk, N-et nevezzük a mintaszámnak. Az O2 becslés kiszámítása azért hatékonyabb a durva módszernél, mert egyU rendszer eseténO(n2)mátrixszorzás helyett csakO(n)mátrixszorzásra van szükség és még néhány skalár szorzásra. Ez a számítástech-nikai hatékonyság növekedés az összes, továbbiakban leírásra kerülő esetben igaz, vagyis eloszlásfüggvény, téglatest, poliéder, ellipszoid, körkúp valószínűségének kiszámítása es-etén is.

A (3.7) egyenletben leírt integráltranszformációt és az eredményül kapott kettős inte-grált többféleképpen is felfoghatjuk.

(i) Tetszőleges p=P{ξ ∈X}valószínűség felírható, mint az X halmaz f(ξ) =

( 1, haξ ∈X,

0, egyébként (3.15)

indikátor valószínűségi változójának a várható értéke, vagyis p=E[f(ξ)].

Ez a várható érték megfelel a (3.4) jobboldalán álló integrálnak. Felhasználva aE(α) = E[E(α|β)] ismételt (feltételes) várható érték összefüggést ez a várható érték átírható a

p=E[f(ξ)] =E[f(χnTη)] = E[E(f(χnTη)|η)] (3.16)

alakba, ami viszont pontosan megfelel (3.7) kettős integráljának.

(ii) Egy másik lehetséges értelmezés adódik a numerikus integrálás szempontjainak figyelembevételével. A Monte Carlo integrálás elég jól működik, ha a feladat dimenziója nagy, de tudjuk, hogy viszonylag lassú, O(N−1/2) a konvergencia sebessége. A hagy-ományos (determinisztikus) integrálási szabályok kis hibával dolgoznak, de ezeket nem nagyon lehet magasabb dimenzióban használni.

A kettős integrál formájába írt kifejezés a munkánkat két részre osztja: egy egydi-menziós, vonal menti integrál meghatározása hagyományos numerikus integrálási tech-nika segítségével és egy, az n-dimenziós térben elhelyezkedő (n−1)-dimenziós felületen elvégzett Monte Carlo integrálásra. Ezt a felbontást sugaras-felületi (radial–spherical) integrálásnak [MG 97], vagy iránymenti szimulációnak (directional simulation) is nevezik [DB 89], s a többdimenziós t-eloszlás eloszlásfüggvényének kiszámítására, illetőleg más halmazok valószínűségének meghatározására is használható (elliptikusan szimmetrikus sűrűségfüggvények esetén).

(iii) Végül a Monte Carlo integrálás szempontjából is megvizsgálhatjuk a dekompozí-ciót. Minden szimuláció esetén a fő kérdés az, hogyan lehet csökkenteni a becslés szórását (anélkül, hogy lényegesen megnövelnénk a szükséges munkát). Ez az eljárás éppen erre példa – a változók számának csökkentésével szóráscsökkenést érünk el. A Monte Carlo in-tegrálás területén szokásos szóhasználattal egy ortonormált becslést egy determinisztikus integrálási formula randomizált változatának is nevezhetünk.