A logaritmikus transzformáció mellékhatásai

4. Egydimenziós közelítések 49

4.2. A többdimenziós normális eloszlás egy egyenes mentén való közelítései

4.2.2. A logaritmikus transzformáció mellékhatásai

Az f(x) függvényérték hibája (a zaj) a szokásos feltevések alapján nulla várható értékű, és azonos szórású mindenxesetén. Az előző szakaszokban leírt logaritmikus és fordított–

logaritmikus becsléseiben szereplő logaritmikus transzformáció megváltoztatja a hiba elos-zlását, így a várható értékét és a szórását is. Pontosabban míg a p = f(x₀) +ξ zajos függvényértékben Ep = f(x0) +Eξ = f(x0) és Dp = Dξ = σ minden x0 esetén, addig

logp = log [f(x₀) +ξ] várható értéke nem logf(x₀) és szórása is függ x₀-tól. Szeretnénk elérni, hogy a transzformáció után kapott hiba is nulla várható értékű és azonos szórású legyen, vagy ezt legalábbis közelítőleg szeretnénk biztosítani.

A szórásban bekövetkezett változást súlyok bevezetésével lehet csökkenteni, míg a várható érték megváltozását egy korrekciós, javító tag hozzáadásával lehet ellensúlyozni.

A súlyozás használatát minden, a logaritmikus transzformációt használó becslés esetében javasoljuk, ha az x_i alappontok egy széles tartományban szóródnak (ha az f(x_i) füg-gvényértékek különbsége nagyobb, mint egy adott érték, példáulσ – ugyanis azx_i pontok tartományát nem lehet jól jellemezni az|x_i−x_j|² eltéréssel, ezért inkább az|f(x_i)−f(x_j)|

függvényértékek közti különbséget használjuk). A korrekciós tag használatát csak akkor javasoljuk, ha nagyon pontos függvényértékekre van szükségünk.

Súlyok a logaritmikus transzformáció esetén

Az egyszerűség kedvéért csak a t₂(x) becslés vizsgálatával foglalkozunk, de a gondo-latmenet és a megadott képletek nehézség nélkül átvihetők a fordított–logaritmikus, vagy akármilyen más, a logaritmikus transzformációt használó becslésre.

Tegyük fel, hogy azx₀helyen egy Monte Carlo módszerrel ap₀értéket határoztuk meg, p₀ ∈ N(fe (x₀),σ), azaze p₀ =f(x₀) +ξ írható egy ξ ∈Ne(0,σ)e valószínűségi változó segít-ségével. Természetesen a tényleges számításokban null–csonkolást hajtunk végre, vagyis értékünk ap₀ = max(0,min(1, f(x₀) +ξ))lesz, de a leírás egyszerűségének érdekében ap₀ normális eloszlását tesszük fel (ami numerikus szempontból megengedhető helyettesítés egy kis környezetben).

Tegyük fel, hogy a közelítésünk teljesen pontos, vagyis g(x) = f(x). Ekkor az alap-becslés esetén a [p₀ −f(x₀)]² = ξ_i² hibanégyzeteket összegezzük és minimalizáljuk, ahol a ξ_i hibák függetlenek az f(x₀) függvényértéktől és egymástól. A t₂(x) becslés esetén a minimalizálandó összegben szereplő tagok[logp₀−logf(x₀)]² alakúak, amelyek függenek az f(x₀) értéktől. Fejtsük ki a logaritmikus függvényt, a logp₀ = log(f(x₀) +ξ) értéket azf(x0)körül, akkor azt kapjuk, hogy

logp₀ = logf(x₀) + 1

f(x)ξ, (4.14)

ahol f(x) ∈ [f(x0), f(x0) +ξ] a középértéktétel alapján. Átrendezve a (4.14) tagjait kapjuk a

[logp₀−logf(x₀)]·f(x) =ξ

egyenlőséget. Ezek szerint a minimalizálandó összegben szereplő tagok függetlenné tehetők azf(x0)-tól, haf²(x)értékű súlyokat teszünk az egyes[logp0−logf(x0)]² tagokhoz. Bár az f(x) értékét nem ismerjük, de ez közelíthető a p₀ =f(x₀) +ξ és azf(x₀) átlagával – ezekből az első ismert, a második ismeretlen, de viszont közelíthető valamelyik előzőleg leírt becslés segítségével. Tehát a w_i súlyokat a következő egyenletek adják:

w_i = w_i^∗/s,

w^∗_i = [p_i+t^∗(x_i)]²/4, i= 1, . . . , n, s =

i=1

w_i^∗,

ahol a t^∗(·) becslés akár a kiszámítandó becslés egy korábbi változata, akár az f(x) valamelyik másmilyen, előzőleg meghatározott becslése lehet. At^∗(·)szerepében használ-hatjuk at₀(x) = a₀x+b₀lineáris regressziós becslést is, amely igen egyszerűen meghatározható.

A fordított-logaritmikus becslésekben használt súlyokat szintén meg lehet határozni az előző érvelés segítségével, és ezekre

w_i = w^∗_i/s,

w^∗_i = [1−p_i+ 1−t^∗(x_i)]²/4, i= 1, . . . , n, s =

i=1

w_i^∗.

Amint ezt megjegyeztük, a logaritmikus transzformáció által a hiba szórásnégyzetében okozott változás csak abban az esetben lesz zavaró a numerikus számításainkban, ha az f(xi) értékek nagyon különbözőek. Ezt a „nagyon különbözőséget” a következő módon lehet kvantifikálni. Tegyük fel, hogy kiszámítottuk az első t^∗(x) közelítést, ha most a t^∗(max_ix_i)− t^∗(min_ix_i) < σ egyenlőtlenség fennáll, akkor gyakorlatilag nincs szükség a súlyok kiszámítására és használatára, mert a függvénymeghatározásban tapasztalt σ hiba értéke nagyobb a logaritmikus transzformáció által okozott hibánál, így ez utóbbi elhanyagolható.

A becslés korrekciója

Eredetileg a mintavételi hiba 0 várható értékű – ha egy korrekciós tagot hozzáadunk a becsléshez, akkor a transzformált hiba várható értékét közel 0 értékűvé tudjuk tenni.

Tegyük fel, hogy adott x-re az f(x) függvényérték egy p közelítő értékét kiszámí-tottuk, tehát p = f(x) +ξ, ξ ∈ Ne(0,eσ). A sztochasztikus programozásban a szokásos megbízhatósági szintf(x) =µ∼0.9, amely egy σ= 0.05 hiba esetén nagyon „féloldalas”

eloszlásúlogpvalószínűségi változót eredményez és az ebből eredő eltérés sokkal nagyobb, mint az a korrekció, amelyet a továbbiakban leírunk. Másrészt, egyσ = 0.01szórás esetén a probléma gyakorlatilag nem jelentkezikf(x)≤0.95függvényértékekre.

Feltesszük, hogy a p várható értéke µ = f(x), szórása σe (amely nagyon közeli a σ értékhez), sűrűségfüggvénye φ(z) =e Cexp{−((z −µ)²)/(2σ²)}, z ∈ [µ−3σ, µ+ 3σ] egy C = 1.0028/(√

2πσ)állandóval.

Sorbafejtjük logp= log(µ+ξ) függvényt a µkörül, akkor

logp= logµ+ 1 A logp várható értékét úgy kaphatjuk meg, hogy a fentebbi kifejezést használjuk a várható értékben: ahol M_2k a 2k-adik momentuma a Ne eloszlásnak, mivel a páratlanadik momentumok nullával egyenlőek. Legyen r egy páros szám, akkor a standard normális eloszlás r-edik momentuma 2^r/2Γ((r+ 1)/2)/√

π, amely egy divergens összeget adna az E(logp) várható értékre, de a Ne csonkolt normális eloszlásnak korlátos momentumai vannak. Ez a következőképpen látható be. Vegyük a várható értékét a (4.15) összeg (r + 1)-edik tagjának és helyettesítsük a σe értéket a σ-val, C = 1.0028/(√

Ennek az integrálnak egy felső korlátját úgy kaphatjuk meg, hogy az exponenciális füg-gvényt 1-el helyettesítjük, miáltal

Növekvő r esetén ez a felső korlát csökken és számítástechnikai szempontból elhanyagol-ható értékű, ha 3σ < Lµ fennáll valamilyen elég nagy L esetén – a legtöbb gyakorlatban felmerülő feladatban L∼0.1 esetén ez fennáll, így az integrál értékét aL^r/r² geometriai sor felülről korlátozza. (Azokban az esetekben, amikor 3σ > µ, a fordított logaritmikus becslés alkalmazható.) Tehát a (4.16) egyenlet jobboldali összegéből, mivel a tagok gyor-san csökkennek, csak az első két tagot tartjuk meg, miáltal a következő közelítő egyen-lőséget kaptuk a logp várható értékére:

E(logp)∼logµ− σ² 2µ²,

ahol a jobboldalon szereplő második tagot nevezzük a korrekciós tagnak. Alapjában véve ez a közelítő formula azt jelenti, hogy bár azf(x)-nek a _n¹P

i f(x_i) +ξ_i egy torzítat-lan becslése, de log(f(x) + ξ) értéknek nem torzítatlan becslése a ¹_nP

ilog [f(x_i) +ξ_i]

(általában a keresettnél kisebb értékeket kapunk az alkalmazásával), és a kettő közti különbség jól közelíthető a σ²/(2µ²) korrekciós taggal. Ez a korrekció egész kicsi, és csak azokban az esetekben használandó, amikor a kiszámítandó becslés értékének megkívánt pontossága közel van a korrekciós tag értékéhez. Mindenesetre, ennek a korrekciónak a használatát csak a számítások legvégső fázisában javasoljuk.

A fordított-logaritmikus becslés esetében a korrekciós tagot a fentiekhez hasonlóan lehet meghatározni, a korrekciós tag képlete ekkorσ²/(1−µ)².

In document A sztochasztikus programozás Monte Carlo módszereiről Doktori értekezés (Pldal 72-76)