• Nem Talált Eredményt

A logaritmikus transzformáció mellékhatásai

4. Egydimenziós közelítések 49

4.2. A többdimenziós normális eloszlás egy egyenes mentén való közelítései

4.2.2. A logaritmikus transzformáció mellékhatásai

Az f(x) függvényérték hibája (a zaj) a szokásos feltevések alapján nulla várható értékű, és azonos szórású mindenxesetén. Az előző szakaszokban leírt logaritmikus és fordított–

logaritmikus becsléseiben szereplő logaritmikus transzformáció megváltoztatja a hiba elos-zlását, így a várható értékét és a szórását is. Pontosabban míg a p = f(x0) +ξ zajos függvényértékben Ep = f(x0) +Eξ = f(x0) és Dp = Dξ = σ minden x0 esetén, addig

logp = log [f(x0) +ξ] várható értéke nem logf(x0) és szórása is függ x0-tól. Szeretnénk elérni, hogy a transzformáció után kapott hiba is nulla várható értékű és azonos szórású legyen, vagy ezt legalábbis közelítőleg szeretnénk biztosítani.

A szórásban bekövetkezett változást súlyok bevezetésével lehet csökkenteni, míg a várható érték megváltozását egy korrekciós, javító tag hozzáadásával lehet ellensúlyozni.

A súlyozás használatát minden, a logaritmikus transzformációt használó becslés esetében javasoljuk, ha az xi alappontok egy széles tartományban szóródnak (ha az f(xi) füg-gvényértékek különbsége nagyobb, mint egy adott érték, példáulσ – ugyanis azxi pontok tartományát nem lehet jól jellemezni az|xi−xj|2 eltéréssel, ezért inkább az|f(xi)−f(xj)|

függvényértékek közti különbséget használjuk). A korrekciós tag használatát csak akkor javasoljuk, ha nagyon pontos függvényértékekre van szükségünk.

Súlyok a logaritmikus transzformáció esetén

Az egyszerűség kedvéért csak a t2(x) becslés vizsgálatával foglalkozunk, de a gondo-latmenet és a megadott képletek nehézség nélkül átvihetők a fordított–logaritmikus, vagy akármilyen más, a logaritmikus transzformációt használó becslésre.

Tegyük fel, hogy azx0helyen egy Monte Carlo módszerrel ap0értéket határoztuk meg, p0 ∈ N(fe (x0),σ), azaze p0 =f(x0) +ξ írható egy ξ ∈Ne(0,σ)e valószínűségi változó segít-ségével. Természetesen a tényleges számításokban null–csonkolást hajtunk végre, vagyis értékünk ap0 = max(0,min(1, f(x0) +ξ))lesz, de a leírás egyszerűségének érdekében ap0 normális eloszlását tesszük fel (ami numerikus szempontból megengedhető helyettesítés egy kis környezetben).

Tegyük fel, hogy a közelítésünk teljesen pontos, vagyis g(x) = f(x). Ekkor az alap-becslés esetén a [p0 −f(x0)]2 = ξi2 hibanégyzeteket összegezzük és minimalizáljuk, ahol a ξi hibák függetlenek az f(x0) függvényértéktől és egymástól. A t2(x) becslés esetén a minimalizálandó összegben szereplő tagok[logp0−logf(x0)]2 alakúak, amelyek függenek az f(x0) értéktől. Fejtsük ki a logaritmikus függvényt, a logp0 = log(f(x0) +ξ) értéket azf(x0)körül, akkor azt kapjuk, hogy

logp0 = logf(x0) + 1

f(x)ξ, (4.14)

ahol f(x) ∈ [f(x0), f(x0) +ξ] a középértéktétel alapján. Átrendezve a (4.14) tagjait kapjuk a

[logp0−logf(x0)]·f(x) =ξ

egyenlőséget. Ezek szerint a minimalizálandó összegben szereplő tagok függetlenné tehetők azf(x0)-tól, haf2(x)értékű súlyokat teszünk az egyes[logp0−logf(x0)]2 tagokhoz. Bár az f(x) értékét nem ismerjük, de ez közelíthető a p0 =f(x0) +ξ és azf(x0) átlagával – ezekből az első ismert, a második ismeretlen, de viszont közelíthető valamelyik előzőleg leírt becslés segítségével. Tehát a wi súlyokat a következő egyenletek adják:

wi = wi/s,

wi = [pi+t(xi)]2/4, i= 1, . . . , n, s =

n

X

i=1

wi,

ahol a t(·) becslés akár a kiszámítandó becslés egy korábbi változata, akár az f(x) valamelyik másmilyen, előzőleg meghatározott becslése lehet. At(·)szerepében használ-hatjuk at0(x) = a0x+b0lineáris regressziós becslést is, amely igen egyszerűen meghatározható.

A fordított-logaritmikus becslésekben használt súlyokat szintén meg lehet határozni az előző érvelés segítségével, és ezekre

wi = wi/s,

wi = [1−pi+ 1−t(xi)]2/4, i= 1, . . . , n, s =

n

X

i=1

wi.

Amint ezt megjegyeztük, a logaritmikus transzformáció által a hiba szórásnégyzetében okozott változás csak abban az esetben lesz zavaró a numerikus számításainkban, ha az f(xi) értékek nagyon különbözőek. Ezt a „nagyon különbözőséget” a következő módon lehet kvantifikálni. Tegyük fel, hogy kiszámítottuk az első t(x) közelítést, ha most a t(maxixi)− t(minixi) < σ egyenlőtlenség fennáll, akkor gyakorlatilag nincs szükség a súlyok kiszámítására és használatára, mert a függvénymeghatározásban tapasztalt σ hiba értéke nagyobb a logaritmikus transzformáció által okozott hibánál, így ez utóbbi elhanyagolható.

A becslés korrekciója

Eredetileg a mintavételi hiba 0 várható értékű – ha egy korrekciós tagot hozzáadunk a becsléshez, akkor a transzformált hiba várható értékét közel 0 értékűvé tudjuk tenni.

Tegyük fel, hogy adott x-re az f(x) függvényérték egy p közelítő értékét kiszámí-tottuk, tehát p = f(x) +ξ, ξ ∈ Ne(0,eσ). A sztochasztikus programozásban a szokásos megbízhatósági szintf(x) =µ∼0.9, amely egy σ= 0.05 hiba esetén nagyon „féloldalas”

eloszlásúlogpvalószínűségi változót eredményez és az ebből eredő eltérés sokkal nagyobb, mint az a korrekció, amelyet a továbbiakban leírunk. Másrészt, egyσ = 0.01szórás esetén a probléma gyakorlatilag nem jelentkezikf(x)≤0.95függvényértékekre.

Feltesszük, hogy a p várható értéke µ = f(x), szórása σe (amely nagyon közeli a σ értékhez), sűrűségfüggvénye φ(z) =e Cexp{−((z −µ)2)/(2σ2)}, z ∈ [µ−3σ, µ+ 3σ] egy C = 1.0028/(√

2πσ)állandóval.

Sorbafejtjük logp= log(µ+ξ) függvényt a µkörül, akkor

logp= logµ+ 1 A logp várható értékét úgy kaphatjuk meg, hogy a fentebbi kifejezést használjuk a várható értékben: ahol M2k a 2k-adik momentuma a Ne eloszlásnak, mivel a páratlanadik momentumok nullával egyenlőek. Legyen r egy páros szám, akkor a standard normális eloszlás r-edik momentuma 2r/2Γ((r+ 1)/2)/√

π, amely egy divergens összeget adna az E(logp) várható értékre, de a Ne csonkolt normális eloszlásnak korlátos momentumai vannak. Ez a következőképpen látható be. Vegyük a várható értékét a (4.15) összeg (r + 1)-edik tagjának és helyettesítsük a σe értéket a σ-val, C = 1.0028/(√

Ennek az integrálnak egy felső korlátját úgy kaphatjuk meg, hogy az exponenciális füg-gvényt 1-el helyettesítjük, miáltal

Növekvő r esetén ez a felső korlát csökken és számítástechnikai szempontból elhanyagol-ható értékű, ha 3σ < Lµ fennáll valamilyen elég nagy L esetén – a legtöbb gyakorlatban felmerülő feladatban L∼0.1 esetén ez fennáll, így az integrál értékét aLr/r2 geometriai sor felülről korlátozza. (Azokban az esetekben, amikor 3σ > µ, a fordított logaritmikus becslés alkalmazható.) Tehát a (4.16) egyenlet jobboldali összegéből, mivel a tagok gyor-san csökkennek, csak az első két tagot tartjuk meg, miáltal a következő közelítő egyen-lőséget kaptuk a logp várható értékére:

E(logp)∼logµ− σ22,

ahol a jobboldalon szereplő második tagot nevezzük a korrekciós tagnak. Alapjában véve ez a közelítő formula azt jelenti, hogy bár azf(x)-nek a n1P

i f(xi) +ξi egy torzítat-lan becslése, de log(f(x) + ξ) értéknek nem torzítatlan becslése a 1nP

ilog [f(xi) +ξi]

(általában a keresettnél kisebb értékeket kapunk az alkalmazásával), és a kettő közti különbség jól közelíthető a σ2/(2µ2) korrekciós taggal. Ez a korrekció egész kicsi, és csak azokban az esetekben használandó, amikor a kiszámítandó becslés értékének megkívánt pontossága közel van a korrekciós tag értékéhez. Mindenesetre, ennek a korrekciónak a használatát csak a számítások legvégső fázisában javasoljuk.

A fordított-logaritmikus becslés esetében a korrekciós tagot a fentiekhez hasonlóan lehet meghatározni, a korrekciós tag képlete ekkorσ2/(1−µ)2.