• Nem Talált Eredményt

Vegyes matematikai statisztikai feladatok

In document Sztochasztikus modellezés (Pldal 101-0)

1. minta:

6.10, 0.01, 6.97, 6.03, 3.85, 1.11, 4.03, 4.76, 2.02, 1.55, 4.11, 6.64, 4.55, 4.82, 5.19, 1.62, 3.39, 4.59, 1.34, 2.96, 3.20, 6.92, 1.71, 3.50, 1.22, 0.32, 3.33, 6.07, 2.76, 5.83, 3.49, 4.01, 0.80, 5.36, 0.53 2. minta:

1.63, 1.60, 2.26, 7.60, 1.94, 6.90, 4.66, 3.64, 4.24, 8.35, 6.13, 4.21, -1.73, 3.08, 4.44, 3.95, 13.32, 1.48, 6.60, 4.80, 9.48, -0.78, 6.34, -3.95, 3.55, 7.59, -3.15, 0.16, 3.14, 2.36, 2.73, 9.14, -3.06, 9.98, 2.87, 1.70, -1.27, -1.49, 2.82

3. minta:

1.74, 0.10, 2.25, 0.35, 0.69, 0.26, 0.13, 0.19, 0.38, 0.11, 4.02, 0.32, 0.72, 0.57, 1.28, 0.40, 2.29, 0.33, 0.62, 0.99, 1.74, 5.25, 1.24, 0.12, 0.97, 0.45, 2.31, 2.11, 1.26, 2.48, 0.73, 0.49, 0.43, 0.96, 0.33, 0.04, 0.31, 0.24

1. Az 1. minta esetén határozza meg a mediánt!

2. Az 1. minta esetén határozza meg a medián abszolút eltérést!

3. A 2. minta esetén határozza meg az átlagot!

4. A 2. minta esetén határozza meg a tapasztalati szórásnégyzetet!

5. Készítsen 0.95 valószínűségű (kétoldali) konfidenciaintervallumot a vár-ható értékre a 2. minta esetén. Adja meg az intervallum jobboldali végpontját!

6. Készítsen 0.95 valószínűségű (kétoldali) konfidenciaintervallumot a szó-rásnégyzetre a 2. minta esetén. Adja meg az intervallum jobboldali végpontját!

7. Készítsen a p = 0.56 valószínűséghez kvantilis becslést a 3. minta alapján!

8. Ha az 1. minta a (0, ϑ) intervallumon egyenletes eloszlású, akkor be-csülje meg a ϑparamétert!

9. Igazolja, hogy az 1. minta a(0, ϑ) intervallumon egyenletes eloszlású!

Adja meg a χ2 statisztika értékét, ha az osztályok száma öt!

10. Az előzőχ2 statisztika értékhez adja meg a χ2-eloszlás kritikus értékét 0.95-ös szinten! Írja le a döntést is!

11. A 3. minta esetén határozza meg a korrigált tapasztalati szórást!

12. A 3. minta esetén adja meg a szórási együtthatót!

13. Ha a 3. minta exponenciális eloszlású, akkor becsülje meg aλ paramé-tert!

14. Igazolja, hogy a 3. minta exponenciális eloszlású! Adja meg a χ2 statisztika értékét, ha az osztályok száma négy!

15. Az előzőχ2 statisztika értékhez adja meg a χ2-eloszlás kritikus értékét 0.99-es szinten! Írja le a döntést is!

16. Igazolja, hogy a 2. minta normális eloszlású! Adja meg aχ2 statisztika értékét, ha az osztályok száma öt!

17. Az előzőχ2 statisztika értékhez adja meg a χ2-eloszlás kritikus értékét 0.95-ös szinten! Írja le a döntést is!

18. Megegyezik-e a 2. és a 3. minta szórása? Adja meg az F statisztika értékét! Írja le a döntést is, ha a próba szintje 0.95!

19. Adott a következő hét pont:

(-0.35, 2.79), ( 1.42, 5.47), ( 3.11, 6.93),

( 4.06, 9.59), ( 4.89,11.37), ( 4.73,12.60), ( 6.49,14.51) Becsülje meg a regressziós egyenes meredekségét!

20. Az előző feladatban kapott egyenesnek adja meg az ún. y-tengelymet-szetét!

NUMERIKUS VÁLASZOK:

1. 3.5000 2. 1.7900 3. 3.5195 4. 14.6944 5. 4.7775 6. 24.2125 7. 0.6984 8. 7.1691 9. 2.0000 10. 9.4877 11. 1.1284 12. 1.0794 13. 0.9694 14. 1.9161 15. 11.3450 16. 1.5881 17. 7.8147 18. 11.8433 19. 1.7687 20. 2.8847

3. fejezet

Többdimenziós normális eloszlás

3.1. Többváltozós normális eloszlás fogalma

A történelem során megszerzett eredményekre, tapasztalatokra építve a több-változós normális eloszlás definícióját Hilary Seal fejtette ki. A legkorábbi próbálkozások Bravais és Schols nevéhez fűződnek. Francis Galton kétvál-tozós adatokon végzett korreláció analízissel tett megállapításokat egy két-változós normális sűrűségfüggvény szerkezetéről. Abból a feltételezésből ki-indulva, hogy az azonos sűrűségek szintvonalai koncentrikus ellipszisek, a sűrűségfüggvény egy olyan formáját fejlesztette ki (J.D.H. Dickson segítségé-vel), melyet napjainkban is használunk. Edgeworth kisérelte meg a normális eloszlás 4 és magasabb dimenziókba való kiterjesztését. Mégis Karl Pear-son volt az, aki először bemutatta a többváltozós normális sűrűségfüggvény modern formáját.

A mai elemzők a többváltozós normális eloszlást több nézőpontból is meg-vizsgálják. A mai napig nincs olyan egységes definíció, amely alkalmazható lenne a különböző nézetekre. Egyváltozós esetben a Z véletlen változó -amelynek várható értéke 0 (E(Z) = 0) és szórásnégyzete 1 (D2(Z) = 1) -sűrűségfüggvénye(2π)−1/2exp(−z2/2), ahol−∞< z <∞. A többdimenziós kiterjesztés aZ1, . . . , Zpfüggetlen változókból (N(0,1)) áll, amelyek együttes sűrűségfüggvénye az alábbi módon írható fel

(2π)−p/2exp(−zTz/2), z∈Rp. (3.1) Jelölésére a Z∼Np(0,I)kifejezést használjuk. Ennek általánosítására szol-gál a következő definíció.

3.1. Definíció. Az X p-dimenziós véletlen vektor nemszinguláris p-dimen-ziós normális eloszlású, ha xelemeinek az együttes sűrűségfügvénye a követ-kező:

f(x1, . . . , xp) = (2π)−p/2|Σ|−1/2×exp{−(x−µ)TΣ−1(x−µ)/2}, (3.2) ahol x∈Rp.

Jelölés: X∼Np(µ,Σ).Itt µa várható érték vektor, Σa variancia-kovarian-cia mátrix. |Σ| a determinánsa Σ mátrixnak. Ha Σ rangja kisebb mint p, akkor azX vektornak szinguláris normális eloszlása van. X áttranszformál-ható az Y = AX + b vektorba, aholA r×pmátrix és a rangja r. Ekkor Ynemszinguláris többváltozós normális eloszlásúr-dimenzióban. Mindezek a következő definícióhoz vezetnek.

3.2. Definíció. (Srivastava és Khatri)AzXp-dimenziós véletlen vektor-nak többváltozós normális eloszlása van (Np(µ,Σ)), ha X eloszlása ugyan-olyan, mint az Y=µ+DZ vektornak, ahol D p×r mátrix és a rangja r, Σ=DDT és Z∼Nr(0,I).

3.3. Megjegyzés. Ebben az esetben r az X eloszlásának rangját jelenti.

Következésképpen Σ rangja p kell legyen. Az eloszlást tehát az egyik fő jellemző tulajdonsága alapján definiáltuk.

3.1.1. Többváltozós elemzések

A normális eloszlás sűrűségfüggvénye - az ismert haranggörbe (Gauss-görbe) - több dimenzióra történő általánosítása alapvető szerepet játszik a többvál-tozós elemzésben. Számos többváltöbbvál-tozós technika feltételezi, hogy az adatok többváltozós normális eloszlásból származnak. Bár a valós adatok sosem kö-vetikpontosan a többváltozós normális eloszlást, a normális sűrűség gyakran egy hasznos közelítést ad a "valódi" sokasági eloszlásra. Tehát a normális el-oszlás sokszor megfelelő populáció modellként szolgál. Számos többváltozós statisztika mintavételi eloszlása közelítőleg normális, tekintet nélkül a szülő populációra, acentrális határeloszlás tétel miatt.

Ap-dimenziós normális eloszlás sűrűségfüggvényének szintvonalai ellipszisek, amelyek egyenlete azx függvényében a következő

(x−µ)TΣ−1(x−µ) =c2. (3.3)

Az ellipszisek középppontjaµ, tengelyeik ±c√

λiei, aholΣeiiei,

i = 1,2, . . . , p. λi,ei a Σ−hoz tartozó sajátérték(normalizált)-sajátvektor pár.

A következők igazak a többváltozós normális eloszlású Xvéletlen vektorra.

1. X elemeinek lineáris kombinációi normális eloszlásúak.

2. X elemeinek minden részhalmaza (többváltozós) normális eloszlású.

3. A nulla kovariancia arra utal, hogy a megfelelő összetevők független eloszlásúak.

4. A többváltozós összetevők feltételes eloszlásfüggvényei (többváltozós) normálisak.

Ezen tulajdonságok teszik a normális eloszlást könnyen kezelhetővé.

3.1.2. Elemi tulajdonságok

A legtöbb alapvető tulajdonság a momentumgeneráló (karakterisztikus) függ-vényből könnyen levezethető:

exp[tTµ+tTΣt/2]. (3.4) A továbbiakbanE(X) =µ, D2(X) =Σ. Ha Σ pozitív definit, akkor létezik egy nemszinguláris transzformáció, amely standardizáljaXvektortNp(0, I)-be. A momentumgeneráló függvényből láthatjuk, hogy minden harmadik momentumµ körül nulla. A negyedik momentum

E{(Xi−µi)(Xj−µj)(Xk−µk)(Xl−µl)}=σijσklikσjlilσjk, (3.5) ahol σij a kovarianciaXi és Xj között.

További tulajdonságok:

1. HaY = AX + b, A(r×p), b(r×1) konstans, akkor Y∼Nr(Aµ+ b,AΣAT).

2. HaX-et felosztjuk azX1(q×1),X2[(p−q)×1] vektorokra, a részeket µ és Σ szerint definiálva, akkor észrevehetjük, hogy X1 peremelosz-lása Nq111), X2 peremeloszlása pedig Nq222). Ebből követ-kezik, hogy X minden elemének egyváltozós normális eloszlása van.

Jegyezzük meg, hogy X elemeinek perem normalitása nem biztosítja az együttes normalitást. Ezt szemléltetve, ha példul p= 2,

f(x1, x2) = 1

2[ϕ1(x1, x2)] +ϕ2(x1, x2), (3.6) ahol ϕi standard kétváltozós normális sűrűségfüggvény, amelynek kor-relációs együtthatója ̺i, akkor minden peremnek egyváltozós normális eloszlása van, de f(x1, x2)nem kétváltozós normális sűrűségfüggvény.

3. AzX1,X2véletlen vektorok akkor és csak akkor függetlenek, ha a Σ1,2 kovariancia mátrix nulla.

4. Ha az Yi-k függetlenek, Npii) eloszlással i = 1,2 esetén, akkor X1+X2 eloszlása Np1212).

5. Az első definícióban szereplő(X−µ)TΣ−1(X−µ)kitevőnekχ2 elosz-lása van p szabadságfokkal.

3.1.3. Jellemzők

A többváltozós normális eloszlás bizonyos tulajdonságai az egyváltozós eset jellemzőinek analógiájára épülnek. Tekintsünk meg néhány fontosabb ered-ményt:

1. A többváltozós normális eloszlás azXmintaátlag és az Sszórásmátrix függetlenségével jellemzhető.

2. LegyenX1,X2függetlenp-dimenziós vektor. Az összegük többváltozós normális eloszlású akkor és csak akkor, ha mindkét vektor többváltozós normális eloszlású.

3. Ghurye és Olkin általánosította a Darmois-Skitovich tételt: Legyen X1, . . . ,Xn,n darab függetlenp-dimenziós véletlen vektor, és legyenek A1, . . . ,An,B1, . . . ,Bn p×pdimenziójú nemszinguláris mátrixok. Ha W1=

n

X

i=1

AiXi,W2 =

n

X

i=1

BiXi függetlenek, akkorXi normális elosz-lású. Vegyük észre, hogy ha Ai (vagy Bi) nulla, akkor Xi tetszőleges is lehet. Másrészt viszont, ha Ai szinguláris, akkor a hozzá tartozóXi vektor csak részben normális.

4. A legfontosabb tulajdonság, hogy X akkor és csak akkor többválto-zós normális eloszlású, ha az elemeinek bármely lineáris kombinációja egyváltozós normális eloszlású. Egyes szerzők ezt a tulajdonságot hasz-nálják fel a többváltozós normális eloszlás definiálásához.

3.2. A paraméterek becslése

Legyen X1,X2, . . . ,XN egy N méretű, Np(µ,Σ) eloszlásból vett véletlen minta, ahol N > p. Ekkor a µ és a Σ maximum likelihood becslése a következő:

AΣbecslésének korrigálásával könnyen megkapható azS=A/ntorzítatlan becslés, aholn=N−p.

A sűrűségfüggvény konstans tagja következmények nélkül elhagyható, így a likelihood függvény:

ahol az egyenlőség akkor és csak akkor teljesül, haµ=X, amelynél felhasz-náltuk azt tényt, hogy

X−µT

Σ−1 X−µ

= 0 (3.11)

akkor és csak akkor ha µ = X, ugyanis Σ−1 pozitív definit. Ebből az kö-vetkezik, hogy X a maximum likelihood becslése µ-nek, bármely Σ esetén.

Ezután már csak a

L X,Σ

függvényt kell maximalizálni (Σ-ra), vagy ami ezzel ekvivalens,

függvénynek egyetlen maximuma van, mégpedig az x = N helyen, azaz a maximumNlnN−N, amiből az következik, hogy

g(Σ)≤ 1 amelynél az egyenlőség akkor és csak akkor áll fenn, ha

λi =N,(i= 1, . . . , p). (3.17) Ez utóbbi feltétel ekvivalens az

A1/2Σ−1A1/2 =N Ip (3.18) egyenlőséggel, ezértΣ = (1/N)A. Összefoglalva,

L(µ,Σ)≤NpN/2e−pN/2|A|−N/2 (3.19) kifejezésben az egyenlőség akkor és csak akkor áll fenn, ha µ = X és Σ = (1/N)A. Ezzel az állítást igazoltuk.

Habár ezek a becslések könnyen meghatározhatók, valamint jól megállapított tulajdonságokkal rendelkeznek, döntéselméleti szempontból mégsem optimá-lisak, ugyanis nem megengedhetőek. A négyzetes veszteségfüggvény összegé-ből kiindulva

L(µ,µ,ˆ Σ) = (µ−µ)ˆ TΣ−1(µ−µ)ˆ , (3.20)

James és Stein [15] megmutatta, hogy a becslésnek

kisebb a várható vesztesége, mint az X-nek,p≥3,ezért X nem megenged-hető a p≥3esetben.

Sajátos becslési problémák merülnek fel, amikor a vizsgálandó többváltozós normális eloszlású adatok között hiányzó értékek is vannak. Nézzünk egy kétváltozós esetet, ahol legyen a hiányos minta (x1, x2, . . . , xn, xn+1, . . . , xN) és

(y1, y2, . . . , yn), a várható érték vektor (µ1, µ2), a közös szórásnégyzet σ2, valamint a korrelációs együttható ̺. A maximum likelihood becslés meg-kapható, ha a likelihood függvényt felírjuk az x likelihoodjának és az y, x melletti feltételes likelihood függvényének szorzataként. A becslést tehát a következő négy egyenlet megoldásai adják:

ˆ

A[−1,1] intervallumon pontosan egy gyöknek egyezik meg az előjele azS12 -ével, ami a harmadfokú egyenlet megoldása

f(ˆ̺) = n S1∗2−S12 ˆ

̺3−(N −n)S12̺ˆ2+ +

N S12+S22

−n S1∗2−S2∗2 ˆ

̺−(N+n)S12 = 0.

Ez a valós gyök az egyetlen maximum likelihood becslése (MLE)̺-nak.

3.3. Hipotézis vizsgálat, konfidencia intervallum

Az alábbi állításokat (tulajdonságokat) felhasználjuk a többváltozós normális eloszláshoz kapcsolodó statisztikák minta eloszlásainak származtatásához.

1. Legyen Z eloszlása Np(0,Σ), ekkor a ZTΣ−1Z kvadratikus alakja χ2p eloszlású.

2. HaA egy p×pdimenziójú pozitív definit mátrix és felírható a

m

X

α=1

ZαZTα (3.30)

alakban, ahol Z1, . . . ,Z(m) függetlenek és Np(0,Σ) eloszlásúak, akkor az A elemei Wishart eloszlásúak, m szabadságfokkal és Σ kovarianca mátrixal. Ennek a jelölésére az A ∼ Wp(m,Σ) kifejezést használják, ahol az index az A dimenzióját mutatja.

3. LegyenZ ∼Np(0,Σ)és A∼Wp(m,Σ), ahol Zés A független elosz-lásúak, akkor a

ZT(A/m)−1Z (3.31)

eloszlására azt mondjuk, hogy Hotelling-féle Tm2 eloszlású, m szabad-ságfokkal.

Az egyváltozós normális esetbeli mintaátlag és szórásnégyzet függet-lenségének analógiájára alapozva, az X és S itt is független eloszlású, ahol

X∼Np(µ,Σ/N) és S∼Wp(n,Σ/n). (3.32)

A Σ kovariancia mátrix ismeretében felhasználhatjuk az 1. tulajdonságot,

Ennek következményeként, hipotézisvizsgálatokat és konfidencia intervallu-mokat készíthetünkµ paraméterhez.

AH0 :µ=µ0 vizsgálatára az N X−µ0T

Σ−1 X−µ0

≥χ2p,α (3.34)

elfogadási tartományt használjuk, aholχ2p,αapszabadságfokúχ2eloszlás fel-ső1−αpontját jelöli. X-ből kiindulva, aµ(1−α)konfidencia intervalluma

N µ−XT

Σ−1 µ−X

≤χ2p,α, (3.35) ami egy Xközéppontú ellipszoid felülete és belseje.

A3. tulajdonságot felhasználva, következésképpen kapjuk, hogy N X−µT

S−1 X−µ

∼Tn2. (3.36)

Ennek eredményeként, ha Σ ismeretlen akkor is állíthatunk fel µ-re vonat-kozó próbákat a következő egyenlőtlenséget felhasználva

N X−µT

S−1 X−µ

≥Tn,α2 . (3.37)

Aµ-re vonatkozó (1−α)konfidencia intervallum pedig N µ−XT

leegyszerűsíti ezeket a számításokat, ugyanis azF-eloszlás percentilisei azon-nal elérhetők. A szóban forgó eredmények kiterjeszthetők két sokaság várható érték vektorát vizsgáló próbákra és konfidencia intervallumokra is.

Egyéb hipotézis vizsgálatok (pl.: diszkriminancia analízis, k várható érték vektorok egyenlőségének vizsgálata, MANOVA, kovariancia mátrixok egyen-lősége, kanonikus korreláció) különböző Wishart eloszlásokból származtatott karakterisztikus gyökök együttes eloszlásfüggvényén alapulnak.

3.4. Normalitás vizsgálat

Módszer annak vizsgálatára, hogy egy populáció normális eloszlású-e vagy sem. Meglehetősen sokféleképpen térhet el a vizsgált eloszlás a normálistól, és ezek meghatározására irányuló különböző eljárások egyesítése nem len-ne hatékony. Mivel nincs egyetlen átfogó, minden esetben jól alkalmazható módszer sem, így a megfelelő kiválasztása történhet a legvalószínűbbnek vélt eltérés alapján, vagy amelyikkel a leghasználhatóbb eredmények kaphatók.

A vizsgálat előtt érdemes az adatokat ábrázolni és a nagyon kiugró pontokat elhagyni, mert ezek miatt hamis eredményeket is kaphatunk a nem normali-tásra vonatkozólag.

Amikor egy tesztet sok változón kell végrehajtani, akkor előfordulhat, hogy a legjelentősebb nem normalitást okozó tényezők hatását elrejti a többi változó ún. "hígító" hatása. Ilyen esetben csak azokat kell kiválasztani, amelyek a vizsgálat tárgyát képezik.

Feltéve, hogy diszjunkt részhalmazokat választottunk, amelyek hozzávetőleg függetlenek, és nem okoz gondot a szignifikancia szint meghatározása a teljes tesztet átfogóan, a következő vizsgálatok közül választhatunk:

1. Perem normalitás vizsgálat.

2. Egydimenziós vizsgálat részleges vagy együttes normalitást illetően.

3. Többváltozós módszerek az együttes normalitás vizsgálatára.

Legyenx1,x2, . . . ,xn egyXvéletlen vektorból vettnhosszúságú megfigyelés sorozat, és legyen az X p darab komponense X1, X2, . . . , Xp. Legyen X és Sa mintabeli átlag és a szórásmátrix, valamint µ és Σ a megfelelő sokasági paraméterek. A nullhipotézis az, hogyX többváltozós normális.

Az xi Mahalanobis távolsága X-től a következőképp definiálható

ri2= (xi−X)TS−1(xi−X). (3.40) Az xi−X és xj−Xközti Mahalanobis szög

rij = (xi−X)TS−1(xj−X). (3.41) Askálázott reziduálisok

yi=S−1/2(xi−X). (3.42)

3.4.1. Perem normalitás vizsgálat

Emlékezzünk rá, hogy a határ normalitásból nem következik az együttes normalitás, fordítva viszont igen. A legegyszerűbb lehetőség az, ha megvizs-gáljuk a határeloszlások egyváltozós normalitását és megbecsüljük a teljes szignifikancia szintet.

Legyen v1 és v2 két p×1 dimenziójú vektor, melyek a ferdeség és a lapult-ság értékeit tartalmazzák. Johnson SU transzformációjának alkalmazásával, kapunk belőlük egy w1 és w2 vektort, melyek megközelítőleg standard nor-mális eloszlásúak. Jelöljew1 és w2 kovariancia mátrixait U1 és U2, melyek főátlóiban egyesek állnak. A nem főátlóbeli elemek aszimptotikusan ̺3ij és

̺4ij, ahol ̺ij a corr(Xi, Xj), mely a mintabeli korrelációk által lett becsül-ve. AQ1 =wT1U−11 w1 és Q2 = wT2U−12 w2 próbastatisztikák megközelítőleg függetlenek, és null-eloszlásúak, hozzávetőlegesenχ2p.

Mivel megmutatják, hogy egy önmagában álló határeloszlásban fellelhető-e a normálistól való eltérés, ezért az ilyen tesztek elvégzése mindig javasolt.

3.4.2. Egydimenziós vizsgálaton alapuló módszerek

Egy egyszerű, de jól alkalmazható módszer a többváltozós normalitás megha-tározására, az, hogy ábrázoljuk a rendezett Mahalanobis távolságokat a nekik megfelelő null eloszlások várható statisztikáinak függvényében. A p = 2 és a n ≥ 25 esetben ez az eloszlás a χ22-tel közelíthető. A p > 2 esetben a χ2p eloszlással való közelítás már nem alkalmas, ilyenkor a Beta-eloszlás statisz-tikáinak becslése sokkal célravezetőbb. Mivel az ri2 null eloszlása ismert, így egy mennyiségi teszt végezhető azáltal, hogy normál pontokká alakítjuk őket és egyváltozós normalitás vizsgálatot végzünk.

A módszerek egy másik fajtája az, hogy a többváltozós normális eloszlás jellemzőit a váltózok összes lineáris kombinációján végzett egyváltozós nor-malitástesztek alapján vizsgálják.

A harmadik módszer két dimenziós adathalmazokon végzendő, de itt a pró-bastatisztikát a változók egyenkénti lineáris kombinációjával kapott függvény maximuma adja.

3.4.3. Együttes normalitás vizsgálat

Egy lehetséges geometriai megközelítés, hogy az yi skálázott reziduálisokat polár koordinátákká alakítjuk, amivel kapunkpdarabr2i =yiTyikoordinátát, valamint

(p−1) független szöget. Az egyik szög egyenletes eloszlású lesz a [0,2π) intervallumon, így ez könnyen ábrázolható. p >2esetén a fennmaradó szögek eloszlásának sűrűsége

sinj−1ϑ (0≤ϑ≤π, j = 2, . . . , p−1). (3.43) Mardia statisztikái a ferdeség és a lapultság mérésére:

b1,p= 1 n2

n

X

i=1 n

X

j=1

rij3 és b2,p= 1 n

n

X

i=1

r4i. (3.44) Aszimptotikusan,

nb1,p

6 (3.45)

eloszlásaχ2,

p(p+ 1)(p+ 2)

6 (3.46)

szabadsági fokkal, és b2,p eloszlása pedig

N(p(p+ 2),8p(p+ 2)

n . (3.47)

Andrews és mások a Box-Cox-féle egyváltozós normalitásba transzformáló módszert kiterjesztették a többváltozós esetre is, amellyel egy likelihood há-nyados próba végezhető el a többváltozós normalitás megállapítására.

3.5. Példák

3.5.1. Kétváltozós normális eloszlás

AzXésYvalószínűségi változó kétváltozós normális eloszlású, ha az együttes sűrűségfüggvényük a következő:

f(x, y) =

= exp

"

− 1

2(1−̺2)

x−µ1 σ1

2

−2̺(x−µ1)(y−µ2) σ1σ2 +

y−µ2 σ2

2!#

2πσ1σ2p 1−̺2

ahol −∞< x <∞,−∞< y <∞, σ1>0,σ2 >0és −1< ̺ <1.

Az alábbi MAPLE program megrajzolja a sűrűségfüggvényt. Az ábrán két független standard normális valószínűségi változó együttessűrűségfüggvénye látható.

restart:

with(plots,display,textplot3d):

f:=(x,y,mu1,mu2,sigma1,sigma2,rho)->exp((-1/(2*(1-rho^2)))*

(((x-mu1)/sigma1)^2-2*rho*(x-mu1)*(y-mu2)/(sigma1*sigma2)+

((y-mu2)/sigma2)^2))/(2*Pi*sigma1*sigma2*sqrt(1-rho^2));

plot3d(f(x,y,0,0,1,1,0),x=-3..3,y=-3..3,axes=frame);

Az ábrán két független standard normális valószínűségi változó együttessű-rűségfüggvénye látható.

Az ellipszis alakú szintvonalak ábrázolása:

with(plots):contourplot(f(x,y,0.9,0,1,1,0.5),x=-4..4,y=-4..4, grid=[40,40]);

3.5.2. T

2

próba

Vizsgáljuk meg H0 :µ= (9,5)T hipotézist az alábbi adatokon:

X =

 6 9 10 6 8 3

.

Ebből megkapjuk, hogyX = (8,6)T és S =

4 −3

−3 9

. Tehát

S−1=

 1 3

1 1 9 9

4 27

és

A 2 és 1 szabadsági fok és 5%-os szignifikancia szint mellett még bőven bele-esik a megbízhatósági intervallumba, így elfogadhatjuk aH0 hipotézist.

3.5.3. Konfidencia intervallum meghatározása

A konfidencia intervallumot alapvetően aH0 hipotézis által elfogadott összes paramaméter érték határozza meg. Például egy egymintás, két oldalút-próba esetén

−t≤ x−µ s/√

n ≤t,

ahol taz eloszlás megfelelő értéke, µ pedig aH0 hipotézis feltevése.

Alkalmazzuk ugyanezt a gondolatmenetet aT2 próbára is: határozzuk meg azokat aµ= (µ1, µ2)T értékeket, melyekre igaz, hogyT2≤F. Térjünk vissza

Ahhoz, hogy beleessen a 90%-os konfidencia intervallumba, teljesülnie kell annak, hogy T2 ≤ 49,5. Mivel µ1 = 10, µ2 = 20, d1 = 8−10 = −2, d2 = 6−20 = −14. TehátT2 = 27,44<49,5,ezért belesik.

Továbbá, µ1 = 20, µ2 = 15, d1 = 8−20 = −12, d2 = 6−15 = −9. Tehát T2 = 63>49,5, azaz kívűlre esik.

4. fejezet

Feltételes várható érték, folyamatok

4.1. Bevezetés

4.1. Példa. Dobjunk fel egy dobókockát és az eredmény pontszám legyen Y. Továbbá, legyen az X = 1, ha az Y páros és X = 0, ha az Y páratlan.

Tudjuk, hogy E(Y) = 3.5. De mennyi az Y várható értéke, ha az eredmény páros, azaz X = 1. Az utóbbi információból következik, hogy az Y 2, 4, 6 lehet 1

3 valószínűséggel. Tehát az Y várható értéke az X = 1feltétel esetén E(Y|X = 1) = 2 + 4 + 6

3 = 4.

Hasonlóképpen

E(Y|X = 0) = 1 + 3 + 5 3 = 3.

Összefoglalva

E(Y|X) = 3 +X. (4.1)

4.2. Megjegyzés. Ebben a példában azY =y feltételes valószínűségeX =

xesetén

P(Y =y|X =x) =P(Y =y és X =x) P(X =x) =

=P({y} ∩ {2,4,6})

P({2,4,6}) = P({y}) P({2,4,6}) =

=1

3 hax= 1és y ∈ {2,4,6}

=P({y} ∩ {2,4,6})

P({2,4,6}) = P(∅) P({2,4,6}) =

=0 ha x= 1 és y6∈ {2,4,6}

=P({y} ∩ {1,3,5})

P({1,3,5}) = P({y}) P({1,3,5}) =

=1

3 hax= 0és y ∈ {1,3,5}

=P({y} ∩ {1,3,5})

P({1,3,5}) = P(∅) P({1,3,5}) =

=0 ha x= 0 és y6∈ {1,3,5}, így

6

X

y=1

yP(Y =y|X =x) = 3 +x.

Tehát abban az esetben, amikor azY és azX valószínűségi változó is diszkrét azE(Y|X)feltételes várható érték a következőképpen definiálható

E(Y|X) =X

y

yp(y|X), (4.2)

ahol p(y|x) =P(Y = y|X =x)amikor P(X =x)> 0.

4.3. Példa. Vezessük be a következő jelölést:

I(A) =

(1, ha x∈A, 0, ha x6∈A.

Legyen X ∼U(0,1).Ha X =x, akkor legyen Y ∼U(0, x),ekkor

amikor 0< y <1. Tehát az Y sűrűségfüggvénye fy(y) =

(−lny, ha y ∈(0,1), 0, ha y 6∈(0,1).

Ebből a várható érték

E(Y) =

De mennyi az Y várható értéke, ha X = x. Az utóbbi információ alapján mostY ∼(0, x).Tehát a várható érték

4.4. Megjegyzés. Ebben a példában a két valószínűségi változó folytonos, azaz léteznek a sűrűségfüggvények. Ekkor

E(Y|X =x) = Z+∞

−∞

yf(y|x)dy =g(x).

Tehát általánosítva

E(Y|X) = Z+∞

−∞

yf(y|X)dy=g(X). (4.3) A példák két alapvető tulajdonságát mutatják a feltételes várható érték-nek. Egyrészt,E(Y|X)az X függvénye, amely a következőképpen fordítha-tó le: LegyenY és X két olyan valószínűségi vátozó, amelyek ugyanazon az {Ω,F, P}valószínűségi mezőn értelmezettek, és legyen FX =σ(X),azaz az X által generáltσ-algebra. Ekkor

Z =E(Y|X) mérhetőFX-re nézve. (4.4) Másrészt,

E((Y −E(Y|X))I(X ∈B)) = 0 ∀B ∈ B(R) esetén. (4.5)

4.2. Feltételes várható érték

Legyen X valószínűségi vátozó az {Ω,F, P}valószínűségi mezőn, ekkor E(X) =

Z

XdP = Z

R

xdFX(x), ahol FX az eloszlásfüggvény.

4.5. Definíció. Jelölje PC aC feltétel melletti feltételes valószínűséget. Az Z

XdPC (4.6)

integrált, ha létezik az X C feltétel melletti feltételes várható értékének ne-vezzük.

Jele: E(X|C). azaz PC abszolút folytonosP-re nézve. Ez alapján

dPC

dP = I(A) P(C) az ún. Radon-Nikodym derivált.

Tulajdonságok: Ezután meghatározhatjuk a feltételes várható érték általános fogalmát.

4.8. Definíció. Adott azX valószínűségi változó az{Ω,F, P}valószínűségi mezőn, E(X) véges és A ⊂ F σ-algebra. Az Y valószínűségi változó az X valószínűségi változó Afeltétel melletti feltételes várható értéke, ha

1. Y mérhetőA-re nézve, azaz σ(Y)⊂ A,

2. bármely A∈ A esetén E(Y|A) =E(X|A),azaz Z

A

Y dP = Z

A

XdP.

4.9. TÉTEL. Ha A ⊂ F és azX valószínűségi változó, amelyreE(X)véges, akkor a P valószínűség szerint 1 valószínűséggel egyértelműen létezik az 1-2.

tulajdonságoknak eleget tevő Y valószínűségi változó.

Jelölés: Y =E(X|A) =E(X|A)(ω).

4.10. Megjegyzés. Ha Z valószínűségi változó, akkor σ(Z) ⊂ F. Tekint-hetjük aσ(Z)-re vonatkozó feltételes várható értéket, amelyet azE(X|σ(Z)) helyett rövidenE(X|Z)-vel jelölünk. Tehát

1. E(X|σ(Z)) mérhető σ(Z)-re nézve és 2. bármely A∈ A esetén

Z

A

E(X|σ(Z))dP = Z

A

XdP.

4.3. A feltételes várható érték tulajdonságai

4.11. TÉTEL. E(E(X|A) =E(X).

4.12. TÉTEL. Ha P(X ≤Y, akkor P(E(X|A))≤P(E(Y|A)).

4.13. TÉTEL. Ha E(|X|)< ∞ és E(|Y|)<∞ akkor

P(E(αX +βY|A) =αE(X|A) +βE(Y|A)) = 1.

4.14. TÉTEL. Legyen E(|X|)< ∞. Ha X F-mérhető, akkor P(E(X|A) =X) = 1.

4.15. TÉTEL. Legyen E(|X|)< ∞. Ha X F-mérhető, akkor P(E(X|{∅,Ω}) =E(X)) = 1.

4.16. TÉTEL. Legyen E(|X|)< ∞ és U =X −E(X|A), akkor P(E(U|A) = 0) = 1.

4.17. TÉTEL. (torony tulajdonság) Legyen E(|X|)<∞ és A0 ⊂ A1 ⊂ A σ-algebrák, akkor

P(E(E(X|A1)|A0) =E(X|A0)) = 1.

4.18. TÉTEL. (monoton konvergencia) Legyen azXn nem-negatív való-színűségi változók sorozata az{Ω,F, P} valószínűségi mezőn úgy, hogy

P(Xn ≤Xn+1) = 1 és

E(sup

n≥1

Xn)<∞, ekkor

P

n→∞lim E(Xn|A) =E( lim

n→∞Xn|A)

= 1.

4.19. TÉTEL. Legyen X A-mérhető, E(|X|)<∞ és E(|XY|)<∞, akkor P(E(XY|A) =XE(Y|A)) = 1.

4.20. TÉTEL. Legyen X és Y valószínűségi változók az {Ω,F, P} valószí-nűségi mezőn és E(|Y|) < ∞, ekkor létezik g Borel-mérhető függvény úgy, hogy

P (E(Y|X) =g(X)) = 1.

4.21. TÉTEL. LegyenX ésY független valószínűségi változók. HaE(|Y|)<

∞, akkor

P(E(Y|X) =E(Y)) = 1.

4.22. TÉTEL. Ha E(Y2)<∞, akkor ψ(X) =E(Y|X)esetén E((Y −ψ(X))2)

minimális.

4.23. Megjegyzés. Ez a tétel az alapja a regresszióanalízisnek.

4.24. Példa. Legyenek

X1, X2, . . . , Xn független, azonos eloszlású ésXi ∼U(0,1).Legyen

Y1, Y2, . . . , Yn a rendezett minta, ekkor

E(Y1|Yn = y) =y n, E(Yk|Yl =x) =k

lx, E(Yk) = k

n+ 1, E( Yk

Yk+1) = k k+ 1.

Bizonyítás.

E(Yk) =E(E(Yk|Yn)) = Z1

0

k

nxnxn−1dx= k n+ 1.

E( Yk

Yk+1|Yk+1=t) = 1

tE(Yk|Yk+1 =t) = 1 t

k

k+ 1t= k k+ 1.

4.4. Martingál

4.25. Definíció. Legyen az {Ω,F, P} valószínűségi mező. Az

A1 ⊂ A2 ⊂ · · · ⊂ F (4.8) σ-algebra sorozatotszűrésnek nevezzük.

4.26. Megjegyzés. An jelenti a "tudást" az n-edik időpontban. An tartal-mazza az összes olyanAeseményt azn-edik időpontban, amelyről eldönthe-tő, hogy bekövetkezett vagy nem. Han növekszik, akkor ezen Aesemények halmaza is bővül. Ha hosszabb ideig élsz bölcsebbé válsz!

4.27. Definíció. Az X1, X2, . . . valószínűségi változó sorozat adaptált az A1⊂ A2⊂. . . szűrésre nézve, ha Xn An-mérhető bármely n∈N esetén.

4.28. Megjegyzés. AzAn =σ(X1, X2, . . . , Xn)a legszűkebb szűrés, amely-re azX1, X2, . . . valószínűségi változó sorozat adaptált.

4.29. Definíció. Az X1, X2, . . . valószínűségi változó sorozat martingál az A1⊂ A2⊂. . . szűrésre nézve, ha bármely n∈N esetén

1. E(Xn) véges, azaz integrálható, 2. Xn An-mérhető, azaz σ(Xn)⊂ An, 3. P(E(Xn+1|An) =Xn) = 1.

Jelölés:(Xn,An).

4.30. Megjegyzés. A harmadikat szokás martingál tulajdonságnak nevez-ni.

4.31. Példa. Legyen az Y1, Y2, . . . független valószínűségi változó sorozat,

4.31. Példa. Legyen az Y1, Y2, . . . független valószínűségi változó sorozat,

In document Sztochasztikus modellezés (Pldal 101-0)