Valószínűségszámítás B - 8. előadás

(1)

Valószínűségszámítás B - 8. előadás

2.8. A de Moivre–Laplace-tétel

Tekintsük a következő problémát. Dobjunk fel egy szabályos pénzérmétn-szer, és jelölje X a fejek számát. Ekkor X ∼B(n,¹₂), és tetszőleges 0≤k ≤n egész esetén

P(X =k) = n

k

· 1 2ⁿ.

Ez a valószínűség persze könnyen számolható, amíg n viszonylag kicsi. De már ebben az esetben is jóval fáradságosabb lehet a

(1) P(X ≤k) =

k

X

i=0

P(X =i) = 1 2ⁿ

k

X

i=0

n i

=

k

X

i=0

n!

2ⁿi!(n−i)!

valószínűség kiszámolása, hiszen itt egyk+ 1tagú összeget számolunk. Ráadásul han nagy, akkor az összegben szereplő binomiális együtthatók számolása sem egyszerű.

Ahelyett, hogy a fenti valószínűséget pontosan kiszámolnánk, egy jó közelítést fogunk adni rá. A számolásokat itt nem részletezzük, de vizuálisan jó képet kaphatunk arról, hogy mi is történik pontosan. Az (1) összegben k db valószínűséget adunk össze. Ezeket a valószínűségeket egy oszlopdiagramon ábrázolva látható, hogy ez tulajdonképpen k darab téglalap területének az összegeként is felfogható, ahol a téglalapok oldalainak hossza 1 ill.

P(X =i). A következő ábra szemlélteti azn = 10, k= 6 esetet.

(2)

Hogy analitikusan jobban kezelhető legyen ez az összeg, először is a X értékkészletét

"szimmetrizáljuk", azaz eltoljuk balra ⁿ₂-vel. Az X − ⁿ₂ változó már a 0-ra szimmetrikus [−ⁿ₂;ⁿ₂]intervallumban veszi fel az értékeit. Vegyük észre, hogy valójában a várható értékkel toltunk el, hiszen E(X) = ⁿ₂, tehát voltaképp úgy transzformáltuk a változónkat, hogy a transzformált várható értéke0 legyen, hiszen

(2) E(X−E(X)) =E(X)−E(E(X)) = 0.

Emellett szükség lesz még egy normalizálásra is: a fenti különbséget leosztjuk azXszórásával, azaz D(X) = ¹₂√

n-nel. A szórás tulajdonságai alapján

(3) D

X−E(X) D(X)

=D X

D(X)

= 1

D(X)D(X) = 1, azaz az ^X⁻^E^(X⁾

D(X) egy olyan transzformáltja X-nek, melynek várható értéke 0 és szórása 1.

Persze itt X eloszlását nem használtuk ki, azaz (2) és (3) igaz egy tetszőleges valószínűségi változóra, amelynek véges a várható értéke, ill. véges és pozitív a szórása (a pozitivitás is szükséges, hiszen osztunk vele).

Definíció. Legyen X egy olyan valószínűségi változó, melyre E(X)és D(X) véges, továbbá D(X)>0. Ekkor az

X−E(X) D(X) változót az X sztenderdizáltjának nevezzük.

Térjünk most vissza a n, ¹₂ paraméterű binomiális eloszláshoz, és fejezzük ki a P(X ≤k) valószínűséget a sztenderdizált segítségével:

(4) P(X ≤k) = P

X−ⁿ₂

1 2

√n ≤ k− ⁿ₂

1 2

√n

.

A sztenderdizált az értékeit már a[−√ n;√

n]intervallumon veszi fel, és a szomszédos értékek között2/√

n a különbség. Éppen ezért, ha fenti valószínűséget egy oszlopdiagramon szereplő téglalapok területének összegével szeretnénk kifejezni, akkor - mivel a téglalapok szélessége 2/√

n-szerese az X esetében adódó 1 szélességnek - a terület (azaz a valószínűség) akkor marad változatlan, ha a téglalapok magasságát√

n/2-vel szorozzuk.

Ennek a transzformációnak az eredménye látható az alábbi ábrán azn = 100értékre. Ha most a téglalapok helyett csak azok magasságát ábrázoljuk a grafikonon, akkor megfigyelhető, hogy az így kapott pontok jól illeszkednek egy speciális görbére, nevezetesen a

φ(t) := 1

√2πe⁻^t

2 2

függvény gráfjára, és így a téglalapok területe valójában a φ integrálját közelíti. Egészen pontosan az igaz, hogy ha n tart a végtelenbe, akkor egy fix t ∈ R-re a P ^X−_D_(X^E^(X)₎ ≤ t) valószínűség tart a

Φ(t) :=

Z t

−∞

φ(s)ds

integrálhoz. Azaz a (4) valószínűséget nagy n esetén jól tudjuk közelíteni egy integrállal.

(3)

A fenti φ és Φ jelöléseket a továbbiakban rögzítjük. A φ grafikonját szokás Gauss- görbének, ill. az alakja miatt haranggörbének is nevezni. Az integrálfüggvényére azért is vezetjük be a Φ(t) jelölést, mert φ-nek nincs elemi függvényekkel kifejezhető primitív függvénye, ezért a Newton–Leibniz-formula nem alkalmazható a kiszámítására, elemi függ- vényeket tartalmazó zárt formulával nem tudjuk megadni Φ(t) értékét. Természetesen ettől függetlenül léteznek módszerek a Φ(t) integrál értékének numerikus közelítésére.

Habár a fentiekben mi egy speciális binomiális eloszlású változóval dolgoztunk, valójában ugyanilyen eredmények adódnak egy tetszőlegesX ∼B(n;p)változó esetén, ahol p∈(0; 1).

Természetesen ekkorE(X) = np, tehát ezzel kell eltolniX-et, továbbá aD(X) =p

np(1−p) értékkel kell osztanunk a sztenderdizálásnál. Továbbá, bár a (4) valószínűségben csak egy felső korlátot szabtunk a változónak, amely az integrálás felső határát adja, de ugyanígy

(4)

visgálhatunk egy alsó korlátot is, ez természetesen a közelítésnél az integrálás alsó határa lesz. Minden adott ahhoz, hogy kimondjuk a következő tételt.

Tétel (de Moivre–Laplace). Legyen Xn ∼B(n;p) egy binomiális eloszlású valószínűségi vál- tozó, ahol p∈(0; 1) rögzített szám. Ekkor

n→∞lim P

a < Xn−E(Xn) D(X_n) < b

= lim

n→∞P a < Xn−np pnp(1−p) < b

!

= Z b

a

φ(s)ds= Φ(b)−Φ(a),

ahol a, b ∈ R. Továbbá a b = ∞ és a = −∞ értékékek is megengedhetők, ekkor a fenti egyenlőség jobb oldalán a limb→∞Φ(b) = 1 ill. a lima→−∞Φ(a) = 0 értékek szerepelnek a megfelelő tag helyett.

A tétel precíz bizonyítása természetesen jóval túlmutat e kurzus keretein. Már itt meg- jegyezzük, hogy a fenti állítás speciális esete egy lényegesen általánosabb tételnek, a cent- rális határeloszlás tételének. Ez a tétel az egyik fő oka, hogy a fent definiált φ függvény, ill. az általa megadott (és alább részletesen tárgyalt) eloszlás központi szerepet játszik a valószínűségszámításban és alkalmazásaiban.

2.9. Normális eloszlás

A de Moivre–Laplace-tételben rejve szerepel egy állítás, amely önmagában is figyelemre méltó, és rögtön elvezet ennek a szakasznak a témájához. Ha a tételben szereplő (a;b) intervallum felső határát b =∞-nek választjuk, akkor a lim_n→∞Φ(b) = 1 értéket írjuk Φ(b) helyett a jobb oldalon. Az iménti határérték kiszámítása nem teljesen triviális, ezt a számolást itt nem is fogjuk elvégezni. A jelentése viszont annál fontosabb, hiszen a Φ függvény a φ integráljaként áll elő, így tehát azt kapjuk, hogy

1 = lim

b→∞Φ(b) = lim

b→∞

Z b

−∞

φ(s)ds= Z ∞

−∞

φ(s)ds = Z ∞

−∞

√1 2πe⁻^s

2 2 ds.

Tehát, mivelφ(t)>0is teljesül mindent-re, aφfüggvény valójában egy valószínűségi változó sűrűségfüggvénye:

Definíció. AzX folytonos valószínűségi változótsztenderd normális eloszlásúnak nevezzük, ha sűrűségfüggvénye φ(t). Ennek jelölése: X ∼N(0; 1).

A sűrűségfüggvény definíciójából rögtön adódik, hogyΦ(t) egy sztenderd normális elosz- lású valószínűségi változó eloszlásfüggvénye. Így tehát a de Moivre–Laplace-tétel állítása úgy is fogalmazható, hogy ha X_n ∼B(n;p), és Y ∼N(0; 1), akkor

n→∞lim P a < Xn−np pnp(1−p) < b

!

= Φ(b)−Φ(a) =P(a < Y < b).

Bár a sztenderd normális eloszlás kitüntetett szereppel bír köztük, a normális eloszlások valójában egy eloszláscsaládot alkotnak. A fenti állítás csak egy ok azok közül, amik miatt érdemes velük részletesen megismerkedni. Túlzás nélkül állítható, hogy a valószínűségszámítás legfontosabb eloszlásai közé sorolhatók, így ebben a fejezetben részletesen leírjuk őket. Kezd- jük a sztenderd normális eloszlás jellemzőivel.

(5)

Állítás. Legyen X ∼N(0; 1), ekkor E(X) = 0 és D²(X) = 1.

Bizonyítás. A várható érték definíciója szerint E(X) =

Z ∞

−∞

tφ(t)dt= Z ∞

−∞

√1

2πte⁻^t

2

2 dt = 1

√2π h

−e⁻^t

2 2

i^∞

−∞= 0.

A szórásnégyzet meghatározásához először számoljuk kiX² várható értékét a transzformált várható értékére vonatkozó állítás segítségével:

E(X²) = Z ∞

−∞

t²φ(t)dt= Z ∞

−∞

√1

2πt²e⁻^t

2 2 dt =

Z ∞

−∞

√1

2πt· ∂

∂t

−e⁻^t²² dt

=

− 1

√2πte⁻^t

2 2

^∞

−∞

+ Z ∞

−∞

√1 2πe⁻^t

2

2 dt= 0 + Z ∞

−∞

φ(t)dt= 1,

hiszenφ azX sűrűségfüggvénye. Így tehát D²(X) = E(X²)−E(X)² = 1−0 = 1. □ A következőkben a sztenderd normális eloszlású valószínűségi változók lineáris transzfor- máltjának eloszlását fogjuk vizsgálni. Ehhez a következő, valójában jóval általánosabb állítást fogjuk használni.

Lemma. Legyen X egy folytonos valószínűségi változó, melynek sűrűségfüggvénye f_X(t).

Legyenek továbbá σ, µ ∈ R, σ > 0, ekkor az Y = σX + µ transzformált is folytonos valószínűségi változó, melynek sűrűségfüggvénye

fY(t) = 1 σfX

t−µ σ

.

Bizonyítás. Az eloszlásfüggvény definíciója szerint

F_Y(t) = P(Y < t) = P(σX+µ < t) = P

X < t−µ σ

minden t ∈ R esetén, ahol felhasználtuk, hogy σ >0, és így az osztásnál az egyenlőtlenség iránya nem változik. MivelfX azX sűrűségfüggvénye, így

P

X < t−µ σ

= Z ^t−µ_σ

−∞

fX(s)ds.

Most az integrálban azs= ^u−µ_σ helyettesítést végezzük, és ígydshelyett _σ¹du-t írunk, továbbá has= ^t−µ_σ , akkor u=σs+µ=t, így tehát az integrálás felső határa t lesz. Azaz

F_Y(t) = Z t

−∞

1 σf_X

u−µ σ

du,

ezért a folytonos valószínűségi változó és a sűrűségfüggvény definíciója alapján adódik az

állítás. □

A lemma alapján azonnal adódik, hogy ha X ∼ N(0; 1), és σ, µ ∈ R, σ > 0, akkor az Y =σX +µ valószínűségi változó folytonos, és a sűrűségfüggvénye

(5) f_Y(t) = 1

σφ

t−µ σ

= 1

√

2πσ²e⁻

(t−µ)2 2σ2 .

(6)

Definíció. Egy Y folytonos valószínűségi változónormális eloszlású µ és σ² >0 paraméte- rekkel, ha sűrűségfüggvénye az (5) jobb oldalán álló függvény. Ennek jele Y ∼N(µ;σ²).

A sztenderd normális eloszlás jelölésénél a µés σ² helyére 0és 1került, vagyis a várható érték és a szórásnégyzet. Ennek alapján sejthető, hogy ez általában is így van, és ez jelen helyzetben már nagyon könnyedén igazolható. Legyen ugyanis Y ∼ N(µ;σ²). Vegyünk továbbá egyXsztenderd normális eloszlású valószínűségi változót, ekkorσX+µésY eloszlása a fentiek szerint megegyezik (itt σ a σ² pozitív gyöke), ezért persze a várható értékük és a szórásnégyzetük is ugyanaz:

(6) E(Y) = E(σX +µ) = σE(X) +µ= 0 +µ=µ

a várható érték linearitása ill. a sztenderd normális eloszlás várható értéke miatt, továbbá (7) D²(Y) =D(σX +µ) =D²(σX) =σ²D²(X) =σ²

a szórásnégyzet tulajdonásgai ill. a sztenderd normális eloszlás szórásnégyzete miatt. Azaz:

a normális eloszlás paraméterei a várható érték és a szórásnégyzet.

Láttuk, hogy a sztenderd normális eloszlás transzformáltjaként előáll bármely normális eloszlás. A konstrukció azonban fordítva is működik, bármely normális eloszlásból előál- lítható a sztenderd normális. Legyen ugyanis Y ∼ N(µ;σ²), és tekintsük az X = ^Y^−µ_σ sztenderdizáltat. Ekkor perszeE(X) = 0ésD²(X) = 1 automatikusan teljesül. Amit be kell még látni, hogy X is normális eloszlású, ami azonban a fenti lemma alapján adódik, hiszen X sűrűségfüggvénye

σf_Y(σt+µ) = σ 1

σφ

(σt+µ)−µ σ

=φ(t).

Innen már nagyon egyszerűen látszik, hogy ha Y ∼ N(µ;σ²), továbbá ρ, ν ∈ R, ρ > 0, akkorρY+νis normális eloszlású. Legyen ugyanisXazY sztenderdizáltja, ekkorY =σX+µ teljesül, így ρY +ν = ρ(σX+µ) +ν =ρσX +ρµ+ν. Mivel X ∼ N(0; 1), így az eddigiek alapján adódik a következő

Állítás. Legyen Y ∼N(µ;σ²), továbbá ρ, ν ∈R, ρ >0. Ekkor ρY +ν∼N(ρµ+ν;ρ²σ²).

Az állítás lényegesebb része, hogy aρY+νtranszformált is normális eloszlású, amennyiben Y az. A paraméterek (ha valaki nem szeretné fejben tartani) egyszerűen adódnak a várható érték linearitásából és a szórásnégyzet tulajdonságaiból, ahogy azt a (6)-ban és (7)-ben is láttuk.

A normális eloszlás eloszlásfüggvénye

Az előző szakaszban már említettük, hogy aΦfüggvény, azaz a sztenderd normális eloszlás eloszlásfüggvénye nem fejezhető ki zárt alakban elemi függvények segítségével. Értékei így számoló- ill. számítógép vagy táblázat segítségével határozhatók meg. Mivel ez a függvény a páros φ sűrűségfüggvény integrálja, így kielégíti a következő egyenletet. (Egy f : R → R függvényt párosnak nevezünk, ha f(−t) = f(t) teljesül minden t∈R-re.)

Állítás. Minden t ∈R esetén Φ(−t) = 1−Φ(t).

(7)

Bizonyítás. Ha t∈R, akkor Φ(−t) =

Z −t

−∞

φ(s)ds = Z ∞

−∞

φ(s)ds− Z ∞

−t

φ(s)ds

= 1− Z −∞

t

−φ(−u)du= 1− Z t

−∞

φ(u)du= 1−Φ(t),

ami éppen az állítás. □

Megjegyzés.A fenti számolás mutatja, hogy az előző formula érvényes minden páros sűrűség- függvénnyel rendelkező eloszlás eloszlásfüggvényére, hiszen csak azt használtuk ki a fenti számolásban, hogyφ-nek a valós egyenesen vett integrálja 1, ill. hogyφ(−t) =φ(t).

A fenti állítást gyakran alkamaznunk kell, ha táblázatból keressük ki a Φértékeit, hiszen éppen ennek az egyenletnek köszönhetően a táblázatban elegendő megadni a függvény pozitív helyen felvett értékeit. AΦfüggvény értékeire nem csak a sztenderd normális eloszlás esetén van szükség, ugyanis segítségével kifejezhető tetszőleges normális eloszlás eloszlásfüggvénye:

Állítás. Legyen Y ∼N(µ;σ²), ekkor az Y eloszlásfüggvénye F_Y(t) = Φ ^t−µ_σ .

Bizonyítás. JelöljeX az Y sztenderdizáltját, ekkor Y =σX+µ(ahol σ aσ² pozitív gyöke).

Az eloszlásfüggvény definíciója alapján

F_Y(t) = P(Y < t) = P(σX+µ < t) = P

X < t−µ σ

= Φ

t−µ σ

,

mertΦ azX eloszlásfüggvénye. □

A normális eloszlás alkalmazásai

Az alkalmazásokban tipikusan akkor találkozunk a normális eloszlással, amikor nagyszámú, független, de egymagában elhanyagolható méretű hatás eredményeként létrejövő valószínűségi változó eloszlását modellezzük. Ilyen lehet egy fizikai mérés eredménye, pl. egy terület át- laghőmérséklete egy adott hónapban. A normális eloszlás alkalmazhatónak elméleti hátterét valamelyest megvilágítja majd a későbbiekben tárgyalt centrális határeloszlás tétele.

Példa. Egy tartályból a gyártási folyamat végeztével mintát veszünk. Tegyük fel, hogy a minta hőmérséklete Celsius-fokban mérveN(−2; 1,69) eloszlású. Mi a valószínűsége, hogy a minta hőmérséklete nagyobb, mint0^◦?

Jelölje a minta hőmérsékletétY, ekkor aP(Y >0)mennyiséget keressük. A komplementer eseményre áttérve, azY folytonosságát és az előző állítást is felhasználva

P(Y >0) = 1−P(Y <0) = 1−Φ

0−(−2) 1,3

= 1−Φ 2

1,3

≈0,0618.