Valószínűségszámítás B - 8. előadás
2.8. A de Moivre–Laplace-tétel
Tekintsük a következő problémát. Dobjunk fel egy szabályos pénzérmétn-szer, és jelölje X a fejek számát. Ekkor X ∼B(n,12), és tetszőleges 0≤k ≤n egész esetén
P(X =k) = n
k
· 1 2n.
Ez a valószínűség persze könnyen számolható, amíg n viszonylag kicsi. De már ebben az esetben is jóval fáradságosabb lehet a
(1) P(X ≤k) =
k
X
i=0
P(X =i) = 1 2n
k
X
i=0
n i
=
k
X
i=0
n!
2ni!(n−i)!
valószínűség kiszámolása, hiszen itt egyk+ 1tagú összeget számolunk. Ráadásul han nagy, akkor az összegben szereplő binomiális együtthatók számolása sem egyszerű.
Ahelyett, hogy a fenti valószínűséget pontosan kiszámolnánk, egy jó közelítést fogunk adni rá. A számolásokat itt nem részletezzük, de vizuálisan jó képet kaphatunk arról, hogy mi is történik pontosan. Az (1) összegben k db valószínűséget adunk össze. Ezeket a valószínűségeket egy oszlopdiagramon ábrázolva látható, hogy ez tulajdonképpen k darab téglalap területének az összegeként is felfogható, ahol a téglalapok oldalainak hossza 1 ill.
P(X =i). A következő ábra szemlélteti azn = 10, k= 6 esetet.
Hogy analitikusan jobban kezelhető legyen ez az összeg, először is a X értékkészletét
"szimmetrizáljuk", azaz eltoljuk balra n2-vel. Az X − n2 változó már a 0-ra szimmetrikus [−n2;n2]intervallumban veszi fel az értékeit. Vegyük észre, hogy valójában a várható értékkel toltunk el, hiszen E(X) = n2, tehát voltaképp úgy transzformáltuk a változónkat, hogy a transzformált várható értéke0 legyen, hiszen
(2) E(X−E(X)) =E(X)−E(E(X)) = 0.
Emellett szükség lesz még egy normalizálásra is: a fenti különbséget leosztjuk azXszórásával, azaz D(X) = 12√
n-nel. A szórás tulajdonságai alapján
(3) D
X−E(X) D(X)
=D X
D(X)
= 1
D(X)D(X) = 1, azaz az X−E(X)
D(X) egy olyan transzformáltja X-nek, melynek várható értéke 0 és szórása 1.
Persze itt X eloszlását nem használtuk ki, azaz (2) és (3) igaz egy tetszőleges valószínűségi változóra, amelynek véges a várható értéke, ill. véges és pozitív a szórása (a pozitivitás is szükséges, hiszen osztunk vele).
Definíció. Legyen X egy olyan valószínűségi változó, melyre E(X)és D(X) véges, továbbá D(X)>0. Ekkor az
X−E(X) D(X) változót az X sztenderdizáltjának nevezzük.
Térjünk most vissza a n, 12 paraméterű binomiális eloszláshoz, és fejezzük ki a P(X ≤k) valószínűséget a sztenderdizált segítségével:
(4) P(X ≤k) = P
X−n2
1 2
√n ≤ k− n2
1 2
√n
.
A sztenderdizált az értékeit már a[−√ n;√
n]intervallumon veszi fel, és a szomszédos értékek között2/√
n a különbség. Éppen ezért, ha fenti valószínűséget egy oszlopdiagramon szereplő téglalapok területének összegével szeretnénk kifejezni, akkor - mivel a téglalapok szélessége 2/√
n-szerese az X esetében adódó 1 szélességnek - a terület (azaz a valószínűség) akkor marad változatlan, ha a téglalapok magasságát√
n/2-vel szorozzuk.
Ennek a transzformációnak az eredménye látható az alábbi ábrán azn = 100értékre. Ha most a téglalapok helyett csak azok magasságát ábrázoljuk a grafikonon, akkor megfigyelhető, hogy az így kapott pontok jól illeszkednek egy speciális görbére, nevezetesen a
φ(t) := 1
√2πe−t
2 2
függvény gráfjára, és így a téglalapok területe valójában a φ integrálját közelíti. Egészen pontosan az igaz, hogy ha n tart a végtelenbe, akkor egy fix t ∈ R-re a P X−D(XE(X)) ≤ t) valószínűség tart a
Φ(t) :=
Z t
−∞
φ(s)ds
integrálhoz. Azaz a (4) valószínűséget nagy n esetén jól tudjuk közelíteni egy integrállal.
A fenti φ és Φ jelöléseket a továbbiakban rögzítjük. A φ grafikonját szokás Gauss- görbének, ill. az alakja miatt haranggörbének is nevezni. Az integrálfüggvényére azért is vezetjük be a Φ(t) jelölést, mert φ-nek nincs elemi függvényekkel kifejezhető primitív függvénye, ezért a Newton–Leibniz-formula nem alkalmazható a kiszámítására, elemi függ- vényeket tartalmazó zárt formulával nem tudjuk megadni Φ(t) értékét. Természetesen ettől függetlenül léteznek módszerek a Φ(t) integrál értékének numerikus közelítésére.
Habár a fentiekben mi egy speciális binomiális eloszlású változóval dolgoztunk, valójában ugyanilyen eredmények adódnak egy tetszőlegesX ∼B(n;p)változó esetén, ahol p∈(0; 1).
Természetesen ekkorE(X) = np, tehát ezzel kell eltolniX-et, továbbá aD(X) =p
np(1−p) értékkel kell osztanunk a sztenderdizálásnál. Továbbá, bár a (4) valószínűségben csak egy felső korlátot szabtunk a változónak, amely az integrálás felső határát adja, de ugyanígy
visgálhatunk egy alsó korlátot is, ez természetesen a közelítésnél az integrálás alsó határa lesz. Minden adott ahhoz, hogy kimondjuk a következő tételt.
Tétel (de Moivre–Laplace). Legyen Xn ∼B(n;p) egy binomiális eloszlású valószínűségi vál- tozó, ahol p∈(0; 1) rögzített szám. Ekkor
n→∞lim P
a < Xn−E(Xn) D(Xn) < b
= lim
n→∞P a < Xn−np pnp(1−p) < b
!
= Z b
a
φ(s)ds= Φ(b)−Φ(a),
ahol a, b ∈ R. Továbbá a b = ∞ és a = −∞ értékékek is megengedhetők, ekkor a fenti egyenlőség jobb oldalán a limb→∞Φ(b) = 1 ill. a lima→−∞Φ(a) = 0 értékek szerepelnek a megfelelő tag helyett.
A tétel precíz bizonyítása természetesen jóval túlmutat e kurzus keretein. Már itt meg- jegyezzük, hogy a fenti állítás speciális esete egy lényegesen általánosabb tételnek, a cent- rális határeloszlás tételének. Ez a tétel az egyik fő oka, hogy a fent definiált φ függvény, ill. az általa megadott (és alább részletesen tárgyalt) eloszlás központi szerepet játszik a valószínűségszámításban és alkalmazásaiban.
2.9. Normális eloszlás
A de Moivre–Laplace-tételben rejve szerepel egy állítás, amely önmagában is figyelemre méltó, és rögtön elvezet ennek a szakasznak a témájához. Ha a tételben szereplő (a;b) intervallum felső határát b =∞-nek választjuk, akkor a limn→∞Φ(b) = 1 értéket írjuk Φ(b) helyett a jobb oldalon. Az iménti határérték kiszámítása nem teljesen triviális, ezt a számolást itt nem is fogjuk elvégezni. A jelentése viszont annál fontosabb, hiszen a Φ függvény a φ integráljaként áll elő, így tehát azt kapjuk, hogy
1 = lim
b→∞Φ(b) = lim
b→∞
Z b
−∞
φ(s)ds= Z ∞
−∞
φ(s)ds = Z ∞
−∞
√1 2πe−s
2 2 ds.
Tehát, mivelφ(t)>0is teljesül mindent-re, aφfüggvény valójában egy valószínűségi változó sűrűségfüggvénye:
Definíció. AzX folytonos valószínűségi változótsztenderd normális eloszlásúnak nevezzük, ha sűrűségfüggvénye φ(t). Ennek jelölése: X ∼N(0; 1).
A sűrűségfüggvény definíciójából rögtön adódik, hogyΦ(t) egy sztenderd normális elosz- lású valószínűségi változó eloszlásfüggvénye. Így tehát a de Moivre–Laplace-tétel állítása úgy is fogalmazható, hogy ha Xn ∼B(n;p), és Y ∼N(0; 1), akkor
n→∞lim P a < Xn−np pnp(1−p) < b
!
= Φ(b)−Φ(a) =P(a < Y < b).
Bár a sztenderd normális eloszlás kitüntetett szereppel bír köztük, a normális eloszlások valójában egy eloszláscsaládot alkotnak. A fenti állítás csak egy ok azok közül, amik miatt érdemes velük részletesen megismerkedni. Túlzás nélkül állítható, hogy a valószínűségszámítás legfontosabb eloszlásai közé sorolhatók, így ebben a fejezetben részletesen leírjuk őket. Kezd- jük a sztenderd normális eloszlás jellemzőivel.
Állítás. Legyen X ∼N(0; 1), ekkor E(X) = 0 és D2(X) = 1.
Bizonyítás. A várható érték definíciója szerint E(X) =
Z ∞
−∞
tφ(t)dt= Z ∞
−∞
√1
2πte−t
2
2 dt = 1
√2π h
−e−t
2 2
i∞
−∞= 0.
A szórásnégyzet meghatározásához először számoljuk kiX2 várható értékét a transzformált várható értékére vonatkozó állítás segítségével:
E(X2) = Z ∞
−∞
t2φ(t)dt= Z ∞
−∞
√1
2πt2e−t
2 2 dt =
Z ∞
−∞
√1
2πt· ∂
∂t
−e−t22 dt
=
− 1
√2πte−t
2 2
∞
−∞
+ Z ∞
−∞
√1 2πe−t
2
2 dt= 0 + Z ∞
−∞
φ(t)dt= 1,
hiszenφ azX sűrűségfüggvénye. Így tehát D2(X) = E(X2)−E(X)2 = 1−0 = 1. □ A következőkben a sztenderd normális eloszlású valószínűségi változók lineáris transzfor- máltjának eloszlását fogjuk vizsgálni. Ehhez a következő, valójában jóval általánosabb állítást fogjuk használni.
Lemma. Legyen X egy folytonos valószínűségi változó, melynek sűrűségfüggvénye fX(t).
Legyenek továbbá σ, µ ∈ R, σ > 0, ekkor az Y = σX + µ transzformált is folytonos valószínűségi változó, melynek sűrűségfüggvénye
fY(t) = 1 σfX
t−µ σ
.
Bizonyítás. Az eloszlásfüggvény definíciója szerint
FY(t) = P(Y < t) = P(σX+µ < t) = P
X < t−µ σ
minden t ∈ R esetén, ahol felhasználtuk, hogy σ >0, és így az osztásnál az egyenlőtlenség iránya nem változik. MivelfX azX sűrűségfüggvénye, így
P
X < t−µ σ
= Z t−µσ
−∞
fX(s)ds.
Most az integrálban azs= u−µσ helyettesítést végezzük, és ígydshelyett σ1du-t írunk, továbbá has= t−µσ , akkor u=σs+µ=t, így tehát az integrálás felső határa t lesz. Azaz
FY(t) = Z t
−∞
1 σfX
u−µ σ
du,
ezért a folytonos valószínűségi változó és a sűrűségfüggvény definíciója alapján adódik az
állítás. □
A lemma alapján azonnal adódik, hogy ha X ∼ N(0; 1), és σ, µ ∈ R, σ > 0, akkor az Y =σX +µ valószínűségi változó folytonos, és a sűrűségfüggvénye
(5) fY(t) = 1
σφ
t−µ σ
= 1
√
2πσ2e−
(t−µ)2 2σ2 .
Definíció. Egy Y folytonos valószínűségi változónormális eloszlású µ és σ2 >0 paraméte- rekkel, ha sűrűségfüggvénye az (5) jobb oldalán álló függvény. Ennek jele Y ∼N(µ;σ2).
A sztenderd normális eloszlás jelölésénél a µés σ2 helyére 0és 1került, vagyis a várható érték és a szórásnégyzet. Ennek alapján sejthető, hogy ez általában is így van, és ez jelen helyzetben már nagyon könnyedén igazolható. Legyen ugyanis Y ∼ N(µ;σ2). Vegyünk továbbá egyXsztenderd normális eloszlású valószínűségi változót, ekkorσX+µésY eloszlása a fentiek szerint megegyezik (itt σ a σ2 pozitív gyöke), ezért persze a várható értékük és a szórásnégyzetük is ugyanaz:
(6) E(Y) = E(σX +µ) = σE(X) +µ= 0 +µ=µ
a várható érték linearitása ill. a sztenderd normális eloszlás várható értéke miatt, továbbá (7) D2(Y) =D(σX +µ) =D2(σX) =σ2D2(X) =σ2
a szórásnégyzet tulajdonásgai ill. a sztenderd normális eloszlás szórásnégyzete miatt. Azaz:
a normális eloszlás paraméterei a várható érték és a szórásnégyzet.
Láttuk, hogy a sztenderd normális eloszlás transzformáltjaként előáll bármely normális eloszlás. A konstrukció azonban fordítva is működik, bármely normális eloszlásból előál- lítható a sztenderd normális. Legyen ugyanis Y ∼ N(µ;σ2), és tekintsük az X = Y−µσ sztenderdizáltat. Ekkor perszeE(X) = 0ésD2(X) = 1 automatikusan teljesül. Amit be kell még látni, hogy X is normális eloszlású, ami azonban a fenti lemma alapján adódik, hiszen X sűrűségfüggvénye
σfY(σt+µ) = σ 1
σφ
(σt+µ)−µ σ
=φ(t).
Innen már nagyon egyszerűen látszik, hogy ha Y ∼ N(µ;σ2), továbbá ρ, ν ∈ R, ρ > 0, akkorρY+νis normális eloszlású. Legyen ugyanisXazY sztenderdizáltja, ekkorY =σX+µ teljesül, így ρY +ν = ρ(σX+µ) +ν =ρσX +ρµ+ν. Mivel X ∼ N(0; 1), így az eddigiek alapján adódik a következő
Állítás. Legyen Y ∼N(µ;σ2), továbbá ρ, ν ∈R, ρ >0. Ekkor ρY +ν∼N(ρµ+ν;ρ2σ2).
Az állítás lényegesebb része, hogy aρY+νtranszformált is normális eloszlású, amennyiben Y az. A paraméterek (ha valaki nem szeretné fejben tartani) egyszerűen adódnak a várható érték linearitásából és a szórásnégyzet tulajdonságaiból, ahogy azt a (6)-ban és (7)-ben is láttuk.
A normális eloszlás eloszlásfüggvénye
Az előző szakaszban már említettük, hogy aΦfüggvény, azaz a sztenderd normális eloszlás eloszlásfüggvénye nem fejezhető ki zárt alakban elemi függvények segítségével. Értékei így számoló- ill. számítógép vagy táblázat segítségével határozhatók meg. Mivel ez a függvény a páros φ sűrűségfüggvény integrálja, így kielégíti a következő egyenletet. (Egy f : R → R függvényt párosnak nevezünk, ha f(−t) = f(t) teljesül minden t∈R-re.)
Állítás. Minden t ∈R esetén Φ(−t) = 1−Φ(t).
Bizonyítás. Ha t∈R, akkor Φ(−t) =
Z −t
−∞
φ(s)ds = Z ∞
−∞
φ(s)ds− Z ∞
−t
φ(s)ds
= 1− Z −∞
t
−φ(−u)du= 1− Z t
−∞
φ(u)du= 1−Φ(t),
ami éppen az állítás. □
Megjegyzés.A fenti számolás mutatja, hogy az előző formula érvényes minden páros sűrűség- függvénnyel rendelkező eloszlás eloszlásfüggvényére, hiszen csak azt használtuk ki a fenti számolásban, hogyφ-nek a valós egyenesen vett integrálja 1, ill. hogyφ(−t) =φ(t).
A fenti állítást gyakran alkamaznunk kell, ha táblázatból keressük ki a Φértékeit, hiszen éppen ennek az egyenletnek köszönhetően a táblázatban elegendő megadni a függvény pozitív helyen felvett értékeit. AΦfüggvény értékeire nem csak a sztenderd normális eloszlás esetén van szükség, ugyanis segítségével kifejezhető tetszőleges normális eloszlás eloszlásfüggvénye:
Állítás. Legyen Y ∼N(µ;σ2), ekkor az Y eloszlásfüggvénye FY(t) = Φ t−µσ .
Bizonyítás. JelöljeX az Y sztenderdizáltját, ekkor Y =σX+µ(ahol σ aσ2 pozitív gyöke).
Az eloszlásfüggvény definíciója alapján
FY(t) = P(Y < t) = P(σX+µ < t) = P
X < t−µ σ
= Φ
t−µ σ
,
mertΦ azX eloszlásfüggvénye. □
A normális eloszlás alkalmazásai
Az alkalmazásokban tipikusan akkor találkozunk a normális eloszlással, amikor nagyszámú, független, de egymagában elhanyagolható méretű hatás eredményeként létrejövő valószínűségi változó eloszlását modellezzük. Ilyen lehet egy fizikai mérés eredménye, pl. egy terület át- laghőmérséklete egy adott hónapban. A normális eloszlás alkalmazhatónak elméleti hátterét valamelyest megvilágítja majd a későbbiekben tárgyalt centrális határeloszlás tétele.
Példa. Egy tartályból a gyártási folyamat végeztével mintát veszünk. Tegyük fel, hogy a minta hőmérséklete Celsius-fokban mérveN(−2; 1,69) eloszlású. Mi a valószínűsége, hogy a minta hőmérséklete nagyobb, mint0◦?
Jelölje a minta hőmérsékletétY, ekkor aP(Y >0)mennyiséget keressük. A komplementer eseményre áttérve, azY folytonosságát és az előző állítást is felhasználva
P(Y >0) = 1−P(Y <0) = 1−Φ
0−(−2) 1,3
= 1−Φ 2
1,3
≈0,0618.