Valószínűségszámítás B - 6. előadás
2.4. Abszolút folytonos valószínűségi változók
Tekintsük a következő, az előző szakaszból már ismert valószínűségi változót: válasszunk egy pontot véletlenszerűen a síkon az origó középpontú egység sugarú körlapon, és legyen Z a választott pont távolsága az origótól. A Z eloszlásfüggvénye segítségével kifejezhetők bizonyos események valószínűségei. Először is emlékeztetünk, hogy
(1) FZ(t) =P(Z < t) =
0, ha t≤0, t2, ha 0< t≤1,
1, ha t >1.
Az előző szakaszban láttuk, hogy ennek segítségével felírhatók más események valószínűségei is, például ha s, t ∈ R, s < t, akkor P(s ≤ Z < t) = FZ(t) −FZ(s). Továbbá, mivel P(Z =s) = 0 mindens∈R esetén, valamint
{s≤Z < t}={Z =s} ∪ {s < Z < t}
egy diszjunkt felbontás (azaz a jobb oldalon egymást kizáró események uniója áll), így P(s < Z < t) =P(s≤Z < t)−P(Z =s) = P(s ≤Z < t) =FZ(t)−FZ(s)
is érvényes, tehát ebben az esetben mindegy, hogy az intervallum végpontját a fenti esemény- ben számításba vesszük vagy sem. Hasonló érveléssel adódik ugyanez a másik végpontra, tehát az [s;t], [s;t), (s;t] és (s;t) intervallumokba ugyanolyan eséllyel esik a Z változó.
Ez érvényes minden olyan valószínűségi változóra, ami az adott intervallum végpontjainak értékét0valószínűséggel veszi fel. Látni fogjuk, hogy az alább definiált ún. abszolút folytonos valószínűségi változóknál ez így lesz.
HabárP(Z =t) = 0érvényes mindent∈R esetén, mégis van arról információnk, hogyZ milyen eséllyel leszközel t-hez, például annak egy kisε >0sugarú környezetében. A fentiek szerint ugyanis
P(t−ε < Z < t+ε) =FZ(t+ε)−FZ(t−ε).
Ez az érték persze kisε-ra kicsi lesz, hiszen FZ folytonossága miatt a fenti különbség mind- két tagja FZ(t)-hez, így különbségük 0-hoz tart, ahogy ε tart 0-hoz. Ez megfelel annak a várakozásunknak, hogy aP(t−ε < Z < t+ε)valószínűség P(Z =t) = 0-hoz tartson, ahogy at körüli intervallum hossza 0-hoz tart.
A fenti valószínűség azonban már sokkal informatívabb, ha az intervallum hosszát is fi- gyelembe vesszük, pontosabban, ha a valószínűség és az intervallum hosszának arányát tekint- jük, azaz a
P(t−ε < Z < t+ε)
2ε = FZ(t+ε)−FZ(t−ε) 2ε
kifejezést. Ha ε→ 0, akkor ennek határértékét - amennyiben létezik - tekinthetjük egyfajta súlynak, ami meghatározza, hogy milyen valószínűséggel esik Z a t közelébe. Hamarosan látni fogjuk, hogy ez valóban egy jó kép.
A határérték meghatározásához figyeljük meg, hogy FZ(t+ε)−FZ(t−ε)
2ε = FZ(t+ε)−FZ(t) +FZ(t)−FZ(t−ε) 2ε
= 1
2 ·FZ(t+ε)−FZ(t) (t+ε)−t + 1
2· FZ(t−ε)−FZ(t) (t−ε)−t ,
ez pedig éppen az FZ eloszlásfüggvény t-beli deriváltjához tart, ha ε tart 0-hoz - legalábbis amennyiben a derivált létezik. Az FZ(t)-re adott (1) formula alapján könnyen látható, hogy FZ deriválható minden t ̸= 0,1 esetén, hiszen itt vagy egy konstanssal vagy egy polinom- függvénnyel egyezik. Az is könnyen látható, hogy a0 pontban a jobb és baloldali deriváltak léteznek, és mindkettő 0-val egyenlő, így a derivált létezik az t = 0 pontban is. Nem ez a helyzet viszont at = 1 pontban, hiszen, habár a bal és jobb oldali deriváltak léteznek, azok nem egyeznek meg:
t→1−0lim
FZ(t)−FZ(1)
t−1 = lim
t→1−0
t2−1
t−1 = lim
t→1−0t+ 1 = 2, de
t→1+0lim
FZ(t)−FZ(1)
t−1 = lim
t→1+0
1−1 t−1 = 0.
Definiáljuk azfZ(t)függvényt a következőképp: legyenfZ(t) = FZ′(t), hat ̸= 1, és legyen fZ(1) = 0. Tehát
(2) fZ(t) =
2t, ha 0< t <1 0 különben.
Ezt a függvényt a későbbi definíciók alapján a Z sűrűségfüggvényének fogjuk hívni. A Newton–Leibniz-formula szerint ekkor
(3) P(s < Z < t) =FZ(t)−FZ(s) = Z t
s
fZ(y)dy
érvényes minden olyan s, t ∈ R, s < t számpárra, ahol az FZ függvény deriválható az (s;t) intervallumon és folytonos az [s;t] zárt intervallumon, vagyis ez igaz minden s < t ≤ 1 és 1≤ s < t esetén. Azonban ha s < 1< t, akkor kettébonthatjuk az (s;t) interevallumot, és tagonként alkalmazva a Newton–Leibniz-formulát láthatjuk, hogy (3) ekkor is teljesül:
Z t s
fZ(y)dy= Z 1
s
fZ(y)dy+ Z t
1
fZ(y)dy
=FZ(1)−FY(s) +FZ(t)−FZ(1) =FZ(t)−FZ(s).
Ebből valóban látszik, amit már korábban említettünk: hafZ folytonos t-ben, ésε >0kicsi, akkor
P(t−ε < Z < t+ε) = FZ(t+ε)−FZ(t−ε) = Z t+ε
t−ε
fZ(y)dy≈2ε·fZ(t),
vagyisfZ(t)-re valóban tekinthetünk egyfajta súlyként, ami leírja, hogy milyen valószínűséggel esik a Z a t egy kis környezetébe.
Mielőtt rátérnénk az abszolút folytonosság áltlános definíciójára, még egy formulát iga- zolunk aZ változóra. AzfZ sűrűségfüggvényt azFZ eloszlásfüggvényből deriválással kaptuk, a Newton–Leibniz-formula pedig ennek a folyamatnak a megfordítását adja. Ha most az (3) formulában s-sel tartunk a mínusz végtelenhez, akkor FZ(s) 0-hoz tart (pontosabban már minden s ≤ 0 esetén 0), így az integrálás segítségével ténylegesen visszakapjuk az eloszlás- függvény értékét a sűrűségfüggvényből:
FZ(t) = Z t
−∞
fZ(y)dy.
Ez az a formula, aminek segítségével az abszolút folytonos valószínűségi változókatdefiniáljuk: Definíció. Az X valószínűségi változót abszolút folytonosnak nevezzük, ha létezik olyan fX : R → [0;∞) nemnegatív függény, amelyre az R∞
−∞fX(y)dy Riemann-integrál létezik, és mindent∈R esetén
FX(t) = Z t
−∞
fX(y)dy,
ahol FX az X eloszlásfüggvénye. Ekkor az fX függvényt az X változó sűrűségfüggvényének nevezzük.
Megjegyzés. Ezen a kurzuson a későbbiekben az abszolút folytonos változókra gyakran csak folytonos valószínűségi változókként hivatkozunk, és az abszolút jelzőt elhagyjuk. Az iro- dalomban azonban folytonos valószínűségi változó alatt olyan változót értenek, amelyeknek az eloszlásfüggvénye folytonos. Mivel az abszolút folytonos valószínűségi változók eloszlásfügg- vénye egy sűrűségfüggvény integrálfüggvényeként áll elő, így folytonos. Tehát az abszolút folytonos valószínűségi változók a fenti értelemben folytonosak, azonban általában ez fordítva nem igaz. Mivel mi kizárólag abszolút folytonos változókkal foglalkozunk, a két elnevezést szinonimaként használjuk.
Vegyük észre, hogy a fenti definícióban lévő fX sűrűségfüggvény nem egyértelmű. Ha például véges sok ponton megváltoztatjuk az értékét, akkor ez a változtatás azfX integrálját nem változtatja meg, így a fenti definiáló tulajdonság továbbra is érvényben marad, tehát az így kapott függvény szintén sűrűrségfüggvény lesz.
A fentiek szerint azZváltozó (abszolút) folytonos (ehhez persze még ellenőrizni kell, hogy fZ integrálható a teljes valós egyenesen, de mivelt /∈(0; 1)eseténfZ(t) = 0, ez nyilvánvalóan teljesül). AZ változó példáján illusztrált módszer általában is alkalmazható a folytonosság igazolására:
Tétel. Legyen X olyan valószínűségi változó, amelynek FX eloszlásfüggvénye folytonos és véges sok pont kivételével mindenhol deriválható. Ekkor az X valószínűségi változó abszolút folytonos, és az
fX(t) =
FX′ (t), ahol a derivált létezik,
0 különben
függvény sűrűségfüggvénye X-nek.
AZ változóra alkalmazott gondolatmenet kis módosításokkal tulajdonképpen a fenti tétel bizonyítását az általános esetben is megadja, de ezt itt nem részletezzük. Viszont néhány további, a konkrét példával kapcsolatban látott állítást kimondunk az általános esetben is.
Állítás. LegyenX egy folytonos valószínűségi változó, amelynek sűrűségfüggvényefX. Ekkor tetszőleges s, t∈R, s < t esetén
P(s≤X < t) = Z t
s
fX(y)dy.
Bizonyítás. Az előző szakaszban láttuk, hogy
P(s≤X < t) = FX(t)−FX(s).
Mivel X folytonos valószínűségi változó, így az eloszlásfüggvényének értékei felírhatók a sűrűségfüggvény segítségével:
FX(t)−FX(s) = Z t
−∞
fX(y)dy− Z s
−∞
fX(y)dy = Z t
s
fY(y)dy,
ahol felhasználtuk az integrál határokra vonatkozó additivitását. □ Megjegyezzük, hogy általában is igaz minden X folytonos valószínűségi változóra, hogy tetszőlegest∈R eseténP(X =t) = 0, és így a fenti állításban szereplő eseményben mindkét egyenlőtlenségnél elhagyhatjuk vagy megengedhetjük az egyenlőséget, tehát
P(s < X < t) =P(s≤X < t) = P(s < X ≤t) = P(s≤X ≤t), és ezeket a fenti integrál segítségével írhatjuk fel.
Ahhoz hasonlóan, ahogy az eloszlásfüggvények esetén történt, a sűrűségfüggvényeket is karakterizálhatjuk:
Tétel. Egy f : R → [0;∞) nemnegatív függvény pontosan akkor sűrűségfüggvénye egy X folytonos valószínűségi változónak, ha Riemann-integrálható a valós egyenesen, és
Z ∞
−∞
f(y)dy= 1.
Az világos, hogy haf egyX változó sűrűségfüggvénye, akkor a fenti egyenletnek teljesülie kell, hiszen
Z ∞
−∞
f(y)dy= lim
t→∞
Z t
−∞
f(y)dy = lim
t→∞FX(t) = 1
az eloszlásfüggvény tulajdonságai alapján. A tétel másik irányát nem bizonyítjuk.
Várható érték a folytonos esetben. A diszkrét valószínűségi változók esetén a várható érték a változó által felvett értékek valószínűségekkel súlyozott összege volt. A folytonos eset- ben ilyen összeg nem írható fel (már csak azért sem, mert túl sok a lehetséges felvett érték), viszont - bár a P(X = t) valószínűségek mind nullák, és így súlyként nem használhatók - a sűrűségfüggvény értékei éppen ezt a szerepet töltik most be. Súlyozott összeg helyett, ezek egyfajta infinitezimális határeseteként, integrálást alkalmazunk:
Definíció. Legyen X folytonos valószínűségi változó, aminek sűrűségfüggvénye fX. Ekkor X várható értéke
E(X) = Z ∞
−∞
tfX(t)dt,
amennyiben a fenti integrál abszolút konvergens, azaz az Z ∞
−∞
|t|fX(t)dt
integrál véges.
Megjegyezzük, hogy ha egy improprius integrál abszolút konvergens, akkor konvergens is, így a definícióban szereplő feltétel teljesülésekor a várható érték is véges.
Példa. Számoljuk ki a Z valószínűségi változó várható értékét. Az fZ sűrűségfüggvény értékét a (2) fomula adja meg. Ebből látszik, hogy a(0; 1)intervallumon kívül ez a függvény0, így a várható érték kiszámításánál valójában csak ezen a véges intervallumon kell integrálnunk (és így persze abszolút konvergens lesz az integrál). A fenti definícióba behelyettesítve, majd a Newton–Leibniz-formulát alkalmazva:
E(Z) = Z ∞
−∞
tfZ(t)dt= Z 1
0
2t2dt = 2t3
3 1
0
= 2 3.
Ahogy a diszkrét esetben, a várható érték linearitása a folytonos esetben is érvényes.
Azaz, amennyiben X és Y folytonos valószínűségi változók, és az E(X) és E(Y) várható értékek léteznek, akkor
E(X+Y) = E(X) +E(Y), E(cX) =c·E(X)
is teljesül, ahol c∈R egy valós konstans. Az fenti egyenlőségek úgy értendők, hogy ameny- nyiben az X ill. Y várható értéke létezik, akkor az egyenlőségek mindkét oldala létezik, és azok megegyeznek. Megjegyezzük, hogy a várható érték tetszőleges - azaz nem csak diszkrét vagy folytonos - esetben is definiálható (lásd pl. a 4.3. szakaszt ebben a jegyzetben), és a linearitás általában is érvényes, ha az X és Y várható értéke létezik. Ezt tehát akár olyan esetekben is alkalmazhatjuk, mikor az egyik változó folytonos, a másik pedig diszkrét (persze ez nem túl gyakori szituáció).
Eloszlások megadása. Általában egy X valószínűségi változó eloszlását az eloszlásfügg- vényével adhatjuk meg. Láttuk, hogy az X értékének egy adott intervallumba esésének valószínűsége ennek segítségével könnyen felírható, valójában pedig igaz az is, hogy bármely
"hasonlóképp felírt" esemény valószínűsége kiszámolható az eloszlásfüggvény értékeiből. Azaz:
ha ismerjük az eloszlásfüggvényt, akkor ismerjük az eloszlást. Míg a diszkrét valószínűségi változók esetén a P(X =t) valószínűségek megadása az eloszlásfüggvény megadásával ekvi- valens, a folytonos esetben ez nincs így. Folytonos valószínűségi változók esetén az eloszlás
megadása (az eloszlásfüggvény felírásán kívül) történhet a sűrűségfüggvény megadásával is, hiszen egyrészt abból az eloszlásfüggvény integrálás segítségével adódik, másrészt a különböző események valószínűségei - szintén integrálás segítségével - a sűrűségfüggvényből közvetlenül megkaphatók. Ez utóbbira láttunk is példát korábban, amikor aP(s < X < t)valószínűséget adtuk meg ilyen módon, azfX sűrűségfüggvényt az(s;t)intervallumon integrálva. Valójában ez a módszer szintén működik más, "hasonlóképp felírt" eseményekre is, de ezzel itt részlete- sen nem foglalkozunk.
Egyenletes eloszlás. AzX valószínűségi változótegyenletes eloszlásúnak nevezzük az(a;b) intervallumon, ha sűrűségfüggvénye
fX(t) =
1
b−a, hat ∈(a;b),
0 különben.
Ennek jelölése: X ∼U(a;b).
Megjegyezzük, hogy az előző szakaszban látottY valószínűségi változó egyenletes eloszlású a (0; 1) intervallumon. Kiszámojuk az egyenletes eloszláshoz tartozó eloszlásfüggvényt. Ha X ∼U(a;b), akkor
FX(t) = Z t
−∞
fX(y)dy.
Ez nyilván0, hat≤a, hiszen aza-tól balra az fX függvény értéke0. Ha viszontt > b, akkor valójában a és b között integrálunk, hiszen b-től jobbra fX ismét 0. Az (a;b) intervallumon integrálva a konstans1/(b−a)függvényt az eredmény 1lesz. Végezetül, ha t∈(a;b], akkor
FX(t) = Z t
a
1
b−ady = t−a b−a. Összefoglalva:
FX(t) =
0, ha t≤a, t−a
b−a, ha a≤t < b, 1, ha t > b.
Végül számoljuk ki egyX egyenletes eloszlású változó várható értékét:
E(X) = Z ∞
−∞
tfX(t)dt = Z b
a
t
b−adt=
t2 2(b−a)
b a
= b2−a2
2(b−a) = (b−a)(b+a)
2(a−b) = a+b 2 .