II. A VALÓSZÍNŰSÉG-SZÁMÍTÁS ALAPJAI
7. Nevezetes eloszlások
7.3. A Bernoulli-eloszlás
Mint a Bernoulli-kísérletsorozatban, a kísérletnek legyen két kimenetele, A és A. Az A esemény valószínűsége:P
A p, az Aesemény valószínűsége pedig: P(A)1 pq. Végezzük el a kísérletet n-szer, egymástól függetlenül. Legyen a valószínűségi változó az n számú kísérlet közül azok száma, amelyekben A következett be. Korábban már lát-tuk, hogy ilyenkor annak valószínűsége, hogy n kísérlet során az A esemény k-szor követ-kezik be:Ezt az eloszlást Bernoulli-eloszlásnak, vagy sokszor binomiális eloszlásnak nevez-zük, amely diszkrét eloszlás. Az alábbiakban az eloszlás tulajdonságait ismerjük meg rész-letesebben.
Mindenekelőtt be kell látnunk, hogy a (7.3.1) kifejezés valóban valószínűség eloszlás, azaz normált, ami azt jelenti, hogy az összes lehetséges értékre összegezve a valószínűség értékeket 1-et kapunk.
Normáltság
, 1.0 0
n k n kk n
k
p p q
k k n
n B
Bizonyítás
A bizonyítás során felhasználjuk a binomiális tételt, miszerint
n
0 k
k n k
n a b
k ) n
b a
( . (7.3.2.)
Ha most a (7.3.2) képletben végrehajtjuk az a=p és b=q helyettesítést, akkor azt kap-juk, hogy
1 ) p 1 p ( ) q p ( q k p
n k n k n n
n
0 k
,és éppen ezt akartuk belátni.
Az eloszlás alakja
Az alábbi ábra p=0,1 és n=100 esetén mutatja a Bernoulli-eloszlás alakját pálcikaábra formájában.
7.6. ábra: A Bernoulli-eloszlás alakja p=0,1 és n=100 esetén
A Bernoulli-eloszlás tehát diszkrét eloszlás, amelynek eloszlásfüggvényét a 7.7. ábra mu-tatja.
7.7. ábra: A Bernoulli-eloszlás eloszlásfüggvénye p=0,1 és n=100 esetén Rekurziós képlet
A rekurziós képlet alapján az eloszlás k-1. értékéből kiszámolható a k. értéke, tehát )
1 k , n ( pB 1
p k
1 k ) n k , n (
Bp p
. (7.3.3.)
Bizonyítás
Az egyszerűsítések után éppen a bizonyítandó (7.3.3) összefüggésre jutunk.
A Bernoulli-eloszlás várható értéke Tétel. A Bernoulli-eloszlás várható értéke
np ) (
M . (7.3.4.)
Bizonyítás. A várható érték kiszámítására két módszert is megmutatunk.
a. A várható érték definíciója alapján a Bernoulli-eloszlás várható értéke:
Mivel k=0 esetén az első tag maga is nulla, ezért az összegzés k=1-től indulhat, tehát
hogy az összegzésen belül most n 1 , k 1
Itt az utolsó lépésben alkalmaztuk a binomiális tételt, és azt, hogy (p+q)n-1=1.
b. A várható érték kiszámítható az indikátorváltozók segítségével is. Az n mérés során minden egyes méréshez rendeljünk hozzá egy ηi indikátorváltozót, ahol i=1, 2, ..., n. Tehát
Mivel a kísérleteket egymástól függetlenül végezzük, ezért az ηi változók független va-lószínűségi változók. Adott kísérletsorozatban az indikátorváltozók értékeinek összege éppen k–t ad, tehát az ηi változók összege éppen ξ, vagyis Számítsuk ki a várható értéket!
) Az indikátorváltozó várható értékét már korábban kiszámítottuk (7.1.2), vagyis
re Ezzel ismét a korábban kapott várható értékhez jutottunk.
A Bernoulli-eloszlás szórása
Tétel. A Bernoulli-eloszlás szórását az alábbi összefüggés adja:
npq )
(
D . (7.3.6.)
Bizonyítás. Természetesen most is választhatnánk a közvetlen bizonyítást, azaz a szórás-négyzet és a szórás definíciója alapján a szórás közvetlen kiszámítását. Ehelyett sokkal könnyebben célhoz érünk az indikátorváltozók segítségével. Ismét felhasználjuk, hogy ξ a fentiekben definiált n darab független valószínűségi változó összege. Szórásnégyzete tehát:
... D ( ) D ( ) ... D ( ) D
) (
D2 212 n 2 1 2 2 2 n . Az indikátorváltozó szórásnégyzetére vonatkozó (7.1.3) képlet szerint
re
tehát
A Bernoulli-eloszlás módusza
A Bernoulli-eloszlásnak két paramétere van: n és p. Adott eloszlás esetén n és p konkrét számértékek. Miközben k változik, a hozzárendelt valószínűség értékek kezdetben növek-szenek, majd csökkennek, ahogyan azt a 7.6. ábra esetén láthatjuk is. Kérdés, hogy milyen k értéknél lesz az eloszlásnak maximuma? Ameddig növekszenek a valószínűség értékek, addig igaz, hogy
)
Amikor csökkennek a valószínűség értékek, akkor
)
A csúcs közelében esetleg az egyenlőség is megengedett
)
A fenti három összefüggés úgy is írható, hogy
)
ami a (7.3.3) rekurziós formula szerint megegyezik azzal, hogy
p
Átrendezve az egyenlőtlenséget, azt kapjuk, hogy (n+1) p ⪋ 1.
A maximum keresésekor, tehát azt kell vizsgálnunk, hogy k növekedésével mikor vált a reláció kisebbről nagyobbra. Két eset lehetséges: a. (n+1)p nem egész szám, vagy pedig b.
(n+1)p egész szám.
Tekintsük először az a. esetet:
Miközben k növekszik, kezdetben az (n+1)p>k egyenlőtlenség teljesül. Eddig a Bp(n,k)>Bp(n,k-1) reláció teljesül. Ahogy k nő, van olyan értéke k-nak, amikor megfordul a reláció, azaz innentől kezdve a Bp(n,k)<Bp(n,k-1) reláció lesz az igaz. Ez a k érték, ahol ez a váltás bekövetkezik az (n+1)p egész részével lesz egyenlő, azaz
(n1)p
k. (7.3.7.)Ennél a k értéknél lesz az eloszlásnak a maximuma, vagyis ez a k az eloszlás módusza.
Tekintsük a b. esetet:
Ha történetesen az (n+1)p érték egész szám, akkor van olyan k érték, ahol az egyenlőség teljesül, vagyis
k
Itt maximuma lesz az eloszlásnak, viszont ekkor igaz az is, hogy
)
ami azt jelenti, hogy két maximális értéke is van az eloszlásnak a
k1=(n+1)p és k2=(n+1)p–1 (7.3.8.) értékeknél. Ilyenkor bimodálisnak nevezzük az eloszlást.
7.2. Példa. Zárthelyin a hallgatók tesztet oldanak meg. 5 tesztkérdésre kell válaszolni, minden kérdésre három lehetséges megoldást kínál a teszt, de ezek közül csak egy a he-lyes. Ha valaki egyáltalán nem készült, és a kérdésekre véletlenszerűen válaszol, úgy hogy a válaszok függetlenek egymástól, akkor mi annak a valószínűsége, hogy legalább három kérdésre helyes választ ad?
Egy kérdésre a helyes válasz valószínűsége: p=1/3. Legalább három kérdésre adott he-lyes válasz azt jelenti, hogy vagy három, vagy négy, vagy mind az öt kérdésre hehe-lyes a válasz. A Bernoulli-eloszlás szerint, annak valószínűsége, hogy öt közül pontosan három kérdésre lesz helyes a válasz:
...
Hasonló módon annak valószínűsége, hogy pontosan négy feladat megoldása lesz
Annak valószínűsége, hogy mind az öt megoldás helyes:
...
Tehát, hogy legalább három feladat megoldása helyes, ennek a három valószínűségnek az összege, azaz
Gyors ellenőrző feladatok
7.3. A 7.2. példa adatai alapján számítsuk ki annak valószínűségét, hogy véletlenszerű vá-laszadás esetén egyetlen feladat megoldása sem lesz helyes? (0,13168)
7.4. A 7.2. példában mi annak a valószínűsége, hogy legalább egy feladat megoldása he-lyes? (1-0,13168=0,86832)