• Nem Talált Eredményt

középértékek, ingadozás, várható érték, szórás

Kísérletsorozatok eredményeinek összefoglalása gyakori feladat. Gondoljunk csak arra, hogy mennyi adat keletkezik a legkülönbözőbb kísérletek során nap-mint nap és hogy ezek lényegének rögzítése nélkül teljesen áttekinthetetlenek lennének az eredmények. Tekintsük például a nap mint nap látott, hallott időjárás-jelentést!

Ez az adott időszakra várt (gyakran éppen véletlen szimulációval vizsgált) kimenetelek összefoglalása. Szerepel benne a legalacsonyabb, illetve legmagasabb hőmérséklet-érték, gyakran az átlagos csapadékmennyiség és szélsebesség is. Tehát egyszerre az ingadozás egy lehetséges mérőszáma és a középértékek is szerepelnek benne. Kezdjük a vizsgálatainkat a középértékekkel.

1. 4.1 Középértékek

A mért adatok legfontosabb középértékei az átlag (számtani közép) és a medián (a nagyság szerint sorbarendezett értékek közül a középső. Páros sok megfigyelés esetén ez nem egyértelmű, ilyenkor a két középső érték átlagával szokták definiálni.)

Érdemes megjegyezni, hogy bár az átlag sok eloszlás esetén optimális statisztikai tulajdonságú, ha kiugró értékek is vannak az adataink között, megbízhatatlan mérőszámmá is válhat. Ezt úgy mondjuk, hogy az átlag érzékeny a kiugró értékekre. A mediánt viszont nem befolyásolják ezek az értékek, ezért ajánlható az alkalmazása, ha számítani lehet (esetleg kevésbé megbízható) kiugró értékekre.

Mind a két középérték rendelkezik optimum-tulajdonsággal: az átlag a minimumhelye a szélsőérték-feladatnak, a medián pedig a szélsőérték-feladatnak.

Ennek illusztrálását interaktív animáció formájában a http://hpz400.cs.elte.hu:3838/ZA_median_a/ és a http://hpz400.cs.elte.hu:3838/ZA_median_b/ weblapon találhatjuk. Egy-egy screenshot a 4.1 és 4.2 ábra.

További ábrák pedig a függelékben találhatóak: 11.6, 11.7 és 11.8. Jól látható, hogy mennyire eltérő az optimumok értéke az egyes eloszlásokra. A http://hpz400.cs.elte.hu:3838/ZA_median/ animáció pedig egy ábrában mutatja a kétfajta veszteségfüggvényt és a két optimumot.

4.1. ábra

-4.1. ábra

A medián optimumtulajdonsága az ábra baloldalán látható eloszlásra és mintanagyságra

érték, szórás

4.2. ábra

-4.2. ábra

Az átlag optimumtulajdonsága az ábra baloldalán látható eloszlásra és mintanagyságra

Ha nem adatok, hanem az eloszlás alapján szeretnénk mondani valamit a jövőbeniértékek középértékéről, akkor célszerű bevezetni az átlag elméleti megfelelőjét, az úgynevezett várhatóértéket . Ez a most vizsgált esetekben egyszerűen a lehetséges értékeknek a hozzájuk tartozó valószínűséggel vett súlyozott összegeként kapható meg:

azaz az átlag úgy is felfogható, mint a tapasztalati eloszlás – ez minden megfigyeléshez valószínűséget rendel – várható értéke. A medián elméleti értéke pedig definiálható úgy, mint

A nevezetes eloszlások várható értékét gyakorlatilag minden tankönyv levezeti, ezért itt csak hivatkozunk ezekre az eredményekre:

Az paraméterű binomiális eloszlás várható értéke . A paraméterű Poisson eloszlás várható értéke .

A paraméterű geometriai eloszlás várható értéke .

4.3. ábra

-érték, szórás

4.3. ábra

Az átlag és a medián összehasonlítása az ábra baloldalán látható eloszlásra és szimulációszámra, 11.25 kód

Néhány folytonos eloszlásból származó minta átlagát és mediánját hasonlíthatjuk össze a http://hpz400.cs.elte.hu:3838/ZA_mean/ lapon található interaktív szimuláció segítségével. Itt kiválaszthatjuk az eloszlást (normális, exponenciális vagy 2 paraméterű Pareto) és megadhatjuk a szimuláció-számot. (Az eloszlások definícióját az 5. részben adjuk meg.) A 4.3 ábra egy screenshot a szimulációból. A folytonos eloszlások várható értékét az 5.2 fejezetben fogjuk definiálni.

Gyakran használható a várható érték azon fontos tulajdonsága, hogy esetén (ha

léteznek a valószínűségi változók várható értékei) .

4.1 Feladat

Egy betegség a fiataloknál -os, a középkorúaknál -os, míg az időseknél -os valószínűséggel lép fel. A lakosság -a fiatal és -a középkorú. Ezer véletlenszerűen kiválasztott személy közül mennyi lesz a betegek számának várható értéke?

Megoldás. A 3.4 feladatban láttuk, hogy egy véletlenszerűen kiválasztott személy valószínűséggel beteg. A betegek száma , ahol annak az eseménynek az indikátora, hogy az -edik személy beteg (azaz ekkor 1, egyébként pedig 0). Az előzőekben látott additivitás miatt

és mivel , így a végeredmény .

4.2 Feladat

Egy sorsjátékon darab Ft-os, db Ft-os, és db Ft-os

nyeremény van. A játékhoz db sorsjegyet adtak ki. Mennyi a sorsjegy ára, ha egy sorsjegyre a nyeremény várható értéke megegyezik a sorsjegy árával?

Megoldás. Most is az additivitást használhatjuk. Az összes sorsjegyen kiosztott össznyeremény millió Ft.

Feltételezhetjük, hogy minden sorsjegy ugyanakkora eséllyel nyer, tehát az egy szelvényre eső várható nyeremény Ft.

4.3 Feladat

érték, szórás

Tegyük fel, hogy egy dobozban van kártyalap, melyek közül kettőn -es, kettőn -es szám van és így tovább. Válasszunk ki véletlenszerűen lapot. Várhatóan hány pár marad a dobozban?

pelda

Ez a feladat még Bernoullitól származik, eredetileg párból haláleset után megmaradó házasságok számát modellezte ezen a módon. Megoldás. Most is az additivitást használhatjuk. Legyen annak az eseménynek az indikátora, hogy az -edik pár bent maradt a dobozban (azaz ekkor , egyébként pedig ).

Tehát a keresett várható érték

4.4. ábra

-érték, szórás

4.4. ábra

A megmaradó párok számának várható értéke különböző és -re (a 4.3 feladathoz, 11.20 kód)

4.4 Feladat

Várhatóan hányszor kell dobni egy szabályos kockával, hogy minden számot legalább egyszer megkapjunk?

pelda Megoldás. Most is használhatjuk az összegrebontást, de egy kevésbé triviális módon. Most azt célszerű észrevennünk, hogy az új számok dobása egyre nehezebbé válik, ahogy már egyre több számot dobtunk. Tehát

(a szükséges dobások száma) különböző eloszlású tagokra bontható:

ahol az a dobásszám ami ahhoz kell, hogy szám után az -edik is kijöjjön. , hiszen elsőre bármit dobhatunk. Ezután annak felel meg, hogy mennyit kell várni egy 5/6 valószínűségű eseményre, tehát

érték, szórás

geometriai eloszlású, . Ugyanígy , mert ekkor már rossz

szám van. A végeredmény tehát

4.5. ábra

-4.5. ábra

Ahhoz szükséges kísérletek számának várható értéke, hogy egyformán valószínű kimenetelek mindegyike legalább egyszer kijöjjön, a lehetséges kimenetelek számának függvényében (a 4.4 feladathoz, 11.21 kód)

4.5 Feladat

Tegyük fel, hogy egy dobozban van fehér és piros golyó. Visszatevés nélkül húzunk addig, míg az első fehér golyót meg nem kapjuk. Várhatóan hány húzásra van ehhez szükség?

pelda Megoldás. Jelölje a kérdéses mennyiséget. Ezt úgy kaphatjuk meg, hogy az első fehér előtt kihúzott piros golyók számához hozzáadunk 1-et. Feltehetjük, hogy ezek meg vannak sorszámozva -től -ig.

érték, szórás

Tekintsük ezeknek az indikátorait: pontosan akkor, ha az sorszámú pirosat az első fehér előtt húztuk ki (különben pedig ). Ezekkel a jelölésekkel

hiszen . , hiszen az fehéret és az adott

pirosat bármilyen sorrendben ugyanakkora valószínűséggel húzhatjuk, és a sorrendek közül pontosan 1 olyan van, amikor a piros az első. A végeredmény tehát

A teljes valószínűség tételéhez hasonló állítás a várható értékekre is megfogalmazható.

4.1 Tétel

Legyen teljes eseményrendszer, pozitív valószínűségű eseményekből. Ekkor

ahol az

bekövetkezése melletti, úgynevezett feltételes várható értéke.

4.6 Feladat

Dobjunk egy érmével annyiszor, amennyit egy szabályos kockával dobtunk. Jelölje a fejek

számát. ?

Megoldás. A teljes eseményrendszer most a kockadobás lehetséges eredményének megfelelően 6 elemű. A

teljes várható érték tétel értelmében

, ami teljesen természetes, hiszen a kockadobás várható értéke 3,5 és várhatóan ezek fele lesz a fejre eső érmék száma.

2. 4.2 Az ingadozás mértéke és lehetséges