• Nem Talált Eredményt

Statisztika

In document Magyar nyelv˝ u irodalom (Pldal 36-39)

2. Alapfogalmak, jel¨ ol´ esek 24

2.6. Statisztika

A statisztik´aban ´altal´abanX1, X2, . . . , Xnf¨uggetlen, azonos eloszl´as´u val´osz´ın˝us´egi v´altoz´ok vannak megadva, amiket mint´aknak nevez¨unk. Az eloszl´ast nem ismerj¨uk pontosan, de rendel-kez´es¨unkre ´allnak megfigyel´esek.

Legyenek X1, X2, . . . , Xn f¨uggetlen, azonos eloszl´as´u val´osz´ın˝us´egi v´altoz´ok. Ekkor a X¯ = X1+X2n+···+Xn val´osz´ın˝us´egi v´altoz´ot empirikus k¨oz´epnek, vagy minta´atlagnak, a s∗2n =

= n11Pn

i=1(Xi−X)¯ 2 val´osz´ın˝us´egi v´altoz´ot pedig korrig´alt empirikus sz´or´asn´egyzetnek ne-vezz¨uk.

A χ2 eloszl´as defin´ıci´oj´ab´ol k¨ovetkezik, hogy az (n−1)sσ2 ∗2 val´osz´ın˝us´egi v´altoz´o eloszl´asa χ2n, amennyiben a s2 σ sz´or´as´u, norm´alis eloszl´as´u val´osz´ın˝us´egi v´altoz´ok korrig´alt empirikus sz´or´asn´egyzet´et jel¨oli

2.2. defin´ıci´o. Legyenek X ´es Y k´et olyan val´osz´ın˝us´egi v´altoz´o, amelyek eloszl´asa rendre χ2n

´es χ2m. Ekkor a Z= Y /mX/n val´osz´ın˝us´egi v´altoz´o eloszl´as´at Fn,m eloszl´asnak h´ıvjuk.

2.6.1. Hipot´ ezisvizsg´ alat

A hipot´ezisvizsg´alat feladata mindig valamilyen ´all´ıt´as helyess´eg´enek vizsg´alata. Ezt az

´all´ıt´ast nullhipot´ezisnek nevezz¨uk, jele H0. A nullhipot´ezis ´altal´aban egy val´osz´ın˝us´egi v´altoz´o valamely param´eter´ere vagy a v´altoz´o viselked´es´ere vonatkoz´o ´all´ıt´as. Az ´all´ıt´as igazol´as´ahoz vagy elvet´es´ehez k´ıs´erletezget´esek, mint´ak ´allnak rendelkez´es¨unkre. Ha a mint´ak alapj´an a null-hipot´ezist elvetj¨uk, holott az igaz, akkor els˝ofaj´u hib´at k¨ovet¨unk el. Ellenkez˝o esetben – ami-kor a nullhipot´ezis hamis, de mi elfogadjuk – m´asodfaj´u hib´ar´ol besz´el¨unk. Puszt´an mint´ak seg´ıts´eg´evel nem tudunk teljesen biztos v´alaszt adni. A gyakorlatban egy param´eterrel (α)

r¨ogz´ıtik az els˝ofaj´u hiba elk¨ovet´es´enek megengedett val´osz´ın˝us´eg´et. Az 1−α ´ert´eket a pr´oba szintj´enek h´ıvjuk.

Osszefoglalva teh´at, adott egy ´all´ıt´as, egy param´eter (α) ´es mint´ak sorozata. Feladatunk,¨ hogy a mint´ak alapj´an c´afoljuk vagy igazoljuk az ´all´ıt´ast ´ugy, hogy bizony´ıthat´oanα-n´al kisebb legyen annak val´osz´ın˝us´ege, hogy az ´all´ıt´as igaz, holott mi c´afoljuk. A hipot´ezisvizsg´alatn´al a mint´ak eredm´enyeit felhaszn´alva kisz´am´ıtunk egy ´un. pr´obastatisztika ´ert´eket, ´es ezt vetj¨uk

¨ossze egy ismert eloszl´assal. Az α-nak c´elszer˝u kis (0.1 ´es 0.01 k¨oz¨otti) ´ert´eket v´alasztani1.

2.6.2. A binomi´ alis pr´ oba 2.6.3. Az F -pr´ oba

AzF-pr´oba arra szolg´al, hogy k´et f¨uggetlen, norm´alis eloszl´as´u val´osz´ın˝us´egi v´altoz´o (X, Y) sz´or´as´anak egyenl˝os´eg´et eld¨onts¨uk.

H0XY. Tudjuk, hogy (nXσ21)s∗2X

X ´es (nYσ21)s∗2Y

Y χ2 eloszl´as´uak (nX−1) illetve (nY −1) param´eterrel. Ha a nullhipot´ezis fenn´all, akkor az

F =sX2 sY2

pr´obastatisztika F-eloszl´as´u (nX −1, nY −1) param´eterrel. Azonban F1 is F-eloszl´as´u (nY

−1, nX −1) param´eterrel, ez´ert a gyakorlatban F = max{F,1/F} ≥ 1 statisztik´at szok´as haszn´alni.

2.6.4. A χ

2

-pr´ oba

A χ2-pr´ob´ak az al´abbi t´etelt haszn´alj´ak fel.

2.3. t´etel. Legyen A1, A2, . . . , Ar egy teljes esem´enyrendszer (r≥3), legyen pi=P(Ai)>0, i=

=1, . . . , r. Ism´etelj¨uk a k´ıs´erletetn-szer egym´ast´ol f¨uggetlen¨ul. Jel¨oljeXiazAiesem´eny bek¨ovet-kez´es´enek sz´am´at. Bel´athat´o, hogy ekkor a

Xr

j=1

(Xj−npj)2 npj

val´osz´ın˝us´egi v´altoz´o eloszl´asa n→ ∞ eset´en χ2r−1 eloszl´ashoz konverg´al.

A χ2 eloszl´as kvantiliseit f¨uggv´eny-t´abl´azatokban megtal´alhatjuk.

2-pr´oba legfontosabb alkalmaz´asi ter¨uletei az (1.) illeszked´es-, (2.) f¨uggetlens´eg- ´es (3.)ho-mogenit´asvizsg´alat. T´em´ankhoz a f¨uggetlens´eg-vizsg´alat tartozik hozz´a, ´ıgy a tov´abbiakban ezt r´eszletezz¨uk. A χ2-pr´oba ir´ant ´erdekl˝od˝oknek a [65] magyar nyelv˝u irodalmat aj´anljuk.

1Gondolkozzunk el azon, hogy mi t¨ort´enne, haα-nak nagyon kis ´ert´eket v´alasztan´ank!

2.6.5. F¨ uggetlens´ egvizsg´ alat

Legyen A1, A2, . . . , Ar ´esB1, B2, . . . , Bs k´et teljes esem´enyrendszer. V´egezz¨unkn k´ıs´erletet.

Nullhipot´ezis¨unk az, hogy az esem´enyrendszerek f¨uggetlenek.

H0:P(Ai, Bj) =P(Ai)P(Bj), i= 1, . . . , r j= 1, . . . , s

Ha az esem´enyek val´osz´ın˝us´egei adottak, akkor tiszta illeszked´es vizsg´alati feladatr´ol besz´el¨unk, ahol

H0 :P(Ai∩Bj) =piqj

hiszen pi, qj ´ert´ekek adottak. Jel¨olje kij azAi∩Bj esem´eny bek¨ovetkez´es´enek sz´am´at. Ekkor ki kell sz´am´ıtanunk a

un. pr´obastatisztika ´ert´eket. Jobban megvizsg´alva χ2-et l´athatjuk, hogy az egy P(megfigyelt ´ert´ek - v´art ´ert´ek)2

v´art ´ert´ek jelleg˝u kifejez´es. Amennyiben χ2 kicsi, akkor a megfi-gyelt ´ert´ekek k¨ozel vannak azokhoz, amit H0 fenn´all´asa eset´en v´artunk, teh´at a nullhipot´ezist elfogadjuk.

Hogy pontosan mit jelent az, hogy

”kicsi”, azt a 2.3-as t´etel alapj´an χ2rs1 ´es az α pa-ram´eter hat´arozza meg. T´abl´azatb´ol keress¨uk ki, hogy a χ2rs1 eloszl´as hol veszi fel az 1−α

´ert´eket. Amennyiben ez nagyobb a fent kisz´am´ıtottχ2 ´ert´ekn´el, akkor a nullhipot´ezist elfogad-juk, ellenkez˝o esetben elvetj¨uk.

A gyakorlatban sokkal t¨obbsz¨or fordul el˝o az az eset, amikor az esem´enyek val´osz´ın˝us´egeit nem ismerj¨uk. Ekkor a val´osz´ın˝us´egeket az esem´enyek relat´ıv gyakoris´ag´aval becs¨ulj¨uk meg.

Jel¨olj¨uk az Ai esem´eny gyakoris´ag´at ki.-vel, teh´at ki.=Ps

j=1kij ´es hasonl´oan Bj esem´eny gya-koris´ag´at k.j-vel. χ2-pr´ob´ak sor´an az adatok szeml´eltet´es´enek gyakran haszn´alt eszk¨oze az ´un.

kontingencia-t´abl´azat. Ez egy t¨obbdimenzi´os t´abl´azat, amely cell´aiban a megfelel˝o esem´eny bek¨ovetkez´es´enek sz´ama tal´alhat´o. Egy ilyen 2-dimenzi´os kontingencia-t´abl´azatot l´athatunk a k¨ovetkez˝o ´abr´an.

Mivel a f¨uggetlens´eg fenn´all´asa eset´en r−1 darab pi-t ´es s−1 darab qj val´osz´ın˝us´eget kell megbecs¨ulni, ´ıgy a fenti H0 fenn´all´asa eset´en χ2rs1(r+s2)2(r1)(s1) eloszl´as´u.

A χ2 eloszl´as k¨ozel´ıt´ese csak abban az esetben pontos, ha akij ´ert´ekek nagyok. Persze nincs pontos szab´aly arra n´ezve, hogy mennyire kell nagynak lennie. Azt szokt´ak mondani, hogy a kontingencia t´abl´azat elemeinek 90%-a nagyobb legyen ¨otn´el.

2.6.6. Student t-pr´ oba

In document Magyar nyelv˝ u irodalom (Pldal 36-39)