• Nem Talált Eredményt

Fisher-f´ele egzakt pr´oba

In document Magyar nyelv˝ u irodalom (Pldal 108-111)

4. Gyakori elemhalmazok 62

5.3. Szab´alyok f¨ uggetlens´ege

5.3.5. Fisher-f´ele egzakt pr´oba

A binomi´alis pr´oba a P(I, I0) val´osz´ın˝us´eget a f req(I)f req(I0) relat´ıv gyakoris´ag´aval k¨ozel´ıti. A k¨ozel´ıt´es pontatlans´aghoz vezet. Gondoljuk meg, hogy a binomi´alis eloszl´as nemnul-la val´osz´ın˝us´eget fog rendelni azn-n´el kisebb, min{supp(I), supp(I0)}-n´el nagyobb ´ert´ekekhez.

Azonban ezeknek a val´osz´ın˝us´egeknek null´anak kellene lenni¨uk. Nem fordulhat az el˝o, hogy az I-n´el nagyobb, I-t r´eszhalmazk´ent tartalmaz´o halmaznak supp(I)-n´el nagyobb legyen a t´amogatotts´aga. Hasonl´o mondhat´o el az n−supp(I)−supp(I0) ´ert´ekekre, amennyiben n−

−supp(I)−supp(I0)>0. A Fisher-f´ele egzakt pr´oba a k¨ozel´ıt´es helyett a pontos val´osz´ın˝us´egeket haszn´alja.

Tegy¨uk fel, hogy a kontingenciat´abl´azat ´un. margin´alis ´ert´ekei (k1., k2., k.1, k.2) ´es ´ıgy a mint´ak sz´ama is adva vannak. Ez az asszoci´aci´os szab´alyokn´al azt jelenti, hogy a kosarak sz´ama, supp(I) =k1.´essupp(I0) =k.1 r¨ogz´ıtettek. A k´erd´es a k¨ovetkez˝o : Ha tudjuk, hogy a k1. darabI term´ek ´es a k.1 darab I0 term´ek egyenletes eloszl´as szerint v´eletlenszer˝uen van sz´etsz´orva az n kos´arban, akkor mennyi az es´elye annak, hogy azI0-t tartalmaz´o kosarakb´olX darabban leszI.

Elvonatkoztatva a r´eszletekt˝ol ez ugyanaz a k´erd´es, mint amelyet a hipergeometrikus eloszl´as bemutat´asakor tett¨unk fel (l´asd a 2.5.1 r´esz). Ezek szerint

P(X, n, k1., k.1) =

Ez a val´osz´ın˝us´eg m´ar ¨onmag´aban egy j´o mutat´osz´am. Min´el nagyobb az ´ert´eke, ann´al f¨uggetlenebbek az I ´es az I0 term´ekek. Ha a χ2 statisztik´ahoz hasonl´o p-´ert´eket szeretn´enk

kapni, akkor ki kell sz´amolni az ¨osszes olyan X0-re a P(X0, n, k1., k.1) val´osz´ın˝us´eget, amely-re P(X0, n, k1., k.1) ≤P(X, n, k1., k.1). Ezeket az X0 ´ert´ekeket h´ıvjuk extr´emebb, azaz kisebb val´osz´ın˝us´eg˝u ´ert´ekeknek. A p-´ert´ek ezen extr´em ´ert´ekhez rendelt val´osz´ın˝us´egek ¨osszege Form´alisan:

pFisher(I→I0) = X

X0:P(X0,n,supp(I),supp(I0))P(supp(II0),n,supp(I),supp(I0))

P(X0, n, supp(I), supp(I0)) A Fisher-pr´ob´at nem csak kis ´ert´ekekn´el haszn´alhatjuk, tulajdonk´eppen f¨uggetlens´eg eld¨ont´es´ere ez a m´odszer mindig a legjobb eredm´enyt adja. H´atr´anya, hogy nagy n, k1., k.1

´ert´ekekn´el neh´ez a val´osz´ın˝us´egeket kisz´am´ıtani. ´Igy jutunk el a χ2 pr´ob´ahoz. Amennyiben k1.N, akkor a hipergeometrikus eloszl´ast k¨ozel´ıthetj¨uk az k1., k.1/n param´eter˝u binomi´alis eloszl´assal. A binomi´alis eloszl´ast pedig a norm´alis eloszl´assal k¨ozel´ıthetj¨uk. Standard norm´alis eloszl´as´u val´osz´ın˝us´egi v´altoz´ok n´egyzet´enek ¨osszege pedig olyan val´osz´ın˝us´egi v´altoz´ot ad, amelynek eloszl´asa a χ2 eloszl´as. Ty˝u, a mindenit, de sz´ep ez az eg´esz!

Ert´´ ekinvariancia

Egy f¨uggetlens´egi mutat´ot ´ert´ekinvari´ansnak h´ıvunk, amennyiben a kontingencia-t´abl´azat tetsz˝oleges sorait vagy oszlopait felcser´elve ugyanazt a kimenetet (p-´ert´eket) kapjuk. Bin´aris esetre gondolva ez azt jelenti, hogyX´esY f¨uggetlens´ege eset´en,X´es ¯Y (tov´abb´a ¯X,Y ´es ¯X, ¯Y) is az. Ha p´eld´aul meg´allap´ıtjuk, hogy a tejv´as´arl´as ´es keny´erv´as´arl´as f¨uggetlenek egym´ast´ol, akkor tejv´as´arl´as, nem keny´erv´as´arl´as is f¨uggetlenek.

K¨onny˝u bel´atni, hogy a Fisher-f´ele egzakt pr´oba ´es a χ2 pr´oba megfelel a fenti elv´ar´asnak, de a binomi´alis pr´oba nem. A Fisher-f´ele egzakt pr´ob´ahoz csak azt kell meggondolnunk, hogy

P(X, n, k1., k.1) =

teh´at att´ol, hogy a k´et sort (vagy a k´et oszlopot) felcser´elj¨uk m´eg ugyanazt a hipergeometrikus eloszl´ast kapjuk. Aχ2pr´ob´ara vonatkoz´o ´all´ıt´as k¨ozvetlen ad´odik aχ2 statisztika defin´ıci´oj´ab´ol.

A binomi´alis pr´oba eset´et egy p´eld´aval vizsg´aljuk. Induljunk ki a bal oldali kontingenci-at´abl´ab´ol majd cser´elj¨uk fel a k´et sor´at.

X nem X P

A bal oldali kontingenciat´abl´ahoz (3, 4/9) param´eter˝u binomi´alis eloszl´as tartozik. A kett˝oh¨oz nagyobb val´osz´ın˝us´eg tartozik, mint a null´ahoz ´es a h´aromhoz, ez´ert a p-´ert´ek 1−

−3·49·5922 = 0.588. A jobb oldali kontingenciat´abla binomi´alis eloszl´as´ahoz tartoz´o val´osz´ın˝us´eg 2/9. A legnagyobb val´osz´ın˝us´eget a (3, 2/9) param´eter˝u binomi´alis eloszl´as null´an´al veszi fel a maximum´at ez´ert a p-´ert´ek egy.

Erdekess´´ eg

Most, hogy tudjuk hogyan kell f¨uggetlens´eget meghat´arozni, feltehetj¨uk azt a k´erd´est, hogy legal´abb h´any megfigyel´esnek kell rendelkez´es¨unkre ´allnia ahhoz, hogy ¨osszef¨ugg´est ´allap´ıtsunk meg.

Adott 1−αpr´obaszint mellett csak akkor tudunk ¨osszef¨ugg´est meg´allap´ıtani (f¨uggetlens´eget elutas´ıtani), ha az elfogad´asi tartom´anyon k´ıv¨ul van olyan pont, amelyet felvehet azoknak a megfigyel´eseknek a sz´ama, amelyre mindk´et vizsg´alt tulajdons´ag fen´all. Az elfogad´asi tar-tom´anyba a legnagyobb val´osz´ın˝us´eggel rendelkez˝o pontok esnek. Amennyiben a legkisebb val´osz´ın˝us´eg˝u pont val´osz´ın˝us´ege kisebb α-n´al, akkor ez a pont nem esik az elfogad´asi tar-tom´anyba. K´etoldali pr´ob´an´al k´et legkisebb val´osz´ın˝us´egi pont is lehet, ´ıgy ezen val´osz´ın˝us´egek

¨osszege kell α-n´al kisebbnek lennie. Ha n p´aratlan, akkor csak egy legkisebb val´osz´ın˝us´egi pont lehet, ´elj¨unk ez´ert ezzel a felt´etellel. Az ´altal´anoss´ag megs´ert´ese n´elk¨ul feltehetj¨uk, hogyk1.≤k.1

´es a hipergeometrikus eloszl´as m´odusza (b(k1.+1)(kn+2.1+1)c) nem nagyobb, mint az ´ertelmez´ese tar-tom´any ([max(0, n−k1.−k.1),min(k1., k.1)]) felez˝opontja. A legkisebb val´osz´ın˝us´egi pont ekkor a k1., amelynek val´osz´ın˝us´ege

P(k1., n, k1., k.1) =

A fenti val´osz´ın˝us´eg r¨ogz´ıtett n eset´en akkor lesz a legnagyobb, ha k1. min´el nagyobb, teh´at k1.=k.1. Ekkor viszont oszlo-pa megadja a legkisebb val´osz´ın˝us´eget n´eh´any n-re Ezek szerint 97%-os bizonyoss´aggal m´ar

n P(bn/2c, n,bn/2c,bn/2c) p-´ert´ek

5.1. t´abl´azat. p-´ert´ekek extr´em kontingencai-t´abl´azat eset´en

h´et megfigyel´esb˝ol ¨osszef¨ugg˝os´eget ´allap´ıthatunk meg. Ehhez a legextr´emebb esem´enynek kell

bek¨ovetkeznie, nevezetesen, 7 megfigyel´esb˝ol h´aromra teljes¨ul egy tulajdons´ag (X) ´es csak erre a h´arom megfigyel´esre egy m´asik tulajdons´ag (Y) is teljes¨ul. Teh´at a kontingenciat´abl´azat :

X nem X P

Y 3 0 3

nem Y 0 4 4

P 3 4 7

A P(bn/2c, n,bn/2c,bn/2c) ´ert´ek egyben annak a tesztnek a p-pr´ob´aja, amelyben a meg-figyel´esek sz´ama n ´es k11=k1.=k.1 =bn/2c. Ha a pr´oba szintje enn´el az ´ert´ekn´el nagyobb, akkor elutas´ıtjuk a f¨uggetlens´egre tett felt´etelt, ellenkez˝o esetben elfogadjuk. A f¨uggetlens´eg eld¨ont´es´ere haszn´alhatn´ank m´as pr´ob´at is. Az 5.1 t´abl´azat harmadik ´es negyedik oszlopa a meg-figyel´es p-´ert´ek´et adja meg binomi´alis ´es χ2 pr´oba eset´en. L´athatjuk, hogy a binomi´alis pr´oba j´oval nagyobb p-´ert´ekeket ad ugyanarra a megfigyel´esre, azaz a binomi´alis pr´oba ,,f¨uggetlens´eg fel´e h´uz”. P´eld´auln= 11 ´esα= 5% est´en a Fisher pr´oba elutas´ıtja a f¨uggetlens´eget a binomi´alis pr´oba pedig elfogadja azt.

Ha megszor´ıtkozunk olyan kontingenciat´abl´akra, amelyekn´el k1,1=k1.−1, teh´at nem a leg-extr´emebb eset k¨ovetkezik be, akkor a Fisher-f´ele pr´obap-´ert´ekei a k¨ovetkez˝ok´eppen alakulnak:

n

p-´ert´ek

k1,1=k1.−1 k1,1=k1.−2

fisher binom χ2 fisher binom χ2

5 100% 58.17% 70.9% 40% 100% 13.6%

7 48.57% 61.95% 27.0% 100% 100% 65.9%

9 20.62% 39.33% 9.89% 100% 69.4% 76.4%

11 8.00% 25.45% 3.56% 56.71% 70.75% 37.6%

13 2.91% 16.75% 1.27% 28.61% 49.42% 16.9%

15 1.01% 11.19% 0.45% 13.19% 34.30% 7.21%

17 0.35% 7.59% 0.16% 5.67% 23.74% 2.95%

19 0.11% 5.21% 0.05% 2.30% 16.44% 1.17%

A 97%-os bizonyoss´ag megtart´as´ahoz most m´ar 13 megfigyel´es kell (binomi´alis pr´oba szerint 21, χ2-pr´oba szerint is 13). Ha hat-hat megfigyel´esn´el teljes¨ul az X, Y tulajdons´agok, akkor abban az esetben ´allap´ıtunk meg ¨osszef¨ugg´est, ha az X, Y tulajdons´aggal egy¨utt rendelkez˝o megfigyel´esek sz´ama 0, 5 vagy 6.

In document Magyar nyelv˝ u irodalom (Pldal 108-111)