II. A VALÓSZÍNŰSÉG-SZÁMÍTÁS ALAPJAI
11. A becsléselmélet elemei
11.4. Statisztikai hipotézisek vizsgálata
a σ szórás konfidencia intervalluma négyzetgyökvonás után:
11.4. Statisztikai hipotézisek vizsgálata
A statisztikai hipotézisvizsgálatok során feltevéseket teszünk az események valószínűségé-re, várható értékévalószínűségé-re, varianciájára, két változó függetlenségére stb. Ezeket a feltevéseket nevezzük statisztikai hipotéziseknek.
A hipotézisvizsgálat a hipotézisek elfogadásának vagy elvetésének módszereivel fog-lalkozik. A hipotéziseket statisztikai módszerekkel ellenőrizzük. Ezek az ún. statisztikai próbák.
Mielőtt a statisztikai próbákkal megismerkednénk, definiálnunk kell néhány új fogal-mat.
Definíció. Azt a feltevést, amelyet igaznak tételezünk fel, nullhipotézisnek nevezzük, és Ho-lal jelöljük. Például, ha feltesszük, hogy a ξ valószínűségi változó várható értéke mo, akkor a nullhipotézis:
Ho: M(ξ)=mo. (11.4.1.)
Ezzel szemben az ún. ellenhipotézis, amelyet H-val jelölünk:
H: M(ξ)=m≠mo. (11.4.2.)
A két hipotézist mindig úgy kell megalkotni, hogy egymást kizáró feltevések legyenek.
A hipotézisvizsgálat menete
Legyen a ξ valószínűségi változó n elemű statisztikai mintája x1, x2, …, xn. Az a paraméter becslésére az x1, x2, …, xn mintaelemek egy
) ..., , , ˆ(
ˆ a x1 x2 xn a
statisztikai függvényét használjuk. A döntés úgy történik, hogy a megadott 0<p<1 szám-hoz a statisztika összefüggései segítségével olyan T Relfogadási tartományt keresünk, amelyre igaz az, hogy a Ho nullhipotézis fennállása esetén az aˆ statisztikai függvény érté-ke 1–p valószínűséggel benne van a T tartományban. Abban az esetben tehát, ha
p 1 ) H T aˆ (
P o ,
akkor 100(1–p)% szignifikancia szinten elfogadjuk a Ho nullhipotézist. Ha aˆT, akkor elvetjük a Ho hipotézist, vagyis a H ellenhipotézist fogadjuk el.
Az egymintás u-próba
Adott az N(m,σ) normális eloszlású sokaság. Ellenőrizni akarjuk, hogy m egyenlő-e adott mo számmal. Ismerjük (például korábbi statisztikai vizsgálatokból) σ értékét. Kérdés, hogy az x mintaátlag mekkora eltérése esetén feltételezhetjük, hogy a várható érték mo?
A nullhipotézis:
Ho: M(ξ)=mo. Az ellenhipotézis:
H: M(ξ)=m≠mo.
Az u-próba menete a következő. Készítünk egy próbafüggvényt (statisztikai függ-vényt):
m n x
u ,
amelyről a korábbiak alapján tudjuk, hogy u N(0,1) standard normális eloszlású valószínű-ségi változó. A konfidencia intervallum kapcsán beláttuk, hogy az u valószínűvalószínű-ségi változó-nak 1–p valószínűséggel megadható a konfidencia intervalluma, azaz
p 1 ) m u n x u (
P p p
. (11.4.3.)
Az up érték a standard normális eloszlás eloszlásfüggvényének táblázatából meghatá-rozható. Ha most feltesszük, hogy igaz a nullhipotézis, vagyis m=mo, akkor u-ba behelyet-tesítve ezt az értéket, kiszámíthatjuk az alábbi us értéket:
o
s
m nx
u
.
A nullhipotézis igaz volta esetén (11.4.3) szerint fenn kell állnia, hogy
p
s u
u .
Ebben az esetben tehát 100(1–p)% biztonsági szinten elfogadjuk a nullhipotézist.
Ha azt találjuk, hogy
p
s u
u ,
akkor 100(1–p)% biztonsági szinten elutasítjuk a nullhipotézist, vagyis a H ellenhipotézist fogadjuk el.
Mindkét döntésünk a véletlen folytán lehet hibás. Elsőfajú hibát követünk el, ha Ho
igaz, de elvetjük, mert úgy találjuk, hogy us up. Másodfajú hibát követünk el, ha a Ho
hipotézis nem igaz, de a véletlen folytán elfogadjuk, mert úgy találjuk, hogy us up. Egymintás t-próba
A gyakorlatban általában a normális eloszlású változónak nemcsak a várható értéke, hanem a szórása is ismeretlen. Ilyen esetben ki tudjuk számítani a
1 ) (
1
2 2
n x x s
n
i i
korrigált szórásnégyzetet.
A nullhipotézis most is:
Ho: M(ξ)=mo, amelynek ellenőrzésére a
s
m n x t
próbafüggvény használható. A korábbiak alapján tudjuk, hogy t egy n–1 szabadsági fokú Student-eloszlású valószínűségi változó. A Student-eloszlás táblázata alapján p-hez meg-adható az a tp táblázati érték, amelyre igaz, hogy
p t
t t
P( p p)1 .
Ha most az u-próbához hasonlóan behelyettesítjük a próbafüggvénybe a nullhipotézis által feltételezett m=mo értéket, akkor ts próbastatisztikát kapunk:
s m nx
ts o ,
amelyre Ho fennállása esetén igaznak kell lennie, hogy
p o
s t
s m nx
t
. (11.4.4.)
Ha ez az egyenlőtlenség teljesül, akkor 100(1–p)% biztonsági szinten elfogadjuk a Ho hipotézist.
Ha (11.4.4) nem teljesül, vagyis azt találjuk, hogy
p
s t
t ,
akkor a Ho nullhipotézist elutasítjuk, és a H ellenhipotézist fogadjuk el.
F-próba
Az F-próba alkalmazásával eldönthető, hogy két normális eloszlású, ismeretlen várható értékű statisztikai sokaság szórása azonos-e.
A két valószínűségi változó legye ξ és η. Legyen ξ eloszlása N(m1,σ1), η eloszlása pedig N(m2,σ2), továbbá legyen x1, x2, …, xn a ξ változóhoz tartózó minta, és y1, y2, ..., yk az η vál-tozóhoz tartozó minta! A két minta legyen független egymástól!
A nullhipotézis:
Ho: D2(ξ)=D2(η) (azaz 12 22, vagyis σ1=σ2).
Jelölje s12a ξ változóhoz tartozó minta empirikus szórásnégyzetét, és s22 az η változó-hoz tartozó minta empirikus szórásnégyzetét. A korábbiakban láttuk, hogy
2
n–1 szabadságfokú χ2-eloszlású valószínűségi változó, és hasonlóan
2
k–1 szabadságfokú χ2-eloszlású valószínűségi változó. Mivel a minták függetlenek, ezek a valószínűségi változók is függetlenek. Ebből a két valószínűségi változóból képezhető egy új F valószínűségi változó az alábbiak szerint:
2
Tehát az F valószínűségi változó p valószínűséggel tartózkodik az
F1,F2
tartományon kívül, azaz 1–p valószínűséggel tartózkodik a tartományon belül.Ha most feltesszük a nullhipotézis érvényeségét, vagyis hogy σ1=σ2, akkor (11.4.5) alapján az Fs próbastatisztika:
2 teljesül-e az
Fs ≤ F2
reláció. Ha teljesül, akkor ez már elegendő 100(1–p)% szignifikancia szinten a Ho
nullhipotézis elfogadásához. Ennek oka az, hogy a másik feltétel a következő:
1 s 1
s F
1 F P 1 ) F
>
F (
P . (11.4.8.)
Ha viszont Fs-t úgy választottuk, hogy Fs 1, akkor 1/Fs1. Ha megnézzük az F táb-lázatot, akkor láthatjuk, hogy a gyakorlatban használatos kis p értékek esetén a táblázati értékek mind nagyobbak, mint 1. Következésképpen 1/F1>1, tehát (11.4.8) a gyakorlat számára lényeges esetekben mindig teljesül.
Az F-próbát tehát az alábbiak szerint végezzük.
Első lépésben meghatározzuk Fs értékét. Az Fs értékét úgy kell vennünk, hogy a szám-lálóban van a nagyobb si2érték. Nem szabad eltéveszteni a szabadsági fokok sorrendjét.
Ha s12s22 és n az s12szabadsági foka, k pedig az s22szabadsági foka, akkor n–1, k–1 sza-badsági fokról van szó.
Második lépésként az F-eloszlás táblázata alapján meghatározzuk a 100(1–p)%
szignifikancia szinthez tartozó F2 értéket (a táblázat k–1. sorának és n–1. oszlopának érté-két kell venni).
A harmadik lépésben összehasonlítjuk Fs és F2 értékét. Ha igaz az, hogy Fs ≤Fp,
akkor a Ho hipotézist 100(1–p)% szignifikancia szinten elfogadjuk, vagyis elfogadjuk, hogy σ1=σ2. Ellenkező esetben a Ho hipotézist 100(1–p)% szignifikancia szinten elvetjük, azaz σ1 ≠ σ2, mert az eltérést szignifikánsnak tekintjük.
Illeszkedésvizsgálat χ2-próbával
A matematikai statisztikában gyakran előfordul, hogy azt kell vizsgálni, valamely minta származhat-e adott, ismert paraméterekkel rendelkező eloszlásból. Ezt a kérdést vizsgáló statisztikai próbát illeszkedésvizsgálatnak nevezzük.
A próba az ismert eloszlás alapján várható gyakoriságok és a minta gyakorisága közötti eltérés vizsgálatából áll. Nézzük, hogyan megy ez diszkrét valószínűségi változó esetén.
Legyen A1, A2, …, Ar teljes eseményrendszer és vizsgálandó az, hogy igaz-e az esemé-nyek valószínűségeire P(Ai) pi, i=1, 2, …, r.
A nullhipotézis:
r i
p A P
Ho : ( i) i 1,2,..., . Az ellenhipotézis:
i
i) p
A ( P amelyre ,
i :
H .
Végezzük el a kísérletet n-szer (tehát készítsünk egy n elemű mintát!). Az eredmény szerint A1 k1-szer, A2 k2-ször ... Ar kr-szer következik be. Nyilván
n k
r
i i
1.
A ki gyakoriságok valószínűségi változók, méghozzá korábban beláttuk, hogy binomiá-lis eloszlást követnek. A binomiábinomiá-lis eloszlás várható értéke alapján tehát ismerjük ki elmé-leti várható értékét:
i
i np
k
M( ) .
A megfigyelt és az elméletileg várt gyakoriság eltéréséből próbastatisztikát készítünk az alábbiak szerint:
r
i i
i i
np np k
1
2
2 ( )
.
Belátható (ezt most nem tesszük meg), hogy ha n minden határon túl nő, akkor a 2-el jelölt valószínűségi változó r–1 szabadsági fokú 2-eloszlású (a gyakorlatban a megfelelő közelséghez már elegendő, ha npi≥10 minden i-re).
A próbát ezek után a következő módon végezzük el. Megadjuk a kívánt p szignifikancia szintet és a 2táblázatból kikeressük az ehhez tartozó 2p értéket, amelyre
p P(2 p2)1 . Ha a mintából számolt
r
i i
i i
sz np
np k
1
2
2 ( )
értékre igaz, hogy
2 2
p
sz
,
akkor a Ho nullhipotézist elfogadjuk. Ellenkező esetben a a Ho nullhipotézist elvetjük, és a H ellenhipotézist fogadjuk el.