• Nem Talált Eredményt

Statisztikai hipotézisek vizsgálata

II. A VALÓSZÍNŰSÉG-SZÁMÍTÁS ALAPJAI

11. A becsléselmélet elemei

11.4. Statisztikai hipotézisek vizsgálata

a σ szórás konfidencia intervalluma négyzetgyökvonás után:

11.4. Statisztikai hipotézisek vizsgálata

A statisztikai hipotézisvizsgálatok során feltevéseket teszünk az események valószínűségé-re, várható értékévalószínűségé-re, varianciájára, két változó függetlenségére stb. Ezeket a feltevéseket nevezzük statisztikai hipotéziseknek.

A hipotézisvizsgálat a hipotézisek elfogadásának vagy elvetésének módszereivel fog-lalkozik. A hipotéziseket statisztikai módszerekkel ellenőrizzük. Ezek az ún. statisztikai próbák.

Mielőtt a statisztikai próbákkal megismerkednénk, definiálnunk kell néhány új fogal-mat.

Definíció. Azt a feltevést, amelyet igaznak tételezünk fel, nullhipotézisnek nevezzük, és Ho-lal jelöljük. Például, ha feltesszük, hogy a ξ valószínűségi változó várható értéke mo, akkor a nullhipotézis:

Ho: M(ξ)=mo. (11.4.1.)

Ezzel szemben az ún. ellenhipotézis, amelyet H-val jelölünk:

H: M(ξ)=m≠mo. (11.4.2.)

A két hipotézist mindig úgy kell megalkotni, hogy egymást kizáró feltevések legyenek.

A hipotézisvizsgálat menete

Legyen a ξ valószínűségi változó n elemű statisztikai mintája x1, x2, …, xn. Az a paraméter becslésére az x1, x2, …, xn mintaelemek egy

) ..., , , ˆ(

ˆ a x1 x2 xn a

statisztikai függvényét használjuk. A döntés úgy történik, hogy a megadott 0<p<1 szám-hoz a statisztika összefüggései segítségével olyan TRelfogadási tartományt keresünk, amelyre igaz az, hogy a Ho nullhipotézis fennállása esetén az aˆ statisztikai függvény érté-ke 1–p valószínűséggel benne van a T tartományban. Abban az esetben tehát, ha

p 1 ) H T (

Po   ,

akkor 100(1–p)% szignifikancia szinten elfogadjuk a Ho nullhipotézist. Ha aˆT, akkor elvetjük a Ho hipotézist, vagyis a H ellenhipotézist fogadjuk el.

Az egymintás u-próba

Adott az N(m,σ) normális eloszlású sokaság. Ellenőrizni akarjuk, hogy m egyenlő-e adott mo számmal. Ismerjük (például korábbi statisztikai vizsgálatokból) σ értékét. Kérdés, hogy az x mintaátlag mekkora eltérése esetén feltételezhetjük, hogy a várható érték mo?

A nullhipotézis:

Ho: M(ξ)=mo. Az ellenhipotézis:

H: M(ξ)=m≠mo.

Az u-próba menete a következő. Készítünk egy próbafüggvényt (statisztikai függ-vényt):

m n x

u  ,

amelyről a korábbiak alapján tudjuk, hogy u N(0,1) standard normális eloszlású valószínű-ségi változó. A konfidencia intervallum kapcsán beláttuk, hogy az u valószínűvalószínű-ségi változó-nak 1–p valószínűséggel megadható a konfidencia intervalluma, azaz

p 1 ) m u n x u (

Pp    p  

 . (11.4.3.)

Az up érték a standard normális eloszlás eloszlásfüggvényének táblázatából meghatá-rozható. Ha most feltesszük, hogy igaz a nullhipotézis, vagyis m=mo, akkor u-ba behelyet-tesítve ezt az értéket, kiszámíthatjuk az alábbi us értéket:

o

s

m nx

u

 .

A nullhipotézis igaz volta esetén (11.4.3) szerint fenn kell állnia, hogy

p

s u

u .

Ebben az esetben tehát 100(1–p)% biztonsági szinten elfogadjuk a nullhipotézist.

Ha azt találjuk, hogy

p

s u

u ,

akkor 100(1–p)% biztonsági szinten elutasítjuk a nullhipotézist, vagyis a H ellenhipotézist fogadjuk el.

Mindkét döntésünk a véletlen folytán lehet hibás. Elsőfajú hibát követünk el, ha Ho

igaz, de elvetjük, mert úgy találjuk, hogy us up. Másodfajú hibát követünk el, ha a Ho

hipotézis nem igaz, de a véletlen folytán elfogadjuk, mert úgy találjuk, hogy us up. Egymintás t-próba

A gyakorlatban általában a normális eloszlású változónak nemcsak a várható értéke, hanem a szórása is ismeretlen. Ilyen esetben ki tudjuk számítani a

1 ) (

1

2 2

n x x s

n

i i

korrigált szórásnégyzetet.

A nullhipotézis most is:

Ho: M(ξ)=mo, amelynek ellenőrzésére a

  s

m n x t

próbafüggvény használható. A korábbiak alapján tudjuk, hogy t egy n–1 szabadsági fokú Student-eloszlású valószínűségi változó. A Student-eloszlás táblázata alapján p-hez meg-adható az a tp táblázati érték, amelyre igaz, hogy

p t

t t

P( p p)1 .

Ha most az u-próbához hasonlóan behelyettesítjük a próbafüggvénybe a nullhipotézis által feltételezett m=mo értéket, akkor ts próbastatisztikát kapunk:

 

s m nx

ts o ,

amelyre Ho fennállása esetén igaznak kell lennie, hogy

p o

s t

s m nx

t

  . (11.4.4.)

Ha ez az egyenlőtlenség teljesül, akkor 100(1–p)% biztonsági szinten elfogadjuk a Ho hipotézist.

Ha (11.4.4) nem teljesül, vagyis azt találjuk, hogy

p

s t

t ,

akkor a Ho nullhipotézist elutasítjuk, és a H ellenhipotézist fogadjuk el.

F-próba

Az F-próba alkalmazásával eldönthető, hogy két normális eloszlású, ismeretlen várható értékű statisztikai sokaság szórása azonos-e.

A két valószínűségi változó legye ξ és η. Legyen ξ eloszlása N(m11), η eloszlása pedig N(m22), továbbá legyen x1, x2, …, xn a ξ változóhoz tartózó minta, és y1, y2, ..., yk az η vál-tozóhoz tartozó minta! A két minta legyen független egymástól!

A nullhipotézis:

Ho: D2(ξ)=D2(η) (azaz 12 22, vagyis σ1=σ2).

Jelölje s12a ξ változóhoz tartozó minta empirikus szórásnégyzetét, és s22 az η változó-hoz tartozó minta empirikus szórásnégyzetét. A korábbiakban láttuk, hogy

2

n–1 szabadságfokú χ2-eloszlású valószínűségi változó, és hasonlóan

2

k–1 szabadságfokú χ2-eloszlású valószínűségi változó. Mivel a minták függetlenek, ezek a valószínűségi változók is függetlenek. Ebből a két valószínűségi változóból képezhető egy új F valószínűségi változó az alábbiak szerint:

2

Tehát az F valószínűségi változó p valószínűséggel tartózkodik az

F1,F2

tartományon kívül, azaz 1–p valószínűséggel tartózkodik a tartományon belül.

Ha most feltesszük a nullhipotézis érvényeségét, vagyis hogy σ12, akkor (11.4.5) alapján az Fs próbastatisztika:

2 teljesül-e az

Fs ≤ F2

reláció. Ha teljesül, akkor ez már elegendő 100(1–p)% szignifikancia szinten a Ho

nullhipotézis elfogadásához. Ennek oka az, hogy a másik feltétel a következő:



 

 

1 s 1

s F

1 F P 1 ) F

>

F (

P . (11.4.8.)

Ha viszont Fs-t úgy választottuk, hogy Fs1, akkor 1/Fs1. Ha megnézzük az F táb-lázatot, akkor láthatjuk, hogy a gyakorlatban használatos kis p értékek esetén a táblázati értékek mind nagyobbak, mint 1. Következésképpen 1/F1>1, tehát (11.4.8) a gyakorlat számára lényeges esetekben mindig teljesül.

Az F-próbát tehát az alábbiak szerint végezzük.

Első lépésben meghatározzuk Fs értékét. Az Fs értékét úgy kell vennünk, hogy a szám-lálóban van a nagyobb si2érték. Nem szabad eltéveszteni a szabadsági fokok sorrendjét.

Ha s12s22 és n az s12szabadsági foka, k pedig az s22szabadsági foka, akkor n–1, k–1 sza-badsági fokról van szó.

Második lépésként az F-eloszlás táblázata alapján meghatározzuk a 100(1–p)%

szignifikancia szinthez tartozó F2 értéket (a táblázat k–1. sorának és n–1. oszlopának érté-két kell venni).

A harmadik lépésben összehasonlítjuk Fs és F2 értékét. Ha igaz az, hogy Fs ≤Fp,

akkor a Ho hipotézist 100(1–p)% szignifikancia szinten elfogadjuk, vagyis elfogadjuk, hogy σ12. Ellenkező esetben a Ho hipotézist 100(1–p)% szignifikancia szinten elvetjük, azaz σ1 ≠ σ2, mert az eltérést szignifikánsnak tekintjük.

Illeszkedésvizsgálat χ2-próbával

A matematikai statisztikában gyakran előfordul, hogy azt kell vizsgálni, valamely minta származhat-e adott, ismert paraméterekkel rendelkező eloszlásból. Ezt a kérdést vizsgáló statisztikai próbát illeszkedésvizsgálatnak nevezzük.

A próba az ismert eloszlás alapján várható gyakoriságok és a minta gyakorisága közötti eltérés vizsgálatából áll. Nézzük, hogyan megy ez diszkrét valószínűségi változó esetén.

Legyen A1, A2, …, Ar teljes eseményrendszer és vizsgálandó az, hogy igaz-e az esemé-nyek valószínűségeire P(Ai)pi, i=1, 2, …, r.

A nullhipotézis:

r i

p A P

Ho : ( i) i 1,2,..., . Az ellenhipotézis:

i

i) p

A ( P amelyre ,

i :

H   .

Végezzük el a kísérletet n-szer (tehát készítsünk egy n elemű mintát!). Az eredmény szerint A1 k1-szer, A2 k2-ször ... Ar kr-szer következik be. Nyilván

n k

r

i i

1

.

A ki gyakoriságok valószínűségi változók, méghozzá korábban beláttuk, hogy binomiá-lis eloszlást követnek. A binomiábinomiá-lis eloszlás várható értéke alapján tehát ismerjük ki elmé-leti várható értékét:

i

i np

k

M( ) .

A megfigyelt és az elméletileg várt gyakoriság eltéréséből próbastatisztikát készítünk az alábbiak szerint:

r

i i

i i

np np k

1

2

2 ( )

 .

Belátható (ezt most nem tesszük meg), hogy ha n minden határon túl nő, akkor a 2-el jelölt valószínűségi változó r–1 szabadsági fokú 2-eloszlású (a gyakorlatban a megfelelő közelséghez már elegendő, ha npi≥10 minden i-re).

A próbát ezek után a következő módon végezzük el. Megadjuk a kívánt p szignifikancia szintet és a 2táblázatból kikeressük az ehhez tartozó 2p értéket, amelyre

p P(2 p2)1 . Ha a mintából számolt

r

i i

i i

sz np

np k

1

2

2 ( )

értékre igaz, hogy

2 2

p

sz

  ,

akkor a Ho nullhipotézist elfogadjuk. Ellenkező esetben a a Ho nullhipotézist elvetjük, és a H ellenhipotézist fogadjuk el.