Statisztikai hipotézisek vizsgálata - A becsléselmélet elemei

II. A VALÓSZÍNŰSÉG-SZÁMÍTÁS ALAPJAI

11. A becsléselmélet elemei

11.4. Statisztikai hipotézisek vizsgálata

a σ szórás konfidencia intervalluma négyzetgyökvonás után:

11.4. Statisztikai hipotézisek vizsgálata

A statisztikai hipotézisvizsgálatok során feltevéseket teszünk az események valószínűségé-re, várható értékévalószínűségé-re, varianciájára, két változó függetlenségére stb. Ezeket a feltevéseket nevezzük statisztikai hipotéziseknek.

A hipotézisvizsgálat a hipotézisek elfogadásának vagy elvetésének módszereivel fog-lalkozik. A hipotéziseket statisztikai módszerekkel ellenőrizzük. Ezek az ún. statisztikai próbák.

Mielőtt a statisztikai próbákkal megismerkednénk, definiálnunk kell néhány új fogal-mat.

Definíció. Azt a feltevést, amelyet igaznak tételezünk fel, nullhipotézisnek nevezzük, és Ho-lal jelöljük. Például, ha feltesszük, hogy a ξ valószínűségi változó várható értéke mo, akkor a nullhipotézis:

Ho: M(ξ)=mo. (11.4.1.)

Ezzel szemben az ún. ellenhipotézis, amelyet H-val jelölünk:

H: M(ξ)=m≠mo. (11.4.2.)

A két hipotézist mindig úgy kell megalkotni, hogy egymást kizáró feltevések legyenek.

A hipotézisvizsgálat menete

Legyen a ξ valószínűségi változó n elemű statisztikai mintája x1, x₂, …, xn. Az a paraméter becslésére az x1, x2, …, xn mintaelemek egy

) ..., , , ˆ(

ˆ a x₁ x₂ x_n a

statisztikai függvényét használjuk. A döntés úgy történik, hogy a megadott 0<p<1 szám-hoz a statisztika összefüggései segítségével olyan T Relfogadási tartományt keresünk, amelyre igaz az, hogy a Ho nullhipotézis fennállása esetén az aˆ statisztikai függvény érté-ke 1–p valószínűséggel benne van a T tartományban. Abban az esetben tehát, ha

p 1 ) H T aˆ (

P  _o   ,

akkor 100(1–p)% szignifikancia szinten elfogadjuk a H_o nullhipotézist. Ha aˆT, akkor elvetjük a Ho hipotézist, vagyis a H ellenhipotézist fogadjuk el.

Az egymintás u-próba

Adott az N(m,σ) normális eloszlású sokaság. Ellenőrizni akarjuk, hogy m egyenlő-e adott m_o számmal. Ismerjük (például korábbi statisztikai vizsgálatokból) σ értékét. Kérdés, hogy az x mintaátlag mekkora eltérése esetén feltételezhetjük, hogy a várható érték m_o?

A nullhipotézis:

H_o: M(ξ)=mo. Az ellenhipotézis:

H: M(ξ)=m≠mo.

Az u-próba menete a következő. Készítünk egy próbafüggvényt (statisztikai függ-vényt):

 m n x

u  ,

amelyről a korábbiak alapján tudjuk, hogy u N(0,1) standard normális eloszlású valószínű-ségi változó. A konfidencia intervallum kapcsán beláttuk, hogy az u valószínűvalószínű-ségi változó-nak 1–p valószínűséggel megadható a konfidencia intervalluma, azaz

p 1 ) m u n x u (

P  _p    _p  

 . (11.4.3.)

Az up érték a standard normális eloszlás eloszlásfüggvényének táblázatából meghatá-rozható. Ha most feltesszük, hogy igaz a nullhipotézis, vagyis m=mo, akkor u-ba behelyet-tesítve ezt az értéket, kiszámíthatjuk az alábbi u_s értéket:

 ^o

m nx

u 

 .

A nullhipotézis igaz volta esetén (11.4.3) szerint fenn kell állnia, hogy

s u

u  .

Ebben az esetben tehát 100(1–p)% biztonsági szinten elfogadjuk a nullhipotézist.

Ha azt találjuk, hogy

s u

u  ,

akkor 100(1–p)% biztonsági szinten elutasítjuk a nullhipotézist, vagyis a H ellenhipotézist fogadjuk el.

Mindkét döntésünk a véletlen folytán lehet hibás. Elsőfajú hibát követünk el, ha Ho

igaz, de elvetjük, mert úgy találjuk, hogy u_s u_p. Másodfajú hibát követünk el, ha a Ho

hipotézis nem igaz, de a véletlen folytán elfogadjuk, mert úgy találjuk, hogy u_s u_p. Egymintás t-próba

A gyakorlatban általában a normális eloszlású változónak nemcsak a várható értéke, hanem a szórása is ismeretlen. Ilyen esetben ki tudjuk számítani a

1 ) (

2 2











n x x s

i i

korrigált szórásnégyzetet.

A nullhipotézis most is:

Ho: M(ξ)=mo, amelynek ellenőrzésére a



  s

m n x t

próbafüggvény használható. A korábbiak alapján tudjuk, hogy t egy n–1 szabadsági fokú Student-eloszlású valószínűségi változó. A Student-eloszlás táblázata alapján p-hez meg-adható az a tp táblázati érték, amelyre igaz, hogy

p t

t t

P( _p   _p)1 .

Ha most az u-próbához hasonlóan behelyettesítjük a próbafüggvénybe a nullhipotézis által feltételezett m=mo értéket, akkor t_s próbastatisztikát kapunk:



 

s m nx

t_s ^o ,

amelyre Ho fennállása esetén igaznak kell lennie, hogy

p o

s t

s m nx

t 



  . (11.4.4.)

Ha ez az egyenlőtlenség teljesül, akkor 100(1–p)% biztonsági szinten elfogadjuk a H_o hipotézist.

Ha (11.4.4) nem teljesül, vagyis azt találjuk, hogy

s t

t  ,

akkor a Ho nullhipotézist elutasítjuk, és a H ellenhipotézist fogadjuk el.

F-próba

Az F-próba alkalmazásával eldönthető, hogy két normális eloszlású, ismeretlen várható értékű statisztikai sokaság szórása azonos-e.

A két valószínűségi változó legye ξ és η. Legyen ξ eloszlása N(m1,σ1), η eloszlása pedig N(m2,σ2), továbbá legyen x1, x2, …, xn a ξ változóhoz tartózó minta, és y1, y2, ..., yk az η vál-tozóhoz tartozó minta! A két minta legyen független egymástól!

A nullhipotézis:

Ho: D²(ξ)=D²(η) (azaz ₁² ₂², vagyis σ1=σ2).

Jelölje s₁^²a ξ változóhoz tartozó minta empirikus szórásnégyzetét, és s₂^² az η változó-hoz tartozó minta empirikus szórásnégyzetét. A korábbiakban láttuk, hogy

n–1 szabadságfokú χ²-eloszlású valószínűségi változó, és hasonlóan

k–1 szabadságfokú χ²-eloszlású valószínűségi változó. Mivel a minták függetlenek, ezek a valószínűségi változók is függetlenek. Ebből a két valószínűségi változóból képezhető egy új F valószínűségi változó az alábbiak szerint:

Tehát az F valószínűségi változó p valószínűséggel tartózkodik az



F₁,F₂



tartományon kívül, azaz 1–p valószínűséggel tartózkodik a tartományon belül.

Ha most feltesszük a nullhipotézis érvényeségét, vagyis hogy σ1=σ2, akkor (11.4.5) alapján az Fs próbastatisztika:

2 teljesül-e az

Fs ≤ F2

reláció. Ha teljesül, akkor ez már elegendő 100(1–p)% szignifikancia szinten a Ho

nullhipotézis elfogadásához. Ennek oka az, hogy a másik feltétel a következő:



 



 



1 s 1

s F

1 F P 1 ) F

F (

P . (11.4.8.)

Ha viszont Fs-t úgy választottuk, hogy F_s 1, akkor 1/Fs1. Ha megnézzük az F táb-lázatot, akkor láthatjuk, hogy a gyakorlatban használatos kis p értékek esetén a táblázati értékek mind nagyobbak, mint 1. Következésképpen 1/F₁>1, tehát (11.4.8) a gyakorlat számára lényeges esetekben mindig teljesül.

Az F-próbát tehát az alábbiak szerint végezzük.

Első lépésben meghatározzuk Fs értékét. Az F_s értékét úgy kell vennünk, hogy a szám-lálóban van a nagyobb s^_i²érték. Nem szabad eltéveszteni a szabadsági fokok sorrendjét.

Ha s₁^²s₂^² és n az s₁^²szabadsági foka, k pedig az s₂^²szabadsági foka, akkor n–1, k–1 sza-badsági fokról van szó.

Második lépésként az F-eloszlás táblázata alapján meghatározzuk a 100(1–p)%

szignifikancia szinthez tartozó F₂ értéket (a táblázat k–1. sorának és n–1. oszlopának érté-két kell venni).

A harmadik lépésben összehasonlítjuk Fs és F2 értékét. Ha igaz az, hogy Fs ≤Fp,

akkor a H_o hipotézist 100(1–p)% szignifikancia szinten elfogadjuk, vagyis elfogadjuk, hogy σ1=σ2. Ellenkező esetben a Ho hipotézist 100(1–p)% szignifikancia szinten elvetjük, azaz σ1 ≠ σ2, mert az eltérést szignifikánsnak tekintjük.

Illeszkedésvizsgálat χ²-próbával

A matematikai statisztikában gyakran előfordul, hogy azt kell vizsgálni, valamely minta származhat-e adott, ismert paraméterekkel rendelkező eloszlásból. Ezt a kérdést vizsgáló statisztikai próbát illeszkedésvizsgálatnak nevezzük.

A próba az ismert eloszlás alapján várható gyakoriságok és a minta gyakorisága közötti eltérés vizsgálatából áll. Nézzük, hogyan megy ez diszkrét valószínűségi változó esetén.

Legyen A₁, A₂, …, Ar teljes eseményrendszer és vizsgálandó az, hogy igaz-e az esemé-nyek valószínűségeire P(A_i) p_i, i=1, 2, …, r.

A nullhipotézis:

r i

p A P

H_o : ( _i) _i 1,2,..., . Az ellenhipotézis:

i) p

A ( P amelyre ,

i :

H   .

Végezzük el a kísérletet n-szer (tehát készítsünk egy n elemű mintát!). Az eredmény szerint A1 k1-szer, A2 k2-ször ... Ar kr-szer következik be. Nyilván

n k

i i 



1

A k_i gyakoriságok valószínűségi változók, méghozzá korábban beláttuk, hogy binomiá-lis eloszlást követnek. A binomiábinomiá-lis eloszlás várható értéke alapján tehát ismerjük k_i elmé-leti várható értékét:

i np

M( ) .

A megfigyelt és az elméletileg várt gyakoriság eltéréséből próbastatisztikát készítünk az alábbiak szerint:





 ^r 

i i

np np k

2 ( )

 .

Belátható (ezt most nem tesszük meg), hogy ha n minden határon túl nő, akkor a ²-el jelölt valószínűségi változó r–1 szabadsági fokú ²-eloszlású (a gyakorlatban a megfelelő közelséghez már elegendő, ha npi≥10 minden i-re).

A próbát ezek után a következő módon végezzük el. Megadjuk a kívánt p szignifikancia szintet és a ²táblázatból kikeressük az ehhez tartozó ²_p értéket, amelyre

p P(² _p²)1 . Ha a mintából számolt





 ^r 

i i

sz np

np k

2 ( )



értékre igaz, hogy

2 2

sz 

  ,

akkor a Ho nullhipotézist elfogadjuk. Ellenkező esetben a a Ho nullhipotézist elvetjük, és a H ellenhipotézist fogadjuk el.

In document Mérési adatok kezelése és értékelése (Pldal 173-180)