• Nem Talált Eredményt

Statisztikai próbákról röviden

„összecsúszott” spektruma

7. Statisztikai próbákról röviden

A következőkben G. A. Korn és T. M. Korn: Matematikai kézikönyv műszakiaknak c. [4.1.] munkájára támaszkodva összefoglaljuk azokat a próbákkal kapcsolatos legfontosabb ismereteket, amelyek a méréselmélet és méréstechnika szempontjából fontosnak tartunk.

Gyakori feladat a méréstechnikában annak eldöntése, hogy a mért adatok eloszlásával kapcsolatban egy

„nullhipotézis‖ (kiinduló feltételezés) „kiállja-e‖ a próbát.

Paraméteres próba:

Ismert az eloszlás, csak az eloszlásra jellemző paramétereket kell ellenőrizni. A próba elutasítja a hipotézist, ha a minta egy előre kijelölt kis valószínűségű tartományba esik.

Nemparaméteres próba:

Az elméleti eloszlásfüggvény paraméterekkel nem kifejezhető tulajdonságaira irányul, ilyen pl.: két eloszlás azonossága, két valószínűségi változó függetlensége. Különösen előnyös a méréstechnikai gyakorlatban, mert nem követeli meg a minta sűrűségfüggvénye alakjának ismeretét.

A próba egy „null-hipotézis‖ (jele: H0) felállításával indul.

A hipotézis vizsgálat során lényegében arról van szó, hogy az adott minta (mérési adatsor: X1, X2,…Xn) alapján elfogadjuk, vagy elvetjük-e a „H0” feltételezést, hipotézist. Ezt nevezi a szakirodalom statisztikai próbának.

A feltételezés, idegen szóval hipotézis (jelölése „H‖) lehet egyszerű és összetett. Az „egyszerű‖ hipotézis a vizsgált eloszlás paramétereinek μ, σ, … stb. egy-egy meghatározott értékét μ=μ0, σ=σ0, stb., azaz a paramétertér egy pontját jelöli ki. Az összetett hipotézis a μ, σ, … stb. pontok egy halmazát, illetve tartományát jelöli ki a paramétertérben.

Fejezetünkben a legegyszerűbb forma, az egyszerű hipotézis vizsgálatával foglalkozunk.

A hipotézist empirikus (kísérleti úton nyert) adatok alapján ellenőrizzük. A statisztika tudományterülete definiált egy Sc kritikus tartományt, amely a statisztikai próbához tartozó azon pontok halmaza, amelyek esetében a H hipotézist elutasítjuk, ha bebizonyosodik mintáról, hogy elemei az Sc–hez tartoznak. Más mintapontok esetén a hipotézist elfogadjuk.

Megjegyzés: Az elfogadás, illetve elutasítás még elvileg végtelen elemszámú minta esetén sem jelenti azt, hogy a H hipotézis teljesülése logikailag bizonyítást nyert, illetve, hogy a H nem teljesülése bizonyított.

A hipotézissel kapcsolatban következő ábrán látható esetek lehetségesek (Az ábra G. A. Korn és T. M. Korn:

Matematikai kézikönyv műszakiaknak c. könyvéből származik):

1. H igaz, és a próba elfogadja. Ennek valószínűsége „1-α‖

2. H hamis, és a próba elutasítja. Ennek valószínűsége „1-β‖

3. H igaz, de a próba elutasítja (elsőfajú hiba). Ennek valószínűségét „α‖ jelöli.

4. H hamis, de a próba elfogadja (másodfajú hiba). Ennek valószínűségét „β‖ jelöli.

A 4.6. ábra - Hipotézis és ellenhipotézis egy feltételezett eloszláson egy feltételezett eloszlás esetére a fenti eseteket szemlélteti.

4.6. ábra - Hipotézis és ellenhipotézis egy feltételezett eloszláson

Az ábrán H0 jelöli az un. null hipotézist (kiindulási feltételezés) míg H1 az alternatív, vagy ellenhipotézist.

Ugyancsak jól látható, hogy a sűrűségfüggvények alatt jól elkülöníthető módon, α, β görög betűkkel és ezek komplementerjeivel (1-α, 1-β) területeket jelöltünk meg. Ezek a területek a fejezet elején megismert definíció szerint valószínűséget jelentenek. Az α és β szimbólumokkal jelzett valószínűségek mutatják meg a hipotézisvizsgálat során, hogy mennyire jelentős, idegen kifejezéssel szignifikáns a feltételezés és a mérési adatokból nyert „valóság‖ közötti eltérés?

A méréstechnikában és a műszaki életben sokszor előfordul, hogy az elméleti sokaságnak paraméterekkel kifejezett tulajdonságait kell hipotézisként vizsgálni. Ilyen paraméterek lehetnek például a várható érték és a szórás, μ=μ0, σ=σ0, …stb., miközben a minta tulajdonságait empirikus adatok felhasználásával, az μ=y1(X1, X2,

… Xn), σ=y2(X1, X2, … Xn) becslések írják le.

A paraméterek esetében, amint az előzőekben már láttuk, az indexben szereplő „0‖ jelöli a hipotetikus értéket, az index nélküli paraméter pedig a mintából nyert adatokat.

A H0 ≡ [μ=μ0, σ=σ0, …] egyszerű hipotézist adott „α”szignifikancia szinten elutasítjuk (tehát az eltérés szignifikáns), ha y értéke kívül van egy [yP1, yP2,] elfogadási intervallumon, amelyre

P[y P1 ≤ y ≤ y P2 ,] = P 2 – P 1 = 1-α (4.26) Az így definiált próbákat szignifikancia vizsgálatnak nevezik a statisztikában.

Illusztrálás céljából bemutatunk néhány jellegzetes, a méréstechnikában gyakran előforduló statisztikai próbát:

F-próba (paraméteres próba)

A próba alkalmazásával eldönthető, hogy két normális eloszlású statisztikai sokaság szórása azonos-e, vagy nem?

χ 2 -próba (paraméteres próba)

A méréstechnikában lényegében alább felsorolt vizsgálatokra alkalmazzák:

• Normalitás (illeszkedés vizsgálat, azaz a várt értékek összehasonlítása a megfigyelt adatokkal)

• Függetlenség (Két adatsor független-e egymástól?)

• Homogenitás (Az alapsokaságból két eltérő időben vett minta között van-e kapcsolat?) Ilyen vizsgálatra például akkor lehet szükség, ha egy gyártóberendezés esetében a beállításokból, vagy a szerszámkopásokból eredő hibák után kell nyomozni.

Egymintás t-próba (paraméteres próba)

Különösen fontos a szerepe a minőség-ellenőrzés területén. Segítségével eldönthető, hogy egy mintasokaságból számított átlag szignifikánsan különbözik-e egy adott értéktől (Pl. a műszaki dokumentációban megadott mérettől)? különböznek-e egymástól? (Pl.: Ugyanazt a mintát két különböző műszerrel mérték.)

Vizsgáljuk meg azt a H0 hipotézist, miszerint az „n‖ és az „m‖ elemszámú minták átlagértékei adott konfidencia szinten lényegesen (szignifikánsan) nem különböznek egymástól. A szabadságfok ebben a kétmintás próbában f=n+m-2, és táblázatból keressük meg az előírt konfidencia szinthez és az f szabadságfokhoz tartozó tp értéket.

(4.28)

Ha a számítás alapján |t| ≥ tp akkor a H0 hipotézist elvetjük. Ha |t| < tp akkor a H0 hipotézist megtartjuk.

Egymintás u-próba (paraméteres próba)

Az átlag és a várható érték közötti különbség a mintavétel hibája miatt van, vagy szignifikáns az eltérés? A „σ‖

ismert, pl. korábbi mérésekből. Hasonlít a t-próbára.

Jelentőség ugyancsak a minőségellenőrzésben van, ebben az esetben a várható érték alatt a műszaki dokumentációban megadott értékeket kell érteni.

Példaképpen első lépésben felállítjuk a H0 nullhipotézist: Szignifikáns-e az átlag és az előírt érték közötti eltérés? Legyen „σ‖ a minta (itt sorozat) ismert szórása, és μx az ismert (itt: előírt) várható érték, esetünkben a

műszaki rajzon szereplő hosszméret, az átlagértéket pedig a kész darabokon végzett mérésekkel, az „n‖

elemszámú minta alapján határoztuk meg.

Behelyettesítve az u-próba összefüggésébe, amely tulajdonképpen ismert a konfidencia intervallum számításából

(4.29)

és megvizsgáljuk, hogy a kapott érték hogyan viszonyul az alábbi táblázatban szereplő feltételekhez?

Ha a kiszámított értékre teljesül valamelyik ellenhipotézis, akkor az ellenhipotézis elfogadásával elvetjük nullhipotézist, a téves elutasítást valószínűsítő „α‖ szinten. A szignifikancia szinteket a táblázat első oszlopában tüntettünk fel.

Szignifikancia szint Baloldali ellenhipotézis Kétoldali ellenhipotézis Jobboldali ellenhipotézis

0.05 u < -uα = -1,64 u < - uα/2 = -1,96 vagy 1,96

= uα/2 < u

1,64 = uα < u

0.01 u < - uα = -2,32 u < - uα/2 = -2,57 vagy 2,57

= uα/2 < u

2,32 = uα < u

0.005 u < - uα = -2,57 u < - uα/2 = -2,81 vagy 2,81

= uα/2 < u

2,57 = uα < u

Ha a számítással kapott „u‖ értékre nem teljesül valamelyik H1 ellenhipotézis, akkor szakszerű kifejezéssel élve

„meggyőző ellenhipotézis H1 hiányában‖ megtartjuk H0-t.

Irodalmak

[4.1.] Korn, G. A. és Korn, T. M.. Matematikai kézikönyv műszakiaknak. Műszaki Könyvkiadó. 1975.

[4.2.] Prékopa , A.. Valószínűségelmélet műszaki alkalmazásokkal. Műszaki Könyvkiadó. 1974.