• Nem Talált Eredményt

FÜGGELÉK: A KUTATÁS MATEMATIKAI-STATISZTIKAI HÁTTERE

Egy szempontos varianciaelemzés

Két vagy több sokaság szórásnégyzetének (varianciájának) minta alapján történő összehasonlításán alapul, azt vizsgálja, hogy van-e szignifikáns különbség a csoportok átlagai között. A magyarázó modellek közé tartozik, és olyan elemzési módszer, amely egy (vagy több) független változó hatását vizsgálja egy (vagy több) függő változóra. A varianciaelemzést általában a vizsgálatba bevont sokaságok átlagai közti különbségek vizsgálatára használjuk (Sajtos, Mitev, 2007). A kétmintás t-próba általánosításának tekinthető. Azokban az esetekben alkalmaztam a varianciaelemzést a kétmintás t-próbák helyett, amikor egyszerre kettőnél több mintát is összehasonlítottam, különben a t-próbát nagyon sokszor kellett volna kiszámolnom, és így is csak a változópárok közötti kapcsolatokra, de nem az összes változó közti kapcsolatra vonhattam volna le következményeket. Varianciaelemzéssel a hatások kombinációjának együttes tesztelése is lehetséges. Emellett a sok elvégzett t-próbával irreálisan megnövekedett volna az elsőfajú hiba elkövetésének valószínűsége.

A nullhipotézis az, hogy az összes kezelés átlaga egyenlő. Az alternatív hipotézis pedig az, hogy legalább egy olyan középértékpár létezik, amelyek nem azonosak.

H0 : µ1 = µ2 = … = µk

H1 : legalább egyszer µi µj. i = 1,2, … , k, j = 1,2, … , k.

A kérdés tehát az, hogy a minták elkerülhetetlen eltérése a véletlen műve-e, vagy érvényesült valami olyan hatás, ami alapján a sokaságok nem tekinthetően megegyezőnek.

A varianciaelemzés alkalmazhatóságának feltételei:

1. A függő változó normál eloszlású. A függő változónak legalább intervallumskálán mértnek kell lennie, illetve ennek a függő változónak normál eloszlást kell követnie a csoportokon belül.

2. Varianciahomogenitás. A függő változónak azonos szórással kell rendelkeznie a független változó különböző szintjei mellett. A homogenitást Levene-teszttel állapíthatjuk meg. (Sajtos, Mitev, 2007)

Az eljárás két fő lépésből áll. Az első lépésben azt vizsgáljuk, hogy a minták egy populációba tartoznak-e. Ha egy populációba tartoznak, akkor eleve nem különböznek egymástól a minták

182

(átlagok). Ezt végső soron egy F-próba eredménye dönti el. Ha a varianciaanalízis F-próbája szignifikáns, akkor a minták nem tartoznak egy populációba, különböznek egymástól. Csak ekkor van értelme a varianciaelemzés második lépésének, az ún. „post hoc” analízisnek, amely a minták páronkénti összehasonlítását végzi el. Ez mutatja meg, hogy mely minták átlagai között található szignifikáns különbség, és melyek átlagai tekinthetők egyformának. A „post hoc” páronkénti összehasonlításra több módszert is kidolgoztak, melyek végeredményei gyakorlatilag azonosak. Napjainkban leginkább a „Tukey” eljárást javasolják (Ozsváth, Ács, 2011).

Korrelációszámítás

A vizsgálat a különböző változók közti kapcsolat irányát és szorosságát jeleníti meg (Molnár, 2015). A lineáris korrelációs (Pearson-féle) együtthatót az alábbiak szerint számolhatjuk ki:

A korrelációs együttható abszolút értéke a kapcsolat szorosságát, előjele a kapcsolat irányát mutatja (Sajtos, Mitev, 2007). Az együttható -1 és 1 között vehet fel értékeket. Minél szorosabb a kapcsolat a két változó között, az abszolút érték annál közelebb esik az 1-hez. Ha az együttható 0 körüli értéket mutat, az a kapcsolat hiányára (korrelálatlanságra) utal, azaz a két változó között nincs lineáris kapcsolat. Sajtos és Mitev (2007) az alábbiak szerint foglalja össze az korrelációs együttható értékének az értelmezését:

r = 1 Tökéletes pozitív kapcsolat (függvényszerű lineáris kapcsolat) 0,7 ≤ r < 1 Erős pozitív kapcsolat

0,2 ≤ r < 0,7 Közepes pozitív kapcsolat 0 < r < 0,2 Gyenge pozitív kapcsolat r =0 Nincs lineáris kapcsolat - 0,2 < r < 0 Gyenge negatív kapcsolat - 0,7 < r ≤ - 0,2 Közepes negatív kapcsolat - 1 < r ≤ - 0,7 Erős negatív kapcsolat

r = - 1 Tökéletes negatív kapcsolat (függvényszerű lineáris kapcsolat)

183

A lineáris korrelációs együttható négyzete (r2) a determinációs együttható, mely arra ad választ, hogy a független változó a függő változó varianciáját hány százalékban magyarázza meg (Sajtos, Mitev, 2007).

A két változó kapcsolatának mérésére alkalmazott Pearson-féle korrelációs együttható számítására vonatkozó módszer bár a legáltalánosabban használt módszer, alkalmazásának feltételei azonban szigorúak:

- mindkét változó intervallumszintű;

- mindkét változó normális eloszlású;

- feltételezhető, hogy a két változó között lineáris kapcsolat van.

A gyakorlatban ezek a feltételek csak ritkán teljesülnek maradéktalanul (a mutató legkevésbé a normalitásra érzékeny).

Regresszióelemzés

Amennyiben a két változó tapasztalt értékei és a közöttük lévő összefüggés ismerete mellett az egyik változó értékeiből rendre a másik változó értékeit is szeretnénk kiszámítani, a két változó között függvényszerű összefüggéseket kell keresnünk. Ezt az eljárást regresszió-analízisnek nevezik (Falus, Ollé, 2000).

A regresszióelemzés olyan eljárás, amelynek során egy metrikus függő és egy vagy több független változó közötti összefüggést elemezzük.

Két-változós modell esetében a regressziós egyenes általános képlete yi = β1*xi + β0 alakban írható fel, ahol β0 és β1 a regressziós paraméterek. Ez a modell determinisztikus kapcsolatot ír le, amelyben az x teljesen meghatározza az y-t. Azonban a regressziós egyenes illesztése az empirikus vizsgálatokban soha sem tökéletes, az általa meghatározott értékek eltérnek a tényleges értékektől. Az eltérés a hibatagban nyilvánul meg (εi) (Huszvai, Vince, 2012).

Mivel a ponthalmazra illesztett egyenesen nem található meg minden egyes érték, olyan illesztési technikát kell alkalmazni az egyenesre, amely a lehető legkisebb eltérést eredményezi az egyenes értékei (becsült értékek) és a tényleges értékek között. Az erre leggyakrabban használt technika a legkisebb négyzetek módszere (Sajtos, Mitev, 2007).

Az összefüggés szignifikancia-vizsgálatát kell elvégezni annak eldöntésére, hogy a lineáris regressziós egyenlet mekkora valószínűséggel írja le ténylegesen a változók közötti

184

kapcsolatot, vagyis az milyen mértékben nem a véletlen következménye. A determinációs együttható mutatja meg, hogy a független változó(k) milyen mértékben befolyásolják az eredményváltozó alakulását. A determinációt úgy lehet javítani, hogy több, szakmailag helyénvaló változót vonunk be a vizsgálatba (Molnár, 2015).

A Lorenz-diagram és a Gini-együttható

Gini-együttható annak meghatározására használható, hogy az eredményváltozó eloszlása a magyarázó változó függvényeként mennyire torzul az egyenletes eloszláshoz képest. A koncentráció mérésének egyik széles körben elterjedt aggregát statisztikai mutatószáma. Ez a mutatószám 0 és 1 közötti értéket vehet fel. Ha a Gini-koefficiens értéke nulla, akkor mindenki egyenlő összeggel rendelkezik a sokaságban, azaz teljes az egyenlőség, ha viszont eggyel egyenlő, akkor a sokaságban egyetlen személynél koncentrálódik a függő változó teljes értéke, ekkor tökéletes egyenlőtlenségről beszélünk. Minden tényleges, a valóságban megfigyelhető eloszlása az eredményváltozónak a két szélsőséges eset közé esik, s annál nagyobb az egyenlőtlenség mértéke (azaz a koncentráltság), minél távolabb kerül a Lorenz-görbe az átlótól.

(Kovács I., 2011).

A Gini-mutató szemléletesen a görbe grafikus ábrázolásával jeleníthető meg. A Lorenz-görbe az egységoldalú négyzetben elhelyezve ábrázolja a kumulált relatív gyakoriságok függvényében a kumulált relatív értékösszegeket. A Gini-koefficiens a Lorenz-görbe és a tökéletes egyenlőséget szimbolizáló 45 fokos egyenes közötti terület az egész háromszög területének hányadosaként határozható meg.

Amennyiben az egységeknek az értékösszegből való részesedése azonos, a kumulált relatív gyakoriságok és a kumulált relatív értékösszegek rendre megegyeznek. Ekkor a görbe egybeesik a négyzet átlójával, azaz teljes egyenlőség áll fenn. Szélsőséges esetben, amikor teljes koncentráció és teljes egyenlőtlenség lép fel, a görbe egybeesik a négyzet oldalaival és a tengelyekkel. Annál nagyobb lesz a koncentráció, minél nagyobb az átló és a Lorenz görbe által bezárt terület.

Mivel az átló alatti terület egyketteddel egyenlő (egységnyi oldalú négyzetről lévén szó), a Gini koncentrációs együttható egyenlő az átló és a Lorenz-görbe közötti terület kétszeresével. A Gini-index értéke 0 és 1 közé esik, ahol a 0 érték a tökéletesen egyenletes eloszlást, az 1 pedig a teljes egyenlőtlenséget, vagyis a már említett két szélsőséges esetet mutatja (Kovács I., 2011).

Képlete: