• Nem Talált Eredményt

ÖSSZEFÜGGÉS VIZSGÁLATA

A korreláció szignifikanciája a kapcsolat erősségére mutat55 (5.5 fejezet).

Korreláció-analízis

A korrelációanalízis több véletlen változó közötti kapcsolat jellemzésére szolgál.

Feltételezzük, hogy mindkét valószínűségi változó (x és y) normális eloszlá-sú, és a közöttük lévő lineáris összefüggés mértékét a korrelációs együttható mutatja, melyet r-rel jelölünk.

Értéke -1 és +1 közé eshet, a határokat is beleértve. Ha r pozitív, akkor y együtt növekszik, vagy csökken x-szel. Negatív r esetében ellentétes irányú a változás. Amennyiben az r értéke │1│, x és y között függvényszerű kapcsolat van, amelynél minden pont egy egyenesen helyezkedik el. A két változót, illetve ismérvet korrelálatlannak nevezzük, ha r=0.

7.1.15 Kettőnél több dimenzió

Kettőnél több dimenzió vizsgálatát a rövid összefoglalóban56 tekintjük át.

Varianciaanalízis

A varianciaanalízist más szóval szórásanalízisnek nevezzük. Kettőnél több csoportos kísérlet vizsgálatánál alkalmazzuk, több minta szórás négyzetének összehasonlításán alapuló statisztikai eljárás.

Feladat annak eldöntése, hogy van-e szignifikáns eltérés a mintaátlagok között. Feltételeztük, hogy azonos varianciából vettük a mintákat. Ezekben az esetekben a nullhipotézis vizsgálatára kerül sor, melynek igazsága esetén a mintaátlagok egyenlők.

Ezekben az esetekben kettőnél több egydimenziós minta elemeinek tulaj-donságát mérő változók állnak rendelkezésre. Az elemzés során a változók kö-zötti különbözőség statisztikai kimutatása, a szignifikanciaszint vizsgálatával, a kétmintás t-próba számításával történik. Ennek során minden minta minden mintával való összehasonlításához, az összes változó közötti kapcsolatot felmé-réséhez sokszor kell a műveletet elvégezni.

Variancia-analízisnek nevezzük azt a statisztikai eljárást, mely több egydimenziós minta ugyanazon változója közötti különbség szignifikancia szintjének összehasonlítását teszi lehetővé.

55 Im.: 51

56 Im.: 51 pp.46-47.

Gyakorlatilag azt jelenti ez a statisztikai összehasonlítás, mintha kettős t-próbát minden minta minden mintájával végeznénk el, amely végtelen sok számítási feladatot jelenthet57.

Diszkriminanciaanalízis

A diszkriminancia analízis két vagy több osztály egyszerre több mennyiségi változó egyidejű figyelembevételével történő szétválasztására alkalmas mód-szer. Az alkalmazás előfeltétele, hogy az objektumokat valamilyen tulajdonsága-ik alapján már előre osztályokba soroljuk. Tehát ismernünk kell az osztályokat, amelyeket éppen ez az osztályozó változó jelöl ki.

A diszkriminanciaanalízis a megfigyeléseink osztályozásának egy lehetséges módszere. Feltételezi, hogy az adatállományban legyen egy diszkrét, ún. osztályozó változó, és egy vagy több kvantitatív változó.

A cél annak eldöntése, hogy ha a megadott kvantitatív változók alapján kell osztályokba sorolni a megfigyeléseket, akkor mennyire kapjuk vissza az eredeti osztályokat, azaz mennyire különböztetik meg (idegen szóval diszkriminálják) a kvantitatív változóink az egyes osztályokat.

A diszkriminanciaanalízis módszerei: a paraméteres és a nemparaméteres elemzés.

 A paraméteres esetben feltételezzük, hogy a változók együttes elosz-lása többdimenziós normális, legfeljebb csak a kovariancia mátrix tér el az egyes osztályok szerint.

 A nem paraméteres esetben már a változók normalitása sem áll fenn.

Főkomponensanalízis

A főkomponensanalízis a változók száma csökkentésének az egyik módszere.

Célja az, hogy az eredeti változók mintából becsült kovariancia (korreláció) struktúráját a változók minél kevesebb számú lineáris kombinációjával írja le, miközben a populációról a lehető legkevesebb adatot veszítsük el.

Az első főkomponenst úgy kapjuk, hogy megkeressük azt a lineáris kombi-nációt, amelynek a szórása maximális. Heurisztikusan: az adatok által meghatá-rozott pontfelhőt arra az egyenesre vetítjük le, ahol a kapott pontok szóródása a lehető legnagyobb lesz. Ezt követően az erre az egyenesre merőleges irányok

57 Murray R.Spiegel: Statisztika. Elmélet és gyakorlat. Panem – McGraw-Hill 1995 ISBN 963 545 029 X pp.:346-381

mentén meghatározzuk a további főkomponenseket. Annyi főkomponens lehet, amennyi a változók száma, és a főkomponensek egymásra merőlegesek. Kiin-dulhatunk a kovariancia és korrelációs mátrixból.

A vizsgálat kiindulási feltételei:

 Ha nem kívánjuk figyelembe venni, hogy a változóink esetleg eltérő skálán mértek, vagy éppen ezt akarjuk kiküszöbölni, akkor dolgozzunk a korrelációs mátrixszal.

 Ha azonban az eltérő nagyságrendi skála fontos információt takar, pl.

az egyik változó tipikus értéke 10-szer nagyobb a másikénál, és ez egy lényeges viszonyt ír le. Ebben az esetben a kovariancia mátrixot kell választani.

Klaszteranalízis

A többváltozós statisztikai vizsgálat, melynek feladata az objektumok elemzése, a struktúrát egészében vizsgáló módszer. Alkalmazásakor az osztá-lyozandó objektumokat számkomponensű vektorokkal kell megadni.

Egy ilyen igen gyakran alkalmazott osztályozási módszer a klaszteranalízis.

Feladat, hogy csoportokba soroljuk a különböző objektumokat azok hasonlósá-ga alapján, közös tulajdonsáhasonlósá-gaik figyelembe vételével. A klaszterelemzés túllép a klasszikus logikai modelleken. Egyrészt olyan osztályokat definiál, amelyekben az objektumok egy vagy több változóban nem feltétlenül ekvivalensek, de ha-sonlóak, szemben a klasszikus logika osztályozásával, ahol egy osztály minden eleme minden szempontból ekvivalens. Másrészt nem definiál típusokat, mie-lőtt az objektumokat az osztályokba sorolná, viszont az eljárás után megadhatja a típusjegyeket. Ezzel szemben a klasszikus logika először definiálja a típusokat és utána sorolja az egyedeket osztályokba.

A klaszteranalízis a megfigyelések (vagy a változók) osztályozásának dimenziócsökkentő módszere.

A diszkriminancia analízissel szemben jelen esetben nincsenek előre meg-adott osztályok, a feladat éppen ezeknek a létrehozása. Elvárás az, hogy azok a megfigyelések kerüljenek egy osztályba (klaszterbe), amelyek a legközelebb vannak egymáshoz, illetve a leginkább hasonlóak egymáshoz. Ezért az elemzés kezdetekor meg kell határoznunk, hogy hogyan mérjük a megfigyeléseink kö-zötti távolságot vagy az ezzel ellentétesen viselkedő hasonlóságot. Használhat-juk a standard euklideszi távolságot, de dönthetünk más mellett is (pl. diszkrét vagy bináris adatok esetén általában más távolságot érdemes használni).

Faktoranalízis

Az elemzésekben gyakran kettőnél több változót kell figyelembe venni az adott probléma megoldásakor. Több változónak nagy elemszámú mintán törté-nő mérése óriási adathalmaz, melyet egy egységként kezelni bonyolult feladat.

A kapcsolatok feltárása során több, egymástól is függő változó kapcsolat lehe-tőségét elemezve kell a feladatot megoldani, melynek elemzése és az eredmé-nyek értelmezése a faktoranalízis segítségével történhet58 (Székelyi-Barna,2002).

Adott: egy sokváltozós mintaállomány, ahol a faktorok korrelálatlanok és a vizsgálat kezdetén még nem ismertek. A faktoranalízist a regresszióanalízistől az különbözteti meg, hogy a független változók ismertek. Egy adatállományon a faktoranalízis csak akkor végezhető el, ha az adatok összefüggnek, más szóval korreláltak, melynek értelmében a változók redundáns információkat hordoz-nak.

A faktoranalízis a változók száma csökkentésének a legelterjedtebb módszere. A jelenség feltárását szolgáló vizsgálati módszer, amelyek a mért változók hátterében lehetnek, egymástól függnek és a jelenségekre magyarázatot adnak.

A változók számának csökkentése a statisztikai mintában a lévő információ lehetőség csökkentésével ugyanazt a jelenséget írja, kevesebb változóval. A feladat a sokváltozós adatállomány jellemzése a változónál kisebb számú, cél-szerűen választott ún. faktorral oly módon, hogy a faktorok az eredeti lehetőség szerinti legtöbb információt tartalmazzák, és az így azonosított faktorokat cél-szerű értelmezni és elnevezni, melyek az eljárás kezdetén ismeretlenek. Másik fontos célkitűzés, hogy a nagyszámú változó közötti korrelációs struktúrát írjuk le kevés számú látens változó, ún. faktor segítségével. A faktoroknak fizikai je-lentésük nincs, közvetlenül nem megfigyelhetőek, nem mérhetőek és létezésük csak elképzelhető az eredeti változók alapján. A változók száma csökkentésének a legelterjedtebb módszere a faktoranalízis. Feladata az adatrendszer struktú-rájának feltárása és a többváltozós adatrendszerek elemzése.

A faktoranalízis alapfeltevése, hogy ezeket a látens változókat nem tudjuk megfigyelni, de a minta által adott változók révén kell azokra következtetni. A faktoranalízis során a faktorok meghatározása a vizsgált változók korrelációs mátrixából kiindulva:

 Ha a változó nem korrelál más váltózókkal, nagy valószínűséggel önál-ló faktorral rendelkezik.

58 Székely Mária – Barna Ildikó: Túlélőkészlet az SPSS-hez. Budapest, Typotex, 2008. pp. 40-108

 Ha két vagy több változó között szoros a korreláció, akkor feltételez-hető, hogy egy vagy több közös faktorral rendelkeznek.

7.1.16 Az eredmények ábrázolása

A grafikus ábrázolás célja az eredmények áttekinthetőbbé és szemlélete-sebbé tétele. A diagramok leggyakoribb típusa a vonaldiagram, az oszlopdiag-ram és a kördiagoszlopdiag-ram. A vonaldiagoszlopdiag-ram az adatok egymáshoz való viszonyát, az oszlopdiagram pedig a rész adatok egészhez történő arányát ábrázolja.

ÖSSZEFOGLALÁS, KÉRDÉSEK