Rummel, R.J.: Alkalmazott faktoranalízis

(1)

STATISZTIKAI lRODALMl FlGYELÓ

KU'L'FULDl STATISZTIKAI lRODALOM'

A STATl'SZ'lTlKA ÁLTALÁNOS ELMÉLETE ÉS MÓDSZERTANA MATEMATlKAl STATllSZTiKA

RUMMEL, R. J.:

ALKALMAZOTT FAKTORANALIZlS

(Applied factor analysis.) Evanston. 1970. North- Western University Press. 61l7 p.

Rummel munkája a faktoranalízis gyakor—

lati alkalmazását oly módon fcáxrgyaljra. hogy azt egy konkrét problémát vizsgáló kutató jól tudja használni.

A faktora—nalizis nagy matrixok elemzésére használható, tehát olyan esetekben. amikor számos megfigyelési egységnek sok váltom- tára vonatkozóan van—nak adataink. Ezeket a megfigyelési egységeket úgy tekinthetjük, hogy egy sokdimenziós térben helyezkednek el (amelyben anny—i dimenzió van. ahány változó szerepel a problémában). A faktor- analizis alkalmazásánál feltételezzük, hogy a megfigyelési egységek elhelyezkedése nem teljesen véletlenszerű. hanem néhány főtengely körül rendeződik. A faktonanalízis alkalmazásával meghatározzuk azt a mini- mális számú, egymástól független koordiná- ta'teangelyt. amelyek segítségével leinható a megfigyelt adatok elhelyezkedése a sokdi- menziós nemben. Minden ilyen tengelyt egy—

egy dimenziónak nevez—ünk. A kapott liaikto- nok mindegyike egy—egy ilyen dimenziót kép—

visel. _

Több ia—ktanaznalízis-model—l létezik. melyek egymástól némileg eltérnek. Ezek a modellek a következők.

1. A közösfaiktor-analizis (common factor analysis). Spearman dolgozta ki 1927-ben két faktorra, és Thurstone terjesztette ki 1935-ben több faktorra. Abból indult ki.

hogy az advamok varianoiójónok egyik részét közös faktorok magyarázzák. a másik részt viszont minden változónak egy—egy speci—

ális falktoras. A közös ta—ktorok száma kisebb

a változók számánál. Az lla-U2 matrixból indul ki. ahol R a változók közötti korrelá—

ciók metrika. U2 pedig a változók speciciitá- sának (*un—igueness) diagonális matrixa. Vagy—

is a (kiinduló matrix főá'clójóban nem egyesek, hanem a specifitással csökkentett egye—

sek, a kommunalitások szerepel—nek. Ez ::

iaktoran—alízis eredeti modellje, ma azonban nemileg háttérbe szorul a kom-ponenslak- tor—lanwalízissel szemben.

2. Komrpon—ensfaktor—analizis (component factor analysis). Az előbbi modellel ellen- tétben ez abból indul ki, hogy nincsenek külön közös és speciális faktorok. Ezért a falktorok száma rendszerint eléri a változók számát. Az első néhány faktor azonban megmagyarázza az adatok variancia'jának legnagyobb részét, a többi faktort - aime—

lyek a varlnncixónnk csupán kis részét ma- gyanózzólk — az elemzésnél elhanyagolják.

Kiindulópontja az R korrelációs matrix a fő- ótlóban egyesekkel.

A szerző további négy újabb, ritkábban alkalmazott modellt ír le.

3. Képlalktor-amalízist (image tactor ona—

lysis) Guttman dolgozott ki 1953-ban. A kö- zösfwaikt—or-aniaiizishez hasonlóan az adatok közös vektortenével foglalkozik.

4. A Harris-féle képfáaktor—zanalizis előnye az előbbi modellhez képest, hogy független az adatok skálázásótóL

5. Kanonikuslaktor-analízis. Segítségével egy minta adataiból az egész populációban érvényesülő falkiorokna lehet következtetni.

A minta kanonikus faktora—it számítja ki.

6. Alíalaktor—analízis. Segítségével egy minta adataiból a változók univerzuimóra vonatkozóan lehet következbefhéseket levonni.

A modellek leirása után a szerző a fak- toraznxalizisben szerephez jutó matrixokkal

' A; Statisztikai Szemle 1962. júliusi szó—mától kezdődően a "Statisztikai Irodalmi Flgyelő"-bon a külföldi statisztikai könyvek és follyóinatoikkek ismertetését havonta közli.

A Külföldi statisztikai irodalom egyes fejezeteisn belül az anyag általl—ában könyv- és folyóinatoikk- ismeretesek-re tagolódik. (Ezeket * választja el egymástól.) Az ilsmertetások szerzők. illetve ahol szerző nincs, a címek betűrendje'ben következnek egymás után.

7 Statisztikai Szemle

(2)

754 STATISZT—lKAil lRODAbel ' FlGYELO

foglalkozik. Az első és leglényegesebb a korrelációs matrix. Ez egyrészt az a híd.

amelyen keresztül a kutató az alapadatok—

tól a bonyolultabb laktormatnindkihoz eljut.

Másrészt ez a matrix is — amely a vizsgá- latban figyelembe vett nagyszámú változó közötti egyszerű szorzaamamen—tum korreláci—

ós együtthatókat tartalmazza - számos ér- dekes inf-onmációit nyújt a változók közötti kapcsolatok-ról. A korrelációs matrix főótló—

jában egyesek szerepelnek (ment a változó- nak önmagával való korreláaióját jelképe- zik), közösfa-ktor-analízis esetén azonban

—— mint említettük -- a kommunalitósok kerül- nek.

A korrelációs matnixiból kiindulva a fak- toranalízis módszere először meghatározza a nem rotá—lt faktonmatrixiot. Ebben minden változót egy sor, minden laktort egy oszlop képvisel. A matrímban a faktors—úlyok vagy tenhelések (loading) szerepelnek. Ezek ::

korrelációs együtthatókhoz hasonló együtt—

hatók, kifejezik a kérdéses változó és fak-

tor közötti korreláció erősségét. A lak—tor- súly négyzete kifejezi azt, hogy a kérdéses faktor az adott változó yarianoiájának mekkora részét magyarázza meg. Ezért, ha, (:

faktorsúlyok négyzeteit egy sorban összead- juik, megkapjuk, hogy a figyelembe vett faktorok az adott változó va—nionciájának mekkora részét magyarázzák meg együtte- sen. Ez nevezik máskép—pen kamimxunalitiás- nak. Ha (: faktorsúlyok négyzeten egy osz- lopban összeadjuk, megkapjuk a kérdéses faktor ,,ieigenvalue'Ujét. Ezek mérik a kér- déses laiktor által megmagyarázott összes varia—nciát, és a karakterisztikus egyenlet gyöikei.

A faktoranalízis eredményeként először megkapott fak-tormatrix a vizsgált adatokban levő fő tendenciákat fejezi ki. Többnyire egy különösen erős faktor emelkedik ki, amely a variancia nagy részét meg-magyarázza, és amelyre vonatkozóan többé—kevésbé minden változó meglehetősen magas faktorsúlyt mu—

tat. A lalktonanalizis alkarlmazásain—ól ezt az első faktormatrimt meg szokták változtatni.

hogy egy kívánatosabb tulajdonságokkal rendelkező, jobban értelmezhető faktorsúly- matrixot kapjanak. Erre a oétlna a rotációnak nevezett eljárást használják. A rotólt tavk- torok a nem rotált faktorok lineáris transz- formációi. A rotációnál különrféle kritériumo- kat lehet alkalmazni. A leggyakrabban hasz- nált kritérium az egyszerű struktúra kritéri- uma. E módszer maximalizálja az egyes faktorok-hoz tartozó magas értélkű fa'ktorsúlyok számát és minimalizálja azoknak a laktam-k- no'k (: számá/t, amelyek minden változóval magas taktorsúlyokat mutatnak. Más szóval e rotációs eljárás alkalmazásával a kapott faktorok élesebben különvál—naík egymástól (más—más vóltozócsoporttal mutatnak maga—s

laktors—úlyokat), és ugyanaldkor az egyes faktorok része a teljes voriancia megmogya;

rázósóban kiegyenl—i—tetteb'bé válik, mint a nem rotált faktorsúlymatrix esetében.

A következő lépésben ki lehet számítani a faktor pontszám matrixot. Ebben a matrix—ban mind-en megfigyelési egység meg- határozott pontszámot kap minden egyes faktor dimenziójában. A pontszámok példá- ul kifejezik, hogy az egyes országok vagy városok milyen magasan helyezkednek el.

mennyire lejlettek az egyes laktorok által képviselt dimenziókban. például az iparoso- dottsóg. az inflrastruikturális fejlettség. a kul- turális ellátottság vonatkozásában.

A szerző a hanmadilk részben az adatok előkészítésével kapcsolatos gyakorlati kérdé- seket tárgyalja.

Az első eldöntendő kérdés: milyen ter—

mészetű választ várnak a laiktoranalrízlis al- kalmazásától. Ebből a szempontból a fülk- tonana'lizisnek tőbb-féle célja lehet: 1. nagy—

mennyiségű ada-t tömör összefoglalása (a kisebb számú faktor segitségével), 2. a vizs- gált terület struktúrájának (alapvető dimen—

zióimak) kimutatása, 3. a megfigyelési egy—

ségelk osztályozása, tipiusoklba sorolása, 4.

a változók közötti összefüggések felderítése.

A felhasznált adatok különfélék lehetnek.

Az egyetlen kikötés, hogy akkor érdemes faktoranalízist végezni, ha nagyszámú meg- figyelési egységről nagyszámú adot (változó) áll rendelkezésre.

Célszerű, hogy a megfigyelési egységek (személyek. országok vagy más területegy- ségek. megfigyelési időszakok) szá-ma na—

gyobb legyen a megfigyelt változók százmé- nál. Az adatmatrix rangja ugyanis kisebb vagy egyenlő a matrix kisebb oldalával és a m—egkü'lön-bözteiihető faktorok száma az adatmatrix rangjáva—l. Kívánatos. hogy a megfigyelési egységek száma legalább a változók számának négyszerese legyen, a szerző azonban több olyan vizsgálatot em- lít, amelyben több változót vizsgál—Mik. mint ahány megfigyelési egységük volt. A leg—

szélsőségesebb ilyen példában 82 országnak 236 jellemzőjével végeztek la-letonaaalízistt.

A szerző szerint a taktonanalízis alkalmas olyan adatok vizsgálatára, amelyeket csu—

pá-n nominális vagy ordinális skálákkal tu—

dunik mérni. ilyenkor azonban óvatosan kell értelmezni az eredményeket. Általá—ban elő—

nyösebb az intervallum-skálákon és arány- mérőskálókon mért adatokat felhasználni.

Nem követelmény, hogy a változók érté- keinek megoszlása normális legyen. A szélső- ség—esen nem normál eloszlású változók ese—

tében azonban célszerű olyan eloszlási tmnszlormáoiókat végezni, hogy közelebb ke- rüljenek (: nonmális eloszláshoz. Hasonló- képpen kivánatos lehet olyan transzformáció- kat végezni, amelyek az adatokat a ho—

(3)

STATbSZ'MKAl IRODALMI FlGYELÖ

755

moszk-edasztioitás követelményének teljesítés—e fele' közelítik.

A könyv negyedik része az elemzéssel tog'lalkazi'k. Ennek leglényegesebb témája a faktorok kiválasztása és értelmezése. A tak- toranali'zis eredményeképpen az alabbi faktorok nyerhetők:

— az általános faktor, amely magas értékű faktor- súlyt mutat minden változó vonatkozásában. ez a faktor tehát mintegy összegezi az összes változót;

—— a csoportfoktor csupán egyes változóknál mutat magas foktorsúlyt; ha több egymást nem átfedő (vagyis más változóknól magas faktarsúlyú) csoport- faktort kapunk, akkor a változókat sikerült a talalo- roknak megfelelő dimenziókban összefogni;

—a kétpólusú csoportfaktor az előbbinek az 0 speciális változata. amely egyes változókna'l magas pozitív. más vóltozóknál magas negatív faktorsúlyt mutat:

-— (: párfaktor (doublet) két változónól mutat ma- g—axs taikrtorsúlyt:

— a speciális faktor egy változónál mutat magas faktorsúlyt.

A kutatás célja határozza meg, hogy milyen típusú faktorokat kívánnafk kapni. A faktoranalízis kiválasztott technikájával olyan irányban befolyásolhatók az eredmények.

hogy azok a kívánt tipusú faktorokat mutas- sák ki. Ezek a technikák lehetnek két—tekto—

r—osalk (minden vuáltozónál egy általános és egy speciális faktort mutatnak ki), bitaikto—

niálisazk (egy általános faktor mellett több csaportfak'vort mutatnak ki) és sorta'ktonosa'k.

Az utóbbiak közé tantoznalk a diagonális technika, a centroid technika, a többcsa- portos (multiple-group) technika és a fő- t—engelyek technikája, valamint a direkt fak—

torarnal—íziis technikája.

A nem *notált faktorsúlyok matrixának ki—

számítása után felmerül a kérdés: hány fak—

tort válasszanak ki az értelmezés céljára.

Elvben az adatmatrix rangjával (többnyire a változók számával) egyenlő számú talk-tort lehet elkülöníteni. Ez azonban semmiképpen sem felel meg a fa'ktoranalrízis amn céljá—

nalk, hogy :: faktorok segítségével a vizsgált jelenséget tömören írják le. Ezért úgy jár- nak el. hogy nem veszik figyelembe azokat a faktorokat, amelyek a varianoiánalk csu- pán elenyészően kis részét magyarázzák meg. A rotálásniál tehát már csak annyi

faktort vesznek figyelembe, amennyit az elemzés céljára kívánatosnak, illetve elegen—

dőnek tartanak.

A talktoroik e számának meghatározásához azonban nincsenek elvi szabályok, csak gyakorlati irányelvek.

A faktorok számának megválasztásánál azért kivanatos óvatosan eljárni, mert túl—

ságosan kevés faktor figyelembevétele és ro—

tálása eltorzítlhatja a taktorstruuktúrát. Egyes szerzők szerint túlságosan sok fa'ktor robál-ása is hasonló torzulást okoz.

A rotálás célja, mint ismeretes, egy kívá- natosabb tulajdonságokat mutató faktorsúly- matrix előállítása.

A rotállással kapott tulajdonságoknak eredményeképpen a fallotioranalízis eredmé- nyei jobba—n értelmezhetők, minta nem rotált ta-ktorsúlym'aetrix esetében.

A rotálás szokásos módszere az ortogo—

nális notálás. Ebben az esetben (: rotált faktorok (ugyanúgy mint az eredeti nem notált faktorok) egymásra merőlegesen he—

lyezkednek el a sokdimenziós térben, más- szóval minden egyes falktor a veáltozákna'k egymástól független varianciaxjázt magyaráz—

za meg. Matematikailag kevésbé egyszerű és fogalmilag kevésbé világos a ferdeszögű rotálós, de egyes esetekben jobban leír- hatja a valóságot. Ebben az esetben a faktorok nem egymásna merőlegesek, ennek következtében a valóságnak nem egymástól független részeit írják le. A szerző szerint célszerű a konkrét kutatás—oknál mind az or- togonális, mind (: ferdeszögű rotálást kipró- bálni. A leggyalkrabban használt ortogoná- lis rotrálsáisi technika a varimax módszer.

Ferdeszögű rotálós alkalmazása esetén a ferdeszögű faktorok közötti fkorreláciákat újra fa'lotoranalízissel lehet kez-elni. lgy kop—

ják a magasabb rendű faktorokat.

Az elemzés utolsó lépése a talktorpont- számok kiszámítása lehet. Ezeket a pont- számokat többféle módszerrel lehet megha-

tározni. '

A könyv utolsó része az eredmények közlé- sével és összehasonlításával foglalkozik.

(Ism.: Andorka Rudolf)

GAZDASÁGSTATISZTlKrA

FAJANA. O.:

NlGÉRlA. A KÖOLAJ HATÁSA A FiZETÉSl MÉSLEGRE

(Nigeria. The impact of petroleum on the balance of payments.) — Intereconomics. 1975. 10. sz. 321—

324. p.

A nigériai gazdasági szerkezetben az utóbbi években bekövetkezett legjelentősebb változás, melynek következtében a bányászat

7i

az ország gazdaságának vezető szektorává lett, főleg a kőolaátermelés gyors emel—ke- desének tudható be. A napi kőo'la'jrtenmellés mennyisége az 1963. évi 0.77 millió banrel- ről 1973—rra 2 millió banrelre emelkedett, an- nak ellenére, hogy ebben az időszakban volt a hároméves polgárháború. 1974-ben a kőolaj már több mint 40 százalékos arány—

nyal szerepelt a bruttó belföldi termékben,