STATISZTIKAI lRODALMl FlGYELÓ
KU'L'FULDl STATISZTIKAI lRODALOM'
A STATl'SZ'lTlKA ÁLTALÁNOS ELMÉLETE ÉS MÓDSZERTANA MATEMATlKAl STATllSZTiKA
RUMMEL, R. J.:
ALKALMAZOTT FAKTORANALIZlS
(Applied factor analysis.) Evanston. 1970. North- Western University Press. 61l7 p.
Rummel munkája a faktoranalízis gyakor—
lati alkalmazását oly módon fcáxrgyaljra. hogy azt egy konkrét problémát vizsgáló kutató jól tudja használni.
A faktora—nalizis nagy matrixok elemzésére használható, tehát olyan esetekben. amikor számos megfigyelési egységnek sok váltom- tára vonatkozóan van—nak adataink. Ezeket a megfigyelési egységeket úgy tekinthetjük, hogy egy sokdimenziós térben helyezkednek el (amelyben anny—i dimenzió van. ahány változó szerepel a problémában). A faktor- analizis alkalmazásánál feltételezzük, hogy a megfigyelési egységek elhelyezkedése nem teljesen véletlenszerű. hanem néhány főtengely körül rendeződik. A faktonanalízis alkalmazásával meghatározzuk azt a mini- mális számú, egymástól független koordiná- ta'teangelyt. amelyek segítségével leinható a megfigyelt adatok elhelyezkedése a sokdi- menziós nemben. Minden ilyen tengelyt egy—
egy dimenziónak nevez—ünk. A kapott liaikto- nok mindegyike egy—egy ilyen dimenziót kép—
visel. _
Több ia—ktanaznalízis-model—l létezik. melyek egymástól némileg eltérnek. Ezek a modellek a következők.
1. A közösfaiktor-analizis (common factor analysis). Spearman dolgozta ki 1927-ben két faktorra, és Thurstone terjesztette ki 1935-ben több faktorra. Abból indult ki.
hogy az advamok varianoiójónok egyik részét közös faktorok magyarázzák. a másik részt viszont minden változónak egy—egy speci—
ális falktoras. A közös ta—ktorok száma kisebb
a változók számánál. Az lla-U2 matrixból indul ki. ahol R a változók közötti korrelá—
ciók metrika. U2 pedig a változók speciciitá- sának (*un—igueness) diagonális matrixa. Vagy—
is a (kiinduló matrix főá'clójóban nem egye- sek, hanem a specifitással csökkentett egye—
sek, a kommunalitások szerepel—nek. Ez ::
iaktoran—alízis eredeti modellje, ma azonban nemileg háttérbe szorul a kom-ponenslak- tor—lanwalízissel szemben.
2. Komrpon—ensfaktor—analizis (component factor analysis). Az előbbi modellel ellen- tétben ez abból indul ki, hogy nincsenek külön közös és speciális faktorok. Ezért a falktorok száma rendszerint eléri a változók számát. Az első néhány faktor azonban megmagyarázza az adatok variancia'jának legnagyobb részét, a többi faktort - aime—
lyek a varlnncixónnk csupán kis részét ma- gyanózzólk — az elemzésnél elhanyagolják.
Kiindulópontja az R korrelációs matrix a fő- ótlóban egyesekkel.
A szerző további négy újabb, ritkábban alkalmazott modellt ír le.
3. Képlalktor-amalízist (image tactor ona—
lysis) Guttman dolgozott ki 1953-ban. A kö- zösfwaikt—or-aniaiizishez hasonlóan az adatok közös vektortenével foglalkozik.
4. A Harris-féle képfáaktor—zanalizis előnye az előbbi modellhez képest, hogy független az adatok skálázásótóL
5. Kanonikuslaktor-analízis. Segítségével egy minta adataiból az egész populációban érvényesülő falkiorokna lehet következtetni.
A minta kanonikus faktora—it számítja ki.
6. Alíalaktor—analízis. Segítségével egy minta adataiból a változók univerzuimóra vonatkozóan lehet következbefhéseket levonni.
A modellek leirása után a szerző a fak- toraznxalizisben szerephez jutó matrixokkal
' A; Statisztikai Szemle 1962. júliusi szó—mától kezdődően a "Statisztikai Irodalmi Flgyelő"-bon a külföldi statisztikai könyvek és follyóinatoikkek ismertetését havonta közli.
A Külföldi statisztikai irodalom egyes fejezeteisn belül az anyag általl—ában könyv- és folyóinatoikk- ismeretesek-re tagolódik. (Ezeket * választja el egymástól.) Az ilsmertetások szerzők. illetve ahol szerző nincs, a címek betűrendje'ben következnek egymás után.
7 Statisztikai Szemle
754 STATISZT—lKAil lRODAbel ' FlGYELO
foglalkozik. Az első és leglényegesebb a korrelációs matrix. Ez egyrészt az a híd.
amelyen keresztül a kutató az alapadatok—
tól a bonyolultabb laktormatnindkihoz eljut.
Másrészt ez a matrix is — amely a vizsgá- latban figyelembe vett nagyszámú változó közötti egyszerű szorzaamamen—tum korreláci—
ós együtthatókat tartalmazza - számos ér- dekes inf-onmációit nyújt a változók közötti kapcsolatok-ról. A korrelációs matrix főótló—
jában egyesek szerepelnek (ment a változó- nak önmagával való korreláaióját jelképe- zik), közösfa-ktor-analízis esetén azonban
—— mint említettük -- a kommunalitósok kerül- nek.
A korrelációs matnixiból kiindulva a fak- toranalízis módszere először meghatározza a nem rotá—lt faktonmatrixiot. Ebben minden változót egy sor, minden laktort egy oszlop képvisel. A matrímban a faktors—úlyok vagy tenhelések (loading) szerepelnek. Ezek ::
korrelációs együtthatókhoz hasonló együtt—
hatók, kifejezik a kérdéses változó és fak-
tor közötti korreláció erősségét. A lak—tor- súly négyzete kifejezi azt, hogy a kérdéses faktor az adott változó yarianoiájának mek- kora részét magyarázza meg. Ezért, ha, (:
faktorsúlyok négyzeteit egy sorban összead- juik, megkapjuk, hogy a figyelembe vett faktorok az adott változó va—nionciájának mekkora részét magyarázzák meg együtte- sen. Ez nevezik máskép—pen kamimxunalitiás- nak. Ha (: faktorsúlyok négyzeten egy osz- lopban összeadjuk, megkapjuk a kérdéses faktor ,,ieigenvalue'Ujét. Ezek mérik a kér- déses laiktor által megmagyarázott összes varia—nciát, és a karakterisztikus egyenlet gyöikei.
A faktoranalízis eredményeként először megkapott fak-tormatrix a vizsgált adatokban levő fő tendenciákat fejezi ki. Többnyire egy különösen erős faktor emelkedik ki, amely a variancia nagy részét meg-magyarázza, és amelyre vonatkozóan többé—kevésbé minden változó meglehetősen magas faktorsúlyt mu—
tat. A lalktonanalizis alkarlmazásain—ól ezt az első faktormatrimt meg szokták változtatni.
hogy egy kívánatosabb tulajdonságokkal rendelkező, jobban értelmezhető faktorsúly- matrixot kapjanak. Erre a oétlna a rotációnak nevezett eljárást használják. A rotólt tavk- torok a nem rotált faktorok lineáris transz- formációi. A rotációnál különrféle kritériumo- kat lehet alkalmazni. A leggyakrabban hasz- nált kritérium az egyszerű struktúra kritéri- uma. E módszer maximalizálja az egyes fak- torok-hoz tartozó magas értélkű fa'ktorsúlyok számát és minimalizálja azoknak a laktam-k- no'k (: számá/t, amelyek minden változóval magas taktorsúlyokat mutatnak. Más szóval e rotációs eljárás alkalmazásával a kapott faktorok élesebben különvál—naík egymástól (más—más vóltozócsoporttal mutatnak maga—s
laktors—úlyokat), és ugyanaldkor az egyes faktorok része a teljes voriancia megmogya;
rázósóban kiegyenl—i—tetteb'bé válik, mint a nem rotált faktorsúlymatrix esetében.
A következő lépésben ki lehet számítani a faktor pontszám matrixot. Ebben a mat- rix—ban mind-en megfigyelési egység meg- határozott pontszámot kap minden egyes faktor dimenziójában. A pontszámok példá- ul kifejezik, hogy az egyes országok vagy városok milyen magasan helyezkednek el.
mennyire lejlettek az egyes laktorok által képviselt dimenziókban. például az iparoso- dottsóg. az inflrastruikturális fejlettség. a kul- turális ellátottság vonatkozásában.
A szerző a hanmadilk részben az adatok előkészítésével kapcsolatos gyakorlati kérdé- seket tárgyalja.
Az első eldöntendő kérdés: milyen ter—
mészetű választ várnak a laiktoranalrízlis al- kalmazásától. Ebből a szempontból a fülk- tonana'lizisnek tőbb-féle célja lehet: 1. nagy—
mennyiségű ada-t tömör összefoglalása (a kisebb számú faktor segitségével), 2. a vizs- gált terület struktúrájának (alapvető dimen—
zióimak) kimutatása, 3. a megfigyelési egy—
ségelk osztályozása, tipiusoklba sorolása, 4.
a változók közötti összefüggések felderítése.
A felhasznált adatok különfélék lehetnek.
Az egyetlen kikötés, hogy akkor érdemes faktoranalízist végezni, ha nagyszámú meg- figyelési egységről nagyszámú adot (változó) áll rendelkezésre.
Célszerű, hogy a megfigyelési egységek (személyek. országok vagy más területegy- ségek. megfigyelési időszakok) szá-ma na—
gyobb legyen a megfigyelt változók százmé- nál. Az adatmatrix rangja ugyanis kisebb vagy egyenlő a matrix kisebb oldalával és a m—egkü'lön-bözteiihető faktorok száma az adatmatrix rangjáva—l. Kívánatos. hogy a megfigyelési egységek száma legalább a változók számának négyszerese legyen, a szerző azonban több olyan vizsgálatot em- lít, amelyben több változót vizsgál—Mik. mint ahány megfigyelési egységük volt. A leg—
szélsőségesebb ilyen példában 82 országnak 236 jellemzőjével végeztek la-letonaaalízistt.
A szerző szerint a taktonanalízis alkalmas olyan adatok vizsgálatára, amelyeket csu—
pá-n nominális vagy ordinális skálákkal tu—
dunik mérni. ilyenkor azonban óvatosan kell értelmezni az eredményeket. Általá—ban elő—
nyösebb az intervallum-skálákon és arány- mérőskálókon mért adatokat felhasználni.
Nem követelmény, hogy a változók érté- keinek megoszlása normális legyen. A szélső- ség—esen nem normál eloszlású változók ese—
tében azonban célszerű olyan eloszlási tmnszlormáoiókat végezni, hogy közelebb ke- rüljenek (: nonmális eloszláshoz. Hasonló- képpen kivánatos lehet olyan transzformáció- kat végezni, amelyek az adatokat a ho—
STATbSZ'MKAl IRODALMI FlGYELÖ
755
moszk-edasztioitás követelményének teljesítés—e fele' közelítik.
A könyv negyedik része az elemzéssel tog'lalkazi'k. Ennek leglényegesebb témája a faktorok kiválasztása és értelmezése. A tak- toranali'zis eredményeképpen az alabbi fak- torok nyerhetők:
— az általános faktor, amely magas értékű faktor- súlyt mutat minden változó vonatkozásában. ez a faktor tehát mintegy összegezi az összes változót;
—— a csoportfoktor csupán egyes változóknál mutat magas foktorsúlyt; ha több egymást nem átfedő (vagyis más változóknól magas faktarsúlyú) csoport- faktort kapunk, akkor a változókat sikerült a talalo- roknak megfelelő dimenziókban összefogni;
—a kétpólusú csoportfaktor az előbbinek az 0 speciális változata. amely egyes változókna'l magas pozitív. más vóltozóknál magas negatív faktorsúlyt mutat:
-— (: párfaktor (doublet) két változónól mutat ma- g—axs taikrtorsúlyt:
— a speciális faktor egy változónál mutat magas faktorsúlyt.
A kutatás célja határozza meg, hogy mi- lyen típusú faktorokat kívánnafk kapni. A faktoranalízis kiválasztott technikájával olyan irányban befolyásolhatók az eredmények.
hogy azok a kívánt tipusú faktorokat mutas- sák ki. Ezek a technikák lehetnek két—tekto—
r—osalk (minden vuáltozónál egy általános és egy speciális faktort mutatnak ki), bitaikto—
niálisazk (egy általános faktor mellett több csaportfak'vort mutatnak ki) és sorta'ktonosa'k.
Az utóbbiak közé tantoznalk a diagonális technika, a centroid technika, a többcsa- portos (multiple-group) technika és a fő- t—engelyek technikája, valamint a direkt fak—
torarnal—íziis technikája.
A nem *notált faktorsúlyok matrixának ki—
számítása után felmerül a kérdés: hány fak—
tort válasszanak ki az értelmezés céljára.
Elvben az adatmatrix rangjával (többnyire a változók számával) egyenlő számú talk-tort lehet elkülöníteni. Ez azonban semmiképpen sem felel meg a fa'ktoranalrízis amn céljá—
nalk, hogy :: faktorok segítségével a vizsgált jelenséget tömören írják le. Ezért úgy jár- nak el. hogy nem veszik figyelembe azokat a faktorokat, amelyek a varianoiánalk csu- pán elenyészően kis részét magyarázzák meg. A rotálásniál tehát már csak annyi
faktort vesznek figyelembe, amennyit az elemzés céljára kívánatosnak, illetve elegen—
dőnek tartanak.
A talktoroik e számának meghatározásához azonban nincsenek elvi szabályok, csak gya- korlati irányelvek.
A faktorok számának megválasztásánál azért kivanatos óvatosan eljárni, mert túl—
ságosan kevés faktor figyelembevétele és ro—
tálása eltorzítlhatja a taktorstruuktúrát. Egyes szerzők szerint túlságosan sok fa'ktor robál-ása is hasonló torzulást okoz.
A rotálás célja, mint ismeretes, egy kívá- natosabb tulajdonságokat mutató faktorsúly- matrix előállítása.
A rotállással kapott tulajdonságoknak eredményeképpen a fallotioranalízis eredmé- nyei jobba—n értelmezhetők, minta nem rotált ta-ktorsúlym'aetrix esetében.
A rotálás szokásos módszere az ortogo—
nális notálás. Ebben az esetben (: rotált faktorok (ugyanúgy mint az eredeti nem notált faktorok) egymásra merőlegesen he—
lyezkednek el a sokdimenziós térben, más- szóval minden egyes falktor a veáltozákna'k egymástól független varianciaxjázt magyaráz—
za meg. Matematikailag kevésbé egyszerű és fogalmilag kevésbé világos a ferdeszögű rotálós, de egyes esetekben jobban leír- hatja a valóságot. Ebben az esetben a fak- torok nem egymásna merőlegesek, ennek következtében a valóságnak nem egymástól független részeit írják le. A szerző szerint célszerű a konkrét kutatás—oknál mind az or- togonális, mind (: ferdeszögű rotálást kipró- bálni. A leggyalkrabban használt ortogoná- lis rotrálsáisi technika a varimax módszer.
Ferdeszögű rotálós alkalmazása esetén a ferdeszögű faktorok közötti fkorreláciákat újra fa'lotoranalízissel lehet kez-elni. lgy kop—
ják a magasabb rendű faktorokat.
Az elemzés utolsó lépése a talktorpont- számok kiszámítása lehet. Ezeket a pont- számokat többféle módszerrel lehet megha-
tározni. '
A könyv utolsó része az eredmények közlé- sével és összehasonlításával foglalkozik.
(Ism.: Andorka Rudolf)
GAZDASÁGSTATISZTlKrA
FAJANA. O.:
NlGÉRlA. A KÖOLAJ HATÁSA A FiZETÉSl MÉSLEGRE
(Nigeria. The impact of petroleum on the balance of payments.) — Intereconomics. 1975. 10. sz. 321—
324. p.
A nigériai gazdasági szerkezetben az utóbbi években bekövetkezett legjelentősebb változás, melynek következtében a bányászat
7i
az ország gazdaságának vezető szektorává lett, főleg a kőolaátermelés gyors emel—ke- desének tudható be. A napi kőo'la'jrtenmellés mennyisége az 1963. évi 0.77 millió banrel- ről 1973—rra 2 millió banrelre emelkedett, an- nak ellenére, hogy ebben az időszakban volt a hároméves polgárháború. 1974-ben a kőolaj már több mint 40 százalékos arány—
nyal szerepelt a bruttó belföldi termékben,