• Nem Talált Eredményt

A faktoranalízis alkalmazása a statisztikai gyakorlatban

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A faktoranalízis alkalmazása a statisztikai gyakorlatban"

Copied!
24
0
0

Teljes szövegt

(1)

MÓDSZERTANI TANULMÁNYOK

A FAKTORANALIZIS ALKALMAZÁSA A STATISZTIKAI GYAKORLATBAN*

ZÁGON CSABA

A faktoranalízis mint módszer jelentős múltra tekinthet vissza a pszichológia te—

rületén. Közgazdasági alkalmazása viszonylag újkeletű.l E tanulmányban e többvál- tozós matematikai statisztikai módszernek a statisztikai gyakorlatban való alkalma- zásával, alkalmazhatóságával kívánok foglalkozni.

Jelen ismertetés természetesen nem lép fel a teljesség igényével sem a mód- szer, sem pedig az alkalmazások tekintetében. Hiszen a módszer rövid ismertetése, a modell vázlatos matematikai megfogalmazása után csupán csak egy faktoranalí- zis—programot ismertetek a KSH Számitástechnikai Igazgatóságán rendelkezésre ál- ló faktoranalizis-programok közül.2 Az alkalmazási példák köre sem teljes. hiszen csak egy részét fogja át azoknak a faktorelemzéseknek, amelyeket az utóbbi hét év-

ben az Igazgatóság számítógépén végeztünk.

A tanulmány 3. pontjában a KSH Számitástechnikai Igazgatóságon kifejlesztett Pl47FAEL faktoranalizis—program főbb jellemzőit ismertetem. Ez a főfaktor—módszeren alapul, változatosan paraméterezhető, és viszonylag gazdag grafikus ábrázolási le- hetőségekkel rendelkezik. A 4. pontban időrendben röviden ismertetem a P147FAEL

program segítségével az Igazgatóságon végzett fakto relemzéseket, majd az alkalma-

zási lehetőségek illusztrálására néhány elemzést részletesebben is bemutatok.

1. A FAKTORANALIZIS MÓDSZERÉNEK RÖVID ISMERTETÉSE

A faktoranalízis a többváltozós matematikai statisztikai módszerek közé tartozik.

Lényege abban rejlik, hogy a vizsgálni kívánt jelenségre vonatkozó információt sű- rített formában szolgáltatja, és egyúttal feltárja az adott jelenség belső törvénysze- rűségeit is.

A faktoranalízís alkalmazása révén elért információtömörítésen azt értjük, hogy az N számú megfigyelt egységre. objektumra (például: ország, város, korosztály, programfutás) mért egyenkénti n mutatóérték (azaz n valószínűségi változó egyen—

kénti N realizációja) által tartalmazott. a vizsgálni kivánt bony olult jelenségre vo-

* Ezúton is köszönetet mondok mindazoknak, akik a P147FAEL faktoranalizis—program létrehozásában, továbbfejlesztésében és alkalmazásában az adatok rendelkezésemre bocsátásával. a program továbbfejlesz- tését elősegltő konzultációkkal segítségemre voltak, és akik munkahelyemen, a KSH Számítóstechnlkai Igaz—

gatóságán lehetővé tették számomra. hogy e témával mélyebben ls foglalkozzam. Külön is köszönöm dr. An- dorka Rudolf és Csébfalví Károly támogatását. Dr. Andorka Rudolf kezdeményezte 1973-ban a program kidol- gozósát, és mind a mai napig fáradhatatlanul népszerűsíti a faktorelemzés statisztikai alkalmazását. Cséb- falví Károly a program továbbfejlesztése során irányította munkámat. és számos, matematikailag kidolgozott ötlettel gazdagította a P147FAEL program funkcionális lehetőségeit.

ifásdmócilsíerről e's alkalmazásairól lásd például (5). (6),7 . (8), (9), (11). (13).

4 Statisztikai Szemle

(2)

1 106

ZÁGON CSABA

natkozó információt oly módon alakítjuk át, hogy a figyelembe veendő adatok meny—

nyisége nagy mértékben csökken anélkül, hogy az összes információban jelentő—

sebb veszteség lépne fel, Az adatok mennyisége azáltal csökken, hogy megfigyelt

egységenként nem n mutatószám (változó) értékét kell figyelembe vennünk, hanem

csak k faktorét (hipotetikus változóét). ahol kSn, és a tapasztalatok szerint elegendő -- azaz megfelelő pontosságot ad — az eredeti változók számának egyhatodát—egy—

harmadát kitevő mennyiségű faktor leválasztása. Ez igen lényeges szempont, hiszen

abban az esetben, amikor a változók száma elég nagy (10, 20. 60, 200), a jelenség

áttekintése lehetetlenné válik, a figyelembe vett változók számának önkényes csök- kentése pedig nem jó megoldás. A faktoranalízis alkalmazásával éppen ez az önké-

nyesség küszöbölhető ki.

Természetesen ezzel a módszerrel sem kaphatunk automatikusan kész eredmé—

nyeket. A faktorok leválasz tása matematikailag ponto s módszerrel történik. de a hhoz,

hogy a faktorokat értelmezni tudjuk, hogy lényegüket kifejthessük, az adott jelensé—

get igen alaposan ismerni kell.

A faktorok értelmezése egyébként a faktoranalízis másik lényegi sajátosságá- hoz. ahhoz kapcsolódik, hogy e módszer segítségével feltárhatók a vizsgált összetett jelenség belső összefüggései. Ez legkönnyebben akkor érthető meg, ha geometriai

úton közelítjük meg a kérdést.

Az n mutatószám szerint végrehajtott N megfigyelés geometriailag N pontot jelent az n változó által képzett n dimenziós R,1 térben. A k faktor leválasztása azt jelenti, hogy ebben a térben olyan k dimenziós alteret jelölünk ki, amelynek a ten- gelyei az egymással ortogonális faktorok, és amely a legjobban közelíti az n di—

menziós térben található N pontot az eltérések legkisebb négyzeteínek értelmé—

ben. Az eredeti R,, tér tengelyei egymásra nem merőlegesek (ha azok lennének, az eredeti változók egyben az egymással kölcsönösen korrelálatlan faktorok is lenné- nek). Mit jelent a faktorok értelmezése? Azt vizsgáljuk meg, hogy melyek azok a változátengelyek, amelyek az adott faktorhoz közel esnek. Ezeknek a változóknak a tartalmából azután már következtethetünk arra, hogy milyen jelenséget takar az adott faktor, és ezzel egyúttal feltárjuk a vizsgált összetett jelenség egyik belső tör—

vényszerűségét is, hiszen a faktorok korrelálatlanok. Egy faktor megismerése, értel—

mezése egyenértékű azzal, hogy megvilágítottuk a jelenség egyik alapvető vonat- kozását, a többitől független belső összefüggését.

Jelen tanulmány a főfaktormódszer alkalmazási lehetőségeit ismerteti. A főfak—

tormódszer egyik kedvező sajátossága az, hogy az ily módon meghatározott fakto- roknak a sorrendje is hasznos információt szolgáltat, hiszen a faktorok leválasztása fontosságuk sorrendjében történik, így ismerjük azt, hogy melyik faktor mennyit ma—

gyaráz meg az adott jelenségből (pontosabban: melyik faktor mennyit ír le a muta- tók — valószínűségi változók — teljes szórásnégyzetéból). Az első faktor egy dimen-

zióban közelíti a legjobban az n dimenziós tér N pontját (a megfigyeléseket), az

első két faktor két dimenzióban stb.

lsmertetésre kerül még a varímax rotáció. Ezzel úgy forgatjuk el a főfaktormód- szerrel meghatározott faktorok k dimenziós alterét, hogy az új k dimenziós altér ,,ugyanolyan jól" közelíti az N pontot, mint az eredeti. A rögzített számú k faktor azonban most már egyenértékűvé válik, azaz a faktorok már nem fontosságuk sor—

rendjében következnek, hanem úgy épülnek fel, hogy az általuk képzett k dimenziós altér az eredeti változók n tengelyét összességében a legjobban közelítse.

A forgatás alkalmazásának főleg a faktoranalízis második lényegi szempontja szerint van jelentősége. Az elforgatott faktorok értelmezése ugyanis általában lé- nyegesen könnyebb feladat, ezek a faktorok egymástól tisztábban elkülöníthető és

(3)

A FAKTORANALlZlS ALKALMAZÁSA

1 107

önmagukban kevésbé bonyolult folyamatokat tükröznek. Ez érthető is. elegendő csak arra gondolnunk, hogy a főfaktormódszerrel meghatározott első faktor a vizsgált je- lenség alapvető irányát mutatja — ami pedig általában még mindig elég bonyolult folyamat —, a második faktor a maradék jelenség fő jellegzetességeit stb. Ha a ro-

tált faktorok értelmezése már sikerrel járt, ez zel sokszor az eredeti faktorok tartalma

is világosabbá válik.

Meg kell jegyeznem, hogy azt a módszert, amelyet e tanulmányban faktorano- lízis vagy főfaktormódszer néven említek, a szakirodalomban néha főkomponens—

elemzésnek nevezik. A főkomponens'—elemzés és a főfaktormódszer megkülönbözte- tésének az az alapja, hogy a feldolgozás kiindulását képező korrelációs matrix fő—

átlójában főkomponens-elemzés esetén 1-esek szerepelnek, a másik esetben pedig a kommunalitások becsült értékei (amelyek általában csak a k : n esetben érik el az 1 értéket)? A

kommunalitások becslése iteratív úton. többszöri. valamely fel- tétel szerint megadott pontosságig történő faktoranalízis—futásokkal megy végbe. Kí—

sérleteztem ilyen iterációs eljárásokkal, de a megfelelő pontosság (kb. 0,01—-0,1%) csak meglehetősen nagyszámú iterációval biztosítható. Az iterációs lépések száma erősen függ a kezdőértékektől is.

Nagyszámú változó esetén az iterációs eljárás bizony tetemes gépidő—fel- használást igényel. Emellett nem vagyok meggyőződve arról. hogy egyáltalán érde—

mes—e a faktormatrixot a kommunalitásoknak a főátlóba történő behelyettesítésével állítanunk elő, hiszen ennek nincs lényeges hatása a faktorkép alakulására. Hatása ugyanis mindössze annyi. hogy ,,kisimítja" a másodlagos faktorokat, azaz csökkenti azoknak egy-egy meghatározó jellegű változóval való korrelációját. Ez a jelenség úgy is megfogalmazható, hogy a főkomponensek az egyes változók egyediségének egy részét is tartalmazzák. míg a faktorok kimondottan csak a kommunalitást. Vélemé—

nyem szerint azonban az, hogy a közös faktorokat egyediségük egy részével együtt értelmezzük. nem rontja annyira becsléseinket, hogy amiatt indokolttá válna az ese—

tenként jelentős időigénnyel járó iterációnak az elvégzése. Ennek a ..pontatlanság- nak" csak a faktoranalízis második szempontja — a minőségi elemzés -— szerint van jelentősége. ebben az esetben pedig az, hogy a faktormatrix értelmezésekor erre a jelenségre is tekintettel legyünk, könnyen megvalósítható.

2. A FAKTORANALlZlS-PROBLÉMA

VÁZLATOS MATEMATIKAI MEGFOGALMAZÁSA

Legyen adott egy (NXn)—es adatmatrix, az X matrix, amely az N objektumra vonatkozó. n ismérv szerinti megfigyeléseket tartalmazza. Ezek a megfigyelések fel—

foghatók úgy, mint n valószínűségi változónak az egyenként N megfigyelt értéke.

Ezekről a valószínűségi változókról feltételezzük azt, hogy normális eloszlásúak. (Ha

ez a feltétel nem is minden esetben teljesül, a főfaktormódszer alkalmazása azért hatékony marad.)

Legyen Z a standardizált (NXn)-es ada'tmatrix. A standardizálás a következő—

képpen történik:

zi! : 23133; (I

) sj

21.2,...,N)

/1/

3 A főkomponens-elemzés végrehajtása egyszerűbb, hiszen nincs szükség a kommunalitások lterotív becs- lésére (azaz ismételt —— időigényes sajátérték-számításokra). Eppen egyszerűbb algoritmusa miatt a gyakor- latban általában ezt a módszert használják. Az irodalomban a főkomponens-elemzés helyett gyakran a .,fő- faktor-módszerrelkalmaztam. de főfaktormódszemektörténő faktorelemzés"vagy csakkifejezéstfaktoreiemzésnekhasználják. Munkámbannevezem. én is a főkomponens—elemzést ol-

,"

(4)

1 108

ZAGON CSABA

ahol:

__ 1 N X

x:w ,

' N Ig "

2 1 N, _.

S-z—w— X —-X 2

' N—1l:21('j ')

A standardizált értékek á tlaga 0, szórása l.

A A faktoranalízis kiindulópontját képező (an)-es korrelációs matrix megható—

rozósa a következő képlet szerint történik:

1

R :: —- Z*Z,

N m

ahol Z" a Z matrix transzponóltja. Az R matrix kvadratikus. szimmetrikus, főótlójóban 1-esek vannak.

Legyen Z, (] : 1. 2, . . ., n) a valószínűségi változó. Ezeket a változóka t egymás—

sal korrelóltaknak tételezzük f el. A meghatározandó fakt orok viszont már korrelólat —

lanok. A faktorok típusai:

— közös faktorok (Fj :i : 1, , ..., k).

-— specifikus faktorok (S, ; í :: 1, 2, ..., n), - hibafaktorok (E,- : i : 1, 2. .... n).

A specifikus faktort és a hibafaktort célszerű egy faktorba öszevonni, ezt Uj —vel (i : 1. 2. . . n) jelöljük, és szintén specifikus faktornak nevezzük.

Az eredeti változók és a faktorok közötti összefüggés a következő:

k

.

Zi : § aiiFi'l'bjsj'l —cjf'i' /3/

vagy

k

ZJ:_E10jiFfl'ajUj (í: 1.2. ...,n)

/4/

,:

Az a]; és a,- együtthatók azok, amelyeket a faktoranalízis alkalmazásakor meg-

hatórozunk. Az aj; faktorsúlyoknak (nXk) méretű A matrixót faktormatrixnak ne—

vezzük.

Legyen a* a specifikus faktor együtthatóinak sorvektora, F a közös faktorok (NXk) méretű matrixa,4 U pedig a specifikus faktor (NXn)—es matrixa. Képezzünk (x'-ból egy diagonális matrixot. az S—t. Ily módon a /4/ összefüggés a következő for—

mara irható ót: '

z : F-A*—§—US /5/

l2/-ből és /5/—ből következik. hogy

, 1 _

R a W Z*Z :: AA*—l—52, [6/

* Pontosabban: F a közös faktorok szerinti N közvetett megfigyelés matrixa. Ugyanez vonatkozik U—ro is.

(5)

A FAKTORANALlZlS ALKALMAZÁSA

1109

Mivel a faktorok a feltételezés szerint korrelálatlanok:

1

—— F*F :: E, N

1

—U*U:E, N

U*F : F*U : 0,

ahol E az egységmatrixot jelöli.

A kommunalitósok:

2 k 2 _

hj:_210ji (I"—"1l20--'rn) [7/

,:

Mivel ló/ alapján igaz a következő összefüggés:

k 2 2 _

Baji—j—ajz1 (]:1,2....,n)

í:1

a specifikus faktor hozzájárulása a változók teljes (egységnyi) szórásnégyzetéhez a következő:

k 2

a::1—igajiz1—hí (i-——1,2...n) /8/

Ha feltételezzük azt, hogy a specifikus faktor elhanyagolható —— és ez k alkal—

mas megválasztásával biztosítható --, akkor a /6/ összefüggés alapján a következő

közelítő egyenlőség írható fel (ezen közelítő egyenlőség megengedése jelenti tulaj—

donképpen az átmenetet a faktoranalízis-modellről a főkomponenselemzés-moclell- re):

R : AA* /9/

A faktoroknak az egyes Z; változók h,-2 kommunalitásához való hozzájárulását a megfelelő faktorsúlyoknak a négyzetei (ag) jelentik. Tehát az egyes faktoroknak a jelenség egészéhez való hozzájárulását a következőképpen határozhatjuk meg:

He: Égi; (i:1,2,....k). /10/

A főfaktormódszer szerint a faktorok meghatározása úgy történik, hogy az egy- más után következő faktoroknak a hozzájárulása (H,) rendre maximális legyen. Ez a feladat egy sajátérték-problémának a megoldását jelenti. Ahhoz, hogy az F1 fak—

tor hozzájárulása maximális legyen, a következő összefüggésnek kell fennállnia:

n

11 : Hl : E' 0121,

,:

ahol 11 az R korrelációs matrix maximális sajátértéke.

Ha v1 a % sajátértékéhez tartozó normált sajátvektor, azaz:

va :: Álvl és Vf! : 1 ,

A M :

!

(6)

1 1 10 ZAGON CSABA akkor

% "; WZ Vn-

Általánosságban:

" 2

azaz-iga]? (iz1,2,...,k) m/

,:

és

A : V?112 112,

ahol:

P —- az Rmatrix k legnagyobb sajátértékéből képzett (ka) méretű diagonális matrix (a sajátértékek nagyság szerinti sorrendben következnek),

V — a sajótértékekhez tartozó normált sajótvektorokból felépített (nXk) méretű matrix.

Az. hogy az

R1 : R——a1 a';

matrix maximális sajátértéke (12) az R korrelációs matrixnak is sajátértéke, a követ- kezőképpen bizonyítható:

R1 a2 : R nana1 ai; az,

tehát

R :2 : 22 :.2 ,

mivel

RlazalzaZ és aíaza .

Ugyanígy bizonyitható bármely 2; (i : 1, 2, . . . , k) sajátértékről az, hogy az az

eredeti R matrix soron következő maximált sajótértéke (az R: maradék matrix min—

den egyes sajátértéke az R matrixnak is sajátértéke).

A sajátérték—probléma megfelelő megoldásához -— ahhoz, hogy a sajátértékek nem negatívak, és a hozzájuk tartozó sajátvektorok ortogonálisak legyenek — általá—

ban elegendő az, hogy R pozitív semidefinit legyen, ami a gyakorlatban szinte min-

dig teljesül. *

A vizsgált jelenséget meghatározó fő jellemzőket, azaz a faktorok hozzájáru—

lását. a faktormatrixot és a kommunalitásokat az

(R—ÁE)v : o [13/

sajátérték—probléma megoldásával meghatároztuk (/5/, /7/, /10/). A kommunalitá-

soknak a korrelációs matrix főótlójába történő behelyettesítésével innen folytathat-

nánk az iterációt addig, amíg a kommunalitások nem stabilizálódnak.

A varimax módszer alkalmazásakor a kvadratikus normált faktorsúlyok szórás- négyzetét maximalizáljuk, azaz a következő kifejezést:

n § % [fil—Y— § [2 (Én? /14/

í:1j:1 hj ;:1 jz1 hr

(7)

A FAKTORANALlZIS ALKALMAZÁSA 1 1 1 1

Ehhez k(k—1)/2 rotációt kell végrehajtanunk annyiszor, ahány iteráció a /14,/ kife-

jezésnek a maximum közelében való stabilizálódásóhoz szükséges. Ha ez megtör—

tént, az iterált faktorsúlyok normáltságának (: megszüntetésével (a kommunalitó- sokkal való beszorzásukkal) megkapjuk a rotált faktormatrixot.

Az F matrix meghatározása az /5/ képletolapjón a /9/ összefüggés és a saját—

vektorok ortogonalitása figyelembevételével a következőképpen történik:

F : zm—1 /15/

Az ; faktorpontszámokat5 a következő összefüggés szerint határozzuk meg:

; : zv /16/

A /12/ összefüggés alapján igaz a következő:

§: rpm /17/

azaz az így meghatározott pontszámok az egyes faktorok szerint F megfelelő osz- lopaitól csak egy szorzó'tényezőben (a megfelelő sajátérték négyzetgyökével) külön—

böznek. ami a faktorok szerint kapott ,,etpszlástérképekre" semmiféle hatással nincs.

A P147FAEL program lehetőséget nyújt a rotált faktormatrix szerinti (a /15/ ösz- szefüggéshez hasonló módon meghatározott) eloszlástérképek grafikus ábrázolá- sára is. Ez azonban az adott jelenségről általában kevésbé szemléletes képet ad a megfigyelt objektumoknak az eredeti faktortengelyek körüli sűrűsödése miatt. ezért ezzel a lehetőséggel ritkc'm éltem.

A faktorelemzésnek más többváltozós matematikai statisztikai módszerekkel való együttes, kombinált használatára nem térek ki. hiszen ez nagy, önálló téma, de a faktorpontszámokkal kapcsolatosan annyit azért megemlítek. hogy a klaszter—

elemzés kiinduló adatait gyakran a faktorpontszámok képezik.

3. A P147FAEL FAKTORANALlZlS-PROGRAM FÖBB JELLEMZÖI

A P147FAEL faktoranalízis-program FORTRAN nyelven íródott. moduláris szer- kezetű. A program a főfaktormódszeren alapszik, és a faktorok rotálósára a vari- max rotációt alkalmazza. A program első változata 1973—ban készült el, végleges- nek mondható mai alakját pedig — folyamatos bővítések. módosítások után — 1975—

ben alakítottuk ki. A bővítésekkel a módszer is gazdagodott, különböző ábrázolási technikák váltak elérhetővé. és sor került a program szabad paraméterezhetőségé—

nek a kialakítására is.

A P147FAEL program alapvető funkciói a következők:

— paraméter-értelmezés,

— adatelőkészités és iteráció—szervezés,

— faktoranali'zís,

— grafikus megjelenítés,

nyomtatás.

A következőkben e programfunkciókat ismertetem részletesebben.

5 A faktorpontszómok dimenzió nélküli, közvetetten mért értékek (hiszen a faktorok az eredeti változók lineáris kombinációi). Azaz a faktorpontszómok az adott objektum faktor szerinti helyét határozzák meg: ha egy objektum pontszáma magasabb. akkor az az objektum az adott faktor tekintetében átlag feletti. vagyls erre az objektumra az adott faktor nagyon jellemző. e faktor szerint az objektumnak magas értéke van. A faktorok elvileg mérhetők is lehetnének. ebben az esetben a foktorpontszámokat (mért értékeket) közvetlenül

lehetne elemezni.

(8)

1 1 12 ZAGON CSABA

1. Paraméter-értelmezés

A P147FAEL program inputjaként néhény kötelező paramétert (például a mu—

tatók számát) kell megadni, valamint a 25 további paraméter közül csak azokat, amelyeknek alapértelmezése az adott esetben nem megfelelő.6

Egy paraméter-csoport megadásával egy feldolgozást vezérlünk. A P147FAEL program inputjaként tetszőleges számú paraméter-csoport megadható, azaz egy fu—

tásban több, egymástól független feldolgozást is végezhetünk. Sőt, az egyes feldol- ,

gozc'rsok önmagukban is több faktorelemzést jelenthetnek (lásd a 2. pontban: ite— —

ráció-szervezés).

A feldolgozások alapvetően két csoportba sorolhatók:

— kiindulási feldolgozásokra, azaz olyan elemzésekre, amelyeknél a vizsgálni kívánt je- lenségről még nincs információnk, tehát minden lehetséges adatot igyekszünk beszerezni;

— elemző feldolgozásokra, amelyeknél elképzeléseinknek megfelelően és a mór felhal—

mozódott ismeretek birtokában különféle változatokban tovább elemezzük az adott jelenséget.

E csoportosítósnak megfelelően a paraméterek alapértelmezéseinek is két cso—

portja van. Megkülönböztetünk kiindulási alapértelmezéseket és elemző alapértel-

mezéseket. A program egyik kötelező*paraméterének7 a megadásával döntjük el

azt. hogy melyik alapértelmezés-csoportot választjuk. Sok esetben ez elég is a fel- adat specifikólásához, azaz a paraméterek konkrét megadása (felülírása) szükség—

telen.

A végrehajtott faktorelemzésekre általában az volt jellemző, hogy egy kiindu—

lási feldolgozást több elemző feldolgozás követett.

2. Adatelőkészítés és iteráció-szervezés

Adatelőkészítésre általában a kiindulási feldolgozások esetén van szükség,

iteráció—szervezésre pedig az elemző feldolgozásoknál.

Az adatelőkészítés egyes munkafázisai a következők:

% M— adatbevitel (bináris vagy karakteres input).

— standardizólós.

— a korrelációs matrix vagy a kovariancia matrix (hiónyos adatok esetén) kiszámítása, Az iteráció-szervezésnek (azaz a többszöri faktorelemzések szervezésének) le- hetséges módjai a következők:

-— a kommunalitásoknak a korrelációs matrix főátlójába való iteratív bevitele (megadható az iterációk maximális száma és az az a pontosság. amellyel a kommunalitásokat stabilizálni kívánjuk).

— a figyelembe vett változók (mutatók) körének a bővítése és (vagy) szűkítése a kom- munalitósokra megadott feltétel szerint,

— a figyelembe vett objektumok körének a bővítése és (vagy) szűkítése.

Az iteráció—szervezés fenti módjai értelemszerűen kombinálhatók egymással.

Ezenkívül lehetőség van arra is, hogy a P147FAEL program soron következő futta- tásakor az előző futós adataiból (illetve eredményeiből) induljunk ki, azaz folytat- hatjuk a félbeszakadt iterációt. De olyat is megtehetünk például, hogy utólag ki—

nyomtatjuk egy korábbi futós tárolt, de ki nem nyomtatott eredményeit.

" A P147FAEL program részletes paraméterezési leírását lásd (7)—ben.

7 A P147FAEL program kötelező paraméterei a következők: a feldolgozás szöveges megnevezése, a mu- tatók száma, az objektumok száma, az alapértelmezés-csoport megnevezése, a módosítandó paraméterek (po—

raméter—alapértelmezések) szóma.

(9)

A FAKTORANAUZIS ALKALMAZÁSA

1 1 13

3. Faktoranalízís

Faktoranalízisen a korrelációs matrix sajátértékeinek és sajátvek'torainak a meghatározását, valamint a faktormatrix kiszámítását és varimax-módszerrel történő forgatását, továbbá a faktorpontszámok meghatározását értem.

A sajátérték-számítás a P147FAEL program legidőigényesebb része.

4. A grafikus megjelenítés

Kirajzolható két tetszőleges mutató síkjában az alapadatok eloszlástérképe vagy pedig az, hogy egy-egy mutatót értékkategóriánként milyen előfordulási szá- mok jellemeznek. A megjeleníteni kívánt mutatók, illetve mutatópárok paraméter—

ben adhatók meg, de kérhető az is. hogy a diagramok minden mutatóra. illetve a térképek minden mutatópárra megjelenjenek.

Kirajzolható a megfigyelt objektumoknak a faktortérben való elhelyezkedése.

Pontosabban: a program az egyes faktorpárok síkjában rajzolja ki az objektumok elhelyezkedését a faktorpontszámok alapján. Az objektumok egyedi vagy csoportos azonosítására egykarakteres objektumazonositók adhatók meg, a térképen ezek a jelek kerülnek kinyomtatásra. Faktortérképek kérhetők az összes leválasztott faktor egymás közötti összes kombinációjára, de megadhatók az ábrázolni kívánt faktor—

párok is. Az ábrázolás történhet a sajátvektorok, illetve a faktorok terében, de a rotált faktorok terében is. A sajátvektorok, illetve a faktorok esetében az ábrázolt kép azonos, csak a skálabeosztás különböző. Paraméterezhető a programban az is, hogy a kért faktortérképek hány példár'lyban készüljenek el.

Mutatónként ábrázolhatjuk az alapadatok és a számított értékek közötti eltéré—

sek eloszlását. A számított érték a faktormodell alapján az objektumot jellemző ér—

ték. Dimenziója megegyezik az alapadat dimenziójával. Minél több faktort válasz-

tunk le a faktorelemzés során, a számított értékek elvileg annál jobban megköze-

lítik az alapadatokat. Az alapadat és a számított érték közötti eltérés az adott ob- jektum egyediségeként is felfogható. Paraméterezhető a programban az, hogy mi—

lyen kommunalitás—érték alatt kérjük a mutatónkénti eltérések eloszlásának kiraj- zolását.

5. Nyomtatás

A program a tradicionális faktoranalízis—eredményeket nyomtatja ki, azaz a következő adatokat: átlagok és szórások, korrelációs matrix, sajátértékek és a saját—

értékek kumulatív százalékai, sajátvektorok, faktormatrix. rotált faktormatrix, faktor- pontszámok.

4. A VÉGREHAJTOTT FAKTORELEMZÉSEK ÁTTEKlNTÉSE

A következőkben röviden ismertetem azokat a faktorelemzéseket, amelyeket a KSH Számítástechnikai Igazgatóságon az 1973—1979. években a P147FAEL prog-

ram segítségével végeztünk el.

A végrehajtott faktorelemzésekről általánosságban elmondhatjuk, hogy min—

den tekintetben igen különbözők voltak.'A vizsgált jelenségek szerint többek között a következő területekről dolgoztunk fel adatokat: országok. városok, iparágak, vál-

lalatok, községek társadalmi és gazdasági fejlődésének a mutatói; a bűnözés ala-

kulását szemléltető korosztályos adatok; a történeti Magyarország kulturális fejlett—

ségi színvonalát tükröző adatok; a szülő és a sportoló nők testméretei; az árindexek

(10)

1114

ZÁGON CSABA

alakulása; a számítógépünkön végrehajtott futtatások fontosabb jellemzői stb. A

feldolgozott adatok másik két fontosabb jellemzője a megfigyelt objektumok száma és a figyelembe vett ismérvek száma. Az egyes feldolgozások során az objektumok

száma néhány tíz és több ezer, az ismérvek száma pedig 5 és 72 között változott.

Az adatok túlnyomó többsége kimondottan faktoranalízis elvégzése céljából érke-

zett be hozzánk a Központi Statisztikai Hivatal egyes főosztályoitól és más szervek-

től. de néhány más feldolgozás adatain is kipróbáltuk a módszer nyújtotta lehető-

ségeket.

A felhasznált program az évek során természetesen változott, és mind több ,.ki- egészítő szolgáltatást" nyújt. Az egyes programfutámk gépidőigényéről általános—

ságban az mondható el, hogy az az objektumok számától alig, a változók számától viszont nagy mértékben függ. A faktoronalizis időigényes lépése a sajátértékek meg—

határozása -— 10 ismérv esetén 10 másodpercnél kevesebb, 60 változónál viszont már 4—5 percnyi CPU—időt8 igényel az igen gyors lBM—370/155—ön is -. ehhez ké-

pest a korrelációs matrix meghatározásának vagy a varimox rotáció végrehajtásá-

nak az időigénye minimális. Ezek az időadotok természetesen nem egy teljes feldol- gozásra vonatkoznak, hiszen az általában több lépésből áll, sőt a program lehető- séget nyújt arra is. hogy a valamely szempont szerint végrehajtott ..iterációs faktor- analízis" több programfutással menjen végbe, amikor is az egyik futás eredmé- nyeinek az értékelése után dönthetünk arról, hogy érdemes-e folytatnunk az iterá—

ció't, vagy pedig — az alkalmazott eljárás lassú konvergenciája miatt — nem. (Foly- tatás esetén természetesen a már végrehajtott iterációs lépéseket nem kell meg- ismételnünk.) Több futásra lehet szükség akkor is, ha a közbülső számítások ered—

ményei több helyet igényelnek, mint amennyi a mágneslemezen rendelkezésre áll.

Mielőtt felsorolnám az 1973—1979. években végrehajtott faktorelemzéseket.

megjegyzem. hogy még a megrendeléses munkák többsége sem puszta program—

futtatás volt, hiszen az esetek többségében módszertani segítségre, a lehetséges

változatok ,,felkinálására" is szükség volt. És ez így természetes. hiszen ezt az idő- szakot mindenekelőtt az jellemezte. hogy a foktoranalizis alkalmazásában kezde—

ményező szerepet kellett betöltenünk.

A végrehajtott faktorelemzések Cl következők voltak. (Egyes feldolgozásokról a következő fejezetben részletesebben is szólok.)

1. Magyarország települései fejlettségének vizsgálata régiónként

A munkát. amely a KSH Számítástechnikai lgazgatóságán az első faktoranalí—

zis volt, a Társadalomstatisztikai főosztály rendelte meg. Voltaképpen ez a meg- rendelés volt a kezdeményezője a P147FAEL program kidolgozásának.

Az első régió (Dél-Alföld) adatainak feldolgozására 1973—ban került sor. 'A te—

lepülések száma 258 volt, a mutatók száma pedig 59. A mutatókat és a faktorana—

lizis eredményeit 1974-ben a torontói Szociológiai Világkongresszuson dr. Andorka

Rudolf, a kutatás irányítója ismertette.9 A további régiók faktoranalízise folyamato—

san történt, évente átlagosan egy régió került feldolgozásra. (E feldolgozásokról részletesebb információ (1)—ben és (2)-ben található.) Az objektumok (települések)

száma régiónként 200 és 900 között mozgott, az 59 mutató végig ugyanaz volt. Az

utolsó feldolgozás befejezése 1979—ben várható, ezután sor kerülhet a Magyaror—

szág egészét (több mint 3000 objektum) átfogó faktorelemzésre is.

s A CPU (Central Processing Unit) a központi egység. A CPU-idő az adott program végrehajtási ideje, az az idő. amit a központi egység ténylegesen a program végrehajtására tordít (nem futó ára szerinti idő).

9 A bemutatott dolgozat cime: Analysis of development of villoges and towns in Hungary by factor analysis.

(11)

A FAKTORANALIZIS ALKALMAZÁSA 1 1 1 5

2. Magyarország 65 középfokú központja fejlettségének vizsgálata

E feldolgozást (: Központi Statisztikai Hivatal Területi Statisztikai főosztálya

rendelte meg. (A Területi Statisztikai főosztályon a munkálatokat Hargitay Dániel

irányította.) A feladat 65 város 36 mutató szerinti adatainak különféle változatokban

történő faktoranalizise volt. A feldolgozás 1973-ban készült el.

3. Bűnözési adatok korosztályos elemzése

A feldolgozást a Központi Statisztikai Hivatal Társadalmi Szolgáltatások Sta—

tisztikai főosztálya kérte. A feldolgozandó adatok, amelyeket dr. Kovács Péterné állitott össze, idősoros adatok voltak, korosztályos bontásban (110 objektum, 7 mu- tató). A faktorelemzés 1973—1974-ben ment végbe.

4. Hét szocialista ország népgazdaságának fejlődése

A feldolgozást 1974—ben a P147FAEL program továbbfejlesztése, alkalmazási

lehetőségeinek tanulmányozása céljából végeztem. Az idősoros alapadatok a KSH

Gazdaságkutató Intézettől származtak (133 objektum, 12 mutató).

5. Száz ország gazdasági fejlettségének vizsgálata

E feldolgozásra 1974-ben a KSH Számitástechnikai Igazgatóság kezdeménye- zésére, Csébfalvi Károly elgondolása alapján került sor. Az adatok a KSH Gazda- ságkutató Intézettől származtak. Az egyes országok adatai a következők voltak: te- rület, népesség. a teljes nemzeti jövedelem, valamint annak az egyes szektorokra eső részei. továbbá a feldolgozó ipar, az export és a beruházás adatai. A népes- ség- és a nemzetijövedelem—odatokat két időpontra is megkaptuk. ami az abszolút adatokon (100 objektum. 14 mutató) alapuló elemzés mellett azt is lehetővé tette.

hogy az országok időbeli fejlődését közvetlenül is elemezzük (országonként 2, ösz- szesen 200 objektum, 5 mutató). Igy az országok időbeli fejlődése, mozgása a fak—

tortérképeken közvetlenül is ábrázolható volt.

6. Magyarország iparának iparágankénti idősoros elemzése

A feldolgozást 1975-ben a KSH Gazdaságkutató Intézet által rendelkezésemre bocsátott adatokkal készítettem el. Az egyes iparágak fejlődését a következő muta- tók jellemezték: termelés. gépi berendezések, munkaóra, eszközhatékonyság, terme- lékenység. Mind az öt mutató relatív mutató volt, és az adatok 23 iparágat és 13 évet fogtak át (azaz a megfigyelések száma 299 volt, a mutatószám pedig 5). Két faktor jól leírta a jelenség egészét: az első faktor egyenesen korrelált a termeléssel, a ter—

melékenységgel és a munkaóra-ráfordítással, a második faktort pedig az eszközha—

tékonyság és a gépi berendezések egymással ellentétes korrelációja jellemezte. Ily módon a két faktor terében készített faktortérképen jól meg lehetett figyelni az egyes iparágak időbeli ,,viselkedését", vagyis azt. hogy mely iparágak fejlődnek egy—

mással azonos módon. mely iparágak stagnálnak stb. ' 7. lndexsorok faktoranalízise

A munkát a Központi Statisztikai Hivatal Társadalomstatisztikai főosztálya ré-

szére 1975—ben végeztem, Vita László (12) elgondolása alapján. A faktoranalízis 16X16—os matrixok (16 objektum, 16 mutató) feldolgozását jelentette.

(12)

1 1 16 ZÁGON CSABA

8. A szülő és a sportoló nők testme'retadatainak elemzése

A feldolgozást 1975-ben a KSH Számitástechnikai lgazgatóság az Eötvös Loránd Tudományegyetem Antropológiai Intézetének adatai alapján készítette (az Antropo- lógiai Intézetben a kutatómunka irányítója dr. Eiben Ottó volt). Az alapadatok kü—

lönféle sportágakban aktivan sportoló nők, illetve a szülő (fertilis) nők testméretada- _

tai voltak. Összesen 733 nőről egyenként 28 testméretadat állt rendelkezésre.

A 28 mutatót a 4 leválasztott faktor szinte tökéletesen megmagyarázta, de már 2

(testsúly és testmagasság—jellegű) faktor is jelentős mértékben megmagyarázta az

adott jelenséget. A szülő nők a sportoló nőktől jól elkülönültek, sőt a sportolók—

nál az egyes sportágak szerint is többé-kevésbé határozott csoportok voltak megfi—

gyelhetők. A faktoranalízis eredményei megerősítettek bizonyos korábbi következ- tetéseket. (Lásd (ID—ben.)

9. lparstatisztikai adatok faktoranalízise

A munkát 1975-ben végeztem a KSH Számitástechnikai lgazgatóság kezdemé- nyezésére, az adatok a Központi Statisztikai Hivatal alparstatisztikai főosztályától származtak. Az alapadatok iparcsoportos bontású idősoros adatok voltak, és ipari termelési függvények készítésére szolgáltak. Az öt mutató közül kettő hiányos ada- tokat tartalmazott, faktoranalizis segítségével e hiányzó adatokat igyekeztünk pó- tolni a kovariancia—matrixon alapuló számítások segítségével, A megfigyelt objek—

tumok száma 276 volt.

10. A XIX. századi iskolázás fejlődése Magyarországon

A feldolgozás 1975—ben a KSH Könyvtár és Dokumentációs Szolgálat adatai- nak felhasználásával készült. (Az adatokat dr. Fügedi Erik rendezte.) A faktorana- lízist két alapváltoza'tban végeztem el.

Az első változat az 1869. évi hivatalos magyar iskolastatisztika olyan megyei

adataira támaszkodott, mint az iskolák száma, a tanulók száma (nemek szerint és két korosztályra), valamint a ténylegesen iskolába járók száma (nemek szerinti meg—

oszlásban). Ebben az esetben az objektumok száma 80 volt, a mutatók száma pedig 15, illetve 9 (utóbbi esetén a mutatók közül kihagytam a tanulók száma összesen adatot).

A második változatban az alapadatok az 1881. évi népszámlálásból származ-

tak. Megyékre és városokra voltak korosztályos nemek szerinti adatok a lakosság írni—olvasni tudásáról (ír—olvas, olvas. nem ír és nem olvas). Itt az objektumok szá—

ma 109 volt. a mutatók száma pedig 18. illetve 6. A 18 mutatós változat a muta- tók időbeli elemzésére adott elsősorban lehetőséget (például a nők írni—olvasni tudásának színvonala körülbelül két évtizedes késéssel követte a férfiakét), a 6 mu—

tatós változat pedig elsősorban az objektumok fejlődésének vizsgálatára volt alkal—

mas. (A faktortérképek jól szemléltették például a megyék .,mozgását", a városok

és egyes iskolázottabb megyék elkülönülését.)

11. A programfutások főbb jellemzőinek elem-zése

Az elemzés elvégzésére 1976—ban került sor lgazgatóságunkon. (A szükséges adatokat Papp lmre állította össze.) A vizsgálat során összesen 19 ismérvet vettem figyelembe. Az ismérvek többsége eleve számszerű volt. például: a felhasznált CPU—

(13)

A FAKTORANALIZIS ALKALMAZÁSA . 1 1 17

idő, a start—stop idő.10 az időkihasznóltsági mutató, az abendes idők (sikertelen

futtatás) stb., néhány ismérv viszont nem számszerű, de valamilyen módon számsze—

rűsithető fogalom volt, például: job—osztály. abend—kód stb.

A különböző típusú ismérvek együttes használata mellett az is érdekessé tette a vizsgálatot. hogy a megfigyelt objektumok száma viszonylag nagy volt (2635 prog-

ramfutós).

12. A Nógrád megyei települések fejlettségének vizsgálata

Az elemzést 1977-ben végeztem el a Központi Statisztikai Hivatal Nógrád me- gyei Igazgatósága számára. A felvételben 132 település szerepelt, a mutatók szá-

ma pedig 58 volt.11 A faktorelemzéseket klaszter-elemzések követték.12

13. Az alföldi városok fejlettségének vizsgálata

A munka 1978-ban a Központi Statisztikai Hivatal Szolnok megyei Igazgató—

sága megrendelésére készült. A vizsgálat tárgyát 34 alföldi város adatai képezték.13

Az elemzés két lépésben történt. Az első változat 17 mutató összefüggéseit vizsgálta. A faktoranalízís eredményei alapján az első változat mutatói közül 7-et elhagytunk, helyettük 10 új mutatót vontunk be a vizsgálatba (például az 1899 előtt épült lakások aránya helyett a lakásállomány változása 1960 és 1976 között, az ezer lakosra jutó televízió-előfizetők száma helyett az egy lakosra jutó könyvvásórlós értéke és az ezer lakosra jutó színházi látogatók száma stb.). lgy a második válto—

zatban 20 mutató elemzése történt meg. A faktorelemzéseket klaszter-elemzések kö- vették (a klaszter-elemzés inputját a faktorpontszámok képezték, azaz a klaszter- elemzés mutatói a faktorok voltak).

14. A Pest megyei kiemelt települések fejlettségének elemzése

Az elemzést 1978—ban végeztem el a Központi Statisztikai Hivatal Pest megyei

Igazgatósága számára. A felvétel Pest megye 114 települését fogta átl/*

A faktorelemzés két változatban történt. az első változatban 41 mutatóval, a második változatban pedig 42 mutatóval (ebből 37 mutató megegyezett az első vál- tozat mutatóival). A faktorelemzéseket klaszter-elemzések követték.

15. Kísérlet 36 ország gazdasági fejlettségi szintjének összehasonlítására

A munkát 1978—ban végeztem el a Központi Statisztikai Hivatal Közgazdasági főosztályának kérésére. A faktorelemzés 36 ország 35 mutatójón alapult. A vizsgálat előkészítését. az adatok ismertetését és az eredmények értékelését dr. Szilágyi

György végezte (10).

10A start—stop idő a program óra szerinti végrehajtási ideje (az az idő, amíg a program (: ,.szómítógép- ben tartózkodik"). Ez általában sokszorosa a CPU-időnek ami a központi egység tényleges használati ide- je —, hiszen a program különböző okok miatt gyakran ,,várakozik" (adatokra vár, éppen más programok aktívak stb.).

11 A vizsgálat eredményeit dr. Instítórisz Andrásné ismertette .,Az urbanizációs folyamatok statisztikai vizsgálata Nógrád megyei adatok alapján" c. előadásában az MKT Statisztikai Szakosztálya Területi Statisz- tikai Szekciójának 1978. évi győri ülésén.

( )b 12A klaszter—elemzést -— a később említetteket is -— Csicsman József végezte el. (A módszer leírását lásd 3 an.)

13 Az eredményeket dr. Lukács Pál ismertette az MKT Statisztikai Szakosztálya Területi Statisztikai Szek- ciójának 1978. évi győri ülésén .,Az urbanizáció és a lakosság kulturális szinvonalának összefüggése az alföldi

városokban" c. előadásában.

14 Az eredményeket Kerekes Jánosné dr.; Csóka Rozália és Kocsis Istvánné ..Az urbanizációs folyamat statisztikai vizsgálata Pest megyei péidák alapján" c.. az MKT Statisztikai Szakosztálya Területi Statisztikai Szekciójának 1978. évi győri ülésén elhangzott előadása foglalta össze.

(14)

: r 18 ' ZAGON CSABA

16. A piacközpontok elemzése

Az elemzést 1978—ban végeztem el a Budapesti Történeti Múzeum számára. Az

alapadatok a történeti Magyarország 138 piacközpontját jellemezték. A mutatók száma 59 volt. Faktoranalízis két alapváltozatban készült: Buda—Pest bevonásával.

illetve anélkül. A faktorelemzéseket klaszter-elemzések követték.

17. Magyarország kiemelt települései fejlettségének vizsgálata

A feldolgozás a Központi Statisztikai Hivatal Területi Statisztikai főosztályának kezdeményezésére indult meg*1979—ben. Az alapadatok Magyarország 136 kiemelt településére vonatkoznak. A kiindulási változatban 72 mutató szerepel. A további változatokban a mutatók köre szűkíthető lesz. A faktorelemzés jelenleg folyik.

5. SZEMLÉLTETÖ PÉLDÁK

Az itt bemutatásra kerülő példák természetesen nem elemzések. Ezekkel csu-

pán a faktoranalízis egy—egy sajátosságát vagy az eredmények valamely grafikus ábrázolását — a lehetőségeket — kívánom szemléltetni. Komolyabb elemzésbe már

csak az adott jelenségek mélyebb ismeretének a hiánya miatt sem mentem bele.

1. Magyarország 65 középfokú központja fejlettségének vizsgálata

A figyelembe vett változók tételes felsorolását mellőzöm, a faktorok meghatáro—

zásában legnagyobb szerepet játszó mutatókat a faktorok értelmezésekor nevezem meg. A változók: 4 népességi, 6 ipari és építőipari, 4 mezőgazdasági, 3 kereske- delmi, 4 egészségügyi. 1 művelődésügyi. 5 oktatási, 9 kommunális mutatószám.

A feldolgozás során 9 faktort választottam le, ezek a vizsgált jelenség 80,4 százalékát magyarázzák meg együttesen. Ebből az első faktor részesedése 35.63. a

másodiké pedig további 11,3 százalék.

Az első faktor a várakozásnak megfelelően általános fejlődési faktor, szinte ki—

zárólag csak a mezőgazdasági mutatókkal áll negativ korrelációban, igen ,.erős"

benne a kommunális, az oktatási, a népességi és az ipari mutatóknak a többsége, de pozitivan korrelál a kereskedelmi és az egészségügyi mutatókkal is. A faktort a fiatal iparosodó városok faktorának is nevezhetnénk (a fiatal szó mind az adott városra, mind annak lakóira is vonatkozik). A faktor a következő változókkal korre—

lál a legerősebben (zárójelben a faktornak az adott változóval fennálló korreláció—

ja. százalékban kifejezve):

- a csatornahálózatba bekapcsolt lakások aránya (92).

—— a vízöblítéses WC-vel ellátott lakások aránya (91),

—- az ezer lakosra jutó középiskolát végzettek száma (83).

az ezer lakosra jutó tv—előfizetők száma (80).

— az ezer lakosra jutó aktív keresők száma a mezőgazdaságban (-—79).

—- a közüzemi vízhálózatba bekapcsolt lakások aránya (79),

— a villannyal ellátott lakások aránya (77),

-— az egy lakosra jutó termelési érték az iparban (73).

— a népsűrűség (73).

-— az egy háztartási fogyasztóra jutó évi átlagos háztartási áramfogyasztós (71),

— az ezer lakosra jutó egyetemet, főiskolát végzettek száma (71),

— a tényleges szaporodás aránya az 1960—1970-es időszakban (70).

A második faktor igen érdekesen tevődött össze. Talán ..az egyéb okokból kö- vetkező jó ellátottság" faktorának nevezhetnénk. Azokra a városokra, amelyek e

(15)

A FAKTORANALlZIS ALKALMAZÁSA 1 1 19

szerint a faktor szerint magas pontszámmal rendelkeznek, az jellemző, hogy bizo- nyos szempontból kedvező szociális mutatóik nem a fejlődő ipar vagy mezőgazda—

ság következményei. hanem más okokéi (üdülés, történelmi múlt stb.). Az e faktort leginkább befolyásoló változók a következők:

— az ezer lakosra jutó (magas) összeladási forgalom (72),

— az ezer foglalkoztatottra jutó (alacsony) villamosenergia-fogyasztás az iparban (—71),

— az egy foglalkoztatottra jutó állóeszközök (alacsony) bruttó értéke az iparban (—-61),

—— az ezer lakosra jutó összes bolti alapterület (60).

— az ezer lakosra jutó szakorvosi rendelési órák száma (58).

A további faktorok értelmezése már nehezebb volt (még ,,tiszta" mezőgazda- sági faktor sem alakult ki. a harmadik és a negyedik faktor egyaránt bizonyos me- zőgazdasági sajátosságokkal rendelkezett). A rotált faktorok már lényegesen ,,tisz—

tábbak" voltak. Ezekkel a továbbiakban még foglalkozom.

Most vizsgáljunk meg egy lehetséges grafikus ábrázolási formát, a faktorpont- szám szerinti ,,eloszlástérképeket". Az 1. ábra az első és a második faktor szerinti eloszlástérkép. (Az első faktor a vízszintes, a második pedig a függőleges tenge-

lyen szerepel.)

Az ábrán a városokat kezdőbetűikkel jelöltem. A városok helyének a vissza- keresése a kinyomtatott faktorpontszámok segítségével történik a tengelyeken ta—

lálható fokbeosztás segítségével. A rajz alján a pontosságértékek azt jelzik, hogy mekkora eltérés esetén kerülnek még egy mezőbe bizonyos különböző pontszá- moknak megfelelő jelek. (Ilyenkor az időben utolsó jel kerül a sornyomtatón ki- írásra. Ebben az esetben a megfigyelt egységek kis száma miatt ilyen eset alig for—

dult elő.)

Általánosságban még annyit, hogy egy objektumot általában nem egy faktor határoz meg. A faktorelemzés alkalmazásának lényeges vonása az, hogy egyidejű- leg több dimenzióban (több faktor szerint) mérjük a vizsgált objektumok differen—

ciálódását. Ha a faktorok mibenlétét már tisztáztuk, megvizsgálhatjuk a különböző faktorkombinációkat, kísérletet tehetünk a jelenség egészét átfogó egységes leírásra (például a faktorok súlyozásával). Példánkban egy adott város fejlettségi színvo- nalát nem a város egy bizonyos faktor szerinti pontszáma mutatja, a fejlettségi szinvonal (: különböző faktorok szerinti pontszámok (szintek) együtteséből tevődik

össze.

Az 1. ábrán a következő városokat — bekarikázott betűk -— emeltem ki (a vá—

rosok sorrendje megfelel az első faktor szerint elfoglalt helyüknek, azaz a felso- rolásban szereplő városok az ábrán jobbról balra következnek):

L —Leninváros (az első helyen az első fal E Encs (az utolsó helyen a harmadik torban és az utolsón a másodikban) faktorban és az elsőn a negyedikben)

K — Kazincbarcika S -— Szigetvár

A -— Ajka H — Hatvan

D — Dorog L — Lenti

V —-Várpalota M _— Mohács (az átlagos város az első és

S — Siófok (az első helyen a második és második faktor szerint)

a harmadik faktorban) S — Szentes

B — Balassagyarmat K — Kiskőrös (minimális pontszám a ne-

T — Tapolca gyedik faktorban)

K — Komárom H -— Hajdúnánás

E — Esztergom S — Szeghalom (az utolsó helyen az első

T — Tata faktorban).

Az T. ábra a fejlődési állapotot tükrözi, a fejlődés irányát közvetlenül nem mu-

tatja, hiszen az objektumok megfigyelése egy időpontban történt.

(16)

*FAKTORANAUZIS' **ZÁGONCSABA"

1.ábra.A65városelhelyezkedéseazelsőkétfaktorsíkjában Másod/%fak/an Mon/szám) sPNElsőfakfon .....5-67_,____4.ZE-___,__2770_____1SZ-_____CID11_____1.56_______3.01_______/m46______,S.91_______7-35______B.80_____,10.25__ AVíZSZlNTESTENGELYENÁBRÁZOLTVÁLTOZÓJELLEMZÖh AFUGGÖLEGESTENGELYENÁBRÁZOLTVÁLTOZÓ.!ELLEMZÖI:

.25(Pan/szám] :'(g MINIMUM4.116MAXIMUM1978PONTDSSÁG036583 MINIMUM:-9.16MAXIMUM"420FONTOSSÁG"*0.11724

1120 ZÁGON CSABA _

(17)

A FAKTORANALIZIS ALKALMAZÁSA

1 121 A kommunalítósokról elmondható az, hogy a kilenc faktor egyenletesen ma-

gyarázta meg a változókat. nem volt olyan változó, amely a faktorok által reprezen—

tált jelenségben ne játszott volna érdemi szerepet. Ez azt is mutatja, hogy a mu- tatók megválasztása helyes volt. Maximális kommunalitása volt a 35. és a 33. válto—

zónak — a vízöblítéses WC-vel ellátott, illetve a csatornahálózatba bekapcsolt la—

kások aránya (0.94, illetve 093) —, a faktorok a legkevesebbet a 32. és a 25. vál—

tozóból —- a kiépített belterületi

utak aránya, illetve az ezer lakosra jutó általános

iskolát végzettek szóma (0.63, illetve 0.66) — magyar áztak meg. Ezen utóbbi két mu—

tató az, amelyek az adott jelenséget —— a középfokú központok fejlettségi szinvona—

lát — a legkevésbé befolyásolják.

A továbbiakban néhány számadatot közlök arról. hogyan változik a faktorkép a forgatás elvégzésével.

Vezessük be a következő fogalmakat a változók és a faktorok kapcs olatában

(a vál'tozóknak a faktorokban betöltött szerepével kapcsolatban):

—— meghatározó jellegű változó (faktorsúlya abszolút értékben 0.95—nél nagyobb).

— igen jelentős változó (faktorsúlya 0.70 és 0.95 között);

—- jelentős változó (foktorsúlya 0.50 és 0.70 között);

-— kis szereppel bíró változó (faktorsúlya 0.30 és 050 között);

— kétséges befolyással rendelkező változó (foktorsúlya 0.20 és O,30 között);

-— jelentéktelen változó (faktorsúlya 0.20 alatt).

Ez a beosztás természetesen kimondottan tapasztalati jellegű. Általában maga—

sabb korlátokat szoktak állítani a változók és a faktorok közötti korrelációval szem-

ben ahhoz, hogy ezeket az összefüggéseket a faktorok értelmezésénél figyelembe vegyék, véleményem szerint azonban a pótlólagos faktoroknól az alacsony (020—

0.50) korrelációk óvatos figyelembevétele is indokolt, főleg akkor. ha az összefüg- gések figyelembevételét a rotált faktorsúlyoknól megmutatkozó magasabb értékek

alátámasztják.

A faktormatrix

Aváltozók hatásuk

szerint

1' l 2" ' l 3' l 4' l 5" l 6' l 7' l 8' l 9' ossze-

faktor sen

Meghatározó . . —- _ .. .. _ .. .. _ .. _.

lgen jelentős . . 13 2 — — _— _- _ .— _. 15

JelentősKis szereppel. .biró. .. 106 65 63 52 26 61 3 4 5 2347

Kétséges . . . . 3 7 8 8 5 9 15 9 5 69

Összesen 32 , 20 l 17 , 15 ; 13 [ 16 ! 18 ! 13 I 10 154

A rotált íaktormatrix

A változók hatásukszerint 1' l 2' l 3' l 4' l 5. l 6' l 7' l 8. l 9' Össze-

faktor sen

Meghatározó ._ -- -— —-

Igen jelentős 6 6 2 2 1 1 2 2 —- 22

Jelentős . . 7 3 -- 1 2 2 1 16

Kis szereppel bíró . 8 7 1 5 1 3 4 6 35

Kétséges 4 9 9 3 1 4 2 8 4 44

Összesen 25 ( 25 ! 11 * 7 ! 7 [ 3 j 7 ; 16 ' 11 117

5 Statisztikai Szemle

(18)

1122 ZAGON CSABA

A matrixokból jól látható a rotálás hatása: az igen jelentős változók abszolút száma megnőtt (7-tel), helyileg jobban szétszóródtak (az első két faktor helyett 8 faktorba. sőt. még az utolsó rotált faktornak is ,,jutott" egy jelentős változó), a kis szereppel bíró és a kétséges szerepet játszó változók száma csökkent (12—vel, il-

letve 25-tel).

A rotált faktorok értelmezése — emlitett sajátosságaik miatt -— lényegesen köny- nyebb feladat. Míg az eredeti faktorok esetében az első faktor azért értelmezhető nehezen, mert túl általános (összesen 23 változóval korrelál igen jelentős és jelen—

tős mértékben), a pótlólagos faktorok pedig azért. mert túl kevés bennük a jelen-

tős hatású változó, a rotált faktorok esetén már lényegesen egyenletesebb a kép.

lgy a rotólt faktorok jobban értelmezhetők, ami rendkívül fontos, hiszen a faktor- elemzés alapja a faktorok értelmezése, a faktorok mibenlétének a megállapítása.

Példánkban a harmadik rotált faktor például kimondottan mezőgazdasági faktor.

a negyedik főleg a kisgyermekeké (kevés óvodai férőhely, sok általános iskolai ta- nuló egy tanteremben, a gázzal ellátott lakások szóma alacsony), az ötödik a lak—

sűrűségi, a hatodik az egészségügyi faktor. a hetedik a magas termelékenységű iparral rendelkező városok faktora, a nyolcadik a kereskedelmi faktor, a kilencedik

pedig az ingázók faktora. Ezekből a jól értelmezhető _rotált faktorokból következ-

tethetünk az eredeti faktorok valódi tartalmára is.

2. Hét szocialista ország népgazdaságának a fejlődése

Ezzel a példával azt kívánom szemléltetni. hogy a faktoranalízissel idősoros ada—

tokat is elemezhetünk, mégpedig oly módon, hogy a faktorelemzés segítségével

feltárjuk az adott jelenség belső törvényszerűségeit, a mutatók kapcsolatát, majd a kapott faktorpontszámokon idősorelemzést hajtunk végre. Az itt feldolgozott ada—

tok Bulgária, Csehszlovákia, Lengyelország, a Német Demokratikus Köztársaság, Románia, Szovjetunió és Magyarország népgazdaságának idősoraiból épülnek fel. Az idősorok az 1954-1972—es időszakot fogják át, az adatok viszonylagosak (az 1954. évi adatokhoz viszonyított százalékos értékek). A 11 eredeti változó (nem- zeti jövedelem, ipar, építőipar, mezőgazdaság, fogyasztás, felhalmozás, beruházás, összes és szocialista export, illetve import) mellé még az időt vettem fel változónak (abszolút számként. például: 1957,0 az 1957-es adatoknál).

A 12 ismérv szerinti 133 megfigyelés által reprezentált jelenséget — a hét or—

szág időbeli fejlődését -— 5 faktor segítségével közelítettem meg. Az első faktor (az általános fejlődési faktor) a jelenség 78,6 százalékát magyarázta meg, a második további 9.1 százalékot, az 5 faktor együttesen pedig 979 százalékot. Ez talán túl magas érték is, amire az is mutat, hogy az utolsó (ötödik) faktor. amely a jelenség- nek már csupán 2.0 százalékát magyarázza, leglogikusabban hibafaktorként értel—

mezhető (más értelmezése: időfaktor, az idő függvényében csökkenő felhalmozási és szocialista import növekedési faktor). Tehát a 4 faktor (az eredeti változók szá- mának egyharmada) elegendő lett volna a jelenség viszonylag pontos modellezé—

séhez. A pótlólagos faktorok egyébként a következőképpen értelmezhetők:

második faktor — az aktív szocialista kereskedelem faktora, harmadik faktor - a mezőgazdasági export faktora,

negyedik faktor — a mezőgazdasági felhalmozás faktora.

Az általános fejlődési faktorról talán még annyit, hogy az csak a mezőgazda—

sággal áll jelentős korrelációban (0.601), a fogyasztással, a_nemzeti jövedelemmel és aziparral fennálló kapcsolata meghatározó jellegű, az összes többi változóval pedig igen jelentős.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

lasztják külön a statisztikai szervezet és az állami és szövetkezeti szervek statisztikai módszereinek kidolgozására vonatkozó feladatokat, hanem álta- lában csak a

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A CLIL programban résztvevő pedagógusok szerepe és felelőssége azért is kiemelkedő, mert az egész oktatási-nevelési folyamatra kell koncentrálniuk, nem csupán az idegen

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a

„Én is annak idején, mikor pályakezdő korszakomban ide érkeztem az iskolába, úgy gondoltam, hogy nekem itten azzal kell foglalkoznom, hogy hogyan lehet egy jó disztichont

– Apám révén, s problémamentesen vállalva ezt, zsidó is vagyok, ami persze a zsidóság belső szabályai szerint már csak azért is irreleváns, mert nem anyai ágon, s