MÓDSZERTANI TANULMÁNYOK
NEMZETKÖZI STRUKTÚRA—OSSZEHASONLlTÁSOK KLASZTER-ELEMZÉSSEL
DR. SZlLÁGYl GYÖRGY
A gazdasági struktúra kérdései az utóbbi években a gazdaságpolitika és a köz- gazdaságtudományi kutatások középpontjába kerültek. Ezzel párhuzamosan egyre nagyobb jelentőséget nyertek azok az eljárások. módszerek amelyek a gazdasági struktúra különböző dimenzióibon lehetővé teszik a kvantifikálást. A feladatoknak különös színezetet ad a struktúra kategóriájának egyszerre mennyiségi és minőségi jellege, ami a minőségi ismérvek mérésének. számszerűsítésének követelményét ál-
litja a módszerek kidolgozói elé.
A nemzetközi összehasonlító vizsgálatok -— amelyek ma már szinte minden köz- gazdasági témakör kutatásához hozzájárulnak a maguk sajátos adalékaival —- szin- tén egyre intenzívebben fordulnak a strukturális témák felé.1 Ennek megfelelően válik fontossá a nemzetközi struktúra—összehasonlitásokra alkalmas módszerek fel—
kutatása. E lehetőségek egyikének kínálkozik a klaszter-elemzés.
A klaszter-elemzés elméleti módszertani és gyakorlati kérdéseiről az utóbbi időben igen sok tanulmány jelent meg. A Szigma például egy teljes számot (1977.
évi 3. sz.) szentel a témának, és itt két olyan tanulmányt is találunk, amely teljesen (3) vagy részben (ó) a kvantitatív elemzés fogalmainak és módszereinek ismerteté- sét és rendszerezését tűzte ki célul.
A Statisztikai Szemle röviddel ezelőtt szintén foglalkozott a témával. Már csak ezek miatt sem tartom szükségesnek a kvantitatív elemzés teljes és minden variánsra kiterjedő ismertetését — (3) jól érzékelteti ezek változatos sokaságát —, de azért sem, mert —— mint a hivatkozott tanulmányokból kiderül — az eljárásnak ma még sem a fogalmi rendszere. sem az egyes variánsok előnyös—hátrányos tulajdonságai nem kristályosodtak ki teljesen.2 A módszernek csupán azokkal a vonatkozásaival kívánok foglalkozni. amelyek az itt tárgyalt nemzetközi összehasonlítási vizsgálat szempont- jából fontosak. A hangsúlyt nem annyira a technikára, mint inkább a közgazdasági
értelmezésre kívánom helyezni.
A nemzetközi közgazdasági vizsgálatokban a klaszter—elemzés lényege az orszá- gok csoportokba, ún. klaszterekbe való sorolása oly módon. hogy az egymáshoz strukturális szempontból hasonló országok azonos, a kevésbé hasonlók különböző
* Például (4). amelyben nemzetközi összehasonlításokban már évek óta jelentős eredményeket felmutató szerzők,túra nemzetközia korábban túlnyomóan színvonal—összehasonlításra koncentráló módszerüket teljes mértékben a struk—
összehasonlitásának szolgálatába állították.
? ,.Természetesen ezen eljárások egzakt, matematikai leirása nagy nehézségekbe ütközik. Bár az elmé—
let pontos kidolgozása érdekében igen jelentős kísérletekre került sor, általában csak a kiinduló feltevések és amódszereketfelmerült hoztakproblémáklétresokaságaa legkülönbözőbbismert. Mindezektudományokellenéreterületein:a gyakorlatbana statisztikában.igenahatékonyanpszichológiában,használhatóa szo- ciológiában. a biológiában, az orvostudományban stb." ((2) 137—138. old.).
956
DR. SZILÁGY! ovoaev
klaszterekbe kerüljenek.3 A klaszter-elemzést tehát a gazdasági struktúra nemzet-v közi összehasonlítására szolgáló egyik eszköznek tekintem. és mint ilyennel foglal—
kozom vele.
A gazdasági színvonal és a gazdasági struktúra szoros és kölcsönös egymásra-- hatása azonban a nemzetközi összehasonlítósokban is kifejezésre jut. A színvonal-- és a struktúra-összehasonlítós sohasem választható el teljesen egymóstólf' Az ösz—
szehasonlítós közgazdasági céljától függően az egymásrahatósnak érvényesülése——
egyes esetekben gazdagítja. más esetekben zavarja a vizsgálatot. A tanulmány első részében a klaszter—elemzést a nemzetközi struktúro-összehasonlítús olyan eszköze-—
ként tárgyalom, amely zavartalanul hatni engedi a gazdasági színvonalat a struk—
túra mérőszámaira. Mint látni fogjuk. ez a hatás egyes esetekben túlsúlyra jut mós—
strukturális elemekhez képest, ezért a második részben a módszer olyan tovabb-
fejlesztésére teszek kísérletet, amely a színvonalhatóst bizonyos ésszerű korlátok közé szorítja.!. A KLASZTER-ELJÁRÁSSAL VÉGZETT NEMZETKÖZI ÖSSZEHASONLITÁS ALAPFELADATA
A klaszter—elemzés a vizsgált országokat azok gazdasági tulajdonságai - vala-A milyen mutatószómhalmaz segítségével kifejezett jellemzők -— alapján rendezi cso—r
portokba.
Az országok csoportosítósóhoz tehát nem rendelünk valamely exogén ismérvetr hanem a csoportosítási ismérv(ek) kialakítását is mutatószámainkra bízzuk.
A módszer vázlatos összefoglalása
Az 1. táblában összefoglalom az alkalmazásra kerülő és többször előforduló szimbólumokat.
1. tábla?
A tanulmányban használt szimbólumok jelentése
a) Skalárok, vektorok, matrixok A vektor
Megnevezés Skulór ÉS 1132;
vonatkozása elemszóma jele
Mutatószómok . . . Xii i-edik mutató m orszag x,- X i-edik ország n mutató xi (""") Mutatószómok
standard értéke . . . . Zjí i-edik mutató m ország , Z j—edik ország n mutató z,- (""")
Távolsági mérőszám . . . . dhi D(Z)
(m-n)
Súlyozatlan tóvolsógmérték . dhi D(F')
ím-n)
Klaszterbelí értékek cg,- g-edik klaszter cg
Klaszterek közötti távolság . .
geg
3 E feladatnak egy duólisa is megfogalmazható, amelynél nem az országokat, hanem a mutatószámokat rendezzük csoportokba. A nemzetközi irodalom az előbbit ..cluster analysis on cases". ez utóbbit "Giuster analysis on variables" elnevezéssel illeti. A duális feladattal itt nem foglalkozom. mert megítélésem szerint;
nem ad többet annál, amit a mutatószámok faktoranalltikus csoportosítása által nyerünk.
4 Lásd (4) és (7).
*STRUKTÚRA—OSSZEHASONLlTÁSOK
957
b) Sorszám és számosság
Megnevezés l Futó index l Számossóg
Mutató . . . l i n
Ország . . . . . . h, i m
Klaszter . . . (
Induljunk ki az országok m elemű és a mutatószámok n elemű halmazából.
át,-; az i—edik mutatószám nagysága a i-edik országban. Kiinduló adatmatrixunk X :
: [x,-;] tehát (m-n) típusú. A továbbiakban a mutatószámok standardizált v agy nor—
mált értékére lesz szükségünk, tehát olyanokra, amelyeknek átlaga egységesen O.
szórása pedig 1. Az i-edik mutatószám *; oszlopvektorához tartozó standardizált z
vektor: (
,].ZASlÁxi—gi) 1:(1,1,...,1)
/1/
ahol:
x,- —az i-edik mutató számtani átlaga.
S,— —az i-edik mutató szórása.
A standardizált változók egy ugyancsak (m-n) tipusú Z : [Z,-;] matrixba ren-
deződnek. .
A klaszter-elemzés módszertanában a vizsgálandó objektumok —— esetünkben országok — hasonlóságának vagy különbségének mérésére valamilyen távolsági mérőszámot (ún. klaszter—függvényt) alkalmaznak. Ezeknek számos változata ismert, és az irodalom részletesen foglalkozik e változatok előnyös és hátrányos tulajdon- ságainak elemzésével. E nagyszámú változat közülma gyakorlatban legtöbbször az egyik legegyszerűbbet, az ún. euklidészi távolságot használják, amely — éppen egy—
szerűsége révén — a jelenlegi vizsgálathoz is alkalmas kiindulópont. Két ország (h és ]) euklidészi távolsága az alkalmazott mutatószámok alapján:
___—___ n
% : (zh — l;)* (zh * ij) : l/'—21 (zhfzji)2 /2/
Mint a /2/ formulából látható, az euklidészi távolság mértéke az országok ha—
sonlóságán—különbözőségén
kivül a figyelembe vett mutatók számosságótól függ, an- nak monoton növekvő függvénye.5 Ha távolsági mérőszámainkat az egész vizsgálat alatt ugyanannyi mutatószámból képezzük. akkor ez a körülmény nem zavar. Ha azonban olyan változatokat is megvizsgálunk. amelyek képzésénél más—más számos—
ságú mutatószám—rendszert használunk. akkor ezta hatást ki kell szűrni. Mivel ilyen vizsgálatokra is szükség van. az euklidészi távolság klasszikus formulája. /2/ helyett
6 . h;
dhj : 'É
/3/
Vn
távolsági mérőszámot fogjuk használni. Távolsági mérőszámunkra —— akárcsak az
5 Egészen precízen: monoton nem csökkenő függvénye, de a két fogalom között csupán abban a gyakor- üatilag nem lényeges esetben van eltérés. ha olyan mutatószámot vonunk be az összehasonlitásba. amelynek nagysága h és i országban azonos.
958
DR. SZILÁGY! GYÖRGY
euklidészi távolságra — érvényesek a metrikus tér általános tulajdonságai. amelyek közül számunkra a legfontosabb. hogy dhi akkor és csak akkor 0 ha zh : 'i' azaz
ha a két ország minden mutatószáma páronként azonos, illetve ha hsi (egy ország önmagától való távolsága 0).Távolsági mérőszámunkból az (m-m) tipusú
D(Z) : [db,] [4/
matrixot képezzük. E matrix birtokában a klaszter—elemzés különböző variánsai vé- gezhetők el. Nem feladatunk sorra vizsgálni e variánsokat, hanem közülük ismét ::
célunkhoz elégségeseket. általában az egyszerűbbeket választva. az ún. hierarchi—
kus osztályozás felé fordulunk.6 Ezek lehetőségei közül az ún. összevonó (agglome—
ratív) eljárást választjuk, ahol indulásnál minden országot külön klaszternek tekin—
tünk, és az egyes lépések klaszterek egyesítését jelent ik.7
Szinte vég nélküliek az ún. klaszter-technikáknak, tehát azoknak a változatoknak
a száma. amelyek szerint a klasztereket képezzük ((3). (G)). illetve ezeket leírjuk. A továbbiakban ezek közül a centroid eljárást alkalmazzuk, amely a kialakítandó
klaszterek tömegközéppontjainak vizsgálatán alapul. Ekkor az i-edik mutató stan—dardizált értéke a g-edik klaszterben
cg; : M /5l
ahol m!g a g—edik klaszterbe tartozó országok száma.
A g-edik klasztert tehát a
cg:[r51. cgz, .... cgi, ..., cg") /ó/
vektor írja le. Két klaszter (e- és g—edik) közötti távolság pedig
A 1
deg : l/T (ce—cg)* (ce—cg) /7/
A /3/ képlet a /7/ formula olyan speciális esetének fogható fel. ahol me :
: mg :1.
E technikánál mindig azok az országok, illetve országcsoportok vonódnak ösz-
sze a következő kloszterbe. amelyek közötti cl, illetve d távolság a legkisebb.
Szómszerű illusztráció
A módszertani gondolatmenetet egy kisméretű számszerű példa illusztrálja,8 amelynek kiinduló adatai megegyeznek a (7)—ben használt példáéval.9 A példában
_ _ ** Hierarchikus eljárások esetén az objektumokat oly módon soroljuk részhalmazokbu. hogy a klaszterek drszyunktak legyenek. vagy tartalmazzák egymást. nem hierarchikus modell esetén a klaszterek csak diszjunk-
tak lehetnek.
7 Felosztó (divizív) eljárás esetén az induláskor az országok halmazát egyetlen osztálynak tekintjük. és az egyes lepesek soran az osztályokat két osztállyá bontjuk.
8, Hangsulyozm kivanom az illusztrálás elsődlegességét az itt szereplő országok tényleges összehasonlító elemzesevel szemben.
9 A számításokat a KSH Számítástechnika! Igazgatóság IBM 370/155—11. típusú gépén végeztem a BMDP programcsomag—gyujtemeny megfelelő programjának segítségével.
STRUKTÚRA-USSZEHASONUTASOK
959.
hét közepes méretű európai szocialista ország (Bulgária, Magyarország, Német Demokratikus Köztársaság, Lengyelország, Románia. Csehszlovákia, Jugoszlávia)?
1973. évi adatai szerepelnek. A figyelembe vett mutatószámok a következők:
acél (egy lakosra jutó acélfogyasztás, kilogramm).
cement (egy lakosra jutó cementfogyasztás, kilogramm),
energia (egy lakosra jutó energiafelhasználás szénegyenértékben, kilogramm).
élettartam (születéskor várható átlagos élettartam),
iskola (ezer tanulóra jutó tanerők száma az alsófokú iskolákban),
műtrágya (egy hektár szántóra jutó műtrágya-felhasználás hatóanyagban, kilogramm), telefon (száz lakosra jutó távbeszélő—készülékek száma),
tv (ezer lakosra jutó tv—készülékek száma).
?NpüPPN?
Kétségtelen, hogy egy ilyen kisméretű adatbázis ellentmond a klaszter—elemzés—
szabályainak, amelyek kifejezetten nagy tömegű adat rendezésére vonatkoznak. A":
módszertani mondanivalót és az interpretációra vonatkozó kifejtést azonban nem vagy csak alig befolyásolja a modell mérete, és ezért megengedhetőnek látszott an-
nak az időrabló munkának az elkerülése, amit a jóval több ország több adatának
összegyűjtése jelentene. E kényelmesebb megoldás mellett még az a könnyebbségis szól, amit a kisméretű mátrixok áttekinthetőbb volta jelent.
A mutatószámok kiválasztásában is a könnyű hozzáférhetőség játszotta a fő sze- repet. Mindazonáltal olyan mutatók kiválasztására törekedtem, amelyek általános gazdasági vagy társadalmi jelentőséggel bírnak akár a színvonal. akár a struktúra szempontjából. Kívánatos volt továbbá, hogy még ez a kisméretű mutatószámhalmaz
is lehetőleg minél több oldalról világítsa meg az országok gazdaságát.
A mutatószámhalmaz korlátai és fogyatékosságai természetesen az egész nu- merikus példát befolyásolják. Nyilvánvaló. hogy minden eredmény és minden meg—
állapítás csak az országoknak ebben a körében és csak az e mutatószámok általl meghatározott térben érvényes. A módszertani mondanivalót ez nem korlátozza.
A mutatószámok standardizált értékeinek Z matrixát a 2. tábla tartalmazza.
2. táblák
A változók standard értékei (Z matrix)
, Acél Cement Energia Élet- Iskola Műtrágya Telefon Tv
0'5209 (1) (2) (a) foggm (5) (a) (7) (a)
I !
Bulgária —0,9330 0,1336 —0,1024 09600 -—0,5234 —0.3893 —0.3335 —0.3697 Magyarország —0,4661 —O,3339 ——0,5001 —0,1054 1.5278 0.1721 0.0929 0.4021
kus Köztársaság . Lengyelország
0.5759 0,6946 1.1120 1.0419 1.1600 1,6723 1.0578 1,6281 0.4506 0.3933 0.1477 O,3863 —-—O,8063 0.1006 —0.4905 —O,2184 Románia . —-0,0220 —O,9053 —0.5188 ——'l,0887 —O.1132 —1,17Sl —-1,0291 —1,2324 Csehszlovákia ( 1.6634 1.4945 1.3801 0.3863 —-0.0707 0.6926 1.6189 0,7507*
Jugoszlávia . . . $--—1,2689 —1.47óó I—1,5190 ——1.5805 —'l,1741 *——1.073l I—O.9ló9 l—O'9600
!
Német Demokrati- '
l
l l
A távolsági mérőszám és a távolsági matrix
A 3. tábla a /4/ képlet szerinti D(Z) távolsági mátrixot, azaz az országok közötti
távolsági mérőszámnak a /3/ képlet szerinti d,,j értékeit tartalmazza.10
m A táblák általában az országoknak az orosz betűrendnek megfelelő sorrendjét követik (kivéve. amikor valamelysorrend bizonyosváltozó nagyságatechnikai szerintikönnyebbségetsorrendetjelentett.ls kifejeznek). A felhasznált források többségére tekintettel ez al
960 DR. SZILAGYI GYÖRGY
3. tábla
Az országok közötti távolságok (DlZ) matrix)
lglémel'f-
orszag Bulgária 13320; állít.; írsz.—'g— Roman... cm?- "95;ng-
Köztársa—
sag
Bulgária . . . 0 0.937 1.460 0.583 1.015 1.481 1.259
Magyarország . 0 1.167 ' 1.011 1.114 1.453 1.453
Német Demokra- tikus Köztársa—
ság . . . . O 1,305 2.012 0.859 2.383
Lengyelország _ 0 0.997 1.146 1,382
Románia . . . , 0 1.899 0,735
Csehszlovákia . l 0 2.326
Jugoszlávia . . ()
A távolsági mérőszám a klaszter-elemzés számára csak segédeszköz, kiszámí- tása csupán közbenső lépés. A nemzetközi összehasonlítás szempontjából azonban önálló jelentése is van, ezért érdemes némi figyelmet fordítani vizsgálatára.
A távolsági mérőszám ugyanis mint összehasonlíthatósógi mérték is értelmezhető.
lsmeretes. hogy a gazdasági szinvonal összehasonlításának egyértelműsége a struk- turális azonosság mértékének függvénye. Minél inkább különbözik egymástól két ország gazdaságának struktúrája, annál kevésbé, illetve annál lazább határok kö- zött (szélesebb intervallumban) értelmezhetők a gazdasági színvonaluk arányára
vagy különbségére vonatkozó mérőszámok.
Az összehasonlithatóság fokának kvantilikálására különféle mérőszámok ala- kultak khm amelyek általában szorosan kapcsolódnak a szinvonal—összehasonlítás
módszeréhez és mérőszómához.12 A távolsági matrix elemeihez bármilyen színvonal—összehasonlítási mérőszám hozzárendelhető. Általánosságban legyen a gazdasági szinvonal nemzetközi összehasonlításának eredménye (tehát például az egy lakosra jutó GDP azonos valutában kifejezve) az m elemű Y vektor és ennek standardizáltja y. Az országok közötti színvonalkülönbségek mérőszámai e vektor elemeiből számított
düh,-: [yb—Yi] lsl
különbségek. E különbségek pontossága — nem számitásbell, hanem értelmezésbeli pontossága -— a távolsági matrix megfelelő elemétől (th) függ. E függés típusai a
4. táblában bemutatott sémával jellemezhetők.
Kérdés természetesen. hol vonjuk meg a sémában a ,,nagy" és a ,,kis" határa-
it.13 A szín'vonalmutató esetében ez a figyelembe vett országok kör'étől is függ: egy
világszintű összehasonlítás esetén például valamely régió országai közötti különb—ség valószínűleg ,.kicsinek" minősül, ha azonban az összehasonlítás csak egy régió- ra terjed ki, akkor ugyanezen országok közötti különbségek egy része már ,,nagy-
nak" fog minősülni. Egyik lehetséges változat, hogy az adott országpárok között fel-
" A taktoranalizis például az első főfaktor súlyainok négyzetösszege (illetve (: korrelációs matrix leg- nagyobb sajátértéke) és a mutatók számosságának hányadosaként kvantifikálja az összehasonlíthatóság fokát, ez a szám azonban az országcsoport egészére jellemző; a távolsági matrix elemei országpáronként jellemzik
az összehasonlíthatóság fokát.
" Értékmutotók átszámítása esetén például a különféle súlyozású volumenindexek eltérése jól jellemzi az összehasonlithatóság fokát, de eleve csak az ilyenfajta színvonal—összehasonlításoknál alkalmazható.
13 Egy ,.bonyolultabb" sémában több fokozatot is bevezethetnénk -— például ..közepes" -—. de akkor is el kellene dönteni a határokat.
STRUKTÚRA-USSZEHASONUTÁSOK
961
ielhotő legnagyobb d(y) érték felét tekintjük határnak, egy másik: úgy vonjuk meg a határt, hogy az országpárok fele az egyik kategóriába, fele a másik kategóriába essék.
4. tábla
Az összehasonlíthatóság típusainak sémáia
Színvonal- Távolsági A típus jele különbség mérőszám
Jelentése
d(y) (d)
i
a ; nagy nagy Heterogén országok összehasonlítása, a színvonal—
különbség korlátok között értelmezhető
b nagy kis Jól értelmezhető színvonalkülönbség
c kis nagy A színvonalkülönbség nem vagy kevéssé értelmez-
hető *
d kis kis Eléggé hasonló szerkezetű országok ahhoz, hogy viszonylag kis színvonalkülönbség is értelmezhe-
i , tő legyen
!
A távolsági mérőszámra is meg kell határozni egy küszöbértéket, amelyen feiül a távolságot már ,,nagynak" minősítjük. Ez a küszöbérték azonban nem független a színvonalkülönbség mérőszámától. A távolsági mérőszámokban ugyanis a gazda- sági színvonal különbségei is kifejezésre jutnak. méghozzá — a mutatószám—rend- szer összetételétől függően — elég jelentős mértékben. Ezért a küszöbértéket céisze—
rű a színvonalkülönbség és egy koefficiens szorzataként kifejezni: ' a : ff d(l'lhj
/9/
,,nagy" ha ) a
dhj /10/
.,kicsi" ha ( a
(diri: a határesetet tetszés szerint sorolhatjuk egyik vagy másik kategóriába, a
döntésnek itt nincs különösebb gyakorlati jelentősége.)
A 5 szorzótényező meghatározásánál azt kell mérlegelni, hogy a távolsági mé- rőszámok kialakításában mekkora szerepe van a gazdasági színvonalnak. Minél erő-
sebb ez a hatás, annái közelebb kell esnie a koefficiensnek 1-hez.
Vizsgáljuk meg az eddig tárgyaitakat példánkon is. Mindenekelőtt egy szinvo- nalmutatót kell választanunk. Kézenfekvőnek látszik, hogy erre a célra a nyolc mu- tatóból származtatott legnagyobb közös faktor standardizált értékeit —— fí' vektor —
használjuk, amelyet (7)-ben határoztunk meg, és amelyet a gazdasági színvonal le—
hetséges mérőszámónak tekintünk.
A gazdasági színvona/ faktorának értékei Német Demokratikus Köztársaság . . . . 1.2897 Csehszlovákia . . . 1.1939 Magyarország . . . 0.0384 Lengyelország . . . 0,0270 Bulgária . . . —O,208O Románia . . . . , . . . —O,9202 Jugoszlávia . . . '. . . —1,4209
? Statisztikai Szemle
962
DR. SZILÁGYI ovoaev
Ezekből az adatokból kiszámíthatjuk — és az 5. táblában bemutatjuk -— az or—1 szágonkénti különbséget.
5. tábla
A színvonalmutató (fl') országonkénti különbségeí'
géme;
Bulgaria 13313; fám; ngggg' Románia Cszgsg'g- iuggsg'c'
Köztár- saság
Bulgária . . . 0 0.246 1.450 0.235 0.712 1.402 1.213
Magyarország . 0 1.251 0.011 0.959 1.156 1.459
Német Demokra—
tikus Köztársa-
ság . . . . 0 1263 2.210 0.096 2.711
Lengyelország . 0 0347 1.167 1,448
Románia . . . 0 2.114 0.501
Csehszlovákia . 0 2.615
Jugoszlávia . . O
' E különbségeket egyetlen mutató alapján számítjuk egyszerű kivonással (IS/. ahol most y : h'). mind- azonáltal közvetlenül nagyságrendileg egybevethetők a nyolc mutatóbál számitott távolsá i adatokkal. ome- lyek a 3] [táblában találhatók. Többek között ez az előnye az euklidészi távolság átlagért kké való átalakítá- sának ( 3 ).
A színvonalkülönbség-mutató küszöbértékének válasszuk — az egyszerűség ked- véért — a matrixban szereplő legnagyobb érték (Német Demokratikus Köztársaság—
Jugoszlávia) felét (1.35).
A dhj távolsági mérőszám a küszöbérték, illetve a B koefficiens értéke tetszés
szerint változtatható meg: minél nagyobb értéket választunk. annál lazábban hatá—rozzuk meg az összehasonlíthaitóság mértékét, minél kisebb ez az érték, annál ,.szi—
gorúbbak" vagyunk. Mivel a színvonalkülönbség mérőszáma és a távolsági mérőszám
azonos nagyságrendű, e ,,szigorúság" foka 13 : 1. azaz a : d(y) esetben tekinthető
átlagosnak vagy közömbösnek. Példánkban válasszunk ennél valamivel szigorúbb összehasonlítási követelményt, legyen 5 : 0.95; ebben az esetben az egyes össze- hasonlítás-párok típusa az 5. tábla szerinti lesz. (Az országokat itt a gazdasági színvonal sorrendjében adjuk meg; a tipusjelek magyarázata a 4. táblában talál-ható.)
6. tábla
A páronkénti összehasonlítások típusai
Német
Demok— C _ ,. _ '.
ratikus 333530 biogén; 153332! Bulgária Románia Jugasazlu Köztár-
saság
Német Demokra- tikus Köztársa-
ság . . . — c d c a b b
Csehszlovákia c - c c a b b
Magyarország d c — c c c a
Lengyelország . c c c — c c a
Bulgária . . . a a c c —- c c
Románia . . b b c c c — c
Jugoszlávia . a b a a c c —
STRUKTÚRA—USSZEHASONUTASOK
963
A matrix jobb felső (és a vele azonos bal alsó) sarkaiban b típusú összehason- lítások helyezkednek el. azok tehát. ahol az országok közötti szinvonalkülönbségek elég nagyok ahhoz. hogy a szerkezeti különbségek ellenére is értelmezhetőek legye—
nek. E kis blokk körül néhány a típusú orszógpárt találunk. ezeknél a szerkezeti el- térések már korlátozzák az összehasonlíthatóságot. A matrix főátlója mellett a c tí- pus a kizárólagosan uralkodó, e viszonylag kis szinvonalkülöanégek kevéssé értel- mezhetők. Egyébként a matrixban szereplő 21 országpárnak a többsége (12) ebbe a típusba tartozik (ami elsősorban összehasonlíthatósági kritériumaink viszonylagos szigorúságának következménye). A d típust csak egy reláció (Magyarország—Német Demokratikus Köztársaság) képviseli; ebben a relációban a színvonalkülönbség és a távolsági mérőszám egyaránt közepes nagyságrendű, de a szerkezeti eltér'ések mértéke a színvonalkülönbséghez képest alacsony, így az összehasonlithatóság vé- gül is kedvező.
Az országok csoportosításának automatikus folyamata
Térjünk most vissza a klaszter-elemzéshez, amelyhez a továbbiakban az orszá- gok közötti távolságok D(Z) matrixát (3. tábla) használjuk. E táblában a Bulgária—
Lengyelország távolságot találjuk a legkisebbnek (0.583), ez az országpár bizonyul a leghomogénebbnek, ez fogja alkotni az első csoportot (klasztert). Az egyes muta-
tószámok értékei (ci vektor) az 1. tábla 1. és 4. sorának páronkénti átlagai, az /5/képlet szerint (mg : mi : 2).
' A mutatószámok standard értéke
a Bulgária—Lengyelország klaszterben'
Acél . . . — 0.241 Cement . . . . . . . . . . . . . 0.263 Energia . . . . . . . . . . . . . 0.023 Élettartam . . . 0,671 Iskola . . . . . . . . . . . . . . —O.665 Műtrágya . . . . . . . . . . . . . —0.144 Telefon . . . . . . . . . . . . . —O,41 2 Tv...—O.294
' Az algoritmus értelmében most a mutatószámok egy új matrixát képezzük. ahol a sorok száma eggyel kevesebb.rült a matrixba.mint azEzutáneredetimeghatározzuk eZ motrixbon, mertklaszterBulgáriatávolságátés Lengyelországa többi országától.helyett csak az első klaszter sora ke—
A következő lépésben Románia és Jugoszlávia vektorát vonjuk össze egy klasz- terba (távolságuk 0.735), majd a Német Demokratikus Köztársaságét és Csehszlová-
kiáét (távolságuk O,859).
E három lépés után négy klaszterünk van. három kéttagú és egy egytagú (Ma—
gyarország) :
Bulgária, Lengyelország, Jugoszlávia, Románia,
Csehszlovákia. Német Demokratikus Köztársaság.
Magyarország.
Magyarország esetében bizonyos szerkezeti ,.különállás" állapítható meg (lega—
lábbis a vizsgálatunkban szereplő nyolc mutató által meghatározott szerkezet tekin- tetében). Ennek mértéke nem különösen nagy: Magyarország a következő lépésben
már belép az eddigi első klaszterbe (BulgáriaL—Lengyelország). Érdemes megjegyez- ni, hogy Magyarországnak az első klasztertől való távolsága 0.931. kisebb. mint a2.
964 DR. SZILÁGYI GYÖRGY
klaszter tagjaitól való távolsága külön-külön (Bulgáriától 0.937, Lengyelországtól
1.011), vagyis Magyarország struktúrája jobban ..hasonlit" a bolgár—lengyel átlag-struktúrára, mint a két ország bármelyikének struktúrájára.
E lépés után már egy háromtagú klaszterünk is van (Magyarorszag—Lengyel- ország—Bulgária). A három klaszter közül most ez utóbbi és a második (Románia——
Jugoszlávia) áll közelebb egymáshoz (1.046). az új klaszter tehát öttagú. Ennek az
öttagú klaszternek (: távolsága a Német Demokratikus Köztársaság—Csehszlovákia klasztertől jóval nagyobb, mint az eddig említett távolságértékek: 1.519. Vagyis a példánkban szereplő hét országot legmarkánsabban két alapvető kategóriába le- het sorolni, az egyikbe a Német Demokratikus Köztársaság és Csehszlovákia, a má—sikba a többi öt ország tartozik. Ebben valószínűleg a két ország hagyományos. ::
többinél régebben megindult iparosodása és az ezzel összefüggő fejlettségi és strukturális sajátosságok jutnak kifejezésre.
Az osztályozási folyamat szemléltetése (: grafikus ábrázolás egyik sajátos eszközével. az ún. dendogrammal történik. Az 1. ábra a hét országra végzett számí—
tás menetét és eredményét mutatja be. A vízszintes tengelyen a nevük kezdőbetűjé—
vel jelölt országok pontjai a gazdasági szinvonal növekvő sorrendjében, egymástól egyenlő távolságra helyezkednek el. A függőleges tengelyen a távolsági mérőszá—
mot vesszük fel. A csoportképzést jelző pontok ordinátája a csoportba kerülő orszá- gok, illetve klaszterek távolságának felelnek meg. A pontokat jelző körben levő
szám a csoportba tartozó országok számosságát jelenti.
1. ábra. Az országok csoportosításának folyamata Him/ság
1,5
M)
0, 5
A klaszter—technika segítségével tehát az országokat oly módon rendeztük cso- portokba. hogy a csoportképzésben kizárólag a számításokban felhasznált mutató- számoknak volt szerepük, semmiféle külső csoportképző ismérvet nem alkalmaztunk.
Ezzel azonban még nem merül ki (: klaszter—eljárás elemző képessége. A kö—
vetkező lépést a mutatószámok egyes értékeinek egymáshoz rendelése, kölcsönös megfeleltetése jelenti. Ez a megfeleltetés a sokváltozós nemzetközi összehasonlitá-
sok egyik kulcskérdése. ami igen változatos módon merül fel a különböző nemzet-
közi összehasonlítások során. A kérdés legáltalánosabban úgy fogalmazható meg, hogy az összehosonlitósban szereplő valamely (i-edik) mutatószám x,—,- értékéhez tar- tozik-e. illetve hozzárendelhető-e egy másik (c,-adik) mutatószám Xia értéke. A hoz- zárendelést természetesen a nemzetközi 'összehasonlítások dimenziójában értelmez- zük, tehát a nemzetközi tendenciák, nemzetközi összehasonlításokban érvényesülő arányok körében keressük a hozzárendelés lehetőségét. Az is természetes továbbá,STRUKTÚRA—USSZEHASONLITÁSOK 965
hogy mindezt sztochasztikus összefüggésként és bizonyos hibahatárok között értel—
mezzük.
Nyilvánvaló. hogy az egyes országok adatai önmagukban nem adnak választ a kérdésre, vagyis az (x,-;, xm) adatpárok sorozata (] : 1. . . ., m) nem tekinthető nem- zetközi dimenzióban értelmezett adatmegfeleltetésnek, hiszen ezeket az adatokat az egyes országok egyedi gazdasági—társadalmi sajátosságai éppen úgy befolyásol—
ják, mint különféle véletlen jelenségek.14
A klaszter—eljárás egyike a lokális értékmegfeleltetés lehetséges módjainak. Te—
kintsük a ló/ formulát. Valamely klaszterben két mutató értékének (cgi, egg) adatpár—
ját tekinthetjük a két mutató egymáshoz rendelhető értékének. Minél több országot egyesít a klaszter, annál kisebb befolyásuk van az egyedi országsajátosságoknak és véletlen jelenségeknek, annál nagyobb biztonsággal érvénye-sülnek a hozzárende- lésben a nemzetközi tendenciák. Viszont minél több országot egyesítenek a klaszte- rek. annál kisebb a klaszterek száma. annál kevesebb számú az egymás mellé ren-
delhető értékpár.15
Példaképpen tekintsük azt a mátrixot, amely a második. a harmadik és a ne- gyedik klasztert tartalmazza. (Lásd a 7. táblát.) A klaszterek a gazdasági színvonal sorrendjében szerepelnek a matrixban.
7. tábla
A klaszterbe/i standard értékek
Aklaszter
—- f*üu W Acél Cement Energia §?th Iskola Műtra'gya Telefon Tv
SZÉL-a összetétele (1) (2) (3) (4) (5) (6) (7) (8)
, l l
3 Nemet 1.120 1.095 1.246 0.711 0.545 1.182 1.338 1.189
Demok- ratikus Köztársa- ság—Cseh szlovakia
4 Magyaror— —0,31ó 0,064 —0,152 —-0,284 —-0.218 —O,473 —O,535 —O,476 szág—Len-
gyelor- szag—Bul—
gária
2 Románia— —0,645 —1,191 —1,019 —1.329 —O.644 —1.124 —O,973 —1,096 Jugosz—
lávia
l l
Ez a matrix a 2. táblában szereplő Z matrix redukált (és némileg átrendezett)
változata. Azzal összehasonlítva plasztikusan mutatkozik meg mutatóink illeszkedése
-— legalábbis, ami a sorrendet illeti — a színvonalhoz. (Az illeszkedés mértéke és" Az egyik megoldás természetesen a regressziófüggvény, amelyet két (vagy akár több) mutatószám között határozunk meg. Nagy előnye, hogy a függvény értelmezési tartományán belül az egyik mutató bármely értékéhez tartozik egy helyettesítési érték. amely a másik mutató megfelelő értékének fogható fel. Figyelemre méltó azonban. hogy a nemzetközi összehasonlításokkal foglalkozó közgazdászok gyakran nem elégszenek meg a regressziófüggvények segitségével kapható eredményekkel. A függvénytipus és a függvény paramétereinek meghatározásánál a ponthalmaz minden elemét figyelembe vesszük (eltekintve most bizonyos kiugró értékek esetleges mellőzésétől). így az egyes országokra kapott becsléseket az összes többi ország adatai is befo- lyásolhatják. Ugyanakkor viszont a fejlettségi vagy más mutatóval kapcsolatos skólákon egymástól távol eső országokra a valóságban gyakran nem ugyanaz az összefüggés érvényes. így még a legkifinomultabb eljárás- sal meghatározott függvény is ,.merevnek" és ebből kifolyólag torzítónak mutatkozik. ha nem a skála egészé-
re. hanem csak egy—egy pontjára vagy kisebb tartományára irányítjuk a figyelmünket.
15 Itt most nem foglalkozunk az interpoláció és extrapoláció lehetőségeivel és problémáival.
966 DR. SZILÁGYI GYÖRGY
módja természetesen mutatónként eltérő.) Legszembetűnőbb ez az 5. (iskola) mutató 2. és 7. táblabeli oszlopának összehasonlításánál, jeléül annak, hogy a klaszterezés
révén a legmarkánsabb országspecialitások is kiegyenlítődnek, és az általánosabb, a nemzetközi tendenciáknak jobban megfelelő arányok jutnak túlsúlyba. (Ennek bő—vebb vizsgálatától most eltekintek, mert messzire vezetne a témánktól.) II. A SZlNVONALHATÁS MERSEKLÉSE
Az eddigi módszertani fejtegetések, különösen pedig a numerikus illusztráció eredményei arra engednek következtetni. hogy a klaszter-elemzés alapvetően a gaz—
dasági színvonal—összehasonlítás eredményeit reprodukálja, illetve, hogy a gazda-
sági színvonal országok közötti különbségei döntően befolyásolják a klaszter—elem-zés segítségével kapott képet. A továbbiakban a klaszter-elemzés olyan változatát
keressük. amely jobban kiemeli a valódi strukturális elemeket.
A klaszter-elemzés és a faktoranalízis kapcsolata
A kérdés közelebbi vizsgálata céljából most a faktoranalízishez fordulunk. A foktoranalízis egyes elemeire már eddig is történt utalás, sőt egyik—másik eredmé-
nye a számszerű méréshez is hozzásegített, anélkül azonban, hogy a két eljárást
szisztematikusan összekapcsoltuk volna. Ehhez mindenekelőtt foglaljuk össze (7) alapján a nemzetközi összehasonlítással végzett faktoranalízisnek azokat a voná- sait, melyekre a továbbiakban szükségünk lesz. A vizsgálatot megkönnyíti a példa-ként használt numerikus anyag azonossága. A szükséges jelöléseket -- az 1. tábla kiegészítéseként -— a 8. tábla foglalja össze.
8. tábla
A faktoranalízís szimbólumainak jelölése
(a faktorok futó indexe k, számossága p)
A vektor A t _
Megnevezés Skalár és Tígurs;
vonatkozása ] elemszáma jele
Faktorérték . . . .] ;k i-edik ország ! p faktor f]— 1 F
k-adik faktor m ország tk ("'-P) Faktorok standard ér- f:.k i-edik ország p faktor f',- F'teke ' - ' ' - ' k-adik faktor m ország 'k ím'P)
Sajátérték . . . í . ak ! , a (l)
A faktoranalízis a gazdaságot különböző oldalakról jellemző mutatószámok hal—
mazát úgy rendezi, hogy a kiinduló mutatók kombinációiból új — más módszerrel nem nyerhető — mutatószámok, faktorok vagy főkomponensek jönnek létre, amelyek részben a gazdasági színvonal, részben a struktúra összehasonlító jelzőszámainak
tekinthetők. A faktorok meghatározásához az országok, illetve mutatószámok X mat-
rixának Z standardizáltjából indulunk ki. (Lásd a 2. táblát.) Meghatározzuk a muta-
tók korrelációs együtthatóit és ezek R korrelációs matrixát. A számítások során fon-
tos szerep jut a korrelációs matrix 21. 12. . . . sajátértékeinek, amelyek közül először a legnagyobbat (Á) határozzuk meg, majd csökkenő sorrendben a többit:a) e sajátértékek alapján számítjuk ki azokat az ok, faktorsúlyokat, amelyek megmond- ják, hogy az i-edik mutató mekkora súllyal vesz részt a k-odik faktor kialakításában;
STRUKTÚRA—USSZEHASONLlTASOK 967
b) e sajátértéknek a mutatók számosságához viszonyított lk/n aránya mondja meg. hogy a k-adik faktor milyen mértékben magyarázza meg az összes mutató szórásne'gyzetét;
c) a sajátérték egyenlő a megfelelő faktor szórásnégyzetével.
Ez utóbbival kapcsolatban tisztázni kell a faktorértékek numerikus természetét.
A faktoranalízis különböző algoritmusai kétféle formában állítják elő a faktorokat:
1. vagy olyan értékek formájában, melyek átlaga 0, szórásnégyzete a megfelelő saját- érték (e faktorok matrixát F-fel, oszlopvektorait rendre fi, fg . . .-vel jelölöm);
2. vagy standardizált formában. ahol tehát a faktorértékek átlaga O, szórása 1 (jelölé- sük az F' matrix, illetve az f1', fz'. vektorok); általában
F' : Rio—113
illetve /11/
f,; : **;— k
V Ak
ahol (2) a sajótértékekből képzett diagonálmatrix.
Az első faktort általában a gazdasági színvonal komplex mutatójának tekint—
jük.16 (A kiinduló mutatószámok jellegétől függ. hogy az első faktor mennyire alkal- mas erre a szerepre.) Példánkban az első faktor magyarázó képességének (li/n)
mértéke, 0.75 tehát az első faktor a figyelembe vett nyolc mutató viselkedésének mintegy 75 százalékát egyesíti magában. Ez azonban azt is jelenti, hogy a mutató- számok közötti korreláció jelentős része a gazdasági színvonalban koncentrálódik.Ez a korreláció (: magyarázata annak, hogy a távolsági mérőszámokban és ezen keresztül klaszter—elemzésünkben ennyire erős a gazdasági szinvonal hatása.
Felmerül a kérdés. kell-e és lehet-e ezt a hatást kiszűrni. Hangsúlyozni kívánom, hogy nem a gazdasági színvonal hata'sát akarjuk kiszűrni (ezt is lehet. de nem sok értelme lenne). hanem a mutatószámok közötti korrelációt. amelynek egyik — még-
hozzá számottevő — része a gazdasági színvonalban testesül meg.
A faktoranalízis eddig annyiban segített, hogy számszerűsítette e korreláció mér- tékét. Vizsgáljuk meg, ad-e valami támpontot a kíszűréshez is. Távolsági mérőszámo- kat nemcsak a mutatók, hanem a faktorok értékeiből is számíthatunk. Nem standar—
dizált faktorértékek esetén ezek megegyeznek az eredeti mutatók standardizált érté—
keiből számított távolságokkal:
NZ) : DlFl /12/
Ha most standardizált faktorértékekre térünk rá, akkor új távolsági mérőszámot
kapunk. Két ország (h és [) között ezt a távolsági mérőszámot dl'l szimbólummal je—lölve
D(F') : id"! ns/
. 1 1 , , ; ,
db] : V; (fh—fil*(A)—1(fh—filí : V; (fh— j)*(fh—fjl /14/
l
a [2], /3/ és /11/ képlet alapján (p a faktorok számaí'l).
" A gazdasági színvonalnak természetesen többféle mérő- vagy jelzőszáma van. Ezek egyike lehet az alkalmas mutatószamhaimaz alapján képzett első faktor. A többi faktort különféle dimenziólú struktúramutató—
nak fogjuk fel. Reszletes interpretációjukat lásd: (7) 156—159. old.
_ "'A [14/ formulában a középső kifejezés hasonló a sokak által javasolt és sokak által bírált Mahala.
nobis-fele távolsági mérőszámhoz (de nem azonos vele).
968 ' DR. sznonu GYÖRGY
Ebben a mérőszámban -— amelyet a továbbiakban súlyozatlan távolságmérték—
nek nevezünk — az egyes faktorértékek már nem kapják azt a súlyt, amelyet a nem standardizált esetben éppen az egy-egy faktorban összefogott mutatószámok kö- zötti korreláció mértékének köszönhettek. Mivel az első faktor esetében ez egyrészt
a legnagyobb, másrészt éppen a gazdasági színvonallal függ össze. a /13/ és [14/
formula segítségével mindenekelőtt a gazdasági színvonal e kitüntetett mértékű be-
folyásoló hatását szűrjük ki. (Természetesen a többi faktornál is kiszűrjük a külön-böző struktúrahatások súlyát, ezek mértéke azonban jóval kisebb.) Szómszerűsítés és értelmezés
Számszerű példánkban a /13/, illetve /14/ képlet szerinti súlyozatlan távolsági
mértékeket a 9. tábla tartalmazza.9. tábla
Az országok közötti távolságok a súlyozatlan távolságmérték alapján (D(F') matrix)
DNémft
Ország Bulgária 13593;- emg-ism Lglrvsgzyáegl- Románia nghűgo' Jugzzzlá- Köztár-
saság
Bulgária . . . 0 1,46 1,32 0.77 1.58 1.69 1.62
Magyarország . 0 0.92 1,39 1,21 1.62 1.56
Német Demokra- tikus Köztársa-
ság . . . 0 1,22 1,68 1.19 1.57
Lengyelország . 0 1,12 1.04 1.43
Románia , 0 1.48 1.66
Csehszlovákia 0 1.63
Jugoszlávia 0
A tábla adatait a 3. táblában szereplő mérőszámokkal (th értékeket a db,- érte-—
kekkel) összehasonlítva mindenekelőtt az tűnik szembe. hogy a súlyozatlan távolság-4 mértékek kisebb intervallumban (O,77—1,69) szóródnak mint az eredeti távolságií mérőszámok (0.58—2.38), amiből az következik. hogy a távolságokat elsősorban a:
színvonalkülönbség ,,húzza szét".
A súlyozatlan távolságmértékeket is felfoghatjuk az összehasonlíthatóság jelző—- számaiként. Most azonban az összehasonlíthatóság határát már nem kell a színvo- nalkülönbségtől függővé tennünk, az öszehasonlithatóság mértéke az adatokból közvetlenül is érzékelhető: minél kisebb a dhí érték, annál nagyobb az összehason—
líthatóság foka h és ] ország között, annál erősebb a színvonalkülönbség értelmez—
hetősége.
Ebből a szempontból az országpárok többsége ugyanúgy kategorizálható, mint
az eredeti távolsági mérőszám szerint (6. tábla). Néhány országpár azonban külön
is figyelmet érdemel.
a) Mind a D(Z). mind a D(F') matrixban a Lengyelország—Bulgária távolság bi—
zonyul a legkisebbnek. Eszerint e két ország között a legnagyobb az összehasonlít- hatóság foka is. A 6. táblában azonban a Lengyelország—Bulgária reláció a c kate—
góriába került, ahol a viszonylag ,.kis színvonalkülönbség nem vagy kevésbé értel—
mezhető". A színvonalkülönbség ugyanis; a két ország között (5. tábla) még az ala—
csony távolsági mérőszámnál is jóval kisebb (0.58-dal szemben O,235).. Lehetségesb
STRUKTÚRA-USSZEHASONLlTÁSOK
— 969 *-
hagy emiatt a küszöbértéket flexibilísebben vagy differenciáltabban kellene megál—
lapítani, és például alacsony távolsági mérőszám esetén kevésbé szigorú feltéte—
leket szabni; ez az egyetlen példa azonban nem elég ilyenfajta következtetés meg—
alapozásához.
b) I(F') matrixban a második legkisebb érték a Német Demokratikus Köztár—
saság—Magyarország összehasonlításnál mutatkozik (092), ami a két ország struk- turális hasonlóságára és — a többihez képest — nagyobb fokú összehasonlíthatósá—
gára utal. Ez a megállapítás megerősíti az előző módszerrel kapott eredményt: a 6.
táblában ez az egyetlen d kategóriájú összehasonlítás, ahol tehát a struktúra elég ..hasonló ahhoz, hogy viszonylag kis színvanalkülönbség is értelmezhető legyen."
Felmerül természetesen a kérdés, hogyan értelmezhető éppen a Német Demokratikus Köztársaság és Magyarország "strukturális hasonlósága". A már meghatározott klaszterek segítségével erre szemléletes választ adhatunk. Hasonlítsuk össze a két ország mutatóinak értékét saját klasztereik átlagértékeivel. Saját klaszter a Német Demokratikus Köztársaság esetében a 3. (Német Demokratikus Köztársasángseh—
szlovákia), Magyarország esetében a 4. (Magyarorszc'xg—Lengyelország—Bulgária)
klaszter,10. tábla
A Német Demokratikus Köztársaság és Magyarország mutatóinak eltérési iránya saiát klasztereík átlagmutatóitól
Acél Cement Energia Élettar— iskola MG -Telefon Tv
(1) (2) (3) m'" (5) "ugye (7) (B)
(4) (6)
"l l l
Német Demokrati- ; l l i ! [ ! l
kus Köztársaság . — — * -— —l— —l— —l— — —l—
* l _ * l * l *" l * "*
Magyarország . . l —
Az eltérés iránya csak két mutatónál különböző. hatnál azonos. A hat mutató közül az acél, a cement és az energia tekintetében mindkét ország kisebb, az iskola.
a műtrágya és a tv tekintetében mindkét ország nagyobb értékkel bír, mint a ,.kör- nyezetet" jelentő, klaszterbeli országcsoport. A hat mutató e megoszlása a két ország
közös strukturális sajátosságainak jellegéről is sokat elárul.
c) Az előbbinél jóval nagyobb a Német Demokratikus Köztársaság—Csehszlová-
kia közötti súlyozatlan távolság (1.19), amely megerősíteni látszik azt a korábbi meg-
állapítást, mely szerint a két ország közötti színvonalkülönbség csak nagyon korlá—tozottan értelmezhető. Azért érdemes ezt megemlíteni, mert megvilágítja, hogy (; kü- lönféle nemzetközi összehasonlítások miért adnak annyira eltérő becsléseket e két ország színvonaláról, olyanokat, amelyekben még a két ország egymás közötti nagy-
ságsorrendjét illetően is eltérők az eredmények.
d) Súlyozatlan távolságértékeket alkalmazva Jugoszláviát minden országtól je-
lentős távolság választja el.. itt jut kifejezésre a jugoszláv gazdaságnak a KGST—or-
szágokétól sok tekintetben eltérő típusa.Mindaz. ami a súlyozatlan mérőszámról megállapítható, természetesen érvé- nyesül az ilyen mérőszám alapján történő klaszterezésben is. Az általános színvo—
nalkülönbség hatása háttérbe szorul (ismét hangsúlyozni kell azonban: nem szűnik
meg). a struktúrahatások jobban előtérbe kerülnek. Példánkban ehhez még az is.
hozzájárul. hogy —— mint láttuk — a súlyozatlan távolságmértékek kevésbé markáns.
különbségeket adnak, mint az eredeti távolsági mérőszámok. Emiatt néhány ország
970
DR. SZlLÁGYl GYÖRGY
(főként Csehszlovákia és Románia, de bizonyos fokig Jugoszlávia is) kloszterbe so—
xrolása nem egészen egyértelmű, illetve határesetek eldöntését teszi szükségessé.
Mint már a D(F') matrix elemzésénél láttuk, az első klasztert most is, akárcsak 'az eredeti távolsági mérőszám alkalmazásánál, a Lengyelország—Bulgária ország-
pór képezi (a távolság 0.77). A második klasz terbe (: Német Demokratikus Köztársa-
ság és Magyarország kerül (0.92). Ezután azonban már beleütközünk az emlitett ha—táreset-problémákba. E két klasztert egymástól, továbbá Csehszlovákiától és Romá—
niától kb. ugyanakkor a távolság (1.21) válas ztja el, anélkül azonb an, hogy közben e
két országot egy csoportba sorolhatnánk. E két ország egymástól való távolsága ugyanis nagyobb (1,48). A harmadik klaszterünk tehát máris hattagú, csak Jugosz-lávia nem tartozik bele. Egyébként Jugoszlávia távolsága e hattagú klasztertől nem
sokkal nagyobb (1.32), mint a két klaszter és a két ország egymás közötti távolsá—ga. Ezt az osztályozási folyamatot a 2. és a 3. ábra szemlélteti.
2. ábra. Az országok csoportosításának folyamata súlyozatlan távolságmértékek alapján
(klaszterezési sorrend)
láva/ság
1.32
7,21
200 0,92 0,77
0,50
0 ér
3. ábra. Az országok csoportosításának folyamata súlyozatlan távolságmértékek alapián
(színvonolsorrend)
five/say
1,5 —
V'— " '
250 0," 239 40
Színvonalkűlőobség
A 2. és a 3. ábra alapstruktúrája is az 1. ábráénak felel meg. A 2. ábra vizszintes
tengelyen az orszagok egymástól egyenlő távolságban helyezkednek el. és sorrend-—
'STRUKTÚRA-ÓSSZEHASONLlTÁSOK
971
jük a klaszterezés folyamatát követi. A 3. ábra az országokat a gazdasági szinvonal növekvő sorrendjében helyezi el a vízszintes tengelyen (tehát az 1. ábrának megfe—
lelő sorrendben), egymástól való távolságuk pedig a színvonalkülönbségnek [d(y) : d(f1')] felel meg.
Végül felmerül a kérdés, hogy a klaszter—elemzés nemzetközi összehasonlításra bemutatott két változata — az eredeti mutatók standardizált értékeiből (Z matrix) és a faktorok standardizált értékeiből (F' matrix) kiinduló számítás -— közül adhatunk—e valamelyiknek elsőbbséget, és ha igen, melyiknek. Az elméleti fejtegetés és a nu- merikus illusztráció e tekintetben azt látszik igazolni, hogy a két eljárás párhuzamos alkalmazása teljesebb, árnyaltabb képet ad, mint ha csak az első módszerrel elég- szünk meg. Ugyanakkor a második eljárás kizárólagos alkalmazása önmagában 'nem állja meg a helyét. sőt esetleg félrevezető következtetések veszélyét is magában
;rejtl.
Mindezzel természetesen nem merítettük ki a klaszter-elemzés nemzetközi ösz—
*szehasonlításra való felhasználásának összes lehetőségét. Elképzelhető például.
hogy a klaszter—technika nagyszámú -— az itt csupán említett, de nem alkalmazott —-
variánsa a nemzetközi összehasonlítások módszertanát további új elemekkel tud—
ja gazdagítani. Valószínű továbbá. hogy a most teljesen figyelmen kívül hagyott dinamikai összehasonlítások is kedvező alkalmazási területet jelentenek (: klaszter- elemzés számára. Mindennemű felhasználás alapfeltétele azonban, hogy a mód—
szerhez és az általuk kapott numerikus eredményekhez megfelelően egzakt közgaz—
dasági interpretácíót tudjunk rendelni.
IRODALOM
(1) Dr. Bocskay Zoltán: Csoportok képzése cluster analizlssel (Kézirat)
(2) Csicsmon József: A klaszter—elemzés módszertani és alkalmazási lehetőségei a statisztikában. Sta- ftisztikai Szemle. 1979. évi 2. sz. 137—145. old.
(3) Füstös László — Meszéna György —- Simonné Mosolygó Nóra: Cluster analizis: fogalmak és mód—
szerek. Szigma. 1977. évi 3. sz. 111—148. old.
(4) Dr. Madas András — Dr. Ehrlich Eva - ]ánossy Ferenc — Pártos Gyufa: A gazdasági fejlettséget ttükrözőOMFB tanulmány.naturális gazdaságiBudapest. 1978.mutatók gyakorlati alkalmazásának lehetőségei a prognózis számításokban.
(5) Pálniczky Gábor: A statisztikai informatika alapjai. Statisztikai Kiadó Vállalat. Budapest. 1976.
'190 old.
(6) S. Benedikf Vera — Vári Anna: Egyes cluster analizis eljárások és gazdasági alkalmazásuk. Szigma.
"1977. évi 3. sz. 185—198. old.
(7) Dr. Szilágyi György: A gazdasági szinvonal és struktúra összehasonlítása faktoranalizissel. Statisztikai Szemle. 1978. évi 2. sz. 142—161. old.
PE3fOME
ABTOp uccneAyeT roAHocn, unacrepuoro ananuaa AM MBWAYHÖPOAHHX cpaaHeHuü.
B u.eH'rpe ero aHuMaHun HaXOAHTCS 3Kov—10Muuecnan" uHTepnpe'rauun pesynbra-roa, nony- HaeMle c nomombro Knacrepnoü 'rexnmm. Teopemuecnue Mé'rouonomuecme paccymne- Hun conpoaomnaiorcn unmpoaoü unmocrpauueü, oxaatsiaammeü CSMb esponeücxux co—
uuanucmuecxnx CTpaH npu npuMeHeHuu aocsmw nonaaareneü.
Asrop ua nucrauuuouuux munka-ropog menny cvpaHaMu smaonur noxaaarems conoc- TaBHMOCTHTH. Bcnen sa" c3THMHnomomsioAGMOHCTppreTnocneAHeroaaromamuecnnüaauucnner napa: npoueccc-rpan a xarerapunrpynnupoanuconocraBuMoc—crpau, me rpynnooőpazsoaanue npowaaoAuTcn ucxmouutenbuo Ha ocnoaam—m CHCTeMbl npuMeHHEMbix nonaaarenei—i Sea nonuunenux 3K30reHHOMY rpynnooöpaaoaarenbnomy npnauany.
OAHG ua Bo3MoJm-ioc1'eü ncnonbaoaauua peaynbratoa Knacrepnoro ananuaa COCTOHT ao BaauMHOM cooraercranu semmmi paanuuuux nouasateneü.
B AanbueüweM aarop yssablsae'r aHanus rnasnmx Komnonem—oa c KnaCTeprlM ana- nnsoM : macmraőe memAyHapoAHblx cpaaHeHnü. Ycrauaanuaaer, uto Knacrepubm ananua