STATISZTIKAI IRODALMI FIGYELÖ
KÚLFÖLDI STATISZTIKAI IRODALOM*
A STATISZTIKA ÁLTALÁNOS ELMÉLÉTE Es MÓDSZERTANA
KISH. L.:
TÖBBCÉLÚ MlNTAVÉTEU TERVEK
(Multlpurpose sample designs.) - Survey Methodology.
1988. 1. sz. 19-32. p.
A statisztikai vizsgálatokat általában úgy terve- zik, hogy több különböző célt elégitsenek ki. Az eredmények felhasználása során, az elemzés és értékelés szakaszában gyakran előfordul, hogy további szempontok merülnek fel. Ez a többcélú—
ság azonban sokszor rejtve marad, mivel az egész felvételi tervet — reprezentativ megfigyelé- sekről van szó — kimondottan csak egy célra dol- gozzák ki. Ha viszont a reprezentatív feltételek több célt szolgálnak, több különböző kérdést vizsgálnak, akkor a mintavételi terv kidolgozásá- nál ezt a tulajdonságot miért nem veszik figye- lembe? Ennek elsősorban az a magyarázata, hogy a mintavétel elmélete már az egyszerű egy- változós esetben is elég bonyolult. Vannak olyan mintavételi tervek, mint az egyszerű véletlen kivá- lasztás, ami elég robosztusahhoz, hogy több cél- ra is megfelelő legyen, de annak alkalmazása, költségessége miatt nagyon ritka. Kifejezetten többcélú terveket csak elvétve lehet találni, pedig sokkal többször lenne célszerű ilyet készíteni.
A tanulmány a témáról rövid áttekintést ad az—
zal a céllal, hogy a felvételekkel foglalkozó statisz- tikusokat megfelelő gondolatokkal, módszertani utalásokkal, irodalmi hivatkozással segítse min- dennapi munkájukban. Ugyanakkor elméleti ke- retet is ad, hogy ezzei is segítse a további kutatá- sokat. A rendszerezett megközelítés céljából a gyakorlatban előforduló feladatokat hierarchiku- san rendszerezni, bizonyos terminológiai kérdé- seket pedig tisztázni szükséges.
Nem szabad összekeverni az azonos témakör több változóját. illetve a változók sokirányú rész- letezését vizsgáló felvételeket a több különböző
téma együttes vizsgálatával. A leggyakrabban felmerülő problémák és vizsgálati célok:
1. azonos változók különböző statisztikái (átlag, ouantills,
megoszlás stb.), ' '
2. különböző részletezések (keresztosztályok, klsterületek
stb.),
a adott téme különböző változói (iövedelem, megtakarítás, vagyon vagy eltérő időtartamok. időpontok stb.),
4. több különböző téma,
5. folyamatos. Integrált felvételi rendszerek, 6. mintavételi keretek.
Atöbbcélú mintavételi tervek kidolgozását aka- dályozza az, hogya különböző célokat világosan, statisztikai ,,nyelven" kellene megfogalmazni, becsléseket végezni a szórásra ésa költségekre, külön-külön meg kellene határozni a kívánatos pontosságot, és végül mindezeket a számításo- kat, illetve klvánalmakat egy olyan formulába kel—
lene összefoglalni, amelynek alapján dönteni le- hetne az ,,optimális" elrendezésről.
A mintavételi tervek kidolgozását a következő fontosabb konfliktusok, nehézségek akadályoz—
zák: a minta terjedelmének, illetve a mintavételi hibának és torzításnak összefüggése; a rétegek, alcsoportok, illetve tartományok közötti össze- függések; a minta allokációja; a mintavételi hiba kiszámításának nehézségei; a klaszterek nagysá- ga, az időben folyamatos mintavételi tervek eset—
leges problémái; az elsődleges mintavételi egy- ségek állandósága időben és térben változó fel- adatok esetében stb.
A különböző problémák jelentősége nem azo- nos. Vannak olyan robusztus tényezők, amelyek elhanyagolása nem befolyásolja érdemben a megoldást, de sok esetben egyáltalán nem ez a helyzet. Tehát nagyon fontos, hogy minden konk- rét esetben tisztán megkülönböztessük a lénye—
gest a lényegtelentől.
A minta terjedelme, a kiválasztandó minta ele- meinek száma az alapsokaság szórásától függ. A
. A Statisztikai Szemle 1962. júliusi számától kezdődően : ,,Statíszükel Irodalmi Figyelő "-ben a külföldi statisztlkel könyvek és folyó- lretcikkek ismertetését havonta közli.
A KÚIIBIdI etndsztlkol Irodalom egyen felezetein belül az anyag általában könyv— éa iolyólratclkk-lemertotéaekre tagolódik. (Ezeket ' választ;. el egymástól.) Az lsmertetéeek szerzők, Illetve ahol szerző ninc-, a cimek betűrendjében következnek egymás után.
528
STATlSZTIKAl lRODALMl FIGYELÓbecslés szórása azonban függ a mintavételi terv—
től is. így az egyes alcsoportok szórása ezek se-
gítségével kifejezhető, mint az egész minta terje- delmének függvénye. Bonyolultabb a helyzet ak- kor, ha a torzitással is számolnunk kell ajól ismert
MSE : 02 t 52 összefüggésből kiindulva. Ekkor
meg kell gondolni, hogy érdemes-e az általában jelentős költségekkel járó mintavételi hibát csök—
kenteni, ha a mérésekkel együtt járó torzítás je- lentős és nem csökkenthető.
A legtöbb probléma forrása a minta tartomá- nyok közötti allokációja. Például egy ország föld—
rajzi körzetei általában nagyon különböző nagy- ságúak. Ekkor el kell dönteni azt, hogy a minta minden régióban azonos nagyságú, vagy a régió nagyságával arányos legyen-e. Az első esetben ugyanis a régiók mintavételi hibája lesz optimá—
lis, a második esetben viszont az ország egészé—
re vonatkozó becslésé, mivel a legjobb regioná- lis becslések fogják a legnagyobb súlyt kapni.
Sokszor olyan kompromisszumos megoldásra van szükség, amelyben a tényleges arányok a kis régiók esetében valamivel nagyobbak. mig a na- gyoknál kisebbek az átlagos kiválasztási arány-
nál. Ez a gyakorlat például az Egyesült Államok
Folyamatos Lakossági Adatfelvételénél (CPS).
A dolgozat néhány további technikai jellegű példán mutatja be a különböző nagyságú tarto- mányok közötti átlagos vagy optimális allokáció- kat akkor, amikor többféle statisztikát kell becsül- ni, mint például a Világtermékenységi Vizsgálat (World Fenility Survey - WFS) esetében.
A tartományok és rétegek fogalmát gyakran összekeverik, jóllehet nagyon fontos, hogy azo- kat a gyakorlati munka és a tervezés során gon- dosan elkülönítsük. A tartományok olyan részei az egész sokaságnak, amelyekre külön is becslé- seket kell késziteni, mig a rétegek csak a minta- vételi hiba csökkentésének eszközei. A minta ai- lokációja a rétegek között a költségek és az opti- malizálás tekintetében a tartományokéhoz ha- sonlóan történhet. Nyilvánvaló, hogy minél több változót vizsgálunk, annál több rétegképző is- mérv merülhet fel.
A mintavételi tervek kialakításánál nagyon fon- tos a mintavételi terv hatásával (Daft) számolni, ami a klasztereken belüli homogenitás és a klasz-
ter átlagos nagyságának függvénye. így a vizs-
gált változók a klaszterek terjedelmét befolyásol- ják, mivel ha például a szülőképes korú nőket akarjuk vizsgálni, akkor azok száma a teljes né- pességnek csak körülbelül 10, illetve a lakások körülbelül 30 százalékát teszi ki. A klaszterek nagysága, igy az azon belüli korreláció a változók jellegétől és a keresztosztályok, rétegek számá- tól is függ. Atöbbcélú vagy integrált felvételi rend- szerek esetében azok mértéke nagyon változó le—
het, és kompromisszumokra van szükség átlagos nagyságokkal, illetve mutatókkal számolva.
A minta kiválasztási elemei a későbbi felhasz—
nálás során, amikor esetleg más rétegeket kell ai- kalmazni, vagy az idő múlása miatt a körülmé- nyek vaitoznak, más jelentőséget kapnak. Ha a különböző szempontok szerinti vizsgálatoknál a minta átfedése nagy vagy teljes, akkor lehet, hogy a hatékonyság valamelyest csökken.
Az időszakosan ismétlődő felvételek sok tekin- tetben bonyolult problémákat ölelnek fel, mivel bennük a vizsgálat céljától függően szinte min- den megjelenik. Az egyik legfontosabb kérdés, hogy mikor, milyen mértékben van szükség arra, hogy a minta azonos legyen. Ha csak egyszerű—
en bizonyos átlagos mutatókat vagy azok válto—
zásait vizsgáljuk, akkor nincs szükség átfedésre, bár bizonyos esetekben a mintavételi hibát vala- milyen mértékű átfedés csökkenti. Az egyénen—
kénti (bruttó) változások megállapításához azon- ban panelekre van szükség.
A tanulmány egy táblázatba foglalt, rend- szerezett áttekintést ad arról, hogy az ismétlődő vizsgálatok esetében milyen tipusú feladat meg—
oldásához az egymást követő megfigyelések mi- lyen mértékű ismétlődése, áttedése a kivánatos.
Végül a tanulmány azzal foglalkozik, hogy mi- lyen stratégiát célszerű alkalmazni a mintavételi hiba kiszámításánál, bemutatásánál.
(ism.: Marton Ádám) GAZDASÁGSTATlSZl'lKA
LANGER'CH': A 'Iá k k d i l s it d int
_ VI 9 eres e eem eemz se ren szer
A WLÁGKEEÉÉZKAEEÉEÉÉÉMTEWELÉS nem korlátozzák az export és az import alakulá—
(World trade and production. Methodology and tables ln ISIC.) HWWA Institut für ertaehütefonchung. Verlag Weitarehlv.
Hamburg. 1986. 377 p.
A kiadvány két részből áll: az első módszertani útmutatást ad, mig a kötet zömét kitevő második rész a táblákat közli.
sára, kapcsolatot keresnek a rájuk ható makro— és mikrogazdasági tényezőkkel, elsősorban a ter—
melési adatokkal. Ezért ágazati szerkezetben oél- szerű összevetni az országok külkereskedelmi, valamint ipari (például termelési, foglalkoztatási, hozzáadottérték-, beruházási) adatait, de az ága- zati osztályozások — nemzetközileg az lSlC (ln-
STATISZTIKAI lRODALMl FIGYELÖ
529
ternational Standard industrial Classification of All Economic Activities), a Német Szövetségi Köz- társaságban a SYPRO (Systematik der vm- schaftszweige, Fassung für die Statistik im Pro—
duzierenden Gewerbe) — nem feleltethetők meg egyértelműen azoknak az árucsoportoknak, amelyek a külkereskedelem ismert osztályozói- ban, az ENSZ által alkalmazott SITC-ben (Stan- dard international Trade Classification) és az Eu- rópai Közösségekben a NlMEXE-ben (Nomencla- ture of Goods for the External Trade Statistics of the Community and Statistics of Trade. between Member States) szerepelnek.
A Német Szövetségi Köztársaság gazdaságku—
tató intézetének külkereskededelmi adatbázisa 28 ország, illetve országcsoport adatait tartal- mazza három osztályozó: a SlTC, az ISIC és a SYPRO szerint. Jelenleg az 1966, az 1972. évi, továbbá 197546! kezdve évente (1984-ig) kiegé- szített külkereskedelmi adatok hozzáférhetők, a megfelelő ipari adatokkal öszehasonlitható szer- kezetben. A felhasználók dollárban és márkában juthatnak hozzá az importra, az exportra, a külke- reskedelmi mérleg (előjeles) értékére vonatkozó adatokhoz. Számitható továbbá a külkereskede- lem megoszlása termékcsoportok és földrajzi ré- giók szerint. A közeljövőben az adatbázis és a fel—
használók között közvetlen (on-line) információ- forgalom valósul meg.
Az adatbázis — valamennyi ISIC-ágazat ország és országcsoport szerint részletezve — 4700 oldal terjedelmű. Az adattárban 149 táblázat foglalja össze hat évre (1966, 1972, 1975, 1978, 1981 és 1984), illetve az OECD 12 országára, országcso- portjára a millió dollárra átszámított export és im- portadatokat. A 12 megfigyelt között van a Német Szövetségi Köztársaság, Franciaország, az Egye- sült Királyság, Olaszország, az Európai Közösség 10 tagországa együtt, Svájc, Svédország, az Eu- rópai Szabadkereskedelmi Társulás, az EFTA tagországai (Portugáliával együtt), Kanada, az Amerikai Egyesült Államok, Japán, valamint az OECD országai együtt. Az egyes adatlapokon 20 kereskedelmi partner; az előbb felsoroltakon túl:
az európai KGST—országok (Albániával együtt), az OPEC-országok, a ,,nagy bevételű" fejlődő orszá- gok, Tajvan, Dél-Korea, az újonnan iparosodó (NlC-Newly lndustrializing Countries) ázsiai, vala-
mint latin-amerikai országok, az összes fejlődő ország, továbbá a világ összes országa.
A fejlett ipari országok között (az Európai Kö- zösség, az EFTA tagországai, az Egyesült Álla- mok, Kanada és Japán mellett) szerepeltetik Spa-
nyolországot, Ausztráliát, , Új-Zélandot, illetve
(csak a kereskededelmi partnerek között) olyan OECD—országokat is, mint Törökország, Jugo- szlávia, a kis európai államok, izrael és Dél-Afrika.
8 Statisztikai Szemle
Az OPEC 13 országa: Algéria, Ecuador, Gabon, lndonézia, Irán, Irak, Kuvait, Libia, Nigéria, Katar, Szaúd—Arábia, Egyesült Arab Emírség, Venezue- la; az 5 újonnan iparosodó ország Ázsiában:
Hongkong, Malaysia, Szingapur, Dél-Korea és Tajvan; a 3 latin-amerikai: Argentina, Brazília és Mexikó. Az OPEC- és Nio—országokon túlmenően ,,nagy jövedelműnek" tekintik Szíriát, Jordániát, Omant, Panamát, Trinidadot és Tobagót, Chilét, Uruguayi. A KGST-országok adataiban a Német Demokratikus Köztársaság és a Német Szövetsé—
gi Köztársaság (,,belnémet") áruforgalmat az adatbázis nem tekinti külkereskedelemnek.
A közölt export- és importadatok az lSlC há- rom— (indokolt esetben négy-) jegyű osztályai sze- rint, 45 sorban, valamint összesítve szerepelnek.
Vannak az adatbázisban különleges megitélés alá tartozó tételek: így a nem monetáris rendelte- tésű (például ipari célú) arany, a többnyire titkos kezelésű haditechnikai termékek, az államközi el- számolásokban kiemelt javak, a víz és a villamos áram, a gazdaságilag értékelt postai szolgáltatás, a nemzetközi területeken zajló (így országhatárt a szokásos értelemben át nem lépett) áruforga- ,lom, például tengeri hajózási, légiforgalmi eszkö—
zök, hal, tengeri ásvány- és kőolaj-kitermelés stb.
Ugyanakkor olyan tételeket figyelmen kívül hagy- nak, mint például a monetáris arany, a kormány megrendelésére külföldön tartózkodó diploma- ták, fegyveres erők részére helyben átadott javak és szolgáltatások, a nemzetközileg forgalmazott letét, értékpapír, érme stb.
A forgalmat a tényleges importértékkel (cus—
toms values) veszik számításba, s ez eltérhet az
export helyén és idején érvényesitettól. Értékelé—
si nehézséget okoz egyes ,,nem anyagi áruk" ke- zelése, mert a filmek, videotelvételek, mágneses adathordozóra rögzitett számítógépes progra- mok ,,többet érnek", mint a vámszabályok által meghatározott ,,hordozóanyagár".
A külkereskedelem (SITC) nemzetközi osztá- lyozójának 1. nómenklatúrája (Rev. 1) szerinti adatok állnak rendelkezésre 1978-ig, azóta a Rev.
2 (bővített) nómenklatúrát veszik alapul, az újabb (Rev. 3) termékjegyzéket a harmonizált rendszer (Harmonized Commodity Description and Co- ding System) követelményeihez igazodva a nyolcvanas évek végéig állítják össze, A SITC Rev. 2 termékjegyzék egyjegyű ágazatokat (0-9 SECTION), ezeken belül kétjegyű fócsoportokat (62 DlVlSlON), háromjegyű csoportokat (233 GROUP). négyjegyű alcsoportokat (786 SUS- GROUP) és ezek közül 420-nál ötjegyű tételeket (1466 lTEM) tartalmaz. A tovább nem bontható ,,elemi csoportok" száma (BASIC lTEM) ennek megfelelően 1832; (a SITC Rev. 1 termékjegyzék- ben 1300 elemi csoport szerepelt). Besorolási ne-
530
STATISZTIKAI lRODALMI FiGYELÓhézség adódik a nem egyértelmű SlTC—iSIC nó- menklatúra-megfeleltetésekből: a külkereskedel—
mi termékjegyzék 75 csoportjának a termelési (ágazati) nómenklatúra két csoportja, 16 eseté- ben három, 3 esetében négy lSlC—csoport telel- tethetó meg. Ezért az adatbázisban az ilyen (összesen 94) SlTC—csoportot több lSiC—csoport- hoz kell rendelni, megfelelő módszert alkalmaz- va a ,,szétosztáshoz".
Módszertani kérdés az is, hogy az átadó ország exportjaként és egyidejűleg az átvevő ország im- portjaként is szerepeltetett külkereskedelmi ada- tok eltérő értékeit miként kezeljék. Három ténye- zőcsoport vizsgálandó itt: az elkerülhetetlen kü- lönbségek, a jelentési rendszerek eltérései, vala—
minta hibák. Az elkerülhetetlen különbségek fő oka, hogy az exportot kisebb biztosítási és tuva- rozási költségekkel (tob. — free on board) érté- kelik, mint az importot az átvevő országban (c.i.f.
- cost, insurrance, freight).
Az export és az import értékelésének helye és időpontja többé—kevésbé eltér, emiatt számotte- vő (például ártolyameltérésekből adódó) és elke—
rülhetetien különbségek mutatkozhatnak.
Módszertani eltérések miatt nem egységes a külkereskedelem jelentési rendszere; például egyes cikkeket tudatosan máshová sorolnak (vagy elhagynak) az átadónál, illetve az átvevő- nél, többek között fegyvereket, a közvetítőként (vagy használtan) átadott hajókat, repülőgépe—
ket, a villamos áramot, az aranyat, a javitásokhoz szállított termékeket, a tulajdon anyagi jellegű (például leányvállalattól származó) hozadékai- nak átadását. Különleges megitélés (és eltérő ér- tékelési gyakorlat) fűződik például a vámszabad—
területekről vagy például az áruházale szárma- zó (zömmel fogyasztási cikk) forgalomhoz. Kü- lönböznek az egyes országokban alkalmazott vámszabályok, az ezek által rögzített értékelési eljárások. A jelentési rendszerek nem egyformán értelmezik a ,,rendeltetési ország" fogalmát, pél—
dáui eltérő lehet a vevő és a tényleges felhaszná—
ló ország. ismertek azok a módszertani eltérések, amelyek az országonként sajátosan felépített ter- mékosztályozókra vezethetők vissza.
Nagy figyelmet kell fordítani a harmadik cso- portra: az értékelésben elkövetett (és kiszűrendő) hibákra. Sok esetben a vámtisztviselők az árut nem megfelelően értékelik, akár nemzeti valutá—
ban, akár (téves vaiutaártoiyammal számítva) a közös egyenértékesben. A szokásos adatrögzíté- si és -feldolgozási hibák sem zárhatók ki, Megbiz—
hatóbbak az importstatisztikák, mivel (az export- hoz viszonyitva) szorosabban kezelik mind a megfigyelést, mind az adatgyűjtést a nem tarifa—
jeilegű behozatali korlátozásokra is tekintettel.
import esetén a földrajzi adatok is kevesebb téve—
déssel terheitek, ugyanis az áru eredetéhez ko- molyabb anyagi következmények fűződnek. mint az export esetén.
Az elemzések rámutattak, hogy az OECD-or—
szágok összesített importját az országcsoport összes exportjához viszonyítva, a termékcsopor- tok többségére a c.i.t. —- t.o.b. eltéréséből eredő értékelési különbség jellemző. Megvizsgálták, hogy az ágazati (iSlC) rendszer szerinti külkeres—
kedelmi adatbázis milyen mértékű azonosítási el- lentmondást tartalmaz: számították az import és export különbségének értékét, és ezt az import- export számtani átlagának százalékában adták
meg. így, ha importot nem jelentettek -200 száza-
lék az egyik hibahatár, a másik (t200 %) pedig az export hiánya esetén adódik. Az 1972. és 1983.évi adatokat 46 iSIC csoportra és 19 OECD-or- szágra elemezték ezzel a hibaképlettel: 1972-ben 2,2 százalékkal, 1983-ben 3,0 százalékkal halad—
ta meg az összes import adata az exportét. Szé- les szórási tartomány mutatkozott (1972: 431 és 4-88 százalék; 1983: 409 és Jr 127 százalék kö—
zött). Amennyiben nem törlik a pozitív és a nega—
tiv eltéréseket, a 19 ország kétoldalú forgalmát át- lagosan 15,7, illetve 18,1 százalék eltérés jel- lemzi. Lényegesen nagyobb az lSlC—csoportokra (46) és országokra partnerenként (19 x 18) éven- te meghatározott eltérés: az összesen 15 732 megtigyelésbői 40. illetve 38 százalék az import—
többlet aránya az import—export számtani átla- gához. Külön vizsgálták az 1980. évi adatokat az lSlC szerint rendezve: 8 országot és 16 alágaza- tot (az élelmiszer-, a könnyű—, a vegyipar, az épí- tőanyagipar, a kohászat és a gépipar ágazatait) összehasonlítva az OECD adatbázisából (COM- TAP — Compatible Trade and Production Data Base, amely 1961-tői külkereskedelmi, 197046!
1 1 országra termelési adatokat is tartalmaz) szár—
mazó külkereskedelmi és termelési adatokkal. A feldolgozóipari és kohászati alágazatokra a HWWA és az OECD adatbázisa tíz százalékot meg nem haladó eltéréssel szolgáitat adatokat (az importra 5,4, az exportra 8.5 százalék a kü- lönbség). Jellegzetes, hogy melyek a tiz száza—
léknál nagyobb eltérésű szakágazatok: a fémtar- mékek (iSlC 381) importja 13, exportja 14 száza—
lékkal tért el; a tégla—, cserép— és cementipari ter—
mékeké (iSlC 369) 13, illetve 12, a gumiterméke- ké (ISIC 355) 11, a kerámiáké (lSlC 361) 11 szá- zalékkal.
A kapcsolódó iparstatlsztikai adatokban is je- lentősek az ellentmondások, a tisztázatlan beso- rolások, alapvetően az elsődleges adatok mód- szertani gyengeségei következtében. Hiányzik sok helyen a nemzeti fogalommeghatározáa és a statisztika fogalmai nincsenek összehangolva. Az adatgyűjtésbe vont vállalatok köre (minimális
3571;