STATISZTIKAI IRODALMI FIGYELő
183
véletlen elvén alapuló kísérletezés, illetve a véletlenszerű kiválasztás, a mintavétel problémáját. Ez utóbbi témakörben tevé- kenységük forradalmi újszerűsége abban rej- lett, hogy a véletlen elemét a kutatás- tervezésen keresztül vitték be a statisztikai elemzésbe. A hagyományos felfogás szerint — s ezt a felfogást tükrözte a Gauss—Laplace- szintézis is —— a véletlen a természet sajátos- sága; a Fisher és Neyman által kidolgozott módszerekben ezzel szemben a véletlen tuda—
tos emberi beavatkozás eredménye. A rando- mizálás, illetve a véletlen mintavétel segít- ségével a kutató mintegy mesterségesen idézi elő azt, amit a korábban eredendően meg- levőnek, a természet szerves részének tartot- tak.
A tanulmány legvégén Fienberg visszatér a szorosan vett könyvbírálathoz, s egyenként értékeli a korábban említett hét kötetet, s fel- állít egy —— a kötetek értékét tükröző —— fon- tossági sorrendet. Első helyen S. M. Stigler művét ajánlja egyrészt szakmai alapossága, másrészt a technikai részletek és a kortörté- neti háttér kiegyensúlyozott tárgyalása, har- madrészt pedig a szerző élvezetes stílusa
miatt. Ezt követi I. M. Porter munkája, a
lista végére pedig A. Hold könyve került.
(Ism.: Moksony Ferenc)
KISH, L.:
SÚLYOZÁS KÚLÖNBÖZÖ Pi—k KERETÉBEN
(Weighting for unegual Pi.) — Journal of Official Slatistics.
1992. 2. sz. 183—200. p.
A reprezentatív felvételek megfigyelt ada—
tainak súlyozása a becslések, az eredmények értékelése szempontjából kulcsfontosságú.
Bármilyen felvételről legyen is szó, mindenek- előtt az egyedileg megfigyelt adatok átlago- lását vagy felszorzását kell pontos módon elvégezni. A szerző véleménye szerint azon- ban e problémákat nem lehet egyszerűen megoldani. A tanulmányban a súlyozással kapcsolatos kérdések megválaszolásához kí- ván segítséget nyújtani igen bőséges szak- irodalommal, valamint azáltal, hogy rá- irányítja a figyelmet a legalapvetőbb kér- désekre.
Néhány súlyozással kapcsolatos tipikus kérdés: a nagysággal arányos valószínűségi
kiválasztás és az annak megfelelő súlyozás;
mikor kell, kell-e egyáltalán a megfigyelési adatokat súlyozni; figyelembe kell-e venni a nemválaszolási arányokat; mikor függ erősen a becslés eredménye a súlyozástól; hogyan határozhatók meg a megfelelő súlyok; hogyan alkalmazhatók a súlyok; hogyan végezhető el a súlyozás gyakorlatilag számítógépekkel.
A szakirodalom az egyenletes és független eloszlású valószínűségű változók kapcsán
általában szükségesnek tartja a súlyozás említését. A mintavételi módszerek ugyan- akkor leginkább a kiválasztási eljárásokat ismertetik. A felvételi tervben azonban a kiválasztás és a becslés nem választható el egymástól. így a súlyozás megoldása valójá- ban része mind a kiválasztási, mind a becslési eljárásnak. A szakkönyvek azonban a súlyo- zást nem egy esetben csak bizonyos részleges összefüggéseiben tárgyalják, mint például a rétegzés, a nemválaszolás vagy a szórás csökkentése.
A súlyozással kapcsolatos irodalom több irányból közelíti meg ezt a kérdést. A szerző nagyon gyakorlati megközelítésből kiindulva segítséget próbál nyújtani a szakembereknek annak eldöntésében, hogy miért, mikor és hogyan kell a megfigyelési adatokat súlyozni.
Tökéletes, minden szempontból kielégítő megoldásokat természetesen nem lehet talál- ni, de azt végül is el kell dönteni, hogy nem egyenlő kiválasztási valószínűségek mellett miként súlyozzunk, illetve milyen modelleket használjunk.
A súlyozás szükségessége mellett két szem- pontot sorol fel a tanulmány. Ezek a követ—
kezők:
— nem azonos valószínűséggel történő kiválasztás a költ- ségek és a szórás csökkentése érdekében;
— a minta különböző területekhez, csoportokhoz történő allokációjának korrekciója;
— a mintavételi keret problémáinak csökkentése például olyan esetekben, amikor a kiválasztási egység kis klasztereket jelent, s a megfigyelési egység ezen belül kerül valamilyen módon kijelölésre (például háztartás, személy);
—- a nemválaszolás kiegyenlítése, ami néha a lefedés problémáival együtt oldható meg;
— a becslés javítása például utólagos rétegzés esetén;
— külső kontroll-lehetőségek is a súlyozás felülvizsgálatá- lioz vezethetnek: ilyenek például a célsokaság és a mintára vonatkozó információk, bizonyos megoszlások stb.;
— egyre gyakoribb a különböző minták együttes (kombi- nált) felhasználása, amely valamilyen módon hatással van, illetve kell, hogy legyen a súlyozásra.
A súlyozás gyakorlati megvalósítására négy különböző lehetőség kínálkozik:
-— az egyedi adatok súlyozása, anni különösen gyakori és flexibilis akkor, ha modern számítástechnika áll rendelkezésre (például a P! kiválasztási és az r, válaszolási arányok kombi- nációja); ez azonban nem mindig vezet torzítatlan becslések- hez, valójában célszerű a célsokaság ismert, a kiválasztásnál használt súlyait használni;
—- sok esetben egyes csoportok súlyozott adatainak hasz- nálata a célszerű és ad jó eredményt;
—- sokszor az elerni adatok többszöröse vezet jó súlyozat- lan becslésekhez, különösen a neinválaszolások korrekciójá- nál;
—— bizonyos esetekben indokolt lehet a minta csökkentése elhagyások segítségével, amikor egyes csoportoknál nagyon nagy a kiválasztási arány (ezt a módszert, amely végül is információveszteséggel jár, ritkábban alkalmazzák, de van létjogosultsága az ,,önsúlyozás" biztosítása érdekében).
A tanulmány felsorol néhány olyan esetet is, amelyek a súlyozás ellen szólnak. A súlyo—
zás ugyanis bonyolulttá teheti a számításo- kat még akkor is, ha nagy számítógépek áll—
nak rendelkezésre. A bonyolultság pedig híbaforrást is jelent. A súlyozás esetlegessége
184
STATISZTIKAI IRODALMI FIGYELőnövelheti a szórást, különösen akkor, ha a mintavételi keret hiányos, ami gyakorlatilag úgy is felfogható, mintha nagysága valami- lyen egynél nagyobb számmal arányosan
csökkenne. A súlyozás ellen szólhat az is,
hogy az átlagos négyzetes eltérés általában kisebb a súlyozatlan, de torzitott becslések esetében. Ha pedig modelleket használunk, akkor nincs szükség súlyozásra, a mintavételi torzítás kiküszöbölésére. Néha a közvélemény is ellenzi a súlyozást, amelynek segítségével az egyes tényezők szerepét a végeredmény kialakításában lényegesen befolyásolni lehet.
Erre példa lehet az, ha a tömegtájékoztatás a fogyasztóiár-index egészével szemben annak csak egy kiugró elemét hangsúlyozza.
Bizonyos esetekben nem túl komplikált számításokkal a szórás növekedését a torzítás csökkenésével ki lehet egyenlíteni. A módszer lényege a súlyozott és a súlyozatlan adatok összehasonlító elemzésében rejlik. E megoldás gondolatmenete azonban nem számolt négy fontos tényezővel: a súlyozással kapcsolatos költségekkel és nehézségekkel, az önsúlyozá- sos minták előnyeivel, a súlyozott és a nem súlyozott minták kombinált alkalmazásának kedvező lehetőségével, valamint a bonyolul- tabb statisztikák, például a regressziós együttható követelményeivel.
Az önsúlyozásos mintáknak számos elő- nyük van, így igen gyakran alkalmazzák azokat. Az önsúlyozásos minták és az egyenlő valószínűségű kiválasztás között azonban van bizonyos különbség, amit tisztán kell látni. így bizonyos kis klaszterek esetében,
ha a véletlen mintavétel ,,kétlépcsős", a
kapott minta már nem önsúlyozásos. Hasonló a helyzet a nemválaszolással. így a véletlen kiválasztás tulajdonképpen nem vezet min—
den esetben önsúlyozásos becsléshez.
Hasonló eltérések találhatók az egyenlő valószínűséggel történő kiválasztás és az egy- szerű véletlen mintavétel között. Mindezek ellenére azért használhatók az ilyen minták, mert robosztusak. Nagysággal arányos való- színűségi kiválasztást akkor kell használni, ha a mintavétel célja azt egyértelműen indo-
kolja. A mintát tervezőnek kellőképpen mér- legelni kell az előnyöket és a hátrányokat.
A véletlen minták tervezése kellő tapasztala- tot, ügyességet igényel.
Sok esetben a statisztikusokat a torzítás szó megzavarja. Pedig a mintavétel módjától függő torzítás a mintából becsülhető, s ezt meg is kell tenni. Különösen komplex minták- nál fontos ez, mert az egyik változó becslése lehet erősen torzított, míg a másiké nem.
Sokszor azonban a mintavételi hiba növeke- dése elmarad a torzitásétól.
Az összegek becslése általában érzékeny a súlyok torzítására, az átlagoké kevésbé.
Külön problémát jelent a nemválaszolás, ami világszerte növekvő tendenciájú. Az alcso—
portok átlagainak szórása a minta nagyságá- nak csökkenésével arányosanl növekszik.
Az alcsoportok közötti különbségek mérésé- nél nagyobb problémák állnak elő, mivel a szórások összeadódnak és sokszor a torzítás is egy irányba hat. Az analitikus statisztikák (például regressziós együtthatók) esetében nem könnyű a szórás és torzítás viszonyának értékelése. Amennyiben a súlyozott és súlyo- zás nélküli statisztikák között nagy különb- ség van, a tanulmány az első használatát javasolja.
Végül a szerző felteszi a kérdést, hogy súlyozzunk vagy ne súlyozznnk? A legtöbb felvétel nem csak egy-egy változó becslését szolgálja, hanem számosét. Lehetetlen min- den változót alesoportonként részletesen elemezni. Talán az átlagok becsléseinél sú—
lyozni kellene, míg a regressziós becslések jók lehetnek súlyozás nélkül is.
Az utóbbi évek szakirodalma a kompro- misszumokat keresi. A speciális helyzetekhez azonban alkalmazkodni kell, nem lehet álta- lános szabályt adni. Célszerű a szélsőségesen nagy súlyok alkalmazását kerülni (trimming), valamint bizonyos összevonásokat (shrink- age) alkalmazni. Kétségtelen viszont, hogy a többcélú minták és felvételek esetében még további kutatásokra van szükség.
(Ism.: Marton Ádám)
GAZDASÁGSTATISZTIKA
GUGER, A.:
AZ OSZTRÁK IPAR BÉRKÖLTSÉGEIN EK VERSENYKÉPESSÉGE
(Lobnstückkostenposition der Industáe 1991 verbessert.) -—- WIFO Monalsberíchte. 1992. 7. sz. 381—386. p.
Az ipar nemzetközi versenyképességét egyaránt befolyásolja a bér- és a tőkeköltsé- gek alakulása, tehát nem közömbös, hogy egységnyi termelékenységjavulást mekkora bérnövekedés mellett érnek el. A tanulmány-
ban közölt nemzetközi statisztikai adatok szerint az 1980-as években a munka viszony- lag olcsóbbá vált a tőkéhez képest, a terme- lékenység gyorsabban nőtt, mint a reálbér, és fontosabbak lettek az innovációs hatások, mint a vállalati költségek.
A szerző a béreket és közterheit országok szerint vizsgálva megállapítj a, hogy Ausztria feldolgozóiparának 1991. évi, 214 schillinges órabérszínvonalához viszonyítva a német (129%), a svájci (125%), a norvég (l20%), a