926 STATiSZTlKAl lRODALMl FIGYELÖ
Az SM—eljárás lényege az, hogy informá—
ciókat szerezzünk az y, z együttes eloszlásá—
ról, ami lényegében azt jelenti, hogy ismer- jük az (y, z) együttes gyakoriságokat vagy a Cyz kovarianciamatrixot, vagy az y és z valamilyen keresztmetszeti táblázatait. Külö- nösen az utóbbi két információ fontos, mivel a Cyz ismerete a kiindulási pontja a több- változós elemzéseknek. a keresztmetsz ; táb- lázatok pedig a statisztikai adatok 5 ásos bemutatási módjai. Az összekapcsolás lehet feltételhez kötött vagy feltétel nélküli. Ezek lényege a következő. Az A és B file—ok egye- dei között definiáljuk 0 Díj távolságot, a- melyet a megfelelő x változók különbségei
— fontosságuk szerint súlyozva -— határoz- nak meg. A nem korlátozott eljárásban minden egyes i elemhez a másik file—ból a hozzá legközelebb eső i elemet kell megke- resni függetlenül attól, hogy a [ elemet már felhasználták-e hasonló célra vagy sem.
Ez egy szoros kapcsolást eredményez. azon- ban az így létrehozott z halmaz eloszlása különbözni fog az eredeti 1 halmazétól.
A korlátozott összekapcsolási eljárás nem torzítja el a z eloszlást. Szigorú feltételt tar- talmaz a lehetséges párok x változóira, pon- tosabban az azokból kiszámítható D,,- távolságok arányaira. Ez az eljárás azon- ban nagyon hosszadalmas és költséges.
Az előrejelzés módszerével történő ösz- szekapcsolás lényege az, hogy ha az y_és z az x-re vonatkozóan függetlenek, akkor egyszerűen ,.előjelezhető", hogy az y, és z változók eloszlásának ismeretében hogyan alakulnak az y, z keresztmetszeti gyakori—
ságok, ha az egyik sokaságból hiányzó adatokat az x változók felhasználásával a másik halmazból pótoljuk. Amennyiben az y 'és z változók x—re vonatkozóan nem füg- getlenek, akkor kétlépcsős regressziós tech—
nika segitségével becsülhetők az A file- ból hiányzó adatok a B file-ból és fordítva.
(Ebben az esetben az új C sokaság az ere- deti teljes, tehát az A—j—B sokaság terje- delmével egyezik meg.)
Ha y és z feltételesen függetlenek, akkor a Cyz kovarianciamatrix egyszerűen becsül-
hető O Cyz és sz-ből:
Cyz : ny _ Clxxcxz-
A végrehajtott szimulációs kísérletben a három kapcsolódó változó közül kettő (az is- kolai végzettség és a foglalkozás) katego- rizált, egy (a heti munkaórák száma) foly- tonos volt. Az egyszerű, feltétel nélküli ösz- szekapcsolás, ahol a távolságfüggvénynél az x változók eltéréseinek négyzetei azonos súlyt kapnak, nem működött jól. Ezért ki- próbáltak egy inputálási technikán alapuló megoldást is. Mindkét részhalmaz elemeit
az x változók szerint kategorizálták, s ha ugyanabban a cellában volt egy elem az A és B file-ból, akkor azt összekapcsoltnak tekintették. Ha nem. akkor megkeresték a legközelebb eső elemet. Ez lényegében egy hierarchikus egymáshoz rendelés volt, mivel a válogatás a legutolsó változó szerint kez- dődött az előző kettőt azonosnak tekintve majd a fontossági sorrendet követve követ—
kezett a második változó stb. Ezzel a mód- szerrel viszonylag egyszerűen lehetett nagy adattömeget mozgatni.
A szimuláció eredményei igazolták a vá—
rakozásokat, Az új C file-nak az eredeti A file—la! való összevetése azt jelezte, hogy a z—k marginális eloszlása egymáshoz közel volt, a 12 próbák 5 százalékos valószínű- ségi szint mellett nem voltak szignifikánsak.
A keresztmetszeti tóblázás már más ered- ményt mutatott: azok túlnyomó része (hét- ből hat eset) a 762 próbával szignifikánsan
különbözőnek mutatkozott.
Amikor pedig a C file táblázatait az elő- rejelzési módszerrel kapott táblázatokkal hasonlították össze, szinte teljes volt a ha- sonlóság. Ebben az esetben tehát nem volt különbség az SM és az előrejelzési eljárá-
sok között.
Cassel tanulmánya végeredményben a statisztikai összekapcsolások hasznosságát tárja fel azzal, hogy nem minden megoldás alkalmazható az alapsokaság tulajdonságo-
itól függően.
(ism.: Marton Ádám)
MEDlN, KA:
IDÖSZERÚSÉG A HIVATALOS STATISZTIKÁK ELÖÁLLITÁSÁBAN
(Timeiiness in the production of official statis—
tics.) - Statístisk Tidskrift. 1984. 1. sz. 5—15 p.
A hivatalos statisztika időszerűségének fogalma jelentheti a gyorsaságot, vagy o pontosságot, vagy egyszerre mindkettőt. A gyorsaság itt azt jelenti, hogy a statisztika a vonatkoztatási időhöz (időpont vagy idő- tartam) képest rövid időn belül rendelkezés—
re áll. A pontosság pedig azt jelenti, hogy a statisztika megközelítőena tervezett és elő—
zetesen közölt publikációs határidőre áll rendelkezésre.
A hivatalos statisztika időszerűsége nap- jainkban — a gyors változások és a terve—
zés növekvő térhódításánok korában, amely
a hivatalos statisztika iránti igény gyors nö-
vekedését eredményezte — különösen aktu- ális. A fejlődés a mennyiségi igények növe- kedésén túl a hivatalos statisztikával szem—
ben tómasztott minőségi követelmények nö- vekedését is jelenti, beleértve az időszerű- séget is.
STATlSZTlKAI lRO DALMI FIGYELÖ 927
A statisztikusok körében általános tapasz—
talat. hogy a felhasználók erősen hangsú- lyozzák az időszerűség jelentőségét, ugyan—
akkor az időszerűségi követelmények —— leg- alábbis a szerző tapasztalatai szerint — gyakran nem megfelelően körülhatároltak.
Ennek okait a szerző a következőkben lát- ja: egyrészt a statisztikák felhasználói ne—
héznek érzik annak felbecslését, mely kö- vetelmények tekinthetők indokoltnak, illetve feltételezik, hogy a statisztikák előállítói a gyakorlatilag elérhető legjobb időszerűsé- get biztosítják, esetenként pedig kifejezet- ten ellenérdekeltek az időszerűség javításá- ban (ha például egész felhasználói rend- szerünk és szervezetünk az időszerűség egy korábbi szintjének feltételezésére épült):
másrészt a statisztikák felhasználóinak gyak- ran nincs előzetes képük a felhasználások gyakoriságának és módszereinek változásá-
ról.
Összegezve az időszerűség javításának követelményeivel kapcsolatban mondottakat:
a nemzeti statisztikai hivatalokban folyó fejlesztési munka számára ésszerű feltevés- nek mondható, hogy az időszerűség javí- tása növeli a statisztikák értékét. Töreked- ni kell tehát az időszerűség javítására. an- nál is inkább. mivel az elmúlt évtized so- rán kifejlesztett, az elektronikus adatfeldol—
gozáson alapuló nyilvántartások —- gyorsa- ságuk folytán —— csökkentették a hagyomá—
nyos statisztikák jelentőségét. A szerző bi- zonyítja, hogy az időszerűség javítása nem szükségképpen rontja a statisztikák más mi- nőségi jellemzőit, sőt a statisztikák korábbi—
nál gyorsabb előállítása gyakran alacso- nyabb nem válaszoló arány és kisebb költ- ség mellett érhető el anélkül, hogy más jel- lemzők romlanának. Ennek az a mogyoró- zata. hogy olyan dinamikus szituációban dolgozunk, amelyben az új statisztikai mód- szerek. hatékonyabb adatfeldolgozási eljá—
rások és jobb szervezeti megoldások stb. le—
hetővé teszik a javításokat.
A statisztikák előállítása során az idő- szerűség —— a gyorsaság és pontosság kér- dése —— különböző szituációkban merülhet fel. A rendszeresen ismétlődő statisztikai sorozatok kapcsán e szituációnak alapve- tően két típusa különböztethető meg:
a) a ,,tervezési szituáció", amely a statisztika előállítását megelőző helyzetre vonatkozik,
b) a ,.termelési szituáció", amely a statisztikai vizsgálat végrehajtásának folyamatára vonatkozik.
A gyakorlatban azonban legtöbbször né- mileg más szempontból kell nézni a dol—
gokat, következésképpen egy harmadik tí- pusú szituációról kell beszélnünk: ez az ún.
c) ..dinamikus szituáció". amikor a rendszeresen megjelenő statisztika jövőjét az addig elért ered-
;ritínyek és szerzett tapasztalatok fényében tekint-
A tanulmány sorra veszi. hogy az egyes fent említett szituációkban milyen lehető—
ségek kínálkoznak az időszerűség javításá—
ra. A lehetőségeket értékelve — előnyeit és hátrányait tárgyilagosan felsorakoztatva — mindvégig szem előtt tartja. hogy megte-
remthető, és meg is kell teremteni az idő-
szerűségnek és a statisztikák más minősé- gi jellemzőinek, valamint egyéb tényezőinek (kölségek, a válaszadás munkaigénye, a megfelelően kiképzett személyi állomány) egyensúlyát.
A .,tervezési szituációban" rendszerint le- hetőség van a statisztikai vizsgálat kivitele—
zésének különböző módszerei közül való vá- lasztásra. A szerző itt az alábbi módszereket értékeli:
—- mintavétel lat helyett;
— közelítő becslések;
előzetes statisztika;
fokozatos publikálás;
az elektronikus adatfeldolgozás bevezetése;
on—line technológia;
adattovábbítás számítógépes adathordozón;
nyilvántartási technikák;
a szervezet megerősítése;
a tervezés fejlesztése:
a vezetés fejlesztése;
a gépelés. nyomtatás és elosztás hatékonyabA bá tétele.
-— a válaszadók motivációjának erősítése;
— a válaszadóknak nyújtott támogatás növelése;
—— egyéb módszerek (például munkaerő—átcsopor- tosítás).
alkalmazása a teljes körű vizsgá-
llllllllll
A ,,termelési szituációban" a statisztikák gyors és pontos előállításának alapvető elő- feltétele a gondos, minden lényeges szem- pontra kiterjedő tervezés. Egy másik nagyon fontos követelmény a statisztika előállítási folyamata áttekintésének, nyomon követésé- nek biztosítása. hogy zavar esetén, illetve a nagyobb rugalmasság érdekében késedelem nélkül be lehessen avatkozni a folyamatba.
Az ún. ,,dinamikus szituáció" a ,.tervezési szituáció" speciális eseteként is felfogható, de itt különleges hangsúlyt kapnak az egyes vizsgálatok közötti törekvések, az idő- beli változások. A szerző itt a statisztikai módszertan, a számítógépes technika és a szervezéstudomány fejlődésére utal. Kiemel- kedő jelentősége van továbbá annak a ténynek. hogy a statisztikák előállításának gyors növekedése együtt járt a statisztikusok korösszetételének kedvező változásával (fia—
talodásával). Fontos követelmény azon fel—
tételek megteremtése. amelyek biztosítják az ily módon jelentősen megnövekedett fej- lesztési kapacitás átalakítását tényleges fej—
lődéssé a statisztikában.
A tanulmány további részében a szerző olyan kanadai és svéd gyakorlati intézke—
déseket mutat be, amelyeknek elsődleges célja az időszerűség javítása volt.
(ism.: ifi. Molnár István)