Szakirodalom
Statisztikai Szemle, 84. évfolyam 5—6. szám
593
várható körülményeket. 2009-ben véglegesítik a címlistákat és a térképeket.
Külön problémát jelent a külföldön élő amerikai állampolgárok összeírása. 2004-ben kipróbálták az e körhöz tartozók számbavétel- ének megvalósíthatóságát. A próbaösszeírást Franciaországban, Kuvaitban és Mexikóban tartották. A postán és interneten visszaküldött kérdőívek száma elmaradt a várakozástól.
Franciaországból 3100 kérdőívet, Kuvaitból 300-at, Mexikóból 2000 kérdőívet kaptak visz- sza, amelyből 35 volt spanyol nyelvű. Pontos adatok nem állnak rendelkezésre az amerikai- ak tényleges számáról. Különböző becslések szerint a Kuvaitban élő amerikaiak száma 1245–7710 fő közöttire, a Franciaországban lakóké 32 252–101 750 fő közöttire, a Mexi- kóban élő amerikaiak száma pedig 63 591–
1 036 300 fő közöttire tehető.
A 2000-ben végrehajtott sikeres népszám- lálás után a vázolt fejlesztések, és az új mód- szerek bevezetésével 2010-ben egy minden eddiginél eredményesebb, pontosabb és taka- rékosabb népszámlálás várható az Egyesült Államokban.
Hajnal Béla
kandidátus, a Debreceni Egyetem főigazgató- helyettese
E-mail: bhajnal@interware.hu
Nordholt, E. S.:
A 2001-es holland virtuális cenzus
(The Dutch virtual census 2001: A new approach by combining different sources.) – Statistical Journal of the United Nations ECE. 2005.
évi 1. sz. 25–37. old.
A 2001-es holland cenzus tábláinak előál- lításához különböző adatforrásokat használtak.
A teljes összeíráson alapuló 1971-es cenzus óta a lakosság részvételi hajlandósága erősen
csökkent. A Holland Statisztikai Hivatal (a to- vábbiakban HSH) egy alternatív megoldást ta- lált a virtuális cenzus révén rendelkezésre álló nyilvántartások és statisztikai felvételek fel- használásával. A kapott táblák nemcsak a ko- rábbi holland cenzusok eredményeivel hason- líthatók össze, hanem a 2001-es cenzusforduló egyéb országainak adataival is.
A 2001-es cenzus során részletesebb in- formációkra volt igény, mint a korábbi cenzu- sok esetében. A különböző adminisztratív adatforrásokkal kapcsolatos tapasztalat képes- sé tette a HSH-t arra, hogy kifejlesszen egy olyan társadalomstatisztikai adatbázist, amely koherens és részletes demográfiai és társadal- mi-gazdasági információkat tartalmaz a sze- mélyekről és háztartásokról. Ennek az adatbá- zisnak a gerincét a népesség-nyilvántartás ké- pezi. Reprezentatív felvételekre van szükség azoknak az adatoknak az előállításához, ame- lyek nem szerepelnek nyilvántartásokban.
Ahhoz, hogy általános számszerű egyezést érjenek el a 2001-es cenzus táblái között, a HSH módszertani szakemberei kifejlesztettek egy olyan új becslési módszert, amely biztosít- ja a számszerű egyezőséget a táblák között, ha az adatok különböző forrásokból származnak.
A módszert ismételt súlyozásnak hívják, amely a különböző forrásokból származó táblák becs- lései közötti számszerű inkonzisztenciák ki- küszöbölésére irányuló ismételt regresszió al- kalmazásán alapul.
2003-ban a hollandok kombinált adatokat használtak a 2001-es cenzus tábláinak előállí- tásához, azoknak az adatoknak a segítségével, amelyek a HSH-nál már akkor rendelkezésre álltak, így szükségtelenné vált teljeskörű ösz- szeírásban kikérdezni a lakosságot. Ily módon a holland adófizetők egy sokkal kisebb „cen- zusszámlát” kaptak. Egy hagyományos nép- számlálás közel 300 millió, míg a kombinált módszer költségei mindössze 3 millió euróba kerültek. A becslések tartalmazzák az összes
Szakirodalom
Statisztikai Szemle, 84. évfolyam 5—6. szám 594
előkészítő munka költségeit (beleértve az új módszertan, valamint a társuló szoftver fej- lesztését), az eredmények elemzését, de nem szerepelnek benne a nyilvántartások költségei.
A nyilvántartások nem népszámlálási célra, hanem egyéb célokra naprakészek. A cenzus- költségek megtakarítása csak olyan országok- ban lehetséges, ahol elégséges regiszterinfor- máció áll rendelkezésre. Példaként említhető a holland virtuális cenzus és a kanadai hagyo- mányos cenzus közötti összehasonlítás. A 31,6 milliós Kanadának közel kétszer annyi a lako- sa, mint Hollandiának. A kanadai cenzus közel 450 millió eurót emésztett fel, ezt azzal ma- gyarázzák, hogy a régiók közötti pénzek elosz- tása miatt a népszámlálási eredményeknek rendkívül szerteágazó következményei van- nak. Egyébként egy virtuális cenzus a szüksé- ges regiszterinformációk hiánya miatt Kana- dában lehetetlen volna.
A 2001-es cenzus 40 kiterjedt táblát foglal magában. Ebből 28 vonatkozik Hollandia egé- szére, 3 a NUTS3-szintre, 3 pedig a település- (NUTS5) szintre. A lakásokra 8 tábla vonatko- zik, 2 az ingázásra, míg a többi 30 demográfi- ai, foglakozási, iskolai végzettségi és gazdasá- gi aktivitási adatokat közöl. Ezen túlmenően demográfiai, lakás- és munkaügyi adatok ta- lálhatók a 10 legnagyobb városra.
A pénzügyi szempontoktól eltekintve, más fontos különbségek is léteznek a hagyományos és a holland virtuális cenzusok között. A ha- gyományos cenzus kötelező jellege ellenére a lakosság egy része egyáltalán nem kíván részt venni az összeírásban, egy másik része csak bizonyos kérdésekre nem hajlandó válaszolni.
A nemválaszolást súlyozással és imputálási technikákkal lehet korrigálni. Azonban a ha- gyományos cenzusok jól ismert problémája, hogy az együttműködés korlátozott és szelek- tív jellegű. A hagyományos javító módszerek- nél fellép a megbízható eredmények közlésé- nek hiánya. Hollandiában az utolsó hagyomá-
nyos népszámlálás során (1971-ben) nagyfokú ellenállást lehetett tapasztalni az integrált adat- gyűjtéssel szemben a lakosság részéről. Ez megnövelte a nemválaszolási problémát, és azt lehetett várni, hogy a következő cenzusok so- rán ez még nagyobb fokú lesz. A virtuális cen- zussal szemben alig van kifogás, és a nemválaszolási probléma azoknál a felvételek- nél játszik szerepet, amelyek adatait a cenzus felhasználja. Amennyiben a nemválaszolás ja- vítható a felvételben, akkor szelektivitás esetén a cenzusadatok is javíthatók lesznek.
Hollandiában a virtuális cenzus később kezdődött, mint a hagyományos cenzusokat végrehajtó más országokban, mert nem lett volna értelme a projektet indítani mielőtt az összes forrás nem áll rendelkezésre, ugyanis bizonyos nyilvántartások csak később váltak elérhetővé. Mindezek ellenére Hollandia az el- sők között volt abban, hogy elküldje a 40 táb- lát az Eurostatnak, amely az összes EU- tagállamra, a csatlakozó országokra, valamint az EFTA-tagállamokra vonatkozóan koordi- nálta az akciót. Hollandiának előnye, hogy nem volt szükség a beérkező kérdőívek ellen- őrzésére és javítására. Meg kell azonban je- gyezni, hogy bizonyos változókra csak minta- vételes információk álltak rendelkezésre, ami azt eredményezte, hogy néhány holland táblá- ban lehetetlen volt bizonyos részletességi szin- tet elérni.
Amennyiben egyes cellák becslése nem megfelelő, a jövőben a kisterületi becslési technikák alkalmazása lehet megoldás. Ennek elméleti alapjai kidolgozottak és a Brit Statisz- tikai Hivatal (Office for National Statistics – ONS) megvizsgálta az alkalmazást az ún.
Szomszédsági Statisztikai Program (NSP) ke- retében (ahol például egy gazdagok lakta to- ronyház közvetlen környezetében levő „bá- dogházak” lakóira is kell elfogadható statiszti- kákat közölni ugyanabban a körzetben). Lehet- séges, hogy az ismételt súlyozás és a kisterüle-
Szakirodalom
Statisztikai Szemle, 84. évfolyam 5—6. szám
595
ti becslés kombinációjára kerül sor a 2011-es cenzusfordulóban.
A táblák összeállítása a HSH részéről gentlemen’s agreement alapján történt. Hol- landiában 1991-ben a népszámlálási törvény- ben eltörölték a HSH-nak azt a kötelezettségét, hogy minden tíz évben tartson népszámlálást.
Nincs európai kötelezettség arra sem, hogy bi- zonyos európai szervezetek részére az egyes országoknak népszámlálási adatokat kell szol- gáltatni, de elfogadhatatlan lenne, hogy Hol- landia nem szolgáltat adatokat az európai szer- vezeteknek, ahogyan azt a többi európai or- szág teszi.
A virtuális cenzus 2001-re vonatkozik. A táblák összeállításának módszere elsősorban a központi népesség-nyilvántartáson alapult, amely az összes települési nyilvántartás kom- binációja. Ezek a táblák gyakoriságra koncent- rálódtak. A társadalomstatisztikai adatbázis, amely integrált adatokat tartalmaz a foglalkoz- tatottakról és önfoglalkoztatottakról 2001-re vonatkozóan még nem állt rendelkezésre, ezért 2000-es adatokat használtak a 2001-es adatok közelítésére. Különböző adatokat a munkaerő- felvételből, illetve a nagymintán alapuló fog- lalkozatási és kereseti felvételből vettek át.
Lakásadatokat a lakásnyilvántartásból és a la- káskörülményekre vonatkozó felvétel alapján képeztek.
A táblák közötti konzisztenciát az ismételt súlyozás módszerével biztosították, amelynek segítségével a rekordok súlyait úgy képezik, hogy egy új tábla becslése konzisztens az ösz- szes korábbi tábla becslésével.
Mivel a 2001-es cenzus részben reprezen- tatív felvételekre támaszkodik, a megbízható- ság érdekében a következő szabályokat vették figyelembe: 10 személynél kevesebbet tartal- mazó cellát nem publikáltak; 24-nél több sze- mély esetén a táblát mindig publikálták; 0-24 személyes cellák esetén csak akkor közöltek adatokat, ha egy cellának sincs 10-nél keve-
sebb eleme, valamint a cellák legalább 50 szá- zaléka tartalmaz legalább 25 személyt.
A 2001. évi cenzus főbb eredményei a kö- vetkezők voltak. 2001. elején 16 millió ember élt Hollandiában, ebből 7,9 millió férfi és 8,1 millió nő. A 0-74 év közötti korcsoportokban több volt a férfi, mint nő, azonban 74 év fölött majdnem kétszer annyi nő volt, mint férfi. Az intézeti háztartásokban, az egészséggondozók- ban, a nyugdíjasok- és öregek otthonában élők száma 200 ezer, közülük 36 százalék férfi, 64 százalék nő, és összesen 57 százalékuk 75 év feletti volt.
A számbavételnél az alkalmazottak, önfog- lalkoztatók és a munkanélküliek egymást kizá- ró kategóriákhoz tartoztak.
A holland lakosság csaknem fele volt gaz- daságilag aktív, 6,8 millió alkalmazottal és 0,6 millió önfoglalkoztatottal. A munkanélküliek száma közel 200 ezer volt. Az aktív népesség 58 százaléka férfi, míg ugyanennyi nő volt inaktív. Az aktívak közé sorolták az oktatási intézmények látogatóit, a nyugdíjasokat és a családi feladatokat ellátókat.
A több állással rendelkező személyeket abba az ágazatba sorolták, amely alapján a személy a legtöbb társadalombiztosítási díjat fizette. Az eredmények szerint 0,2 millió hol- land a mezőgazdaságban és halászatban, 1,5 millió a feldolgozóiparban és építőiparban, 5,7 millió pedig a szolgáltató iparban dolgo- zott (ebből 3,5 millió végzett kereskedelmi, míg a maradék nem kereskedelmi szolgálta- tást).
A 6,8 millió alkalmazottból 4,2 millió volt teljes munkaidős (legalább 35 munkaóra), 1,8 millió részmunkaidős (15-34 munkaóra), míg 0,8 millióan dolgoztak heti 15 óránál keveseb- bet. A teljes munkaidősök 77 százaléka férfi, a részmunkaidősök 75 százaléka nő volt.
A foglalkozással és iskolai végzettséggel kapcsolatban érdemes megjegyezni, hogy a nők főleg a technikai és segédszemélyzethez
Szakirodalom
Statisztikai Szemle, 84. évfolyam 5—6. szám 596
tartoznak, középszintű hivatalnokok, kereske- delmi és egyéb szolgáltatásokban dolgozók. A besorolás alapja az International Standard Classification of Occupations (ISCO) volt. Az iskolai végzettségi szint megállapításához az International Standard Classification of Education (ISCED) volt a besorolás alapja. A
15-75 év közötti 12 millió ember esetében a leggyakoribb a középfokú végzettség volt, míg a felsőfokú végzettségűek száma magasabb volt, mint az alapfokúaké.
Sánta József,
a KSH ny. osztályvezetője
Kiadók ajánlata
GEWEKE, J. [2005]: Contemporary Bayesian econometrics and statistics. (Modern bayesi ökonometria és statisztika.) John Wiley.
New York.
A kiadvány a bayesi elemzés átfogó értel- mezését kínálja olvasóinak, mely egyrészt a következtetéselméleten, másrészt az optimális döntéshozatalon alapszik. A Modern bayesi ökonometria és statisztika olyan friss szimulá- ciós módszerekkel és modellekkel ismerteti meg az olvasót, amelyek a való világ összetett problémáit is képesek megoldani. Erős elméle- ti és gyakorlati problémamegoldó alapozással mutatja meg a döntéshozónak, hogy miként optimalizálhatja döntését, amikor korlátozott vagy nem megfelelő adatokkal kell dolgoznia.
A kiadvány évtizedes oktatói tevékenység alapján született, stílusa jól követhető. Majd 200 példa mutatja be hogyan vezet a bayesi statisztika megfelelő alkalmazása optimális döntésekhez. A könyv a Matlab és az R számí- tógépes programokat használja, valamint egy kapcsolódó weboldal számítógépes kóddal se- gíti az olvasókat a példák és az adatgyűjtemé- nyek felhasználásához. A munkát elsősorban olyan kutatók számára ajánljuk, akik munká- juk során az ökonometriát és más hasonló sta- tisztikai módszereket használnak. Gyakorlati problémamegoldó jellege, valamint a példák és gyakorlatok nagy száma miatt kiváló tankönyv is lehet a közgazdaságtant, statisztikát, társada-
lomtudományokat és üzleti tudományokat hallgatók számára.
SEARLE, S. R. – CASELLA, G. – MCCULLOCH CH. E. [2006]: Variance components. (A variancia összetevői.) John Wiley. New York.
A könyv a statisztikai adatokban levő vál- tozékonyság elemzésének módszereit – me- lyek a varianciaanalízis-táblákon keresztül is- mertek – foglalja össze. Olvasmányos stílus- ban ismerteti a szakterületen végzett kutatások legfrissebb eredményeit. A munka a variancia- analízis történetének bemutatásával kezdődik, amelyet a kiegyensúlyozott, majd a kiegyensú- lyozatlan adatok varianciaanalízise, a véletlen változók előrejelzése, a hierarchikus modellek és bayesi becslések, a bináris és diszkrét ada- tok elemzésének ismertetése követ.
HOAGLIN,D.C.–MOSTELLER,F.–TUKEY, J.W. (szerk.) [2006]: Exploring data tables, trends, and shapes. (Exploratív adattáblák, trendek és formák.) John Wiley. New York.
Ez az új, papírkötésű kiadás az exploratív adatelemzés és a robusztus regressziós mód- szerek fő előnyeit mutatja be, részletesen el- magyarázva az egyes technikákat és azok kap- csolatát a klasszikus módszerekkel. A munka amellett, hogy hangsúlyozza és bemutatja az ismert exploratív és robusztus technikák sze-