• Nem Talált Eredményt

Az 1990. évi népszámlálással kapcsolatos mintavételekről

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az 1990. évi népszámlálással kapcsolatos mintavételekről"

Copied!
9
0
0

Teljes szövegt

(1)

AZ 1990. ÉVI NÉPSZÁMLÁLÁSSAL KAPCSOLATOS MINTAVÉTELEKRÖL

ÉLTETÖ ÖDÖN

Bár a népszámlálás fogalma ősidők óta teljes körű összeírást jelent, hazánkban és más országokban is már évtizedek óta különféle célú és eltérő módszerekkel végrehajtott minta—

vételek is kapcsolódnak ehhez az adatfelvételhez. A mintavétel célja gyakran a viszonylag szűk témájú teljes körű adatok kiegészítése olyan aktuális témákra vonatkozó kérdésekkel, amelyeknek teljes körű megfigyelése aránytalanul költséges lenne. Más esetekben a minta- vétel a legfontosabb népszámlálási adatok előzetes gyors publikálását vagy az adatok minő- ségének ellenőrzését szolgálja.

Előzetes, 1 vagy 2 százalékos mintán alapuló adatfeldolgozásra 1960 óta rendszeresen sor került a magyar népszámlálásoknál. Reprezentatív kiegészítő felvétel először az 1970.

évi népszámláláshoz kapcsolódott, ez a körzetek 25 százalékára terjedt ki. Az 1990. évi nép- számlálás előkészítése során döntés született arról, hogy a költségek csökkentése érdekében a teljes körű összeírás csak a legfontosabb személyi, illetve lakásadatokra korlátozódjék, ugyanakkor a népesség 20 százalékára kiterjedő kiegészítő reprezentatív felvétel csatlakozzék az alapösszeíráshoz.

Az alábbiakban rövid áttekintést adunk ezen 20 százalékos reprezentatív összeírás, valamint az előzetes feldolgozás céljait szolgáló 2 százalékos minta lehetséges kiválasztási eljárásairól, a vizsgált mintavételi módok előnyeiről és hátrányairól, állást foglalva egyben az elvárásoknak és az objektív körülményeknek leginkább megfelelőnek tűnő mintavételi eljárások mellett.

A 20 SZÁZALÉKOS REPREZENTATíV ÖSSZEIRÁS

Elvileg három mintavételi egység jöhet szóba: személyek, lakások és körzetek kiválasz- tása.

a) A személyek kiválasztása gépi úton is megoldható az Állami Népességnyilvántartó Hivatal (a továbbiakban ÁNH) állományából minden ötödik személy mintába történő kije- lölésével. Ennek a kiválasztás egyszerű technikai lebonyolítása mellett kétségtelen előnye a minta maximális terítettsége s ebből eredő megbízhatósága. Az ilyen kiválasztás hátrányai azonban messze meghaladják az előnyöket. Mindenekelőtt említendő, hogy ez esetben a min- tavételi keret nem esne egybe a reprezentálni kivánt népességgel, hiszen gyakorlati okokból a kiválasztást bizonyos idővel a népszámlálás, illetve annak eszmei időpontja előtt kellene végrehajtani. így a mintakeretül szolgáló személyi regiszter nem tartalmazná a kiválasztás és a népszámlálás eszmei időpontja között az állományba bekerült személyeket, tartalmazná viszont az ez idő alatt elhalálozott vagy más okból az állományból kikerült személyeket.

További hátrány, hogy személyek kiválasztása esetén a reprezentatív felvétel témaköre az

(2)

780 ÉLTETÓ ÖDÖN

alapfelvételéhez képest csak személyekre vonatkozó adatokkal lenne bővíthető, hiszen ez a minta mind a háztartásokra, családokra, mind a lakásokra vonatkozóan torzított lenne (a több személy által lakott lakások, a népesebb háztartások nagyobb valószínűséggel kerül- nének bele a mintába, mint a kevesebb személy által lakott lakások, illetve a kisebb háztartá- sok, és üres lakásokat egyáltalán nem tartalmazna a minta). Mindehhez járul még, hogy ez esetben minden összeírót a teljes programra be kellene oktatni.

b) A lakáskiválasztás kétféle módon is megoldható. Amennyiben az ÁNH 1989 közepén már rendelkezik naprakész lakcímregiszterrel, a kiválasztás gépi úton is végrehajtható. Másik lehetőség az előzetes körzeti címlistákból minden ötödik lakás manuális kijelölése. Bár az ilyen lakásminta a bennük élő személyekre vonatkozóan már csoportos minta, ez a minta megbízhatóságát csak kis mértékben csökkenti, sőt egyes ismérvek (például nem, kor) esetén, ahol a csoporton (lakáson) belül általában negatív korreláció van az egyes személyek ismér- vei között, a lakásminta még jobb is, mint a személyminta. Itt is jelentkezik azonban a minta- vételi keret pontatlansága: a kiválasztás gyakorlati végrehajtásakor a lakcímregiszter, illetve a körzetek mintája nem tudja tükrözni az ország lakásállományát a népszámlálás eszmei idő—

pontjában. Ezenkivül, mivel a lakcímregiszter a személyi regiszterben szereplő lakáscímek alapján készül, az üres lakásokat egyáltalában nem fogja tartalmazni, így gépi úton készülő kiválasztást feltételezve a kiegészítő programba nem lehetne lakásra vonatkozó kérdéseket felvenni, hiszen a mintában nem fognak lakatlan lakások szerepelni.

A körzeti cimlistákból történő kiválasztás esetén tulajdonképpen kiküszöbölhető lenne a mintakeret nem teljes volta. Ha az összeíró a népszámlálás során a címlistán nem szereplő lakást talál a körzetében, ezt természetesen felvezeti a listára, és ha így a cimlistán reprezen- tativ összeírásra kijelölt utolsó lakás után még van legalább öt lakás, folytatja a listán a min- den ötödik lakás kijelölését reprezentatív összeírásra. Ezáltal a körzeti címlistán nem sze- replő, a címlista összeállítása után épített és lakottá vált lakások is bekerülhetnének a mintába . Lesz azonban a lakcímregiszternek mint mintavételi keretnek olyan pontatlansága, amely nem hiányként jelentkezik, hanem sokkal inkább abban, hogy egyes lakások többszörösen is szerepelhetnek a keretben. Ennek oka a bejelentkezéskor beírt lakáscímek pontatlansága.

Előfordulhat például, hogy egy sarokház esetén ugyanabba a lakásba az egyik lakó az egyik utca megjelölésével jelentkezik be, a másik a rá merőleges utcát írja be. A lakcímregiszterből történő kiválasztás során az ilyen, nem teljesen egyértelmű címen található lakások nagyobb valószínűséggel kerülnének bele a lakásmintába (az is előfordulhatna, hogy ugyanaz a lakás kétszer is kiválasztásra kerülne), a minta torzított lenne, vagy legalábbis fennáll ennek lehe- tősége. Lakásminta esetén is fennáll továbbá az a szervezést érintő hátrány, hogy egyrészt minden összeírót be kell oktatni a teljes népszámlálási programra, hiszen mindegyiknek kel- lene olyan lakásokban is összeírni, ahol a kiegészítő programot is végre kell hajtani, másrészt a körzetek többségén belül keveredne az önkitöltéses és az összeírásos módszer alkalmazása.

Minden olyan mintavételi eljárásnál, amelynél nem a személy a mintavételi egység

—— tehát a lakásmintánál is —, fellép egy további speciális probléma, éspedig az, hogy az olyan személyekről, akik az alkalmazott népességfogalom szerint a mintába kiválasztott lakás lakói, de nem ott írják össze őket, nagy valószínűséggel nem fognak kiegészitő kérdőívet kitölteni, csak akkor, ha az a lakás (vagy intézeti háztartás), ahol összeírásra kerülnek, szintén benne van a mintában. Ám az alapkérdőívtől eltérően a kiegészitő programban szereplő témákzöm- mel olyanok, hogy csak a megkérdezett tud pontos, megbízható válaszokat adni a feltett

kérdésekre.

Lakásminta esetén külön mintavételi eljárást kell alkalmazni az intézeti háztartásokban élő személyek reprezentálására.

c) Népszámlálási számlálókőrzetek kiválasztása esetén is jelentkeznek bizonyos hátrá- nyok, illetve problémák, mégis úgy tűnik, e mintavételi egység alkalmazásával járó előnyök lényegesen nagyobbak, mint a hátrányok.Emlitendő mindenekelőtt, hogy a körzetekkiválasz-

(3)

A MINTAVÉTELEK 781

tása esetén nem lép fel az ún. ,,coverage error", azaz a mintavételi keret pontatlansága, Mivel a körzeteket úgy alakítják ki -— legalábbis az instrukciók ezt írják elő —, hogy azok nem fedhetik egymást részlegesen sem, együttesen viszont lefedik az ország egész területét, a kör- zetekből álló mintavételi keret a kiválasztás időpontjától függetlenül tartalmazza a népszám- lálás eszmei időpontjára vonatkozó teljes lakásállományt, valamint az intézeti háztartá- sokat is.

Körzetminta esetén természetesen fokozottabban jelentkezhet a csoportos kiválasztásból eredő nagyobb mintavételi hiba, de egyrészt ezt megfelelő rétegzéssel csökkenteni lehet, másrészt ez csak olyan személyi, háztartási, illetve lakásismérveknél jelenthet problémát, amelyeknél jelentős pozitív korreláció mutatkozik körzeten belül az egységek között. Min- denesetre ez a lehetőség önmagában is indokolja, hogy legyen utólagos hibaszámítás a rep- rezentatív összeírás adataira vonatkozólag, és körzetminta esetén ez a rétegzett csoportos és ne az egyszerű véletlen mintavételnek megfelelő képletek alapján történjék.

A körzetminta nem elhanyagolható előnye, hogy ebben az esetben az összeiróknak csak kisebb részét kell a kiegészítő program végrehajtására beoktatni, ily módon e munkára a leg- jobb összeírókat —- például a tapasztalt ELAR-összeírókat — lehet alkalmazni, ami várhatóan pozitív hatással lesz az adatok minőségére. Az sem elhanyagolható szempont, hogy körzet—

minta esetén egy körzeten belül azonos a számbavételi módszer.

Mint erre már a lakásminta tárgyalásánál utaltunk, körzetminta esetén is fennáll azon- ban annak lehetősége, hogy egyes személyek nem a lakhelyükön kerülnek összeírásra, hanem más —— a mintába nem tartozó — körzetben, s így kimaradnak a bővített programú összeírásból.

Ha az intézeti körzetek létszáma megfelel a magánháztartásokból álló körzetek átlagá- nak, akkor az intézeteknél is lehet rétegzett csoportos — számlálókörzeti — mintavételt alkal- mazni.

A körzetek rétegzése

Körzetminta esetén a csoportos kiválasztásból eredő hiba csökkentése, azaz a minta reprezentativitásának növelése érdekében célszerű a körzeteket a lehetőségekhez képest minél sokoldalúbban rétegezni. A rendelkezésre álló információk az alábbi rétegzést teszik lehetővé:

A ) Nem intézeti körzetek

A] Nem lakótelepi belterületi körzetek A2 Lakótelepi belterületi körzetek

A3 Egyéb belterületi körzetek (az 1980. évi népszámlálásnál a 8-eal kezdődő körzet- számok)

A4 Külterületi körzetek B ) Intézeti körzetek

Ezeket mindenképpen célszerű jelleg (munkásszálló, nővérszálló, kollégium, szociális otthon, gyermekotthon stb.) szerint rétegezni, esetleg nagyságkategóriákat is alkalmazni.

A körzetminta kiválasztása

Az előzetes számlálókörzeti jelentések alapján megyén belül rétegenként sorba rende- zendők a körzetek a települések növekvő nagysága — népességszáma —, ezen belül a körzetek növekvő sorszáma szerint, külön kezelve a városok, illetve községek anyagát. Ezt a rétegen- kénti sorba rendezést előreláthatólag célszerű számítógéppel elvégeztetni, hiszen a 20 száza- lékos körzetminta kiválasztására viszonylag rövid idő áll rendelkezésre. Ezután rétegenként, véletlen kezdőszámból kiindulva, minden ötödik körzet választandó ki a mintába. Amennyi- ben a külterületi rétegből a mechanikus kiválasztás olyan település külterületi körzetére esett, amelyből más körzet nem szerepel a mintában, ezt az összeírás szervezési technológiájára

(4)

782 ÉLTETÖ ÖDÖN

tekintettel egy másik, a mintában egyébként szereplő hasonló nagyságú település külterületi körzetére kell átcserélni. Az intézeti háztartások bizonyos típusaina'l (például gyermekottho—

nok, szociális otthonok) nem feltétlenül biztosítható a minta megyei reprezentativitása, ilyenkor nagyobb területi egységekből, esetleg az országos listából kell az adott réteget rep—

rezentáló mintát kiválasztani.

A kiválasztásnak ez a módja további implicit rétegzést visz a mintába, biztosítva, hogy nemcsak a különböző körzetrétegek, hanem a különböző nagyságú települések is arányosan legyenek képviselve a mintában. Sőt, mivel a településeken belül a körzetek számozása álta—

lában a centrumból körkörösen kifelé haladva nő — 1980—ban legalábbis ez volt az általáno—

san alkalmazott számozási metódus —, a kiválasztás az egyes településrészek megfelelő arányú reprezentációját is biztosítja, legalábbis a nagyobb településeken.

A minta ellenőrzése

A viszonylag nagy kiválasztási arány és a többszörös rétegzés ellenére nem biztos, hogy a fentiekben leírt módon kiválasztott körzetminta egy adott megye községeiben, illetve váro—

saiban levő lakások vagy az ott élő népesség számának pontosan a 20 százalékát adja, ettől

—- az egyes rétegekhez tartozó körzetek nagyságának szóródásától — függően kisebb-nagyobb véletlen eltérések adódhatnak. Kérdés természetesen, hogy kell—e, érdemes-e arra törekedni, hogy a minta a lakások, illetve a népesség pontosan húsz százalékát képviselje. Hiszen azok a lakásokra, illetve a népességre vonatkozó adatok, amelyek ehhez irányadók lennének, előzetes adatok, amelyek bizonyosan el fognak térni a népszámlálás Végleges (tényleges) adataitól. így a lakások és a népesség végleges adatához képest a minta akkor sem fogja pontosan tükrözni a rögzített kiválasztási arányt, ha ezt az előzetes adatokhoz biztosítjuk.

Ettől függetlenül mindenképpen ellenőrizni kell, hogy a kiválasztott minta ötszöröse mennyire tér el a megye városainak, illetve községeinek előzetes összesen adataitól belterü- let-külterület bontásban. Amennyiben az eltérés közelíti vagy meghaladja az adott réteg átlagos körzetnagysága ötszörösét, újabb körzet(ek) kiválasztásával, illetve már kiválasztot- tak elhagyásával kell az eredeti 20 százalékos kiválasztási arányt közelíteni. Ha pedig a laká- sok és a személyek száma tekintetében ellentétes irányú és jelentős eltérés mutatkozik, akkor körzeteserével kell a minta reprezentativitását a megfelelő irányban javítani. Ehhez, illetve esetleges pótlólagos körzetkiválasztáshoz célszerű eleve tartalékköizeteket kiválasztani.

Ha viszont az ellenőrzés során az derül ki, hogy az eltérés jóval kisebb, mint az átlagos körzetnagyság ötszöröse, véleményem szerint nincs értelme időt és energiát fordítani arra, hogy többszörös körzetcserék révén a minta az előzetes lakás-, illetve népességszámoknak pontosan 20 százalékát adja.

A minta teljeskörűsítése

Már a minta ellenőrzésével kapcsolatban leírtak is érzékeltetik, hogy a mintabeli adatok teljeskörűsitésének módja egyáltalán nem magától értetődő és problémamentes. Célszerű mindenekelőtt rámutatni, hogy a teljeskörűsités problémája csak abban az esetben jelentke- zik, ha a reprezentatív kérdőívek anyaga alapján abszolút számokat is kívánunk közölni.

Megoszlásokat, arányszámokat, átlagokat ugyanis magából a mintából lehet számítani, mindenféle teljeskörűsités nélkül.

Abszolút számok — például bizonyos kritériumoknak megfelelő személyek, lakások or- szágos, illetve megyei száma — közlése esetén viszont előzetesen dönteni kell a teljeskön'isítés módjáról. Erre több megoldás is kínálkozik.

a) Az előzetes népességszámok alapján a mintát úgy kell kialakítani, hogy a benne sze- replő személyek száma a teljes körű adatoknak pontosan 20 százaléka legyen, utána pedig minden mintabeli adatot öttel fel kell szorozni.

(5)

A MINTAVÉTELEK 783

Számítástechnikai szempontból kétségkívül ez a legegyszerűbb megoldás. Hátránya viszont, hogy olyan népességszámok esetén, amelyek a végleges kötetekben is megjelennek, szinte bizonyosan eltérés lesz a felszorzott mintabeli adatok és a népszámlálás adatai között.

Nemcsak azért, mert a felszorzás alapjául szolgáló előzetes népességszámok eltérhetnek a Vég- legesektől, hanem azért is, mert a minta pontos beállítása az összes személy számára nem biz- tosítja, hogy a személyek különböző csoportjaira (nemek, korcsoportok, aktivitási csoportok stb.) is pontosan 20 százalékos legyen a minta.

b) A minta kiválasztása után csak az előző (A minta ellenőrzése c.) pontban vázolt ellen- őrzés történik meg az előzetes népességszámok alapján, de nem állítjuk be a mintát pontosan a népesség 20 százalékára. A felszorzás a végső népességszámok és a mintában szereplő sze- mélyek számának hányadosával történik — lakásadatok esetén a végső lakásszámoknak és a minta lakásszámaínak hányadosával —- területileg (megye, ezen belül város—község) és eset- leg nemek, korcsoportok szerint differenciáltan, az 1970. évi minta felszorzásánál alkalmazott—

hoz hasonló gépi program alapján, úgy, hogy az adott népesség- (lakás-) csoport felszorzott számai pontosan egyezzenek a népszámlálás megfelelő adataival.

Számítástechnikailag ez sem bonyolult megoldás, de részcsoportok esetén itt is eltérés lehet a felszorzott és a népszámlálás publikált adatai között. Továbbá, ha a kerekítés a fel- szorzott adatokból történik, a különböző metszetek összesenjei nem feltétlenül fognak pon- tosan egyezni, illetve az esetleges egyirányú kerekítések miatt a részösszesenek összege nem adja ki a teljes összesent.

c) Megyei (illetve azon belül város—községi) szinten sincs egységes szorzószám, hanem minden egyes témánál a feldolgozás során a teljes körű és a mintabeli adatok hányadosaként a gép számítja ki a felszorzó faktort.

Ez a módszer biztosítja, hogy a mintából felszorzott adatok egyezzenek a teljes körű népszámlálási adatokkal akkor, ha egyetlen ismérv szerint történik a feldolgozás. Ha azon- ban két vagy több ismérv szerint kereszttáblák készülnek, már bonyodalmak léphetnek fel, s számitástechnikailag is ez a legbonyolultabb megoldás. Továbbá a kerekítések miatt a különböző részösszesenek összegei itt sem fognak minden esetben megegyezni.

Mindent összevetve a b) pontban vázolt eljárás látszik leginkább célravezetőnek a minta teljeskörűsitésére.

KÉTSZÁZALÉKOS MINTA

A NÉPSZÁMLÁLÁS ELOZETES FELDOLGOZÁSÁHOZ

A 2 százalékos minta alapvető célja, hogy feldolgozása révén a népszámlálás legfonto- sabb eredményeit (nemcsak országos szinten, hanem megyei, illetve azon belül község—város bontásban is) mint ún. előzetes adatokat az adatfelvétel után a lehető legrövidebb időn belül közzé lehessen tenni. Határozott igény van arra, hogy az előzetes adatközlés ne csak az alap- összeírás témáira korlátozódjék, hanem a reprezentatív felvétel fontosabb kérdéseit is ölelje fel. Ez a követelmény az 1980—as népszámlálás 2 százalékos mintájától eltérő speciális prob—

lémákat, illetve kiválasztási alternatívákat vet fel, amelyekről az alábbiakban részletesebben szó lesz.

Kíválasztásí alternatívák

1980-ban a 2 százalékos minta a népszámlálás teljes anyagából szisztematikusan minden 50. lakás kiválasztását jelentette. Ez a mintavételi eljárás természetesen az 1990. évi népszám- lálásnál is alkalmazható, de tisztában kell lenni azzal, hogy egy ilyen minta a reprezentatív összeírás kérdéseire 20 százalékos minta esetén várhatóan már csak 4 ezrelékes mintát ered- ményez, azaz például egy 150 000 lakást tartalmazó (közepes nagyságú) megye esetén körül-

(6)

784 ÉLTETÓ ÖDÖN

belül csak 600 lakást, ami megyei szintű mélyebb bontásokat, többszörös osztályozásokat már nem tesz lehetővé. Ez gyakorlatilag azt jelenti, hogy ilyen szisztematikus kiválasztás esetén a reprezentatív összeírás eredményeit lényegében csak országos szinten — esetleg Budapest—város—község bontásban — lehet az előzetes kötetben publikálni.

Éppen ezért merült fel egy olyan mintavételi változat, mely szerint a 2 százalékos mintát eleve azokból a lakásokból kellene kiválasztani, ahol reprezentatív összeírás volt, azaz, ha ez utóbbi a lakások 20 százalékára terjed ki, akkor e lakások 10 százaléka kerülne be a 2 szá- zalékos mintába. E mintavételi alternatíva megítélésénél alapvető, hogy milyen mintavételi eljárással kerül kiválasztásra a reprezentatív összeírás mintája. Lakásminta esetén az ily módon kiválasztott minta lényegében ugyanúgy szisztematikus véletlen mintának tekinthető, csak olyan kezdőszámot kell alkalmazni, hogy minden 50. lakás éppen a reprezentatív össze—

írás által érintett lakás legyen. Ebben az esetben a reprezentatív összeírás kérdéseire a 2 szá- zalékos minta pontosan ugyanolyan megbízhatóságú adatokat szolgáltatna, mint az alap—

összeírásra.

Más a helyzet akkor, ha a reprezentatív összeírás körzetmintán alapul. Ebben az esetben alapvetően még kétféleképpen lehet a 2 százalékos mintát kivenni, úgy, hogy az a reprezen—

tatív összeírásban szereplő lakásokon alapuljon.

a) Teljes körzetek kiválasztása. Technikailag ez a legegyszerűbb kiválasztási eljárás, az előzetes adatfeldolgozás is így lehetne leggyorsabb,legegyszerűbb. Körzetek kiválasztása esetén ugyanakkor nehezen — vagy egyáltalán nem — biztosítható, hogy a minta pontosan 2 százalékos legyen, különösen nem megyei szinten. De ennél még nagyobb problémát jelent, hogy a viszonylag kevés körzetre koncentrálódó minta nem biztosítana megfelelő megbízhatóságú adatokat még az alapfelvétel kérdéseinél sem, különösen olyan kérdéseknél, amelyek esetén a tapasztalat szerint jelentős a körzeten belüli korreláció (például foglalkozás, iskolai végzettség, lakások felszereltsége stb.). 300 fős körzetekkel számolva egy 450 000 lélek—

számú megyében 20 százalékos reprezentatív körzetminta esetén körülbelül 300 körzet lenne a 20 százalékos mintában, a 2 százalékosban tehát mindössze 30, ami csak kivételes esetben tudja elfogadható hibahatárokkal reprezentálni a megye lakosságát, háztartásait, családjait, lakásait.

így ez a kiválasztási változat bizonyos előnyei ellenére sem ajánlható a 2 százalékos mintához.

b) A 20 százalékos reprezentatív összeírás minden körzetéből minden 10. lakás kiválasz- tása. Ez a kiválasztási eljárás biztosítja, hogy a reprezentatív összeírás előzetes adatai ugyan- olyan pontosságúak legyenek, mint az alapösszeíráséi, anélkül, hogy túlságosan koncentrált lenne a minta. De természetesen ez a kiválasztási eljárás nem biztosítja az alapösszeírás elő—

zetes adatainak azt a pontosságát, amit egy szisztematikus —- minden 50. lakást felölelő ——

2 százalékos minta, hiszen ez egy kétlépcsős 2 százalékos minta. A mintából kapott adatok mintavételi hibája ilyenkor két tényezőből tevődik össze: 1 . az elsődleges mintavételi egy- ségekből (körzetekből) történő kiválasztás miatti pontatlanságból — ez határozza meg a repre- zentatív összeírás adatainak megbízhatóságát —, és ehhez járul még 2. a körzeteken belüli kiválasztás szórásnövelő hatása. A 2 százalékos minta megbízhatósága szempontjából előre—

láthatólag ez utóbbi tényező sem lesz elhanyagolható, mivel átlagosan 80—100 lakásos körze—

tek esetén és 20 százalékos körzetmintával számolva egy—egy körzetből csak 8—10 lakás kerül bele a 2 százalékos mintába, s ennyi lakás általában csak elég pontatlanul tud reprezentálni egy körzetet.

A fenti két alapeseten kívül elvileg még a reprezentatív összeírás körzeteire vonatkozó, illetőleg a körzeten belüli kiválasztási arány különböző olyan kombinációi is szóba jöhetnek, amelyek együttesen 2 százalékos mintát eredményeznek. A fentiekben a két alapeset előnyei- ről és hátrányairól mondottak ilyen mintavételi eljárásokra is érvényesek, legfeljebb kisebb

mértékben.

(7)

A MINTAVÉTELEK 785

Végeredményben azt, hogy milyen mintavételi eljárást célszerű alkalmazni a 2 százalékos minta kiválasztásánál, az dönti el, hogy az előzetes adatközlésnél minek van nagyobb prio- ritása: a minél részletesebb bontású megbízható alapadatoknak, vagy annak, hogy a repre- zentativ összeírás eredményeiről az alapadatokéval azonos megbízhatóságú és részletezett—

ségű információkat tegyünk közzé. Mindkét cél csak akkor lenne elérhető, ha a reprezentatív összeírás lakásmintán alapulna. Mivel azonban az előnyök és hátrányok mérlegelése alapján a 20 százalékos reprezentatív összeíráshoz a körzetminta látszik legcélszerűbbnek, és ennek eredményeit megfelelő bontásban csak akkor lehet az előzetes kötetben publikálni, ha a repre- zentatív összeírásra is 2 százalékos a minta, gyakorlatilag az a megoldás marad a fent vázolt alternatívák közül, hogy a reprezentatív körzetek mindegyikéből minden 10. lakás alkossa a 2 százalékos mintát.

A kiválasztás gyakgr/atí végrehajtása

Mivel az 1980. évihez hasonlóan az 1990-es népszámlálásnál is decentralizált kódolás és adatrögzítés, adatellenőrzés van tervbe véve, a 2 százalékos minta kiválasztásának is a megyéknél kell történnie, természetesen központilag megadott pontos utasítás alapján.

A reprezentatív körzetekből minden 10. lakás kiválasztása egyszerűen végrehajtható, de tartalék kiválasztásáról is gondoskodni kell, mert arra nincs biztosíték, hogy a körzetek 20 százalékából kiválasztott 10 százalékos lakásminta az egyes területi egységek lakásállo- mányának pontosan 2 százalékát adja. Körzetenként két lakás tartalékként való kiválasztása e célra elegendőnek látszik. A minta kiválasztásához célszerű előbb az igazgatóságok TPA- gépein a reprezentatív körzetek lakásait a lakók száma alapján sorba rendezni, majd területi egységenként egy véletlen kezdőszámot megadva 1 és 10 között, és folyamatosan végighalad- va a repzentativ körzetek címanyagán kell minden 10. lakást kijelölni a 2 százalékos mintába.

Ez az eljárás biztosítja, hogy a reprezentatív körzetek összeírt lakásállományának pontosan 10 százaléka kerüljön be a mintába, egyúttal e körzetekben összeírt személyeknek is jó köze- litéssel a 10 százaléka. Az intézeti háztartások esetén természetesen a személyek 10 százalékát kell a reprezentatív körzetekböl kiválasztani.

A minta ellenőrzése, korrekciója

1980—ban a 2 százalékos minta kiválasztása szintén a megyékben történt, de utána a le- másolt kérdőíveket -- a tartalékkal együtt —— felküldték a központba, s itt történt a minta ellen- őrzése és korrekciója. Területi egységenként ellenőrizték és biztosították, hogy a minta mind a lakások, mind a személyek előzetes számának pontosan 2 százalékát tartalmazza. Ezt a tar—

talék felhasználásával, lakások bevonásával, elhagyásával, cseréjével, illetve esetenként a mintába került lakásokba személyek behelyezésével vagy kivételével lehetett elérni.

Megfontolandó, lehet-e, érdemes-e ezt a meglehetősen sok munkával járó korrekciós eljárást 1990—ben is alkalmazni. A bonyolult korrekciós eljárást ugyanis csak központilag lehet megbízhatóan végrehajtani. Amennyiben tehát a 2 százalékos minta kódolása, adat—

rögzítése is decentralizáltan történik 1990—ben, eleve szóba sem jöhet az 1980-ashoz hasonlói korrekciós eljárás.

Úgy tűnik, a 2 százalékos minta tervezett feldolgozási üteme és módja lehetővé tesz olyan algoritmus kidolgozását és alkalmazását, amelynek alapján központilag és az esetek túlnyomó többségében nem manuálisan, hanem számítógép segítségével lesz végrehajtható a 2 százalékos minta korrekciója, azaz annak biztosítása, hogy a minta elemszáma területi egységenként mind a lakások, mind a személyek tekintetében a teljes körű adatok 2 százaléka legyen. (Pontosabban a minta lakás—, illetve személyszámainak ötvenszerese a teljes körű lakás—, illetve személyadatokból 25—nél kevesebbel térjen el.) Erre részben az ad lehetőséget, hogy — az 1980. évi népszámlálás gyakorlatától eltérően — 1990—ben a 2 százalékos minta már

(8)

786 ÉLTETÖ önön

a kettős lakóhelyűek kérdőíveinek egyeztetése utáni helyzetet fogja tükrözni, így azok a lakás-, illetve személyszámok, amikhez a minta korrigálása történik, már területi egységen- ként is végleges adatoknak tekinthetők. A tervezett jelentős — 25 százalékos — tartalék pedig az esetek várhatóan túlnyomó többségében lehetőséget ad a szükséges számú és méretű (a lakók számát értve a méreten) lakásnak a tartalékból való behelyezésére, illetve cseréjére.

A tervezett gépi korrekciós eljárás a lakásoknak a bennük lakó személyekkel együtt történő behelyezését, kivételét, illetve cseréjét írja elő; a lakásokba személyek behelyezését, illetve onnan kivételüket — az 1980. évi korrekciós eljárástól eltérően — nem engedi meg.

A korrekció számítógéppel történő megoldása egyúttal lehetővé teszi a területi egysé- geknél az előirt korlát alatt maradó, de esetleg egyirányú eltérések országos szinten történő kiegyenlítését is, tehát azt, hogy ezek az eltérések országosan is a megadott korlát alatt maradjanak.

A minta teljeskörűsítése

Az előzetes adatokat közlő kötet alapvető célja, hogy a népszámlálás után minél hama- rabb közzé lehessen tenni a főbb eredményeket, adatokat. így ebben az esetben mindenkép- pen szükség van a mintabeli adatok teljeskörűsítésére. Mivel a minta az előzetes lakásszámok, illetve az intézeti népesség pontosan 2 százalékát fogja tartalmazni, a teljeskörűsítés 1990- ben is a mintabeli adatok SO-nel való felszorzásával történhet.

A mintavételi hiba becslése

Az 1980. évi népszámlálás előzetes adatait közlő kötet táblákat tartalmaz a külön- böző nagyságrendű felszorzott adatok 95 százalékos megbízhatóságú hibahatárai meghatá—

rozásához. Ezek a táblák, arányok, illetve felszorzott adatok egyszerű véletlen minta- vételt feltételező szórásformulák alapján készültek, és jogosan lehetett ezeket alkalmazni, hiszen akkor a 2 százalékos minta valóban egyszerű véletlen mintának volt tekinthető.

Mint az előzőkből kiderül, 1990-ben a 2 százalékos minta nem egyszerű szisztematikus minta lesz, hanem két lépcsőben kerül kiválasztásra, így az emlitett táblák alkalmazása a mintavételből eredő hibák alábecslését eredményezheti. Kétlépcsős mintavétel esetén azon- ban nincs mód hasonló táblák készítésére, mert a mintavételi hiba nemcsak a mintabeli (vagy felszorzott) adat nagyságától, hanem jellegétől is függ, attól, hogy a szóban forgó ismérv szempontjából az elsődleges mintavételi egységek, a körzetek átlagosan homogéneb- bek-e, mint a teljes sokaság.

Mivel arra nincs gyakorlati lehetőség, hogy minden egyes adatra meghatározzuk a két- lépcsős mintavételnek megfelelő formula alapján a mintavételi hibát, véleményem szerint néhány olyan ismérvnél, amelyeknél elsősorban várható jelentős körzeten belüli korreláció, ki kellene számítani a mintavételnek megfelelő formula alapján a hibát, s ennek és az emlí- tett táblából adódó hibának hányadosából következtetni lehetne, hogy különböző ismér- veknél hány százalékkal nagyobb a tényleges hibahatár, mint a táblából adódó, azaz milyen korrekcióval lehet a táblát használni az egyes adatok mintavételi hibájának becslésére.

TÁRGYSZÓ: Népszámlálás. Statisztikai mintavétel.

PEBIOME

ABTOp paccmarpneaer Merononormiecxne npOÖneMbI BbIÖOpOK a csnan c IIBYMH HepeIIHCHMH Haceneimn: nononnsnonree nepenncs Hacenenmi 20%-Hoe Bbiőopoanoe oőcnerroaanne n, trance,

(9)

A MINTAVÉTELEK 787

2%—Hyro BBIÖOpKy c 116an0 cpounoü oőpaöorxn 14 nyönnxaulm Bamneifnnnx npennapnrenbnmx HTO- ros nepem—Ica.

On uccnenye-r npenmymecha n orpuuarenbnbre HeprI paammnmx nosmoxnux Macmraőon anőopm, Boamoxcnocm crparmbmcanmt, cuocoő orőopa n aonpocm Kompomr npencraan'rens- neem amőopxn.

HOMKMO Hznoxenua pazanmrx BoaMoxcnocreü CTaTBH conepmnr Tarcxce n pexomennaumt Kax oruocnrenbno Hanőonee uenecooőpamoro Macmaőa BLIÖOpKH, 'rarc H cnocoőa orőopa.

SUMMARY

The study surveys the methodological problems of two samples in connection with the census of 1990: the 20 per cent representative sample survey complementing the population census and a 2 per cent sample taken from the census guestionnaires for sake of a rapid data processing and preliminary publication of the main results. The author investigates the advantages and disad- vantagcs of the various feasible sampling units, the possibilities of the stratification, the selection procedure and the checking of the representativity of the sample. Beside outlining the various pos- sibilities the study contains also suggestions both in respect of the most expedient sampling unit and the method of selection.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

(Meg kell jegyezni, utóbbival kapcsolatban, hogy nemrégiben behatóbban tanulmányoztuk a gyünnölcscfaállocmány dinamikáját és arra a megállapításra jutottunk, hogy az

Ahol a keret tartalma nagyon elavult, ott azt speciális módon naprakésszé kell tenni a reprezentatív megfigyelés számára, vagy magának a mintavételi tervnek kell a

A mintavételi terv hatékonyságát meghatározó egyik legfontosabb tényező az eredmények pontossága. Helytelen, ha az eredmények pontosságát csak a reprezentatív

A jövedelem hatását a minőségi választásokra legjobban úgy határozhat- juk meg, ha a háztartásstatisztikai vizsgálatokhoz hasonló, azaz olyan felvétele- ket hajtunk

Albrecht eladósodása miatt rá volt utalva az országgyűlés anyagi támogatására, másfelől pedig, a császári politika szellemében, a kelyhes mozgalom

évi népszámlálás adataiból továbbvezetett, 1990 január l—jére vonatkozó népességszáma mintegy 100-—120000-rel haladja meg a népszámlálási összeírás eddigi adatát..

A népszámlálással kapcsolatos kommunikációs tevékenység lényege, hogy az adat- felvételi időszak kezdetére a lakosság megismerje és megértse a

Az elmúlt években kevés olyan szöveget olvastam, amelyre annyira igaz lett volna, mint Bar- tók Imre Jerikó épül című regényére, hogy újra és újra (minden újabb