a mintát torzító hatások számbavétele - A MINTA MEGBÍZHATÓSÁGA ÉS TORZULÁSAI

A MINTA MEGBÍZHATÓSÁGA ÉS TORZULÁSAI

2.1 a mintát torzító hatások számbavétele

Mindenekelõtt vezessük be a szükséges jelöléseket. Emlékeztetjük olvasóinkat: mintánk rétegei a településtípusok (Budapest, Miskolc, megyeszékhelyek, egyéb városok, községek), illetve a cigány népes-ség várható elõfordulási gyakoriságán alapuló körzettípusok (ritka, közepes, sûrû) kombinált értékeiként jöttek létre. Ezekbõl válasz-tottuk ki elsõ lépésben a minta körzeteit, majd a körzeteken belül a mintába bekerülõ háztartásokat. A jelölések ennek megfelelõen a következõk:

p településtípusok indexe; p = 1, 2, 3, 4, 5 r körzettípusok indexe; r = 1, 2, 3

i a (p,r)-edik rétegből (településtípus és körzettípus metszeté-bõl) kiválasztott körzetek indexe; i = 1,...., mpr

v az előzetes mintavétel során kiválasztott nem megyeszékhely vá-rosok száma

V a nem megyeszékhely városok teljes száma

v a nem megyeszékhely városok kiválasztási aránya;

v = v/V

mpr a (p,r)-edik rétegből kiválasztott körzetek száma Mpr a (p,r)-edik rétegbe tartozó körzetek teljes száma¹

mpr a (p,r)-edik rétegből kiválasztott körzetek kiválasztási aránya;

mpr = mpr / Mpr

Npr a (p,r)-edik rétegben élő cigány háztartások teljes száma (elmé-leti adat)

Npr

M a (p,r)-edik rétegből kiválasztott körzetekben élő cigány háztar-tások teljes száma (elméleti adat)

j a (p,r)-edik réteg i-edik körzetéből a mintába bekerült háztartá-sok indexe; j = 1,..., ni

npr a (p,r)-edik rétegből a mintába bekerült háztartások száma fpr a (p,r)-edik rétegből a mintába bekerült körzeteken belüli

ház-tartások kiválasztási aránya; fpr = npr / Npr M

fpr a (p,r)-edik rétegből a mintába bekerült háztartások összesített kiválasztási aránya;²

mprfpr , ha p = 1, 2, 3, 5 vmprfpr , ha p = 4 fpr = npr / Npr =

#

1 A nem megyeszékhely városokból v = 0,2 arányú (20 százalékos) elõzetes mintát vettünk, és csak a ki-választott városokban vé-geztük el a rétegezést. Mr itt a kiválasztott városokban található körzetek számát jelöli.

2 Lásd az elõzõ lábjegy-zetet!

Y_pr a (p,r)-edik rétegben élő cigány népesség teljes száma (elméleti adat)

y_pr a (p,r)-edik rétegből a mintába bekerült cigány népesség száma ã_pr a cigány háztartások átlagos háztartásnagysága a (p,r)-edik

ré-tegben (elméleti adat); ãpr = Ypr / Npr

æpr a mintába bekerült cigány háztartások átlagos háztartásnagysá-ga a (p,r)-edik rétegben; æpr = ypr / npr

Xpr a (p,r)-edik rétegben élő általános iskolás cigány tanulók teljes száma (elméleti adat)

xpr a (p,r)-edik rétegből a mintába bekerült általános iskolás cigány tanulók száma

épr a cigány háztartásokban élő általános iskolás cigány tanulók átla-gos száma a (p,r)-edik rétegben (elméleti adat); épr = Xpr / Npr

ìpr a mintába bekerült általános iskolás cigány tanulók átlagos szá-ma a (p,r)-edik rétegben; ì_pr = xpr / npr

a a index jelöli azokat a mintavétel célsokaságához tartozó körze-teket, illetve háztartásokat, amelyeket valóban sikerült is szám-ba vennünk a mintavétel során

b b index jelöli azokat a mintavétel célsokaságához tartozó körze-teket, illetve háztartásokat, amelyeket nem sikerült számba ven-nünk a mintavétel során

c c index jelöli azokat a körzeteket, illetve háztartásokat, amelye-ket számba vettünk ugyan a mintavétel során, de nem tartoznak a mintavétel célsokaságához

Három problémát kell megoldanunk: 1. A mintavétel algoritmusát visszafelé alkalmazva, településtípusonként és országosan becslést kell adnunk a cigány népesség számára és a becsült érték varianciájára (â és Var¨â©); 2. Becslést kell adnunk továbbá – megint csak telepü-léstípusonként és országosan – az általános iskolás cigány tanulók számára és a becsült érték varianciájára (è és Var¨è©). â és Var¨â©

becslése a közvetlen számításon alapuló népességbecslés célját szolgálja (lásd 3.1. pont), è és Var¨è© becslésével pedig az a célunk, hogy a Mûvelõdési és Közoktatási Minisztérium cigány tanulókra vonat-kozó iskolastatisztikai adatainak (ê) felhasználásával lemérjük min-tánk megbízhatóságát (lásd 2.3. pont). 3. Végül Y és X becsült érté-kének (â és è) felhasználásával becslést adunk H = Y / X rétegen-kénti értékére, majd a településtípusonrétegen-kénti aggregáció után – az iskolastatisztikai adatokat (ê) alapul véve – közvetett módon is meg-becsüljük a cigány népesség településtípusonkénti és országos szá-mát. A becsült érték (ä) mellett ez esetben is közöljük a

becslések-hez tartozó variancia (Var¨ä©) értékét. Ezt az eljárást alkalmazzuk a 3. fejezet közvetett népességbecslésrõl szóló részében (3.2. pont).

2.1.1 a mintavétel algoritmusán nyugvó közvetlen népesség-becslés

A p–edik településtípusban élõ cigány népesség számát az alábbi összegként írhatjuk fel:

(1) Y_p

ahol a index jelzi a célsokasághoz tartozó és számba vett, b index pe-dig az összeírásból tévesen kimaradt háztartásokat. Legyen:

Ekkor:

(2)

Az összeírás során azonban olyan háztartások is bekerültek a min-tavételi keretbe, amelyek nem tartoznak a célsokasághoz (c típusú háztartások). Legyen:

továbbá tegyük föl, hogy a tévesen (c) és a helyesen (a) összeírt ház-tartások mintabeli aránya rétegenként megegyezik a teljes sokaság-ra vonatkozó megfelelõ aránnyal; és tegyük föl azt is, hogy a szóban forgó arány településtípusonként konstans:

(3)

Ekkor npr a és Npr

a / npra felírható az alábbi módon:

(4)

(5)

(4)-et és (5)-öt visszahelyettesítve (2)-be, a következõ formulát kap-juk:

(6)

A becslés gyakorlati kivitelezéséhez ismernünk kellene bpr és dpr pa-ramétereket. Mivel településtípusonként (p) vannak, körzettípuson-ként (r) viszont nincsenek ehhez támpontjaink, az alábbi feltevé-sekkel élünk. bpr-rõl – vagyis az összeírásból tévesen kimaradt és a helyesen összeírt háztartások arányáról – föltesszük, hogy egy adott településtípuson belül, körzettípusok szerint nem különbözik, to-vábbá föltesszük, hogy a hiba mértéke a településtípusok között egy e_ptényezõvel arányosan változik:

(7) b_pr = bep .

e_p arányossági tényezõ becslésekor (lásd 2.2. fejezet!) feltesszük, hogy az összeírás relatív hibája a községekben a legkisebb. ep értékét ezért a községekben (a p = 5 településtípusban) egységnyinek választjuk, és ennek százalékában adjuk majd meg – más tartalmi információk-ra támaszkodva – a többi településtípus esetében a szóban forgó hiba értékét. b értékérõl – vagyis az összeírásból tévesen kimaradt és a megfelelõ módon összeírt községi háztartások arányáról – megint csak a 2.2. fejezetben adunk empirikus becslést.

Ami dpr értékét illeti, itt sem engedtük meg a paraméter változását körzettípusok szerint. Ez a feltételezésünk gyakorlatilag azt jelenti, hogy az összeírásból tévesen kimaradt (b típusú) háztartások átla-gos létszámának, illetve a helyesen összeírt (a típusú) háztartások átlagos létszámának hányadosát a településtípusokon belül állan-dónak tekintjük:

(8) d_pr = dp .

A népességszám empirikus becslésekor azonban további problémá-kat is meg kellett oldanunk. Egyrészt a községbokrok definíciójánál a mintavételi keretbõl kimaradtak azok a községek, ahonnan a

gye-npr

Y_p=

rekek a környékbeli városba jártak iskolába. Másrészt elképzelhetõ, hogy néhány esetben elõzetes információnk alapján üresnek tekin-tettünk, és ennek megfelelõen figyelmen kívül hagytunk a mintavé-tel során olyan körzeteket, amelyekben valójában voltak cigány ház-tartások. Más, a mintavételkor nem felhasznált – mert akkor nem felhasználható – adatok alapján képet alkothatunk arról, hogy hoz-závetõlegesen a célsokaság hányad részét hagytuk így ki a mintavé-teli keretbõl. Jelöljük Mp

a-val azon körzetek számát, melyeket a p-edik településtípusban helyesen soroltunk be a nem üres körzettí-pusok valamelyikébe, Mp

b-vel pedig azoknak a számát, amelyek té-vesen kimaradtak a mintavételi keretbõl. Jelöljük továbbá Y¨Mp

a©-val azon egyének számát, amelyek ily módon bekerültek, Y¨Mp

b©-vel azo-két, amelyek kimaradtak a mintavételi keretbõl. A mintavételi cél-sokasághoz tartozó népesség számát (Yp-t) így kifejezhetjük a min-tavételi keretben szereplõ népesség és a szóban forgó hiba mértékét kifejezõ paraméter (tp) függvényében, – az alábbi módon:

(9)

ahol tp nem más, mint a fenti okok folytán a mintavételi keretbõl kihagyott népesség aránya a p-edik településtípus teljes népességén belül. Mivel a teljes Yp becslése a cél, az Mp

a halmazra vonatkozó népességbecslésünket, [(6)-ot] nyilvánvalóan (9) alapján korrigál-nunk kell. Összesítve az eddig elmondottakat: (6) népességbecslés (7), (8) és (9) felhasználásával a következõképpen alakul:

(10)

Mivel a torzító hatások fenti kiszûrése után a többlépcsõs és a ré-tegzett minták tulajdonságai alapján a rétegenkénti mintaátlag, (æ_pr) torzítatlan becslése a rétegenkénti ãpr

a -nak, az 1. pontban feladatul kitûzött, közvetlen számításon alapuló népességbecslés a követke-zõképpen végezhetõ el a mintából:

Yp = Y¨Mp

(11)

Nevezzük a mintatorzításokat korrigáló tényezõk szorzatát a p-edik településtípusban Ap-nek:

(12)

â_p varianciájának becsléséhez vezessük be a következõ jelöléseket.

Jelöljük Var1

pr-rel a mintavétel elsõ lépcsõjébõl (a körzetszintû min-tavételbõl), Var2

pr-rel pedig a mintavétel második lépcsõjébõl (a ház-tartásszintû mintavételbõl) eredõ bizonytalanságot mérõ varianciát.

â_p varianciáját ekkor a következõképpen írhatjuk fel:

(13)

ahol Var1

pr-t és Var2

pr-t Éltetõ [1982], 8.19. képletének alapján a kö-vetkezõképpen becsülhetjük (az egyszerûség kedvéért a pr indexe-ket elhagytuk):

(14)

(15)

A nem megyeszékhely városok esetében egy speciális probléma – a városok körében alkalmazott elõzetes 20 százalékos mintavétel – miatt a (13)-as képletben megadott varianciát módosítanunk kell.

Éltetõ [1982], 8.19. alapján ezt a pótlólagos bizonytalanságot egy additív tag (Vare) beiktatásával becsülhetjük. További módosítás szük-séges amiatt, hogy – mivel elõzetes mintavételt alkalmaztunk – nem ismerhetjük pontosan az adott körzettípusba tartozó körzetek or-szágos számát. Var1

pr és Var2

pr képleteiben emiatt a megfelelõ körze-tek országos számát jelentõ Mpr szimbólumot M4r / v hányadossal (a mintabeli körzetszám és a mintavételi arány hányadosával) kell he-lyettesítenünk. A nem megyeszékhely városok esetében a létszám-adat becslésének varianciája tehát a következõ lesz:

(13')

ahol (az egyszerûség kedvéért a 4r indexeket itt is elhagyva)

(16)

(14')

(15')

Mivel a településtípusonkénti mintavételek egymástól független ese-mények, a teljes népesség becslésének varianciája nem más, mint a településtípusonkénti varianciák összege:

(17)

2.1.2 az általános iskolások számának becslése

A p-edik településtípusban élõ általános iskolások számának becsült értékét (èp-t) és e becslés varianciáját (Var¨èp©-t) pontosan ugyan-olyan módon számíthatjuk ki, mint âp és Var¨âp© értékét. Mindössze annyi változtatást kell bevezetnünk, hogy a megfelelõ formulákban æ szimbólumot ì szimbólummal helyettesítjük. A becslés során fel-használt paraméterek értékei azonban nem feltétlenül azonosak. (A paraméterek becsült értékeit a 2.2. fejezet táblázatai tartalmazzák.)

2.1.3 az iskolastatisztikákra támaszkodó közvetett népesség-becslés

A közvetett népességbecslés a következõ azonosságon alapul:

(18)

A becslés során a becsült cigány népesség (â) és az általános iskolá-sok becsült számának (è) hányadosát (H-t), valamint az általános iskolások (ismert) országos számát (ê) használjuk fel. Az adott min-tanagyságok és a mintaátlagok relatív standard hibái mellett a

hánya-Vare = V²

¨

^–

©

dosbecsléssel járó torzításoktól eltekinthetünk. A p-edik település-típusra vonatkozó becslést a következõképpen írhatjuk fel:

(19)

A p-edik településtípusra vonatkozó becslés varianciáját Cochran [1977] 6.5 és 2.8 képletének felhasználásával az alábbi módon kap-hatjuk meg:

(20)

ahol Var¨âp© és Var¨èp© értékét a (13), illetve (13') képletek alapján becsülhetjük, ¨ôp© pedig a szóban forgó változók (yij és xij) mintabeli korrelációs együtthatóját jelöli.

Mivel a településtípusonkénti mintavételek egymástól függetlenek, a teljes népesség becslésének varianciája nem más, mint a település-típusonkénti varianciák összege.

(21)

2.2 a mintát torzító hatások mérése

A továbbiakban megpróbáljuk empirikusan is megbecsülni az elõzõ pontban meghatározott paraméterek értékét, és beszámolunk azok-ról az egyéb torzító hatásokazok-ról is, melyeket nem volt szükséges a népességbecslések képleteiben parametrizálnunk. A rendelkezésünk-re álló információk alapján az alábbi paraméterendelkezésünk-rekrendelkezésünk-re (lásd (11)-es képlet) próbálunk számszerû becslést adni: tp, gp, b, ep, dp. A teljes népesség, illetve az általános iskolás gyerekek számának meghatá-rozásához szükséges egyéb mintabeli információk: a rétegenkénti kiválasztási arányok (¡pr) értékei a 12. táblázat utolsó oszlopában, a rétegenkénti mintaelemszámok (npr) pedig a 14. táblázatban talál-hatók meg.

Érvelésünk logikája szerint a mintavétel célsokaságát két nagyobb halmazra bontjuk: az elsõ azokat az egységeket tartalmazza, ame-lyeket a mintavétel elõkészítése során számba vettünk (a típus), a második azokat, amelyeket tévedésbõl kihagytunk a számbavétel so-rán, amelyek így nem kerültek a mintavételi keretbe (b típus). A mintavételi keretbe elvileg tévedésbõl besorolhattunk olyan egysé-geket is, amelyek valójában nem tartoznak a célsokasághoz; ez egy harmadik halmaz (c típus). A mintavétel során a szükséges

informá-ä = Hpêp = ê .

ciók összegyûjtésekor – kérdõíves vizsgálat esetén, a kérdõív kitöl-tésekor – elõfordulhat, hogy egyes megfigyelési egységekrõl nem tudjuk az információkat begyûjteni (kérdõíves vizsgálat esetén ezek a nem válaszolók). A fenti halmazok tehát ennek az ismérvnek a mentén megint csak két részre – információt szolgáltatók, illetve nem szolgáltatók csoportjára – oszthatók. Ez a probléma azonban csak az a típusú hibák esetében releváns. Elvileg természetesen a b típusú egységek is két halmazra oszthatók az információszolgálta-tás szempontjából, ennek azonban semmi jelentõsége nincs a minta torzulásainak becslésekor, ennek a halmaznak ugyanis egyetlen ele-mérõl sincs információnk. A c típusú egységek halmazát pedig azért nem értelmes tovább bontani, mivel a kérdõíves felvételek esetében többnyire kiderül a mintavétel után, hogy az adott egységek e hal-mazba tartoznak-e avagy sem. Ennélfogva az ilyen típusú egysége-ket ki lehet hagyni a további vizsgálatból. A 15. táblázat áttekinthe-tõbben mutatja a szóban forgó halmazok helyét.

15. táblázat

a mintavétel során bekövetkező torzulások (a₂, b, c) forrásai

A célsokasághoz Számba vettük-e tartozik-e? a mintavétel során?

igen nem

igen a* b

nem c –

* Az a eset két alesetre bomlik: azokra a háztartásokra, akik szolgáltattak információt (a₁), illetve azokra, akik nem szolgál-tattak információt (a₂).

Míg a felvétel által megcélzott alapsokaság az a1, a2 valamint a b alsokaságok uniója, addig az elkészült kérdõívek csak az a1 alsoka-ságot reprezentálják: nem kerülhetett a mintába sem olyan egység, amelyet nem sikerült számba vennünk (b típus), sem olyan, amelyik bekerült ugyan, de nem lehetett róla adatot gyûjteni (a2 típus). Mint-hogy legkésõbb a kérdezéskor mindig kiderül, Mint-hogy az adott egység a megfigyelni kívánt alapsokaság része-e, a minta nem reprezentál-ja a felvétel szempontjából érdektelen c típusú egységeket.

A mintát torzító tényezõket mintavételi szakaszonként (körzet-, illetve háztartásszintû mintavétel) és hibaforrásonként (b, c, a2 típu-sú hiba) vesszük számba. A hibatényezõk mértékét kifejezõ para-méterek számszerû becslése minden esetben konkrét célokat szol-gál: az általános iskolás gyermekszám becslését a 2.3. alfejezetben, illetve a teljes népességszám becslését a 3. fejezetben. Ami az elõ-forduló hibák fajtáját illeti, azok településtípusok szerint

nyilvánva-lóan különbözhetnek egymástól, hiszen a mintavétel során telepü-léstípusonként más-más féle információkra támaszkodtunk. Ami pe-dig az egyes településtípusok és mintavételi szakaszok esetében elõ-forduló hibák mértékét illeti, az nyilvánvalóan nem független attól, melyik változó – a teljes népesség vagy az általános iskolás gyerme-kek számának – becslésére, illetve becslési hibájának mérésére vál-lalkozunk.

2.2.1 körzetszintű mintavétel

A mintavételi keretbõl kimaradt körzetek problémája: tp paramé-ter becslése

Elõször a körzetszintû mintavételt megelõzõ elõzetes mintavétel során bekövetkezett torzítások mértékét kifejezõ tp paraméter érté-két próbáljuk megbecsülni. A mintavételnek e fázisában a falvak ese-tében – mint már említettük – két ponton torzulhatott a mintánk. A községek településbokrokba sorolásakor ki kellett hagynunk azokat a fal-vakat (2904 faluból 82-t), amelyekben nem volt teljes általános is-kola, és az általános iskolás gyerekek nem a környék egy másik köz-ségébe, hanem a szomszédos városba jártak iskolába. Egy másik, hasonló jellegû hiba pedig azáltal csúszhatott be, hogy a körzetek típusba sorolásakor elõzetes információink szerint üresnek tekin-tettünk – és ennek megfelelõen kihagytunk a mintavételi keretbõl – olyan körzeteket, ahol valójában voltak cigány háztartások. Mind-két hiba a b típusú torzítások csoportjába tartozik.

A hiba nagyságát az 1990. évi népszámlálás adataira támaszkodva hozzávetõlegesen megbecsülhetjük, ha összevetjük a mintából ily módon kimaradt falvakban élõ cigányok számát az ország összes községében élõ cigányok számával. A kimaradt falvakban átlagosan jóval kevesebb cigány lakost talált a népszámlálás, mint az összes községre vonatkozó átlag: a kérdéses 82 faluban 1 240 fõt, míg az ország valamennyi községében 105 277 fõt. A hiba nagyságrendjét – ez t egyik komponense – a teljes népesség százalékában 1,18 zalékosra becsülhetjük (ugyanez az arány az általános iskolások szá-mát tekintve 1,44 %³). Természetesen egyáltalán nem biztos, hogy ez a becslés pontos képet ad a torzulás mértékérõl, hiszen a mi vizs-gálatunk a népszámlálástól eltérõ definíciót követett a cigányok meg-határozásakor; másrészt a mi mintavételünk megfigyelési egysége a háztartás volt, a népszámlálásban pedig egyéni adatok állnak ren-delkezésre, ráadásul az 1990. januári állapotokat tükröz. A szóban forgó hiba mértékének becslésére azonban más kilencvenes évek-beli forrás nem állt a rendelkezésünkre.⁴

3 307 / 21 337 = 1,44 %.

4 A népszámlálás telepü-léssoros cigány adatai nem álltak rendelkezésünkre a mintavétel idõpontjában.

Ezeket az adatokat így csak az utólagos ellenõrzés cél-jaira használhattuk. Mivel a népszámlálás a cigány né-pességet vizsgálatunktól el-térõ módon definiálta, amúgy sem lehetett volna megfelelõ adatforrás magá-hoz a mintavételhez.

Ami az említett másik hibalehetõséget illeti, a körzetek 1989-es általános iskolai forrásokra támaszkodó rétegzése valószínûleg nem mindenütt sikerült tökéletesen: elképzelhetõ, hogy azon körzetek egy részében, ahol arra számítottunk, hogy nincsenek cigányok, va-lójában voltak, csak nem laktak köztük általános iskolába járó gye-rekek. Elvileg természetesen az általános iskolai statisztikákból is hiányozhattak definíciónk alapján cigány gyerekek, ami szintén nö-velheti a besorolás ilyen irányú tévedéseit, ennek nagysága azonban valószínûleg elhanyagolható.

A községek esetében – megint csak a népszámlálás adataira tá-maszkodva – ellenõrizhetjük a hiba mértékét. A népszámlálás sze-rint az üres kategóriába sorolt községbokrok közül 103-ban éltek cigányok, ám ezekben mindössze 570 cigány lakos élt. A tévesen üres kategóriába sorolt és a mintavételbõl kihagyott községbokrok-ban a teljes sokaság várhatóan 0,54 százaléka él (ugyanez az arány az általános iskolások számát tekintve 0,39 %⁵). Összesítve a két hiba együttes mértékét a községi településtípusra, a következõket mond-hatjuk: a községbokrok definíciójakor a mintából kimaradt telepü-léseken élõ cigány népesség száma a népszámlálás szerint 1240 fõ, a tévesen üres típusba sorolt településeken élõ cigány lakosoké pedig 570 fõ volt. Ha együttes számukat (1810 fõ) a népszámlálás közsé-gekben élõ teljes cigány népességének számára (105 277 fõ) vetítjük, megkapjuk a szóban forgó hiba mértékét kifejezõ t paraméter érté-két: t5 = 1,72 %. (Hasonló kalkuláció alapján, a két hiba együttes mértékére – az általános iskolások számát tekintve – a községi tele-püléskategóriában 1,83 százalékot kapunk.)

A nem megyeszékhely városok esetében a körzetszintû mintavétel során két ponton következhettek be mintatorzulások. Egyrészt az elõzetes mintavétel során, amikor is 20 százalékos véletlen mintát vettünk a nem megyeszékhely városokból, elõfordulhatott, hogy a mintába bekerült városokban élõ cigány népesség a megfelelõ vá-rosi kategóriában élõ teljes cigány népességnek 20 százaléknál na-gyobb vagy kisebb hányadát képviseli. Ennek alapvetõen az lehet az oka, hogy a városi cigány népesség igen egyenetlenül oszlik meg a városok között: léteznek olyan városok, ahol relatíve igen magas, illetve olyanok, ahol relatíve igen alacsony a cigány népesség szá-ma. Ennek következtében a véletlen folytán a kelleténél kisebb vagy nagyobb számban kerülhettek be olyan városok a mintába, ahol na-gyon magas a roma népesség száma. Az egyik esetben ezzel alul-, a másik esetben felülreprezentáljuk a városokban élõ cigány csalá-dokat.⁶ A másik hibalehetõség abból adódik, hogy a kiválasztott vá-rosokon belüli önkormányzati választókörzetek osztályozása során a felkért szakértõk esetleg – tévesen – üresnek minõsítettek olyan körzeteket, melyekben mégiscsak élnek roma családok. Minthogy

5 84 / 21 337 = 0,39 %.

6 Ezen a gondon a váro-sok elõzetes rétegzése sem segített volna sokat. Ugyan-is azoknak a városoknak a száma, ahol relatíve sok ci-gány család él, olyan kicsi, hogy ezek önálló rétegként szerepeltetése a városi tele-püléstípusban élõ roma né-pesség felülreprezentáció-jához vezetett volna. Az ál-talunk követett eljárás – az egyszerû véletlen mintavé-tel – pedig nyilvánvalóan az-zal a veszéllyel járt, hogy alulbecsüljük a városi tele-püléstípusban elõ roma né-pesség számát. Mint hama-rosan látni fogjuk, ez utób-bi hiba be is következett.

az üres körzeteket definíció szerint kizártuk a mintavétel algorit-musából, az ilyen esetek nyilvánvalóan hozzájárulnak ahhoz, hogy alábecsüljük a roma népesség számát.

Az önkormányzati választókörzetek téves besorolásának esélye mind a megyeszékhely, mind a nem megyeszékhely városok eseté-ben elhanyagolható. (Miskolc és Budapest ebbõl a szempontból el-térõ esetet képvisel.) A 4. és 5. táblázat alapján megállapítható: a felkért önkormányzati szakértõk igen óvatosan éltek az önkormány-zati választókörzetek üres kategóriába sorolásának eszközével. Mint a ritkának minõsített körzetek háztartásszintû összeírásaiból kitû-nik – lásd az F1. Függelék F1.3a és F1.4a táblázatait –, a szakértõk többnyire az ellentétes irányú hibát követték el: inkább óvatosság-ból ritkának minõsítettek olyan körzeteket, ahol egyáltalán nem

In document A cigány népesség Magyarországon (Pldal 51-95)