• Nem Talált Eredményt

A nem mintavételi hiba a statisztikai felvételekben

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A nem mintavételi hiba a statisztikai felvételekben"

Copied!
13
0
0

Teljes szövegt

(1)

DR. MARTON ÁDÁM

A statisztikai felvételek, megügyelések lehetnek teljes körűek, a vizsgálni kívánt sokaság minden elemére kiterjedők (cenzusok) vagy részlegesek. Ez utóbbi esetben célszerűen ki- választott ,,reprezentatív" egyedek adatai alapján következtetünk a teljes sokaság bizonyos

paramétereire.

A reprezentatív megfigyelések értékelése során a statisztikusok érdeklődése szinte ki- zárólag a mintavételi hibára, azaz arra irányul, hogy mekkora bízonytalansággal kell szá- molni abból adódóan, hogy a vizsgált sokaság egy részéből következtetünk annak egészére.

Ez a gyakorlat nem számol azzal, hogy a sokaság egyedeire vonatkozó elemi információk sem mindig pontosak, és a hiba nem kizárólag a teljesség hiányából adódik.

A megfelelő dokumentumokkal, bizonylatokkal alátámasztott intézményi adatgyűjté- sek, a viszonylag egyszerű, személyekre vonatkozó információk (például születési év, nem, lakás) egyenként pontosaknak tekinthetők, illetve kellő ellenőrzéssel, utóvizsgálattal pontossá tehetők. A lakossági adatgyűjtések során feltett kérdések nagy részére azonban ez nem áll, mivel azok tartalmilag bonyolultak, vagy éppen szubjektív megközelítést igényelnek.

A ,,hiba" fogalma, amilyen értelemben hibáról itt és a továbbiakban beszélünk, külön- bözik annak köznapi értelmezésétől. Ez utóbbi ugyanis valamilyen téves, szabálytalan, figyelmetlen és így elmarasztalható tevékenység eredménye, ami pontos, fegyelmezett mun—

kával megelőzhető. A statisztikai értelemben vett hiba, jóllehet az ilyen ,,köznapi" hibákat is tartalmazza, sokkal tágabb fogalom. A statisztikai adatgyűjtés során hiba adódhat a meg- figyelés, az emlékezet, a feljegyzések, az értelmezés, a mérés, a feldolgozás pontatlanságából, illetve az elemzés közelítő jellegéből, például modellek alkalmazása esetén.

Valamely statisztikai megfigyelés során tehát a teljes hiba a mintavételi és a nem minta- vételi hibából tevődik össze. Magától értetődik, hogy nem mintavételi hibával a teljes körű felvételek esetében is számolni kell. A nem mintavételi hiba azonban, mint látni fogjuk, többféle forrásból származik. Közöttük vannak olyanok, amelyek a kérdések jellegéből adó—

dóan a reprezentatív felvételekben nagyobbak, mint a leginkább egyszerű kérdéseket tar- talmazó teljes körű felvételekben.

A nem mintavételi hibáról általában

Az elmúlt évek során a szakirodalom sokat foglalkozott a nem mintavételi hibával, felismerve annak — sokszor a mintavételi hibánál nagyobb — jelentőségét.1

! A nem mintavételi hiba problémáit részletesen tárgyalja: National household Survey capability programme ];on—sampling errors in household surveys: sources, assesment and control. United Nations. New York. 1982. VI,

84 old.

(2)

902 DR. MARTON ÁDÁM

A nem mintavételi hiba a következő három forrásból adódhat:

- az alapsokaságot nem tökéletesen fedi le a mintavételi keret, nem sikerül a megfigyeléseket a mintavételi terv szerint végrehajtani; megtagadás vagy egyéb okok miatt hiányoznak adatok;

— az egyedi válasz, mérés, megügyelés pontatlan;

- hibákat követnek el a kódolás, az ellenőrzés (editálás), a táblázás stb. során.

A különböző nem mintavételi hibák lehetnek:

** — véletlenek,

— valamilyen szisztematikus torzítás következményei.

A véletlen hibák az esetszám vagy az ismétlések számának növelésével csökkenthetők.

A torzítás kiküszöbölése általában csak bizonyos külső információk, becslések segítségével lehetséges.

A nem mintavételi hibát nehéz számszerűsíteni. Kiszámításához nem állnak rendelke- _ zésre olyan egzakt matematikai módszerek, mint a mintavételi hiba becslésére. Vf gálatának

_, leginkább az a eréjjabhogy a felvétel tervezésének és végrehajtásának különböz fázisaiban

illat ' csökkenthető le en. A hibaforrások felismerésén keresztül vezethet az út a jó minő- ségű adatokhoz, amelyek megbízhatóan, időben, kellő részletezettséggel jelzik a vizsgált folyamatokat.

A hibák mellett érdemes szót ejteni az adatok minőségéről is. A statisztikai adatok minősége J. Norwood szerint2 nem definiálható egyértelműen, az egyes emberek számára nem ugyanazt jelenti. Csak viszonylagosan értelmezhető például úgy, hogy a minőség azt fejezi ki, hogy valamilyen adat mennyire felel meg a felhasználás követelményeinek. Ebből a szempontból a nem mintavételi hibának igen nagy a jelentősége. Szerinte egy statisztikai adat minőségét annak fontossága (relevance), időszerűsége (timeliness) és pontossága (accuracy) határozza meg. A pontosság és a minőség tehát nem azonos fogalmak, sőt bizo—

nyos követelmények még néha egymással ellentétesek is (például: pontosság—gyorsaság).

Tore Dalem'us szerint3 azok a statisztikai adatok, amelyek nagyon ,,fontosak", általában elég pontosak is. Azokat, amelyek csak nagyon bizonytalanul határozhatók meg, nem hasz- nálják, Viszont azok, amelyek nem fontosak, nem okoznak különösebb bajt még akkor sem, ha viszonylag pontatlanok.

A Svéd Statisztikai Hivatal folyóirata, a Journal ofOfűcial Statistícs 1987. évi 4. számát teljes egészében a nem mintavételi hiba problémáinak szentelte. A matematikai statisztika és a survey—módszertan neves szakértői fejtették ki röviden e téma fontosságát és bizonyos módszertani kérdéseket illető véleményüket. A bevezető áttekintés teljesebbé tételét segítheti, ha a következőkben néhány figyelemre méltó gondolatot kiemelünk. Ez egyben azt is jelzi, hogy e téma nemzetközileg ismert neves szakértőit milyen kérdések foglalkoztatják, milyen problémákat tekintenek fontosnak, aktuálisnak.

Lars Lyberg főszerkesztő bevezetőjében hangsúlyozta, hogy mindenfajta statisztikai adatgyűjtő tevékenységnél kell hibákkal számolni. Amíg azonban a reprezentatív felvételek—

nél a mintavételi hiba kezelése általában megfelelően történik, addig az annál sokszor nem kevésbé jelentős nem mintavételi hiba nem kap megfelelő figyelmet. E hibák több forrásból származnak, és nagyon nehéz mérni, ellenőrizni azokat. Az a le célszerűbb, ha ezeket a problémákat keletkezési helyükön igyekezünk a lehető legjobban megoldani és ezáltal

W .

jelentőségüket CML

Barbara Baílar szerint a különböző forrásból származó nem mintavételi hibák egy részét megfelelően kezelik, míg vannak teljesen elhanyagolt területek is. Ezt részben a magas költ—

' Norwood, J.: What is Ouality? Előadás a US Bureau of the Census konferenciáján. Baltimore. Maryland. 1987.

március 30. (Kézirat.)

' Dalenius, T.: Relevant official statistics. Journal of Official Statistícs. 1985. évi 2. sz. 21—34. old.

(3)

ségek magyarázzák. Fontos tisztán látni, hogy a felvételek tervezésének és végrehajtásának egyes fázisaiban milyen hibák fordulhatnak elő, s azoknak milyen a természete. Szerinte az egyik legfontosabb kérdés a hiányzó adatok torzító hatásának vizsgálata. Dalenius szembe- állítja a statisztikai adatok megbízhatóságát fontosságukkal. Szerinte sokszor azért kell a hibát illetően bizonyos határok között engedékenynek lenni, mert a pontosságra törekvés nagyon időigényes, és bizonyos információkat gyorsan kell publikálni (példa erre a népszám—

lálások előzetes, 1-2 százalékos mintán alapuló feldolgozása). Szerinte az adatfelvételek pontosságának növelése érdekében legtöbbet a módszertani és a terepmunka javításával, az azt végezők képzésével tehetünk.

Robert Barnes szerint a nem mintavételi hiba teljesen sohasem küszöbölhető ki, de az Egyesült Királyság statisztikusai elsősorban a válaszadók készséges közreműködését kí- ván ják biztositani, valamint a lehető legjobban végezni a kódolási munkát.

Thomas Jabíne felteszi a kérdést, hogy vajon a statisztikai adatok felhasználói mennyit tudnak a nem mintavételi hibáról? Mennyire vannak tudatában annak, hogy az elvileg (és gyakorlatilag is) elég jól kontrollálható mintavételi hiba mellett egy másik, nem jelentéktelen tényezővel is számolni kell ahhoz, hogy a teljes hibát megközelítsük. Különösen fontos ez akkor, amikor vélemények, attitűdök vizsgálatáról van szó, amikor magának a hibának a fogalma is meglehetősen bizonytalan.

Robert Tortora szerint a statisztikus számára az egyik legérdekesebb, legizgalmasabb kihívás a nem mintavételi hibának és a torzításnak a számszerűsítése. Valójában három mérőszámra lenne szükség: a mintavételi és a nem mintavételi hiba, valamint a torzítás nagyságára. Elméleti modelleket viszonylag könnyű felépíteni, de számszerűsítésjík csak nagyon költséges és bizonytalan [Mk segítségével lehetséges.

Dennis Trewín néhány statisztikai idősor viselkedésén keresztül igyekszik felkelteni a figyelmet a probléma fontossága iránt. Hangsúlyozza, hogy mind a felvételek megterve—

zése, mind végrehajtásuk során elemző vizsgálatokat kell végezni annak feltárására, hogy milyen módon sikerült a megfigyeléseket végrehajtani. Ráirányítja a figyelmet ugyanakkor arra, hogy a számítástechnika fokozott alkalmazása az adatfelvétel, valamint a kódolás és az editálás során kedvezően befolyásolja az eredmények pontosságát.

Ben Kíregyera a fejlődő, főként afrikai országok szempontjából vizsgálja a kérdést annak tudatában, hogy rendszeres lakossági adatfelvételekre egyre több országban kerül sor.

Többek között a mintavételi keretek kialakításának, a vizsgálni kívánt sokaság lefedésének problémáit hangsúlyozza, de megemlíti a kikérdezést végző összeírók szerepének jelentőségét is, valamint kilépve a lakossági adatfelvételek köréből, foglalkozik a mezőgazdasági termés- becslések mérési problémáival is.

E tanulmányban a reprezentatív lakossági adatfelvételek problémáit vizsgáljuk, amelyek bizonyos értelemben a legszerteágazóbbak, legbonyolultabbak. A gazdaságstatisztikai adat—

gyűjtéseknél a különböző hibák természetüknél fogva jobban kontrollálhatók, bár sok probléma hasonló megfontolást igényel.

A lakossági adatgyűjtések történhetnek személyes kikérdezés, postai úton megküldött és összegyűjtött kérdőívek, valamint telefoninterjúk segítségével. Magyarországon a telefon—

hálózat közismert hiányosságai miatt az ország lakosságát jól reprezentáló mintát a telefon—

nal rendelkezők köréből kiválasztani nem lehetséges. A postai (önkitöltős) adatgyűjtések sem terjedtek el, illetve e tekintetben meglehetősen rosszak a tapasztalatok. Ezért figyelmün- ket a személyes kikérdezések problémáira irányítjuk. (Meg kell jegyezni, hogy olyan fejlett országokban, ahol a telefonnal való ellátottság szinte teljes, sem mellőzik a személyes kikér- dezéseket. A közvetlen kontaktus ugyanis olyan előny, amit az egyéb módszerek személyte- lensége nem tud sehogyan sem pótolni.)

Bármilyen statisztikai felvételről legyen is szó, az előzőkben elmondottakkal összhang—

ban a nem mintavételi hibaforrások két nagy körét határolhatjuk el. Az egyik a vizsgálni

(4)

904

DR. MARTON ÁDÁM

kivánt sokaság megközelítésével (mintavételi keret, lefedés, nemválaszolás stb.), a másik az egyes válaszok pontosságával kapcsolatos. Ez utóbbi gyakorlatilag azt jelenti, hogy a kérdőíven (a tisztított szalagon) levő információ mennyire egyezik meg a valóságos, tény- leges helyzettel. Ezért az esetleges besorolási, kódolási hibák is ide tartoznak. A továbbiak—

ban e két kérdés köré csoportosítva vizsgáljuk a nem mintavételi hiba problémáit. Végül foglalkozunk azzal, hogy milyen módszerek kínálkoznak a válaszadási hiba vizsgálatára.

A vizsgált sokaság kőrűlhatárolása, megfigyelése

A statisztikai felvételek tervezésének gyakorlatilag a vizsgálni kívánt sokaság egyértelmű deliniálásával, körülhatárolásával kell kezdődnie. Ahhoz, hogy a célsokaság (személyek, családok, különböző gazdasági tevékenységet — termelés, kereskedelem stb. —— folytató szer- vezetek stb.) tanulmányozható legyen, minden egyedének elvileg hozzáférhetőnek kell lennie.

Teljes körű felvétel esetén minden egyedet egyszer és csak egyszer kell megfigyelni, megkér- dezni; reprezentatív felvétel esetén ugyanez a megfelelően kijelölt minta elemeire igaz.

A jól körülhatárolt célsokaságból sokféle módon lehet mintát venni. E tanulmánynak nem célja a különböző mintavételi (és becsléselméleti) eljárások tárgyalása, ami végered- ményben a mintavételi hiba kiszámításának, becslésének kérdéséhez vezet. Vannak azonban a mintával kapcsolatban is olyan problémák (például hiányzó adatok), amelyek csak nem mintavételi hibaként kezelhetők.

Leginkább valószínűségi mintákkal dolgozunk! Ez azt jelenti, hogy a célsokaság minden eleme előre meghatározott valószinűséggel kerül be a mintába. A minta gyakorlati kijelö- léséhez tehát egy olyan jegyzékre, ,,keretre" van szükség, amely a vizsgálni kívánt sokaság összes elemét tartalmazza. Ilyen keretet összeállítani azonban nem mindig könnyű.

a) A mintavételi keret. A lakossági adatfelvételek körében a célsokaság általában az or- szág népessége vagy annak bizonyos része (nők, ifjúság, nyugdijasok stb.). Ahhoz, hogy olyan mintáink legyenek, amelyek a lakosság megfelelő részét jól reprezentálják, minden célra külön, a vizsgálat időpontjára vonatkozó mintát kellene kidolgozni, amihez értelem- szerűen a célsokaságot lefedő mintavételi keretre lenne szükség. E helyett rendelkezünk egy több, de nem minden szempont szerint folyamatosan korrigált általános célú mintával, ami meglehetősen jól lefedi a lakosság különböző rétegeit is.5

A minta kiválasztása szinte sohasem történik egyszerű véletlen húzással, felépítése a hatékonyság növelése érdekében strukturált: rétegzéses, többlépcsős stb. Szükség van tehát arra is, hogy a rétegzéshez, a lépcsőzetes vagy csoportos (klaszter) kiválasztáshoz, az eset- legesen eltérő kiválasztási valószínűségekhez a mintavételi keret megfelelő információkat tartalmazzon. Ezen túlmenően a Végső kiválasztási egységek (például lakások) sokszor nem azonosak a megfigyelési egységekkel, amelyek leginkább személyek vagy családok.

Egy reprezentativ lakossági adatfelvétel során számolni kell azzal, hogy a mintavételi keret nem egyezik meg pontosan a vizsgálni kívánt sokasággal. Számolni kell továbbá azzal is, hogy a sikeresen végrehajtott megfigyelések (az ellenőrzött kérdőívek) eltérnek a mintától a különböző okokból adódó meghiúsulások miatt.

Az, hogy a mintavételi keret milyen jól, mennyire pontosan fedi le a vizsgálni kívánt sokaságot, valamint az, hogy a konkrét megligyelések milyen mértékben különböznek a ki- jelölt mintától, befolyásolja az eredmények megbízhatóságát, növeli a nem mintavételi hiba mértékét. (A kijelölt minta és a tényleges megfigyelések eltérésének hatását a mintavételi hiba nem méri!)

' A vizsgálni kívánt sokaság lefedése'nek, valószínűségi és nem valószínűségi minták alapján végzett következtetések- nek problémáival foglalkozik Leslie Kish: Kutatások statisztikai tervezése (Statisztikai Kiadó Vállalat. Budapest. 1989.

251 old.) c. könyvének l. és 2. fejezete.

5 Az Egységes Lakossági Adatfelvételi Rendszer (ELAR) keretében folyó munkánál használt minta leírását lásd:

Az ELAR-minta és az 1984. évi mikrocenzus mintájának kiválasztási eljárása. Statisztikai Módszertani Füzetek. 24. Köz- ponti Statisztikai Hivatal. Budapest. 1987. 59 old.

(5)

A lefedés hiányossága főként az összegek, bizonyos népességszámok becslését rontja.

Különösen fontos lehet ez, ha bizonyos alcsoportok, területi egységek különbségeit kell vizsgálni, az esetleg kimaradó elemek pedig nem egyenletesen oszlanak meg az elemzés egy- ségei szerint.

A lefedés problémáinak vizsgálata nagyon fáradságos, időrabló, a hiányosságok pedig nem mindig érzékelhetők. Ezért a felvételtervezők hajlamosak e kérdéskör vizsgálatának mellőzésére.

Alefedés hiányosságait határozottan meg kell különböztetni a nemválaszolástól, a vala- milyen okból részben vagy egészben meghiúsult adatgyűjtéstől. Ez az elhatárolás azonban nem mindig egyértelmű. Például ha egy család valamelyik tagja kimarad a megfigyelésből (jóllehet őt is meg kellett volna kérdezni), annak oka lehet megtagadás, az összeíró figyelmet—

lensége vagy az utasítások értelmezésének hiányossága. A hiba kiküszöbölése szempontjából nem közömbös, hogy az milyen okból következett be.

Az ELAR mintegy 16 000 családot felölelő általános célú mintájának folyamatos kor- szerűsítése, a minta rotációja — mint az az említett publikációkból látható —- megoldott úgy, hogy a körzetek cimanyagát korrigáljuk, illetve a mintában levő települések esetében nyo- mon követjük az újonnan épülő lakótelepeket, illetve az ott létrejövő körzeteket.

Az általános célú minta egyes konkrét felvételek céljára mindíg csak bizonyos kompro—

misszum vállalásával használható. A továbbvezetés, a minta karbantartása is általában vala—

milyen kompromisszummal jár. így nyomatékosan felmerül az a kérdés, hogy vajon az eseti vagy csak nagyon ritkán, 5—10 évenként ismétlődő felvételek esetén nem célszerűbb-e mindig új mintavételi keretet készíteni. Ez azonban igen költséges lenne, s így be kell érnünk —— más országok gyakorlatához hasonlóan — a meglevő általános, többcélú mintával.6

b) Hiányzó adatok, nemválaszolás. Hiányzó adatokról akkor beszélünk, ha a mintában levő valamely megfigyelési egységről (család, személy stb.) nem sikerül a kívánt információkat részben vagy egészben megszerezni. Ennek többféle oka lehet.

Ha a mintavételi egység a lakás, akkor lehet, hogy az összes ott lakó tartósan távol van, de előfordulhat az is, hogy közülük csak egy-két személy van távol. Lehetséges, hogy néhá- nyan (esetleg mindenki) megtagadják a közreműködést. Az is lehet, hogy vannak olyanok, akik koruk, befolyásoltságuk vagy szellemi fogyatékosságuk miatt nem képesek a válaszo- lásra.

Igen fontos már a tervezés során eldönteni, egyértelműen és szigorúan szabályozni, hogy a feltett kérdésekre kiktől fogadható el válasz. Ha egy családot kérdezünk meglehetnek olyan tényekre vonatkozó kérdések, amelyeket a család bármely tagja pontosan ismerhet.

Míg más, különösen a véleményekre, tervekre, attitűdökre vonatkozó Válaszokat csak az érin- tett személytől lehet elfogadni.

A nemválaszolás kezelése szempontjából fontos tudni, mi volt a meghiúsulás oka: meg- tagadás, távollét, téves cim, egyes megkérdezett személyek alkalmatlansága stb. A hiányzó adatok növelik a mintavételi hibát, illetve olyan bizonytalanságokat eredményeznek, ame—

lyek már átvezetnek a nem mintavételi hiba fogalomkörébe.

A nemválaszolás okozta torzítás, hiba kiküszöbölésére, csökkentésére kétféle lehetőség kínálkozik:

— a megtagadások minimálisra csökkentése az adatgyűjtés során;

— a hiányzó adatok valamilyen módon való (közelítő) pótlása az adatok feldolgozása során.

A megkérdezettek számára a válaszolás bizonyos terhet, kényelmetlenséget, erőfeszítést jelent. (A válaszadási hiba tárgyalásánál erről bővebben lesz szó.) Az összeírást, a megkér—

dezést végző rátermettségén, rábeszélő képességén nagyon sok múlik az összeírás sikere

' Leslie Kish: Multipurpose sample designs. Survey Methodolagy. 1988. évi 1. sz. 19—32, old.

(6)

906 DR. MARTON ÁDÁM

szempontjából. Függ azonban a válaszadás a kérdőív hosszúságától, a kérdések jellegétől is.

Tehát az ún. terepmunka, az összeírók felkészültsége döntő tényező a megtagadások ala- kulása szempontjából. Az egyéb okból adódó meghiúsulások mértéke csökkenthető több- szöri felkereséssel, gondos tervezéssel, jó szervező munkával. A legnagyobb és leggondosabb erőfeszítések mellett is számolni kell azonban bizonyos mértékű meghiúsulással. Amennyi—

ben a meghiúsulások teljesen véletlenszerűen oszlanának meg a minta különböző részei között, akkor a belőlük adódó probléma ,,csupán" annyi lenne, hogy számolni kellene a minta terjedelmének csökkenéséből adódóan a mintavételi hiba növekedésével.

Az adatfeldolgozás során több lehetőség kínálkozik a hiányzó adatok pótlására, illetve bizonyos korrekciókra. Megnehezíti azonban a munkát az, hogy számolni kell általában

azzal, hogy

-— a meghiúsulások megoszlása a különböző rétegek. alcsoportok között nem véletlenszerű;

— a hiányzó, a válaszadást visszautasító személyekről, családokról igen kevés információval rendelkezünk.

Az utólagos rétegzés, amennyiben megfelelő ismérvekkel és külső információkkal ren- delkezünk, javítja a becslések megbízhatóságát, és hozzásegít ahhoz is, hogy a hiányzó adatok miatt a felszorzáshoz szükséges súlyokat korrigáljuk.

Bizonyos feltételek teljesülése esetén lehetőség van a hiányzó adatok becslések alapján történő helyettesítésére, imputálására. Ez történhet:

—- külső információk segítségével;

— hasonló, de korábban végrehajtott felvétel adatai alapján (cold—deck módszer);

— az adott felvételből rendelkezésre álló információk alapján (hot—deck módszer).

E módszerek akkor használhatók, ha a hiányzó információkról (családokról, szemé—

lyekről) valamilyen ismeretünk (létszám, foglalkozás, életkor, nem, társadalmi réteg stb.) van.

Ekkor ugyanis mód van arra, hogy valamilyen hasonló adatokat behelyettesítsünk a hiány- zók helyére.7

A hiányzó adatok kezelését illetően az az általános vélemény a statisztikusok között, hogy a legjobb közvetlenül az érdekelttől megszerezni a hiányzó információt, mig a leg- rosszabb nem csinálni semmit a hiányzó adatok valamilyen pótlása, becslése érdekében.

A válaszadási hiba

A szakirodalomban elfogadott definíció szerint a válaszadási hiba a valódi és a megfigyelt érték különbsége. A válaszadási hiba nagyságát sok tényező befolyásolja a kérdöivtől, az egyes emberek felfogóképességén és emlékezőtehetségén keresztül az összeírók rátermett—

ségén át a kódolás, az adatrögzítés esetleges hiányosságáig. Ezek közül a kérdőívek tervezé- sének fontosságát szeretnénk kiemelni, ami meghatározó lehet az egyedi válaszok megbíz- hatósága szempontjából?

Az egyedi válaszok pontosságának lehető leghatékonyabb biztosítéka, valamint a kapott eredmények értékelése szempontjából szükséges, hogy a kérdőívnek és a megkérdezés aktusa- nak mint az információszerzés eszközének modelljét röviden felvázoljuk.

A kérdések lehetnek nyíltak és zártak. Az első esetben a válaszoló szabadon fogal- mazza meg mondanivalóját, amihez a kérdező segítséget adhat. A második esetben a lehet- séges válaszokat felsorolja a kérdőív, a megkérdezettnek csak választania kell.

7 Lásd bővebben: Graham Kalton: Oompensating for missing survey data. The University of Michigan. Michigan.

1983. 157 old.; Hakan Lindström: Non-response errors in sample surveys. (Kézirat.) Az ímputálás alapgondolata azonos a mikroszimulácíós eljárásokéval, illetve a statisztikai ősszekapcsoláséval (statistical matching).

' Lásd bővebben: Platek, R.: Some important issues in guestionnaire development of official statistics. Journal of Official Statístics. 1985. évi 2. sz. l19—130. old.; Sykes, W.—- Morton-Williams, J.: Evaluatiug survey guestions. Journal of Official Statistics. 1987. évi 2. sz. 191—207. old.

(7)

A kérdések irányulhatnak tényekre, cselekedetekre, illetve véleményekre, attitűdökre.

Az első esetben egyértelműen létezik valamilyen objektiv, valódi válasz, míg az utóbbi esetben a helyes válasz elméletileg sem deüniálható egyértelműen.

Ahhoz, hogy a megkérdezett a helyes választ adja, arra van szükség, hogy -— kész legyen közreműködni;

- megértse a kérdést;

- birtokában legyen a kért információnak, és arra a megkérdezés időpontjában is pontosan vissza tudjon emlékezni.

Az elmondottakból már következik, hogy a kérdés jellege mellett a kérdezőnek is igen nagy szerepe van abban, hogy a közte és a megkérdezett között kellően konstruktív kapcso—

lat, segitő, megértő légkör alakuljon ki?

A kikérdezés, az interjú során az összeiró és a megkérdezett (a meglátogatott család tagjai) között sajátos viszony jön létre. A megkérdezett személyeket tájékoztatják a felvétel céljáról, annak társadalmi fontosságáról, személyes érdekeltségről azonban csak nagyon átvitt értelemben lehet beszélni. Sokkal inkább bizonyos vélt vagy valóságos hátrányokat jelent számára az, hogy kényes kérdéseket tesznek fel, idejét rabolják, erőfeszítésre kénysze-

rítik a jó válaszok érdekében stb.

Az interjú sajátságos társasági kapcsolat két idegen ember között, és azzal a céllal jön létre, hogy bizonyos feladatot elvégezzenek. Rövid ideig tart, személytelen, de azért érvénye- sek a társas érintkezés általános szabályai.

Az interjú sikerét igen sok tényező befolyásolja. Nézzük a továbbiakban azokat, ame—

lyek elsősorban a kérdések jellegétől függnek.

Egy kérdés minél egyszerűbb, minél strukturáltabb, megfogalmazása minél inkább hozzásegít a helyes válasz kiválasztásához, annál inkább várható, hogy pontos választ kap- junk. Vannak azonban olyan esetek, amikor valamilyen múltban végbement eseményt kell felidézni. Akkor nyilvánvalóan sok múlik az egyes személyek emlékezőtehetségén, illetve azokon a feljegyzéseken, emlékeztetőkön, amelyek hozzásegítenek a helyes válasz megadá—

sához. (Ilyen például a háztartási napló.) E téren a kognitív, a megismerési folyamatot vizsgáló pszichológia módszereit felhasználva az utóbbi néhány évben számos vizsgálatot végeztek.10

Számolni kell azzal, hogy az emberek saját magukról nem szeretnek kedvezőtlent mon- dani, rossz fényben látszani. Általános jelenség, hogy a számukra zavaró, kellemetlen választ tompítani igyekeznek, hogy válaszukat a társadalmi elváráshoz igyekeznek közelíteni, nem szeretnek szembehelyezkedni a kérdezővel, szívesen beleegyeznek, elfogadják a felkínált választ. Különösen jelentős lehet a torzítás, ha a kérdés valami társadalmilag elítélt maga- tartásra, tevékenységre irányul, amely esetleg súrolja a törvényesség határait. Ilyen esetben természetesen feszültség keletkezik a válaszolóban, ami nemcsak a szóban forgó konkrét választ teszi bizonytalanná, hanem hatással lehet az interjú hátralevő részére is.

A megkérdezett eseményre való visszaemlékezést nagyon befolyásolja az esemény ki- emelkedő volta, fontossága, bonyolultsága. Nyilvánvaló, hogy valamilyen rendkívül nagy fontosságú eseményre (autóvásárlás, epeműtét stb.) mindenki szinte pontosan visszaemléke- zik. Itt kell megemlíteni azt is, hogy az általános intelligencia, műveltség is jelentősen befo- lyásolja az interjú sikerét.

A mondottak alapján magától értetődő, a válaszadási hiba nagyságát maga a kérdező is befolyásolja. Mennyire rátermett, mennyire sajátította el a szakmai tudnivalókat, milyen személyes tulajdonságokkal rendelkezik.

* Lásd bővebben: Payne, S.: The art of asking auestions. Princeton University Press. Princeton. 1951. XIV, 249 old.

" Az Egyesült Államokban sokirányú kutatás folyik annak felderítésére, hogy melyek a legjobb eszközök, emlékezte- tők, amelyek rávezetik a megkérdezettet a helyes válaszra. Lásd bővebben: Ouestionnaire design: Report on the 1987 BLS Advisory Conference. US Department of Labor Statistics. 1987. (Kézirat.)

(8)

908 DR. MARTON ÁDÁM

Jelentős a kölcsönhatás a kérdező és válaszoló között. Valójában az interjú során mind a kérdező, mind a válaszoló szerepet játszik, amit személyes adottságaik határoznak meg.11 Elméleti modelljét, hátterét tekintve tehát a válaszadási hiba bizonyos mértékig nem csak magától a megkérdezettől függ. A kérdező szerepe is számottevően befolyásolja a kapott információk pontosságát.

A válaszadási hiba becslésének lehetőségei

Az előzőkben mondottak felvázolták azokat a különböző tevékenységeket, amelyek eredményeként rendelkezésünkre állnak a keresett információk, adatok. E munkafolyamat során a célsokaságtól a mintasokaságon, a mintavételi kereten, a mintán keresztül eljutunk a felvétel elemeit jelentő személyekhez (megfigyelési egység), akiknek válaszai (kitöltött kérdő- ívek) alapján vonjuk le következtetéseinket a célsokaságra vonatkozóan. A következtetések megbízhatósága, ,, jósága" értékelhető a lefedés, a meghiúsulások elemzése, a mintavételi és a válaszadási hiba becslése segítségével.

A mintavételi hiba jól ismert módszerekkel magából a mintából (ha az valószínűségi minta) becsülhető. A célsokasággal kapcsolatos problémák értékelése más módszereket kí- ván, ami részben a teljeskörűsitést, részben a mintavételi hibát, részben a torzítást érinti.

Sajátos eljárást igényel a szisztematikus torzítás kezelése, amelyet kiküszöbölni, illetve nagyságát becsülni csak külső, pótlólagos információk segítségével lehet.12

Lehetséges a válaszadási hiba becslése is, de ahhoz is további erőfeszítésekre van szükség, mert a felvétel egyszerű végrehajtása erre a célra már nem tartalmaz kielégítő információt.

A válaszadási hiba becsléséhez egy kifejezetten módszertani indíttatású, feltáró jellegű, ismétléses utóvizsgálat szükséges. A válaszadási hiba becslését lehetővé tevő elméleti modell röviden a következőkben vázolható.13

Tételezzük fel, hogy olyan változót vizsgálunk, amelynek létezik egyértelmű valódi értéke. A minta egyes személyeit többször egymástól függetlenül megkérdezzük.m Az i-edik személytől, az a—dik megkérdezéskor kapott ym válasz felírható, mint ,u, valóságos érték és az em válaszadási hiba összege:

Ytazllt'l'em

Az ismételt megkérdezések alapján em eloszlása becsülhető. Legyen annak B, a Várható értéke és a, a szórása. Ha 13120, akkor véletlen ingadozásról, ha B.;áO, akkor valamilyen szisztematikus torzításról van szó. A 5, torzítás felfogható mint egy változó, amennyiben a B; különbözik az egész mintára jellemző konstans 19 torzítástól. Az eza—k között különböző a értékek mellett lehet bizonyos korreláció, például az Összeíróktól függően. Ez a sokszor nem jelentéktelen hatás matematikailag kezelhető, bár meglehetősen bonyolult. Célszerűbb az

utóvizsgálat jó megtervezésével eleve arra törekedni, hogy az nagyon kicsi legyen.

A diazeia—ő, a mérési hiba véletlen komponense, amelynek várható értéke nulla.

Legyen

lét,:liH—lgtzEUlalí)

" E témát illetően lásd: The influence of íntervíewer and respondent. Psychological and behavioral variables on the reporting in houschold surveys. National Center for Health Statistics. Sor. 2. No. 26. Washington. D. C. 1968. (Kézirat.)

" A jövedelmek, a fogyasztás, bizonyos szolgáltatások ELAR-f'elvételekből származó beesléseit rendszeresen össze- vetjük más forrásokból származó becslésckkel, Ezáltal a teljeskörüsítelt adatoknak főként a torzításból származó hibája csökkenthető.

" Cain-an, W. G.: Sampling technics (John Wiley. New York. 1977. XVI, 428 old.) c. könyve 13. fejezetének gondolat- menetét követjük, Lásd még: Hansen, JVI. II.—Hurwirz, W. N.—Berslmd, M.: Measurement errors in eensuscs and surveys.

Bulletin International Statistícal Institute. 1961. évi 2. sz. 259—374. old.; Fellegi, I.: Response varíance and its estimation.

Journal ofAmcrícan Slatistical Association. 1964. 1016—l041. old.

" Annak érdekében, hogy az ismételt megkérdezés során a torzítást minimálisra csökkentsük. szükséges, hogy azt egy másik személy (összeíró) hajtsa végre. Célszerű erre a célra a lehető legjobb összeírókat, illetvea szakstatlsztikusokat felkérni, már csak azért is, mert kellő rátermettség, ügyesség kell ahhoz, hogy a felkeresett családoknak,személyeknek meg- magyarázzuk az ismételt megkérdezés célját, értelmét.

(9)

A m az i-edik egyednél végzett megfigyelések átlaga, ezért

diaZU'ta _Ht)—(Hlt—Ilt):)'m—Pi

Ha az egész mintára vonatkozóan átlagoljuk az egyes megfigyeléssorozatok eredmé- nyeit, akkor:

ya"sztn'l—(Hl'—Mt)*(ü".u), ahol ,a' a ,u'l-k átlaga. Ekkor

MSE (ya): V(z7a)—!— www—Wu cov maj'),

ahol MSE jelöli az átlagos négyzetes eltérést, a jobb oldalon pedig sorrendben a válaszadási, a mintavételi szórásnégyzet, a torzítás négyzete, valamint az átlagos válaszolási eltérés és a mintavételi hiba közötti kovaríancia kétszerese áll.

Az előbbiekből következik az is, hogy a torzítás a mintából nem állapítható meg, a szórá—

sok függetlenek a torzítástó]. A torzítás állandóságát feltételezve pedig torzításmentesen mérhető az időben bekövetkező változás vagy a különböző rétegek közötti különbség.

Egy adott mintán belül a dm véletlen hibák különböző i értékek mellett általában nem korrelálatlanok. (Gondoljunk a klaszterekre a mintavétel esetében.) _

Jelölje Ha; a korrelációs együtthatót a minta elemei között. Akkor a V(du) teljes válasz- adási variancia:

_ 03

V(du): T [H—(n— Dam]

ahol 042 az egyszerű válaszadási variancia. Egy ismétléseket tartalmazó megligyeléssorozat esetén az átlagos négyzetes eltérés becslése az előzőknek megfelelően a következőképpen írható fel:

MSE (ia): %iSZ-i—an—í—(n— nemm?

Az $$$/n mintavételi és a 030 -— (m)/n teljes válaszadási szórásnégyzet n növekedésével csökken. A 90003, valamint -a ,62 csak nagyon áttételesen függ a minta nagyságától. Nagy minták esetén a mintavételi hiba már elhanyagolható lesz, s így az MSE-ben az egyéb hiba,

illetve torzítás fog dominálni. '

Amennyiben valamely y változóra legalább az eredeti mintának egy részmintáján két mérési adatunk van, akkor a fenti formulák kiszámíthatók, s így az válaszadási hiba be- csülhető.15

Az eredeti felvételből a részmintákatw, illetve az utóvizsgálatot úgy kell azonban meg- tervezni, hogy az a vizsgálati szempontok szerint reprezentatív, megfelelő terjedelmű legyen, s az adatok tartalmazzák a szükséges megjelölő adatokat.

A válaszadási hiba nagysága az előzőkben felvázolt modellben attól függ, hogy az első és a második megkérdezés során kapott válaszok mennyiben térnek el egymástól, azaz meny- nyire inkonzisztensek. Az eltérések átlagos nagysága azonban viszonylagos, nem vonatkoz- tatható el attól, hogy az adott változónak mekkora a szórása.

" Az ELAR keretében az 1988-ban végrehajtott presztízsfelvétel egy részét egy közel 600 elemű véletlenül kiválasztott részmíntán megismételtük úgy, hogy a második megkérdezést nem ugyanaz az összeiró hajtotta végre. Azeredmények köz- lése folyamatban van.

" Az utóvizsgálatokat azok meglehetősen költséges, a válaszadókat is megterhelő volta miatt általában csaknéhány száz, megfelelően kiválasztott elemet tartalmazó részmintán szokták elvégezni.

(10)

9 10 DR. MARTON ÁDÁM

így az inkonzisztencia mértéke (1) a válaszadási hibának a teljes hibához viszonyított aránya:

_ _íL

(Hifi-SM

(A nevezőben a teljes szórás áll, ha a mintán belüli véletlen hibák korrelálatlanok.)

A válaszadási hiba fogalma, a tényleges és a megfigyelt érték különbsége magyarázatra szorul. Az előbbi tárgyalás feltételezte, hogy a különbség nagysága arányos a hiba mértéké—

vel, ami egyben azt is jelenti, hogy a pontosságnak van egy viszonylagos mértéke, lehet a hiba (elemi szinten!) olyan kicsi is, hogy az elhanyagolható, vagy lehet nagyon nagy, amikor a rendelkezésre álló válasz határozottan félrevezető. (Folyamatos változók, mint például a jövedelem esetén, ez a helyzet nyilvánvaló.) Kategóriaváltozók esetén (például nem) egy információ vagy jó, vagy rossz, bár itt is lehet olyan eset (például korcsoport vagy iskolai végzettség), amikor az eltérés nagyságától függően lenne bizonyos értelme a hiba nagyságáról beszélni.

Kategóriaváltozók esetében a válaszok konzisztenciájának vizsgálata úgy szemléltet- hető, hogy az eredeti és a megismételt kikérdezés eredményeit egy olyan négyzetes mátrixba rendezzük, melynek sorai és oszlopai_a lehetséges válaszok kategóriáit tartalmazzák. Az egyes cellákban levő adatok (pu) azt jelzik, hogy ha valaki az első megligyelésben az i-edik kate—

góriába eső választ adta, akkor a második megfigyelés során miként válaszolt. Kategórián—

ként az egyezések számát a pu mennyiség adja meg.17

A kapott válaszok megoszlása

X_ Második

Első x**—— megkérdezés 1 2 3 . . .n Összesen

megkérdezés x

1 P1.

2 P:.

3 Ps.

" Pn.

Összesen p.1 p., p., ...p." p__

A szokásos jelölések szerint a - a megfelelő indexre való összegezést jelzi, tehát

;Pu "P - j

Jelöljenek a pU-k megoszlási viszonyszámokat (p_,:100,0), akkor a nyers megegyezési index (A) a főátló összegeként írható fel:

A '*'- ZP"

Az eltérések mértékét pedig értelemszerűen a D : l—A fejezi ki.

" Lásd bővebben: O'Mulrcheartelgh C. A.: The magnitude and pattern of response variance in the Lesotho Fertility Survey. ISI Scientific Reports. No. 70. 1984. (Kézirat)

(11)

Az A mutatószámnak két hiányossága van:

a) egyezés. illetve eltérés véletlenszerűen is bekövetkezhet;

b) nem jelzi azt, hogy az első és a második megügyelés között mekkora a ,,távolság" (ameny- nyiben csak igen—nem jellegű válasz lehetséges, akkor a 2X2-es kontingenciatábla esetében ez a probléma nem merül fel).

A véletlen egyezésekre a két peremeloszlásból lehet következtetni. A konzisztencia mér—

tékét (k) célszerű a következőképpen definiálni:

1 megfigyelt eltérés _] l—pa __ .va—Pe _ várható eltérés __ 1—17: 1 —Pe ahol:

Po: ZP" Pe: ZPLPJ

(

így:

k Em: —PI.P.I)

_ 1— Zaza

A konzisztencia mértéke k, tehát úgy értelmezhető, mint az A nyers megegyezési index a véletlen egyezéseket figyelmen kívül hagyva (ksA). A k különösen jól használható ferde eloszlásoknál, kivéve, ha csak egyetlen kategória dominál, mert akkor még ez a mutató is félrevezető lehet.

A kereszttáblában mutatkozó eltérés a változó jellegétől függően értelmezhető. Ha tiszta kategóriaváltozóról van szó, akkor mindazok az információk (legalább a kettő közül az egyik) hibásak, amelyek a fődiagonálison kívül esnek. Ha viszont valamilyen mérhető vál—

tozó kategóriáról van szó (például jövedelem), akkor az eltérések különbsége is értelmezhető.

Ilyenkor ki lehet számítani az egyezés mértékét olyan esetben is, ha egy (vagy esetleg több kategóriányi) eltérést még megengedhetőnek, elfogadhatónak tartunk. Mód van arra is, hogy minden olyan esetben, amikor az eltérés nagysága értelmezhető, azt súlyozva értékeljük.

Néhány gyakorlati megjegyzés

A válaszadási hiba előzőkben vázolt modellje az egyedi válaszok esetleges pontatlan—

ságának mértékéből kiindulva becsüli a hibát. Matematikailag az eu viselkedése alapján bár- milyen változó és bármilyen egyedi megfigyelés kezelhető. Gyakorlati szempontból azonban két lényegesen különböző helyzettel kerülünk szembe.

Kategóriaváltozók esetén (például férfi—nő) a különbség mértéke az igazi és a megfigyelt érték között nem értelmezhető, illetve csak egy értelme van: a kapott válasz jó vagy nem jó.

Sok más esetben értelmezni tudjuk az egyedi megfigyeléskor kapott válasz pontosságának mértékét. Azaz az efa nagysága értelmezhető, és minél nagyobb, annál nagyobb a válasz—

adási hiba.

A kategóriaváltozók ,,jósága" kontingencíatáblázatok segítségével vizsgálható, amiből megállapítható az is, hogy egy konkrét Válasz a felvétel átlagos körülményei között milyen valószínűséggel tekinthető pontosnak. A többi változó esetében viszont megadható az az intervallum, amely az előre megadott valószínűséggel az y; tényleges értéket lefedi.

A kapott ; becslésekhez (amelyek kategóriaváltozók esetében általában megoszlások) tartozó Válaszadási hiba értelmezése, akármilyen változóról legyen is szó, már egyformán

történhet.

(12)

91 2 DR. MARTON ÁDÁM

Amíg a kategóriaváltozóknál egyértelmű, hogy a kapott válasz eltérése a valódi értéktől hiba, addig a többi változónál nem ilyen egyszerű a helyzet. Az, hogy valaki a jövedelmét nem tudja emlékezetből pontosan megmondani, teljesen természetes. Ha azonban a tényle- gestől nagyon különböző választ kaptunk, joggal felmerül a kérdés, nincs-e valami félre- értés, elírás, esetleg szándékos torzítás, azaz valami durva, köznapi értelemben vett hiba.

Bár modellünk nem tesz különbséget kis és nagy hiba között, gyakorlatilag azonban van értelme feltenni azt a kérdést, hogy vajon a kapott válasz valóban a feltett kérdésre vonat—

kozik-e?

Az adateditálás feladata az ellentmondások, hibás (logikailag bizonyíthatóan lehetetlen) kódok kiszűrése, lehetőség szerinti javítása. A kapott válaszokat a válaszadási hiba modell- jéből kiindulóan értékelve, arra a következtetésre kell jutnunk, hogy célszerű a nagyon szélsőséges, kiugró válaszokat további vizsgálat tárgyává tenni.

Vannak olyan mérési, vizsgálati módszerek, amelyek eleve nagy teret adnak a szubjektív megítélésnek, de kérdés, hogy minden választ komolyan kell-e, szabad—e venni. Tudjuk, hogy nem ritka az az attitűd, miszerint emberek nem szívesen mondják azt, hogy nem tudom, nem értem, nem akarok válaszolni. Inkább mondanak valamit, esetleg a megtagadás, visszautasí- tás helyett pontosan az ellenkezőjét valóságos véleményüknek.

E kérdés kezelését illetően megoszlanak a vélemények. Vannak, akik azt állítják, minden választ komolyan kell venni. De vannak olyanok is, akik a szélsőséges adatok további elem—

zése, indokolt esetben figyelmen kívül hagyása mellett foglalnak állást.

;:

Végül röviden az ELAR gyakorlatáról.

Az új építkezések és bontások feljegyzésével folyamatosan módosulnak a népszámlálási körzetek, s ez teszi lehetővé a mintavételi keret karbantartását. Mivel az ELAR-minta rög- zített nagyságú, ezért a teljeskörűsítéshez szükséges szorzószámok megállapítása rétegenként a továbbvezetett lakásszámok és a tényleges megfigyelések számának hányadosa alapján történik. Ez az eljárás rétegen belül automatikusan biztosítja a meghiúsulások miatt szük- ségessé váló korrekciót. Ez a gyakorlat a meghiúsulások tekintetében egy olyan ,,hot-deck"

imputálással azonos, amikor rétegen belül a réteg átlagát használjuk. A megtagadások száma az ELAR-felvételek körében nem jelentős, jóval 10 százalék alatt van. Az egyéb okból be- következő meghiúsulások aránya nagyobb (és egyre növekvő), közel 10 százalékos. Emögött legnagyobbrészt tartós távollét és üres lakások húzódnak meg.

A kérdőívek ellenőrzése, kódolása során pótlásra kerülnek a hiányzó adatok, így a fel- dolgozás során a részleges meghiúsulások okozta problémákkal nem kell foglalkozni.

Az ELAR a kitöltött, ellenőrzött kérdőíveket tehát pontosnak, hibátlannak tekinti.

A külső információk, makroadatok felhasználásával az elemzés során az összesített in—

formációk ellenőrzésre, szükség esetén javításra kerülnek.

A népszámlálások esetén mindig sor kerül utóvizsgálatra. Az ELAR-ra ez nem jel- lemző. Mint már említettük, az 1988. évi presztizsfelvétellel kapcsolatban azonban készült utóvizsgálat.

A felvételeket állandó alkalmazású összeirók hajtják végre. Gyakorlott, jó helyismerettel rendelkező, túlnyomórészt nők végzik ezt a munkát. A minta fele—egyharmada cserélődik az egyes években, így az egyes családokat több alkalommal, több téma vizsgálatánál kell felkeresni. így, főként a falvakban, kialakul bizonyos személyes kapcsolat a családok és az összeírók között. Ez tapasztalataink szerint inkább előnyére válik a munkának, mint kárára. Nagyrészt ez a magyarázata a viszonylag nagy közreműködési készségnek.

TÁRGYSZÓ: Statisztikai mintavétel.

(13)

PESIOME

lIocroaepnocrb Bsmonon, nsnneuennux Ha ocnonannn Bmőopo—mmx cramcrmecxuxoőcnezto- Bamm, saBncnr or OHIPIÖKH BBIÖODKH, or Toro, vn'o MEI Ha ocnonanrm Hacm nenaeM 3aicmotre1ma o nemm, a ramice or Toro, nacrtonmco TO'IHBI ezmnmume Haömonem, nanee or TOI'O, Hacxonmco (barcrn'recxne naőmoirermn coomercrayior rpeöoaarmnM, npennxnmtemmm nnanom BLIÖOpKFl (ne—

amöopoanaa onmőKa).

ABTOp H3naracr xapaicrep, ncromrcn u Hexoropme rue-rom namepermx Henuőopo'tnoift omnőm, liacro Bommcaiomeü B xone oőcnenonannü Hacenenmr nyTeMnmmoro onpoca. Ormetiae'r, 'ITO mm naMepenusi Hensröopounoü onmőm He EMeIOTCH B pacnopnxcemmrarne Merom, rare B cny- Irae onmőxn Bmöopxn. Hmerorcx OTHeJTbHBIe KOMIIOHCHTBI, KaK Hanpmep, nepexpmme BOHpOCOB, orxas B orse're, immune Koropstx Ha Bemmny nnrepBana nocrosepnocm nemm: yCTaHOBKTb.

I/Ix pacxpmrne Bamm mm Toro, tiroőm MbI Mornn cnenarb KaK momio öonbme B nnrepecax ux yCTpaHCHHH mm nomencannn nx BJIHSIHHSI. [(mi namepemm cncremamtrecxnx ncicaxcermü cynre—

crsyer neoőxonnmocrb BO Buennmx nndiopMaunax, a onmőicy B npenocraanem OTBeTOB mono onennsarr: c nomombro nomenyronmx oőcnenonatmn.

SUMMARY

The reliability of conclusions drawn from sample surveys depends on the sampling errors, on the fact that one concludcs from part to totality, on the accuracy of individual observations, i.e. how actual observations meet the reguiremcnts set up by the sampling design (non-sampling error).

The study discusses the characteristics, sources and certain methods of measuring non-sampl- ing errors which occur freguently in data collection within the population based on personal inguiry. It is stressed that there are no methods at disposal for measuring non—sampling errors, contrarily to those originating from sampling. There are certain components of the non-sampling errors, such as covering and non-response, the eű'ect of which upon theconfidence interval cannot be determined. Their knowledge is of importance in order to eliminatethem as much as possible or compensate their eü'ect. For measuring systematic bias, exogenous information is reguired, while response error can be estimated through rechecking.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A helyi emlékezet nagyon fontos, a kutatói közösségnek olyanná kell válnia, hogy segítse a helyi emlékezet integrálódását, hogy az valami- lyen szinten beléphessen

Nepomuki Szent János utca – a népi emlékezet úgy tartja, hogy Szent János szobráig ért az áradás, de tovább nem ment.. Ezért tiszteletből akkor is a szentről emlegették

Magyar Önkéntes Császári Hadtest. A toborzás Ljubljanában zajlott, és összesen majdnem 7000 katona indult el Mexikó felé, ahol mind a császár védelmében, mind pedig a

A nyilvános rész magába foglalja a francia csapatok létszámát, és csak az van benne, hogy akkor hagyják el Mexikót, ha a mexikói császár már meg tudja szervezni

Területi szinten azt is megállapíthatjuk, hogy a központi és Nyugat-Dunántúl régióban nagyobb valószí- nűséggel találni reziliens iskolát, ez pedig azért érdekes, mert

Már csak azért sem, mert ezen a szinten még nem egyértelmű a tehetség irányú fejlődés lehetősége, és végképp nem azonosítható a tehetség, tehát igen nagy hibák

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

kiszélesítése és hosszú távú szakmai fenntarthatóságának megalapozása a kiváló tudományos utánpótlás biztosításával”.!. A