• Nem Talált Eredményt

A mintavételi torzítás szerepe a reprezentatív megfigyeléseknél (I)

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A mintavételi torzítás szerepe a reprezentatív megfigyeléseknél (I)"

Copied!
21
0
0

Teljes szövegt

(1)

DR. PÁRNICZKY GÁBOR:

A MINTAVÉTELI TORZlTÁS SZEREPE

A REPREZENTATÉV MEGFIGYELÉSEKNÉL (I)

A reprezentatív megfigyelés végrehajtásának első lépése a mintasoka—

ság kiválasztása. A kiválasztás módja már eleve meghatározza, vagy leg- alábbis befolyásolja a munka további szakaszait, a becslést, valamint az eredmények pontosságának és megbízhatóságának ellenőrzését szolgáló szá- mitásokat. A mintavételen múlik, valóban "reprezentatív,-e a minta, helye- sen tükrözi—e az alapsokaság tulajdonságait, típusait, vagy pedig különféle torzító hatások eredményeképpen mintánk belső arányai szisztematikusan eltérnek a valóságos arányoktól.

Mit jelent a torzítás fogalma? Milyen okok idézik elő leggyakrabban?

Hogyan tudjuk a torzítás jelenlétét ellenőrizni, mértékét csökkenteni, vagy kiküszöbölni? E' kérdések tisztázása nem csupán elméleti szempontból fon- tos, hanem nagy gyakorlati jelentőséggel is bír. Ma már a torzítás egyre ritkábban jelentkezik abban a nyílt formában, hogy a megfigyelés szer—

vezője nem törődve a mintavétel szabályaival önkényesen válogatja össze a mintát. Annál gyakoribb jelenség azonban, hogy az elvileg véletlenre ala—

pozott kiválasztás ellenére, különféle körülmények folytán — melyeket a statisztikus a programkészítés során nem vett vagy nem vehetett figye—

lembe —-— végül is torzított minta jön létre. Ebben az esetben tisztázandó, milyen veszéllyel jár a torzítás, hogyan korlátozhatjuk mértékét.

Kismértékű torzítást nem kell feltétlenül kiküszöbölnünk a mintavétel—

ből. Előfordulhat az is, hogy tudatosan döntünk egy kissé torzított eljárás mellett, mivel úgy ítéljük meg, hogy összhatásában kisebb pontatlanságot eredményez, mint egy torzítatlan, de nagy szórású (nagy Véletlen hibát eredményező) Változat. Lehetséges továbbá, hogy a torzítatlan mintavétel aránytalanul drágább, mint egy jelentéktelen torzítással járó kiválasztás.

Ebben az esetben is a torzított mintavétel látszik előnyösebbnek. Ilyen dön-—

téshez természetesen a helyzet mélyreható elemzése, az egyes hatások el- különített Vizsgálata szükséges.

Jelen tanulmányban a torzítás problémáit vizsgálom. A tárgyalás kö—

zéppontjában a mintavételből eredő torzítás áll; a kiválasztás módja és a becslés szoros kapcsolatából következőleg azonban szó lesz a torzított és a

torzítatlan becslési eljárásról is.

(2)

964 DR. PABNICZKY annak

I. A TORZfTOTT ÉS TORZITATLAN MINTA FOGALMA

A reprezentatív megfigyelés eredményeképpen becsléseket kapunk az, alapsokaság egyes jellemzőinek értékére vonatkozólag. Torzitatlannak tev kintjük a becslést akkor, ha ingadozásának centrumában éppen a becsült jellemző értéke áll, másszóval a becslő statisztikai függvény várható értéke egyenlő az ismeretlen paraméter értékével. Ellenkező esetben a becslés tor-—

sított. A torzítatlanság tehát annyit jelent, hogy nincs semmiféle egy irá-—

nyú, szisztematikus eltérés a becslés és a becsült paraméter között, kizáró—e lag a mintavétel véletlen hibájával kell számolnunk. Ha létezik ilyen szisz- tematikus eltérés, akkor a becslés nem a becsült jellemző értéke, hanem egy másik érték körül szóródik, ingadozik.

Mind elméletileg, mind gyakorlati szempontból lényeges, hogy a rep—

rezentatív megfigyelésnél fellépő torzítások okai között különbséget te—

gyünk. A torzítás ugyanis lehet

1. a becslő statisztikai függvény sajátossága és

2. származhat a torzítás a mintavétel végrehajtásának módjából, az adatszolgáltatásból vagy egyéb körülményből.

Az első esetben tehát a torzítás forrása maga a formula. A matematikai statisztikai tankönyvek és kézikönyvek részletesen vizsgálják a statisztikai

függvények típusait és megállapítják, hogy a formula terzítatlan becslést

eredményez—e vagy sem, mindvégig feltételezve azt, hegy a mintavétel ki- fogástalan és egyéb körülményekből sem számazott torzítás. Ilyen feltétel mellett például valamely X változónak egy n elemű mintából számított át-

laga

az alapsokaság

ZX

—- __i—l

A?

4 __

átlagának torzítatlan becslése, minthogy bebizonyítható:

Ma) ::Zi'

A torzított becslésre jó példa a hányados—becslés, tehát az olyan becslés, amelynél mind a számláló, mind a nevező a mintából származik. Annak ma—

gyarázata, hogy a hányados-becslést a gyakorlatban mégis eredményesen alkalmazhatjuk, abban rejlik hogy a hányados—becslésből eredő torzítás a minta nagyságának növelésével egyre csökken és a társadalmi-gazdasági statisztikában használatos nagyméretű mintasokaságnál már elhanyagolha-

tóan csekély a becslés standard híbájához képest. 1 Az ilyen becslés kon- zisztens.2

! Bizonyítást lásd például Hansen, N. K. —- Hurwitz W. N. Madow, W. G.: ,psamle W Methods alnd Theory. John Wiley and Sons. New Yórk. Chapman and Han. London. 1953. 11.

112—114. () d

2 A hányados-becslés bizonyos feltétel mellett lehet torzítatlan is. Erre a IV. rész 3. pontjában Visszatérünk.

(3)

A WN'I'AVÉTELI TORZI'FÁS 965

A konzisztencia pontosan megfogalmazva a következőt jelenti: a" kon—

zisztens becsléssorozata az a számnak, ha bármilyen kis e ) 0 szám esetén azon esemény valószínűsége, hogy ot,, és ez különbségének abszolút értéke az adott s-nál nagyobb, n növelésével a nullához tart, azaz

P(larl_al)3)"*0

A torzítás második említett típusa a statiSztikai megfigyelés különböző szakaszaiban léphet fel. Lehetséges például fogyatékos vagy félreérthető definició alkotása, esetleg az adatgyűjtés során mérési vagy letagadási hiba.

Ezek a szisztematikus hibák teljeskörű és reprezentatív megfigyelésnél egy—

aránt előfordulhatnak. E tanulmány keretében csak a reprezentatív meg—

figyelésre sajátOSan jellemző mintavételi torzítással foglalkozunk.

Az olyan mintavételi eljárást, amely szisztematikus eltérést eredményez és így torzított becsléshez vezet olyan esetben is, amikor a becslésnél alkal—

mazott statisztikai függvény egyébként torzítatlan, torzitott mintavételnek, az így kapott mintát pedig torzított mintának nevezzük. Ha a kiválasztás módja nem vezet szisztematikus hibához, akkor mintavételünk, illetve min- tánk torzítatlan. Ez utóbbira példa lehet egy lajstrom alapján véletlen számtáblázat segítségével végrehajtott mintavétel a következő feltételek mellett:

* 1. a lajstrom az alapsokaságnak (a felvétel időpontjában létező) vala—

mennyi egyedét tartalmazza,

2. minden kiválasztott egyedről sikerült adatot gyűjteni, tehát az adott címen mindenki megtalálható volt, senki sem tagadta meg a választ.

Az itt ismertetett feltételek teljesülése esetén nem csupán az egyszerű véletlen mintavétel, hanem a véletlenen alapuló bonyolultabb eljárások is torzítatlan mintát eredményeznek. Ezt azért szükséges hangsúlyozni, mert egyik—másik ilyen összetett eljárás, például az ún. nem arányos rétegzés (egyik változata az optimális rétegzés), vagy az ún. nagysággal arányos valószínűségen alapuló kiválasztás azt a benyomást keltheti, hogy a minta- vételből torzítás származott. Valójában nem arányos rétegzés esetén az alap- sokaság egyes elemeire nézve a mintába kerülés valószínűsége nem egyenlő ugyan — mint az egyszerű véletlen kiválasztásánál —, de rögzített és meg- határozható érték. Amikor az adatgyűjtés befejeztével sor kerül a becslésre, a mintavétel módját figyelembe vesszük és megfelelő súlyozással az arány——

talanság hatását megszüntetjük. Egészen más a helyzet akkor, ha a minta belső összetétele nem valamely céltudatos mintavételi terv végrehajtásának eredményeképpen, a kiválasztási valószínűség ismeretében, hanem rajtunk kívülálló okoknál fogva tér el meghatározott irányban az alapsokaság ará—

nyaitól (a következő pontban erre számos példát mutatok be). Ebben az eset- ben a mintát joggal torzítottnak kell minősítenünk.

A reprezentatív megfigyelésnél fellépő torzítások közül a most tárgyalt mintavételi torzítás fontosabb, mint a becslési formulából származó torzí—

tás. A gyakorlatban ugyanis a torzított becslésnek szinte kizárólag a kon—

zisztens Változatai szerepelnek (mint például a hányados—becslés) s így nagy minta esetén súlyos torzítás nem fordulhat el. A torzított mintavételből ez—

zel szemben jelentős hiba származhat.

(4)

966 ' on. emelnem ezzen

II. A TORZITÁS OKAI

Abból a célból, hogy a torzított minta keletkezésének körühnényeit tisztázzuk, a mintavételi eljárás különböző típusait kell szemügyre vennünk.

Nehézséget jelent azonban, hogy a statisztikai mintavételnek számos válto—

zata alakult ki, az utóbbi évtizedekben pedig különösen gazdagodtak a mód—- szerek. Egészen különleges módszerek kerülnek alkalmazásra a statisztikai

minőségellenőrzésnél, az ökonometriai modellek paramétereinek becslésé—

nél stb. Jelen tanulmány keretében csupán a reprezentatív (megfigyelés szo——

kásos alkalmazását tárgyalom, a speciális kérdésekre nem térek ki.

Vegyük sorra a torzított minta keletkezése szempontjából legfontosabb eljárásokat, illetve körülményeket. Félreértések elkerülése céljából meg-—

jegyezzük: a tárgyalandó kiválasztási formák nem vezetnek mind szükség-'- képpen torzitott mintához. Minden esetben fennáll azonban a torzítás ve—

szélye, ezért tisztán kell látnunk a torzítást okozó körülményeket az egyes eljárások alkalmazásánál.

!. Önkényes (tudatos) kiválasztás

Ez a módszer a torzított mintavétel nyílt, durva formája, —mellyel sta—

tisztikai gyakorlatunkban szerencsére ritkán találkozunk. Kétségtelen, hogy az önkényes kiválasztás rendelkezik bizonyos — többnyire látszólagos

—— előnyökkel. Végrehajtása sokszor olcsóbb és kényelmesebb, mint bármely Véletlen eljárás alkalmazása. A megfigyelés szervezőjének az a szubjek—

tív érzése, hogy megragadta a tipikus jelenségeket és ezzel sikerült ,,kikü—

szöbölnie a véletlent".

Valójában a tudatos kiválasztás még a legjobb szándék ellenére is gyak—

ran súlyos torzítást eredményez. Kísérletekkel igazolt tapasztalat ugyanis, hogy az ember képtelen szemlélődés útján átlagot helyesen becsülni (pél—

dául átlagos termésű gyümölcsfákat kiválasztani).3 Ez a megállapítás egyéb——

ként többek között azért is kézen fekvő, mert a gyakorlatban sűrűn előfor—

duló aszimmetrikus eloszlásoknál a tipikus (modális) érték nem azonos az átlagossal. Még kevésbé lehetséges egyidejűleg több ismérv szempontjából átlagos egységeket szubjektiv érzés vagy tapasztalat alapján megjelölni, például egy üzem munkásai közül ,,tipikus munkásokat" vagy akár ,,tipikus termelőszövetkezeteket", ,,átlagos textilszaküzleteket" kiválasztani.

Tegyük fel azonban, hogy sikerült egy mintát csupa átlaghoz közelálló egyedből alkotni. Kérdés, hogy ez a minta ,,reprezentativ"—e? Nyilván nem, mivel egyáltalán nem tükröződik benne az alapsokaság minden tipusa, vál- tozata, és ha meg is felel az átlag becslése céljára, semmiképpen nem alkal—

mas az arányok, az összetétel elemzésére, ami közgazdasági szempontból nem kevésbé lényeges.

Mind ez ideig a teljes elfogulatlanságot és jó szándékot tételeztük fel.

Önkényes mintavételnél azonban ez a feltevés objektive helytelen, mivel az eljárás természete magában hordozza a helyi érdekek, egyéni szempontok érvényesítésének lehetőségét. Vegyük példának a hazai termésbecslők által követett eljárást, amelyet az erről szóló szakkönyv ,,magyar, ún. súlyponti részek kiválasztásán alapuló módszer" néven ismertetf1

SF. Yates kísérletének leírását lásd például Pármczky Gábor—Csepinszky Andor: Reprezen—

tatív megfigyelés a gazdasági statisztikában. Közgazdasági és Jogi Könyvkiadó. Budapest. 1956.

35. old '

t'Rartos Lajos: Termésbecslők kézikönyve, Mezőgazdasági Kiadó. Budapest. 1958. 148—150. old.

(5)

.A MIN'I'AVETELI TORZITAS 967

A többlépcsős mintavétel első fokozatában községeket választanak ki.

Ennek alapelve a következő: ,,A járásokban a 3—5 ún. súlyponti községet nem a véletlenségi elv, hanem tudatosan a járásra jellemző talajtani, termesztési és éghajlati adottságok alapján jelöltük ki." Mivel ezen az alapon objektív, tudományos módszerrel egy járáson belül tipikus községeket kiválasztani lehetetlen, fel kell tételeznünk, hogy a mintavételnél a területi apparátus befolyása érvényesül. Némi túlzással és csupán az érthetőség kedvéért éle—

sen fogalmazva, ez annyit jelent, hogy mindenki oda megy termést becsülni, ahová akar, majd ,,bebizonyitja", hogy éppen az általa kiválasztott község

tipikus.

2. Nem teljes lajstrom alapján történő kiválasztás

Személyeket, illetve családokat (háztartásokat) igen gyakran különböző listák, névjegyzékek alapján választanak ki, mechanikus módszerrel vagy véletlen számtáblázat alapján. Ha a kiválasztás üzemben történik, akkor a lajstrom összeállítása nem okoz nehézséget, hiszen a munkahelyek megfelelő és minden dolgozóra kiterjedő nyilvántartással rendelkeznek. Más a helyzet a lakóterületi kiválasztásnál. Az országban vagy valamely városban lakó sze- mélyekről általában nem áll rendelkezésre ,,naprakész" és könnyen kezel—

hető kimutatás. A könnyen hozzáférhető, de csonka, többnyire speciális név—

jegyzékek (például telefonkönyv) használata a teljes lajstrom helyett sok—

szor erősen torzított mintához vezet.

Ezzel kapcsolatosan bőséges tapasztalatokat nyújt a közvéleménykuta- tással foglalkozó szakirodalom. Az amerikai elnökválasztási prognózisok leg—

nevezetesebb kudarca éppen a most tárgyalt esettel függ össze. Az 1936—os elnökválasztáson két jelölt lépett fel: F. D. Roosevelt és A. M. Landon. Is—

meretes, hogy Rooseveltet választották meg, éspedig szokatlanul nagy, 61 százalékos többséggel. A Litera'ry Digest folyóirat szerkesztősége a választási eredmény előrejelzése céljából közvéleménykutatást szervezett, melynek so- rán több, mint 2 millió választ dolgoztak fel. A minta terjedelme tehát bő—

ségesen elegendő volt. Ennek ellenére a folyóirat Landon győzelmét jósolta.

A magyarázat abban rejlik, hogy a folyóirat szerkesztője telefonköny—

vekből és gépkocsinyilvántartásokból írta ki a címeket. A választók politi—

kai állásfoglalása pedig természetesen összefügg vagyoni helyzetükkel, mely—

nek ismérvei (többek között) éppen a telefonnal, illetve személyautóval való rendelkezés. így a mintában szisztematikus torzítás keletkezett a vagyono—

sabb rétegek javára, és Roosevelt éppen a dolgozók, a ,,kisembere " körében volt elsősorban népszerű.5

Ma már természetesen nem vesznek igénybe speciális névjegyzéket, ha—

nem a piackutató intézmények és más reprezentatív megfigyeléssel foglal- kozó szervek igyekeznek teljes listákkal dolgozni. A népszámlálások cím—

anyaga, választási névjegyzékek, adónyilvántartások e célra jó alapot szol- gáltatnak. Nem mindegy azonban mennyi idő telt el a lajstrom összeállítása és az adatgyűjtés Végrehajtása között. (A két időpont egybeesése csak kivé—

telesen fordulhat elő.) Viszonylag rövid időszak itt nem okozhat lényeges

5 A mintában emellett ,,non—response" torzítás is volt. Lásd részletesen Feröer. R.: Statis—

tical Technigues in Market Research. Me. GraW—Hiu Book Comp. New York—Toronto—London.

1949. 218. old., Stephan, F. F.—Mc Carthy, Ph. J.: Sampling Opinions. John Wiley and Sons. New York. Chapman and Hall. London. 1958. 12. old. és Wallis. W. A.—Roberts, H. V.: statistics, a New Approach. The Free Press, Glencoe, Illinois. 1958. '!4. old.

(6)

968 na. aAamczxY annak

torzítást, hiszen például egy negyedév leforgása alatt a népességnek csupán kis hányada költözik el. A Központi Statisztikai Hivatal a munkás és alkal-—

mazotti családok reprezentatív jövedelmi összeírását az 1960. január 1—i népszámlálás címjegyzéke alapján 1960 márciusában hajtotta végre. Nyilván—

való, hogy a felvétel ebből a szempontból gyakorlatilag torzítatlannak te—

kinthető. Ugyanezen címjegyzék alapján azonban 1963-ban megismételni az összeírást nem lenne helyes.

Kérdés, milyen jellegű a torzítás, amely az eredetileg teljes, de idővel csonkává váló lajstromok használatából adódik? A torzítás jellegét az dönti el, hogy a címváltozás oka mennyiben függ össze az adatfelvétel céljával. A lakóhelyváltozások egy része faluról városba való költözés, ami sokszor fog——

lalkozásváltoztatással jár együtt. Ez a körülmény természetesen befolyá—

solja a gazdasági jellegű megfigyelések eredményét. Az új lakásokba köl—

töző Családok többnyire bútort vásárolnak, ezért például egy tartós fogyasz—- tási cikkek keresletével foglalkozó piackutatás mintája 2—3 éves lajstrom alapján erősen torzított lehet, feltéve, hogy az érintett időszakban nagy lakásépítkezés folyt. Általában is megállapítható, hogy csupán ritka kivétel—

képpen fordulhat elő, hogy a teljes névjegyzéle címváltozás miatt kieső egyedek vagy háztartások sokasága ugyanolyan átlagos összetételű, mint az adott címen megtalálható egyedek sokasága. Ezért az idővel csonkává váló lajstrom általában szisztematikus hibához vezet. Ennélfogva megállapítható,

hogy

1. a sokaságnak csupán egy részét magában foglaló, speciális névjegyzé—

kek használata erősen torzitott mintát eredményezhet, ezért nem ajánlatos;

2. az eredetileg teljes, de régi listákat is kellő óvatossággal kezeljük; a felvétel céljától függően logikailag megvizsgálandó, milyen mértékű lehet

a kieső rész, és milyen torzítás Várható a lakóhelyváltozások eredménye——

képpen. _

3. Válaszadás hiánya

A csonka lajstromhoz hasonlóan torzítás veszélyét hordozza magában az olyan adatgyűjtés is, amelynél az egyébként kifogástalanul kiválasztott egye—

dek egy részéről nem sikerült adatot gyűjteni. Ezt a jelenséget nevezi a nem—' zetközi szakirodalom ,,non—response'i-nak. A hiányos válaszolásnak többféle oka lehet. Legfontosabb tényező a válasz megtagadása; kevésbé gyakori és problematikus eset, hogy a kiküldött kérdezőbiztos ismételt próbálkozással sem talál otthon valakit, vagy levelezéses kikérdezésnél a címzett hosszabb üdülés, utazás stb. miatt határidő után adja postára a kitöltött kérdőívet.

A válaszmegtagadás (nemválaszolás) a postai úton lebonyolított adat——

gyűjtéseknek központi problémája. Külföldi közvéleménykutató intézmé- nyeknél a 20—30 százalékos válaszolási arányt már igen jó eredménynek te—

kintik. Jellemző a következő eset: 1937—ben az Amerikai Egyesült Államok—- ban munkanélküliségi adatfelvételt hajtottak végre, kongresszusi határozat alapján. Az érintett egyének ösztönzése a postai úton kiküldött kérdőívek megválaszolására igen erős volt, többek között az elnök személyesen intézett felhívást a munkanélküliekhez, hogy saját érdekükben ne mulasszák el a kérdőívek kitöltését és visszaküldését. Az eredmény: 67 százalék válaszolta

9 Hansen, M. [i.—Hurwitz, W. N.-—Madow, W. G.: Sample Survey Methods and Theory John Wiley and Sons. New York. Chapman and Hall, London, 1953. I, köt. 70. old.

(7)

A WAVETEIJ TORZI'I'AS 969"

A nemválaszolás inditékai természetesen különbözők lehetnek, sajnos

azonban legtöbb határozottan a szisztematikus hiba irányába hat. Különösen két motivumra kell itt rámutatni: egyfelől a kérdőív kitöltése (különösen, ha terjedelmes kérdőívről van szó!) szellemi munkát végző embernek ki—

sebb fáradtságot jelent, mint fizikai munkát végző, illetőleg kevésbé iskolá—

zott embernek. Ezért az utóbbiak kevésbé hajlamosak válaszolásra, mint az előbbiek, és így —— ha az eredeti kiválasztásnál megfelelő volt is a minta ará—

nya a foglalkozás, illetve műveltség szempontjából — a beérkezett és feldol—

gozható anyagban már torzítás jelentkezik az értelmiségi foglalkozásúak ja- vára. Torzítást okozhat másfelől az a körülmény is, hogy nagyobb arányban válaszolnak azok a személyek, akiket a felvétel témája érdekel, úgy érzik, hogy ezzel kapcsolatban közlendőik vannak, mig a tárggyal szemben kö—

zömbös egyének tartózkodnak a válaszadástól.

Az említett két hatás mintegy összegeződhet akkor, ha a felvétel törté—

netesen kulturális tárgyú. Egyik intézményünk például 1959—ben a buda—

pesti Iakosság színházlátogatási szokásait vizsgálta levelezéses módszerrel.

3000 kérdőívet küldtek szét, a válaszadás aránya 23,4 százalék volt. A vála—

szolók megoszlását a legmagasabb iskolai végzettség szerint vizsgálva kide—

rült, hogy a középiskolát végzettek aránya 46,5, az egyetemet, főiskolát Vég—4 zetteké pedig 22 százalék volt. Ezzel szemben a tényleges arányok 1960. ja—

nuár 1—én (a 15 éven felüli budapesti lakosságot véve alapul) 18,4, illetve 7,4 százalék, beleértve azokat is, akik középiskolát, illetve főiskolát végeztek ugyan, de érettségi bizonyítványt vagy diplomát nem szereztek.7 Ezt és más tényeket is figyelembe véve a felvétel szervezői arra a következtetésre ju—

tottak, hogy a válaszadók sokasága inkább a színházat kedvelő fővárosi kö—

zönséget képviseli, mint Budapest feh'iőtt lakosságát általában. Ilyen leszű—

kítés mellett is természetesen a válaszokból sok hasznos következtetés adódott.

Mindezek alapján indokolt, hogy sok statisztikus aggályosnak tartja a levelezéses módszerrel történő adatgyűjtést és ezt a módszert —— olcsósága ellenére —-- nem javasolja. Akadnak persze a módszernek védelmezői is, és igy az utóbbi években a témáról sok, többek között elég éleshangú vitacíkk jelent meg.s

A válaszmegtagadás aránya személyes kikérdezésnél lényegesen alacso—

nyabb, mint levelezéses módszer használata esetében. A kérdőív kitöltésé- nek munkáját itt a kérdezőbiztos végzi, a kiválasztott személyeknek mind——

össze egy Viszonylag rövid párbeszédre kell vállalkozniok, amit nem sokan tagadnak meg, különösen, ha a kérdezőbiztos fellépése bizalomgerjesztő, ud—

varias. A francia Etmar közvéleménykutató intézet tapasztalatai szerint pál——

dául a non-response aránya gazdasági jellegű személyes kérdéseknél nem haladja meg a 4 százalékot, politikai témáknál pedig a 10 százalékot. Ugyan-—

ezen intézmény vezetői a költségekről úgy vélekednek, hogy bár egy kérdőív kitöltésének költsége kétségkívül nagyobb. a személyes kérdezésnél, de már egy megválaszolt kérdés költsége kisebb. Ennek magyarázata abban rejlik, hogy a levelezéses módszer korlátot szab a kérdőív terjedelmének, szemé——

lyes kérdezésnél azonban hosszabb kérdőívek is alkalmazhatók. (A modern,,

? 1960. évi népszámlálás 2. Személyi és családi adatok képviseleti minta alapján. Budapest, 1960. 158. old.

* Ferber, R. ídézett könyvének irodalomjegyzékében (425. old.) például a következő címekre akadtam: ,,Mail Guestionnaires Aren't Worth Their Salt", ,,Eighteen Elements of Danger in Making Mail surveys". Egy (nyilván. szintén éleshangú) válaszoikk: Don"; Look Dowri Your'Nose at Mail Guestionnaires".

(8)

970 on. PARN'ICZKY ama minden részletre és vásárlási indite'kra kiterjedő piackutatás éppen a hosz—

szú kérdőívek használatát követeli meg.)9 '

r—A levelezés ésa személyes kikérdezésen alapuló módszer érdekes kem—

binációját tanulmányozhatjuk a Központi Statisztikai Hivatalnak a mérnö—

kök és technikusok életkörülményeire vonatkozó 1957. évi adatfelvételepél—

dáján. A felvétel szervezői a várható nagyarányú non-response miatt ide-—

genkedtek a levelezéses módszertől. Nem helyeselték azonban a személyes kikérdezést sem, mivel itt a névtelenség nincs biztosítva, márpedig a szó—

banforgó felvételnél a fizetésen kivüli jövedelmet is tudakolták és őszinte választ csak abban az esetben reméltek, ha a kikérdezett egyén személyazo—

nossága nem állapítható meg. Ezért a következő megoldást választották: a kérdőív kitöltésére felkért/eket személyesen felkeresték és átadták a kérdő—

ívet, egyúttal megvilágítva a felvétel célját. A nevet és címet nem tartal-—

mazó kérdőíveket azután a mérnökök maguk töltötték ki, és adták postára.

Ilyen módonfa válaszolás aránya 65 százalék volt. Egyébként az utólagos vizsgálat szerint az ipari főcsoportok és munkahely-típus (vállalat, mini—sze;- tériunrlz stb—r.) szerinti megoszlás tekintetében a non-response nem okozott tor- zitás . "

4. A kvóta, rendszerű kiválasztás

, A kvóta rendszerű kiválasztás lényege a következő: a mintavételt és az adatgyűjtést számlálóbiztosok bonyolítják le. A gyakorlatban a számlálóbiz—

tosok kiküldését többnyire megelőzi az alapsokaság körzetekre osztása, így

a számlálóbiztosok meghatározott körzetekben tevékenykednek. Minden

.számlálóbiztosnak előírják, hány egyedről kell adatot gyűjtenie és azt is, hogy bizonyos ismérv vagy ismérvek szerint milyen legyen a minta összeté—

tele. Például 50 családot kell kikérdezni, ebből 18 legyen kéttagú, 22 három—

tagú stb. E módszer leggyakrabban a piac— és közvéleménykutatásban, to—

vábbá a háztartási statisztikában kerül alkalmazásra.

Abból, amit eddig mondottam, úgy tűnhet, hogy a kvóta kiválasztás tulajdonképpen a rétegzett mintavétel egy formája. A kettő között azonban lényeges különbség van. Rétegzett kiválasztás esetében az alapsokaságról rétegenként külön—külön teljes lajstrommal rendelkezünk, a mintába kerülő egyedeket ebből véletlen módszerrel választjuk ki és a számlálóbiztosoknak név és cím szerint írjuk elő, kiket kell felkeresniök. Kvóta kiválasztásnál ezzel szemben a számlálóbiztosnak —— az említett arányok betartásától elte,—

kintve —- szabad keze van a kvóta kitöltésénél. A kérdezőbiztosok számára készített utasítások természetesen igyekeznek a mintavételt helyes irányba terelni; általánosságban előírják, hogy a kiválasztást véletlenszerűen kell le-

bonyolítani, tiltják az utcai interjúkat, szorgalmazzák az otthoni, lehetőleg esti órákban végrehajtott kikérdezéseket stb.

A kVóta kiválasztás előnyei kézenfekvők: lényegesen kisebb előkészítő és szervező munkát igényel, olcsóbb mint a valószínűségi mintavétel, álta—

lában nem kell számolni non-response hatással; A csehszlovák háztartási statisztikusok például ennek alapján helyeslik a kvóta rendszer alkalmazá—

sát, ugyanakkor visszautasítják az önkényes és tudatos mintavételt.11

9 Bognár József professzor szíves közlése. ,

" A módszer részletes leírását lásd Statisztikai Szemle. 1958. évi 5. sz. 458—471. old.

. n Vytlaóil, J.: Nékolik poznámek k zámérnému vybéru, Statistickú thor. mm. évi 8. sz.

sss—370. old. Ismertetését lásd a Statisztikai Szemle 196). évi 1. számában (ln—112. old.).

(9)

'A. MINTAVÉTELI TORZITAS ' 971

Közelebbről vizsgálva a kvóta kiválasztásgproblémáját, a torzítás irá—

nyába ható jelentős tényezőkre kell felfigyelnünk'." Mindenekelőtt. nyílván- való, hogy a kérdezőbiztoe (akit darabbérben szokás fizetni) igyekezni fog feladatát minél kevesebb helyváltoztatással, azaz utazási idővel megoldani.

Ezért a mintasokaság területileg koncentrálódik. Bizonyos fokig segíthetünk ezen oly módon, hogy a kontroll ismérvek közé felveszünk egy földrajzi is—

mérvet is (például egy városból álló körzetben a bel— és külvárosi megoszlást írjuk elő), azt azonban nem érhetjük el, hogy adott nagyságú körzetben olyan egyenletes sűrűséggel szóródjék szét a mintasokaság, mint véletlen ki—

választásnál. . *

További probléma, hogy — úgyszintén az idejét kimélendő. —— kvóta rendszerben a kérdezőbiztos nem vesződik azzal, hogy zárkózott vagy a té—

mával szemben közönyös egyéneket szólásra bírjon, hanem keres olyan egyé—

neket vagy családokat (esetleg személyes ismeretségi köréből), akik szívesen nyilatkoznak, általában közlékenyebb természetűek. Ez az oka annak, hogy a kvóta rendszerben fel sem merül a non-response probléma. A reprezenta—

tiv megfigyelés egyik szakértője, W. E. Deming így ír erről: ,,Sajnálatos ön—

ámítás volna nyugalomba ringatni magunkat hasonló helyzetben, mivel ezek a módszerek torzították; 100 százalékos válaszolás is alaposhibát rejthet magában. Ha jó mintavételt akarunk végrehajtani, szembe kell néznünk a non-response problémával, nem pedig eltemetni azt."12

Az elmondottakból kitűnik, hogy rétegzett megfigyelésnél, figyelembe véve a'non—response hatást is (ami személyes kikérdezésnél nem nagyará—

nyú), a torzítás veszélye kisebb, mint a kvóta kiválasztásnál. Ezzel szemben áll a kvóta kiválasztás kétségtelen egyszerűsége és olcsósága, amely miatt e kiválasztási módszer még ma is igen népszerű. Véleményem szerint —- éppen az ismertetett körülményekre tekintettel -— kvóta kiválasztás esetén feltét—

lenül szükséges az eredmények publikálását megelőzőleg meggyőződni ar—

ról, okozott—e (és milyen mértékben) torzítást a mintavétel. Amennyiben tor—

zítást észlelünk, igyekeznünk kell ennek hatását csökkenteni.

5. A koncentrált kiválasztás

Tételezzük fel, hogy egy iparágban 200 vállalat foglal helyet; a terme-- lési érték, a beruházott vagyon vagy más fontos ismérvek szempontjából vizsgálva a megoszlást úgy találjuk,*hogy kevés számú, például 10—20 nagy vállalat döntő hányadot képvisel (pl. 90—95%), a fennmaradó sok kis válla—- lat pedig együttvéve is csak kevés hányaddal járul a termelési értékhez, összes beruházott értékhez stb. A koncentráció ilyen magas fokán álló, élesen aszimmetrikus eloszlást mutató sokaságoknál szokás koncentrált mintavé—

telt alkalmazni. Ez abban áll, hogy kizárólag a nagy egységek vizsgálatára szorítkozunk, a sok kis egységből nem veszünk mintát.13

A magyar gyakorlatban a koncentrált kiválasztás elsősorban az index—

számítás területén kerül alkalmazásra.14 A sokaság ebben az esetben termé-—

12 Deming, W. E.: Some Theory of Sampllng. John Wiley and Sons. New York. Chapman and Hall. London. 1950. 36. old.

18 Az angolnyelvű szakirodalomban _,,cut off" módszer néven ismeretes; lásd Hansen, M. H.

—Hurwitz, W. N.——Madow, W. G.: Sample Survey Methods and Theory. John Wiley and Sons.

New York. Chapman and Hall London. 1953. I. köt. 486—490. old.

14 Részletesen dr. Drechsler László—dr. Köves Pál: A reprezentatív módszer alkalmazása az . indexszámításban. (Statisztikai szemle. 1960. évi 6. sz. 555—573. old.), és Éltető Ödön: A reprezen—

tatív módszerrel nyert árindex hibáíának számítása. (Statisztikai Szemle. 1959. évi 2. sz. 147—163.

old.) c. cikke foglalkozik a kérdéssel.

(10)

972 DR. PÁRNICZKY Gáncs

kekből áll, melyek között léteznek (a fogyasztás, termelés, külkereskedelmi forgalom stb. szempontjából) fontos és kevésbé fontos termékek. Az index kiszámításánál csakis a viszonylag kevés számú legfontosabb terméket vesz—

szük figyelembe, a jelentéktelen termékek nagyobb tömegét elhanyagolása.

A koncentrált kiválasztást úgy foghatjuk fel, hogy a sokaságot két ré—

tegbe soroltuk: a ,,lényeges" és a ,,lényegtelen" egységek rétegei-be. A minta-—

vétel aránya az első rétegben 100 százalék, a második rétegben nulla. Az el—

járás kétségen kivül torzított, lehetséges azonban, hogy a torzítás elhanya—

golhatóan csekély, s így a mintavétel elméletileg nem kifogásolható. A tor?

zítást ugyanis a mintavétel ,,koncentrált" jellege már eleve korlátozza: ha csakugyan sikerült biztosítani, hogy az első réteg értékben az egész sokaság döntő hányadát képviselje, akkor nagymértékű torzitástól nem kell tarta-—

nunk. Lehetséges továbbá, hogy közgazdaságilag megalapozottan feltehet—

jük: a változások és arányeltolódások a második rétegben nagyjából az első réteghez hasonlóan történnek. Kapitalista országokban például egyes ága-—

zatokban a piaci árpolitikát a nagy monopóliumok diktálják, a sok kisvállal—

kozó kénytelen a nagy versenytársakhoz igazodni.

Ha az utóbbi feltevés nem megalapozott, a koncentrált kiválasztás már torzításveszélyes lehet. Ilyenkor helyesebb az eljárást úgy módosítani, hogy a második réteget is bevonjuk a mintavételbe, persze nem 100 százalékos kiválasztási aránnyal, hanem a szükséges mintanagyságot a reprezentatív megfigyelés szabályai szerint kalkulálva. Az eredmények kiszámításánál ter—

mészetesen megfelelő súlyokat alkalmazunk. Ezzel a módszerrel a koncen—

trált kiválasztást teljesen torzításmentessé tehetjük.

6. Térkép alapján történő (kétdimenziós) kiválasztás

A kiválasztás alapjául sokszor kétdimenziós ,,nyilvántartás" (térkép, helyszínrajz, légifelvétel) szolgál. Alapvető követelmény, hogy a térképen az alapsokaság összes egyedei fel legyenek tüntetve, ellenkező esetben a csonka lsjstrommal kapcsolatos, 1. pontban tárgyalt torzítással állunk szemben.

Térkép használata nem vezet minden esetben kétdimenziós kiválasztás—

hoz. Ismeretes például a következő eljárás: egy város (vagy kerület) térképe alapján háztömböket jelölünk ki, ezeket sorszámokkal látjuk el és a sor—

számokból véletlen számtáblázat segítségével választjuk ki a szükséges nagy-—

ságú mintát. E módszer elsősorban a kétlépcsős kiválasztás első fokozatában használatos.15 Ebben az esetben a térképet lényegében csupán a mintavételi egységek kialakítása céljából hasznáka fel, maga a kiválasztás egyenértékű a lajstrom alapján történő mintavétellel.

Tulajdonképpeni kétdimenziós kiválasztásról akkor beszélünk, ha maga a mintavétel is a térképen történik, akár szisztematikus módszerrel, akár véletlen koordináták alkalmazásával.16 A két megoldás közül az előbbi a gya—

koribb. A kiválasztás technikája a következő: a térképre négyzetes hálózatot illesztünk oly módon, hogy a metszéspontok száma éppen a mintaelemek számával legyen egyenlő. A metszéspontokhoz legközelebb eső egységeket választjuk ki.

15 Párniczky Gábor—Csepinszky Andor: Re'prezentatív megfigyelés a gazdasági statisztikában, Közgazdgsági égsa'ogi Könyvkiadó. Budapest, 1956. 111—113. old.

"* o. 92— . old.

(11)

.a; mumus! TORZITAS . ' 973. : *

A kétdimenziós kiválasztás torzítatlan mintát eredményez akkor, ha az alápsokaság egységei nagyjából egyenletes sűrűséggel oszlanak meg a szó- banforgó területen. Ez a feltétel azonban a gyakorlatban sokszor nem telje- sül. Magyarország területén például a községek eloszlása korántsem egyen—

letes: Dunántúlon sokkal több község jut egységnyi területre, mint az Al—

földön. Másik példa: ha Budapest térképére bejelöljük a kereskedelmi üzlet- hálózatot azonnal szembetűnik, hogy a boltok lényegesen sűrűbben helyez- kednek el a belvárosban, mint a peremkerületekben. Ilyen megoszlás esetén * a kétdimenziós mintavétel már nem tekinthető torzításmentesnek.

A torzítás természetét szemlélteti az 1. ábra. Ezen az ábrán két szom—

szédos és egyenlő területű megye látható, A és B. A megyében több, B

megyében kevesebb község van. Igy tehát bármely torzítatlan kiválasztási

eljárással szemben —-— eltekintve most a nem arányos rétegezéstől vagy a nagysággal arányos kiválasztási valószínűség ancahnazásától -—— az a köve—

telrnény támasztható, hogy a mintában is A megyéből több község legyen, mint B megyéből, illetve a várható értéket tekintve az arányok pontosan * egyezzenek az alapsokaság összetételével. Ezzel szemben a most tárgyalt módszerrel készített minta éppen fele—fele arányban oszlik meg a két me—

gye között, tekintet nélkül a tényleges arányokra, mivel a terület egyenlő- sége folytán ugyanannyi metszéspont jut a két megyére. Más szóval ez any-—

nyit tesz, hogy B megye községei nagyobb valószínűséggel kerülhetnek a mintába, mint A megye községei. (Az ábrán a sötét pontok a községeket, a

bekeretezett pontok a kiválasztott községeket jelzik.)

1. ábra. Községek kiválasztása térkép alapján

(12)

'"9'í§ '* * * § * , * ADR. emmczxvemoa

— _ Hasanló a helyzet bármely —— szisztematikus vagy véletlen koordi§ákon alapuló -—— ketdlmenzms kwálasztasnal, ha az alapsokaság egységeinek_el—

oszlása az adott területen nemegyenletes - *

7. Időben történő kiválasztás *

Reprezentatív megfigyelés célja lehet valamely időben lejátszódó jelen-— , ség (folyamat) átlagos színvonalának vagy egyéb jellemzőinek megállapí—í tása. Ezen a területen u§yangsak a szisztematikus kiválasztási módszer ke- , lül leggyakrabban alkalmazásra, megpedig olyan formában, hogy egyenlő

* _idokozonkent végeznek megfigyelést Idényszerűen változó, általában perio—

_giikus hullámzáSt mutató folyamatnál az egyenlő időközös megfigyelés nagy hibát eredmenyezhet A hiba termé3zetét ismét §gy példán világítjukmeg.

_ Tegyük fel hogy egy bolt évi átlages árukéSZletét kívánjuk megalla- , pítani oly modon,hogy minden hó el§ején lelt§rozunk. Tegyük fel továbbá

* hogy az, illetőbolt árubeSZerzése rendezeres időközönként történik és a be—

szerzési idokoznek a hónap hossza egés—z SZámú többszöröse Az így keletkező

** ,, _ hibátszemlélteti a 2. ábra Az ábrázolt esetben havonta kétszer van §):u—

sz,§llít*á_s, a hó közepén és végén. Egy-egy alkalommal mintegy 90 000 farin't - értékű árut szereznek be. Az egyszerűség kedvéert úgy tekintjük, hogy két beszerzés között a kéSzlet egészen értékeSítéSrekerül (tehát az áruszállítás ' időpbntjában nullára, vagy közel nullára cSökken) és a csökkenés tendencaága

lineáris. - _ -

2 ábra. Egyenlő időközös megfigyelés hibája

kiala) IMF) , wa ,.

l -.-A.

67

64?

.,._,,..,W,J...._.)....c .. .. .. ...-..

ílű' '!

!

75. 7, 75 1 75 1 75.

V , V Y ' V

Január- Feárwáf' MÉM/715 April/'.)—

u—bgáZÁf'Z'fk'áiytész/ef l/ípykym á/ey/re'sz/af

A 2. ábrából kitűnően a leltározás (megfigyelés) időpontjában a készlet mindig a legmagasabb szintet éri el, példánkban tehát 90 000 forint körül in—

gadozik. Ennyi lesz természetesen a kiszámított átlagkészlet'18. A valóságban azonban az átlagos színvonal jóval kisebb, a szisztematikus kiválasztással kapott eredménynek csupán fele.

Kérdés ezek után, hogy az így kapott hiba (részben vagy egészben) tor—

zításnak tekintendő—e vagy véletlen eltérésnek minősül. A szisztematikus

(13)

A MINTAVÉTELI TORZITAS 975

mintavétel szempontjából vizsgálva a kérdést a következőképpen okoskod—

hatunk': az, hogy melyik időpontban leltározunk, a véletlentől függ; Az in———

duló leltár (és így a többi is) lehetett volna elseje helyett másodikán, har—

madikán stb. Ebben az esetben más és más becslést kaptunk volna az átlag—

készlet értékére és ezen eredmények várható értéke éppen a helyes átlag—

készlet. Eszerint az eljárás torzításmentes, de nagyon pontatlan (,,ineffi—

ciens").

A gyakorlatban a dolog nem egészen így áll: a leltármegállapítás ideje rögzített, ezzel szemben az áruszállítás időpontja van alávetve véletlenszerű ingadozásoknak. így a véletlen hiba mellett torzítás is fellép. Csökkenti azonban a torzítás jelentőségét két körülmény: egyrészt — szemben a le—

egyszerűsített példánkkal — a készlet nem szokott nullára csökkenni, így egy adott áruszállítás előtti és utáni időpont készlete között nincs olyan éles ' különbség, mint példánkban. Másrészt nem egyetlen bolt készletét kell vizs-—

nunk, hanem a boltok valamely adott sokaságának készletét, ahol az áruszál—

lítás ciklusa boltonként eltérő s ezért az átlagban bizonyos kiegyenlítődés——

sel számolhatunk.

Akármint vélekedünk is a szóbanforgó hiba természetéről, annyit fel—- tétlenül meg kell állapítanunk, hogy időben periódikusan ingadozó folya—

mat reprezentatív megfigyelése bizonyos körülmények között nagy hibával

járhat, ezért a mintavétel különös figyelmet érdemel. Stacionárius idősorok—

nál Viszont a szisztematikus mintavételt előnyösen lehet alkalmazni.

8. A mintavételi és megfigyelési egység különválasztása

A mintavétel alapjául szolgáló lajstrom vagy más kimutatás legtöbbször

a megfigyelési egységek felsorolását tartalmazza. Többlépcsős megfigyelés—

nél természetesen minden fokozatban más és más mintavételi egység fordul elő, de az utolsó fokozatban itt is azonos a mintavétel és a megfigyelés egy—

sége. Előfordulhat azonban, hogy valamilyen okból nem a megfigyelés egye—

deinek listáját, hanem valamely ezzel összefüggő, másik sokaságról készült lajstromot használunk. Az egységeknek ez a cseréje torzítást okoz.

E torzítás természetének megvilágítására Hans Kelle're'r professzor a.

következő anekdótát idézi:17 Egy tanító ,,reprezentatív megfigyeléssel", meg akarja becsülni a családok átlagos gyermekszámát. E célból jelentkezésre szólítja fel azokat a tanulókat, akik szüleinek öt vagy több gyermeke van, majd ez megtörténvén azokat, akiknél négy gyermek van stb. Végül jelent—

kezésre hivja fel azokat a tanulókat, akik szüleinek nincs gyermeke. Mint——

hogy senki sem jelentkezik megállapítja, hogy nincsenek gyermektelen há—

zaspárok.

Vegyünk azonban egy gyakorlati jellegű példát: tegyük fel, hogy mun—

kás— és alkalmazotti családokat kívánunk kiválasztani háztartási statisztika vezetése vagy más kikérdezés céljából. A mintavételt úgy szervezzük meg, hogy első lépcsőben vállalatokat és más munkahelyeket választunk ki, majd második fokozatban a kiválasztott Vállalatok bérlistái alapján dolgozókat.

Az így kiválasztott dolgozó családját vonjuk be a megfigyelésbe. A minta—

vétel ilyen végrehajtásának több oka is lehet: például nem áll rendelkezésre a munkás- és alkalmazotti családok listája egy adott területen és a területi

*7 Kellerer. Hans: Theorie und Technik des Stichprobenverfahrens. Deutsche Statiatische Gesellschaft. München. 1953. 85. old.

(14)

976 * _ , * na. emma—zni? GW

több lépcsős (háztömbök kiválasztása stb.) kiválasztás költséges lenne, az , ; ; üzemi kiválasztás viszent olesőbh Másik oklehet a váz—hato non—respome/ _

elleni védekezés. A munkahelyen nehezebb ilyen jellegű kérést visszautalni-— __

tani, mint otthon

Milyen körülmény okozhat torzítást az üzemi kiválasztásnál a területi ' kiválasztással szemben? A mintavétel egysége itt a dolgozó, mig a megfigye—

lés egysége a család. Egy családban lehet 1, 2, 3, . . . stb. munkás vagy alkal— ' mazott.18 Nyilvánvaló, hogy üzemi kiválasztásnál a több dolgozóval rendel— , ,, ) kező családok arányosan nagyobb valószínűséggel kerülhetnek a mintába,

mint a kevesebb kereső családtaggal bíró családok. Ezért arra kell számita—

nunk, hegy a mintában a kereső—eltartott arány (az egy kereső családtagra jutó eltartottak száma) kisebb lesz, mint ténylegesen, általában a csaladok megoszlása a legfontosabbb demográfiai ismérvek szerint bizonyos torzulást szenved. ,

Előfordulhat természetesen a megfigyelési és mintavételi egység külön- állóságának problémája más formában is.Egy ilyen példára a következő pontban kitérünk.

4:

A mintavételnél fellépő torzítás forrásairól igyekeztünk ebben avész—

ben képet adni, a teljességre való törekvés igénye nélkül. Nem csupán a speciális alkalmazási területeken jelentkező torzító tényezőket hanyagoltuk el (például szegélyhatás a mintavételes termésbecslésnél), hanem olyan tor—

zítást is, amely a társadalmi—gazdasági statisztikában szokásos mintanagy—

ságnál nem jelentős (például a szisztematikus kiválasztásnál abból eredő tor-—

zítás, hogy N a két elem közötti távolságnak, k-nak nem egész számú több—

szöröse).

III. A TORZITAS ELLENÖRZÉSÉNEK MÓDSZEREI

Az előző pontban előadottak alapján sok esetben kikerülhetjük a torzi—

tást, például két nagyjából egyenlően munka— és költségigényes mintavételi terv közül a kevésbé torzításveszélyeset választva. Előfordulhat azonban az is, hogy toxzításmentes módszer az adott esetben nem alkalmazható vagy na—

gyon drága lenne, vagy éppen nem tudunk határozott választ adni arra a kérdésre, hogy mintánk torzítatlan—e. A torzítás irányának és mértéké- nek megitelesenel pedig bonyolítja a helyzetet, hogy egy adott mintavétel- nél néha nem egyetlen torzító tényezővel kell számolnunk, hanem egyide—

jűleg több ilyen tényező is kifea'theti hatását (például csonka lajstrom és non—response).

Ezért a véletlen hiba nagyságának ellenőrzése mellett vagy már azt megelőzően, helyes a torzítás jelenlétének, illetve mértékének vizsgálatá- val is foglalkoznunk. Ezt azért szükséges hangsúlyozni, mert statisztikai gya—

korlatunkban ma már meghonosodtak a hibaszámítás módszerei, ami statisz—

tikai tevékenységünk fejlődésének egyik fontos jele, a torzítás ellenőrzése azonban jóval ritkábban fordul elő. A kiszámított megbízhatósági határok önmagukban félrevezetők lehetnek abban az esetben, ha a véletlen hiba mellett szisztematikus hiba is fellép.

13 A munkás, illetve alkalmazott családtag nélküli családokra a példánkban említett felvé- tel köre nem terjed ki.

(15)

Az első feladat tehát annak megállapítása, hogy mintánk csakugyan reprezentatív—e vagy pedig bizonyos irányba ,,húz", és ha igen milyen irány-' ban és milyen mértékű ez a torzulás. A feladatot a következő körülmény nehezíti meg: erre a vizsgálatra egyedül a mintasokaság nem elegendő, szükség van ettől függetlenül, lehetőleg teljeskörű, de mindenesetre torzítat—

lan megfigyelésből nyert információra is. Ez a követelmény azért újszerű, mert a véletlen hiba nagyságának ellenőrzésére elegendő a mintasokaság is-

merete

(feltéve, hogy a minta elég nagy). A torzítás ellenőrzésére azonban a minta önmagában nem elegendő, hiszen itt azt kell megállapítani, közre—

játszott—e a véletlen mellett valami egyéb tényező is, ehhez pedig összeha- sonlítási bázisra van szükség. A torzítás ellenőrzésére javasolt következő módszerek használata tehát külső információt igényel.

1. A mintasokaság megoszlásának vizsgálata

Ez a módszer mind alapgondolatát, mind végrehajtását tekintve igen egyszerű: választunk egy vagy több cSoportképző ismérvet, melyekhez az alábbi követelményeket fűzzük:

a) az ismérv legyen közgazdasági értelemben lényeges, vagyis legyen szoros sztochasztikus kapcsolatban a megfigyelt jelenséggel, .

b) legyen ismert az alapsokaság megoszlása az illető ismérv szerint vala—

mely, a mintavételtől független forrásból.

Az ismérv megválasztása után a következő lépés természetesen abból áll, hogy csoportosítjuk a mintasokaságot az illető ismérv szerint és a kapott megoszlást összehasonlítjuk a tényleges megoszlással. Az összehasonlítás alapján nem csupán a torzítás jelenlétét, hanem irányát illetően is levonha—

tunk következtetéseket. '

Ezt, a módszert alkalmaztuk a II. rész 3. pontjában a színházlátogatási közvéleménykutatással kapcsolatban. Csoportképző ismérvnek az iskolai végzettséget választottuk. Ott az a következtetés adódott, hogy a non—res- ponse erős torzítást okozott; a magasabb műveltségű rétegek aránya a min—

tában tényleges súlyukat jóval felülmúlja.

A népszámlálási adatok reprezentatív feldolgozásánál fontos követel—

mény, hogy a háztartások nagyságeloszlása a mintában torzítatlan legyen. Az 1960. évi magyar népszámlálás esetében ennek ellenőrzésére -— külső infor—

máció gyanánt —az 1959. évi próbanépszámlálás adatait is felhasználták?"

Az eredményeket mutatja az 1. tábla. Ennek alapján megállapítható, hogy torzítás jelenlétével nem kell számolni. A két megfigyelést egymástól füg—*

getlenül,.egészen különböző módszerrel bonyolították le, így kevéssé való- színű, hogy mindkettőben azonos irányú és mértékű torzítás érvényesül és _ez okozza az eredmények egybeesését. (A függetlenséget nem sérti az a kö—

rülmény, hogy a népszámlálási minta korrekciójánál részben a próbanép- számlálás eredményeit használták fel, mivel az eljárás során a kiválasztott háztartásoknak kevesebb, mint egy százalékát cserélték ki.) (Lásd az

1. táblát.)

' A megoszlások összehasonlításának módszerét természetesen leghatéf - konyabban úgy használhatjuk fel, ha nem egyetlen, hanem több kontroll—

ismérvet választunk. Ebben az esetben méd nyílik arra is, hogy a minta összetételét két vagy több ismérv szerint egyidejűleg vagyis kombinációs táblázatok formájában ellenőrizzük, ;

; t, 19 Dr. Bene Laios—Tekse Kálmán: Mintavételi módszerek az 1960. _évi népszámlálás adatainak előzetes feldolgozásánál. Statisztikai szemle. 1961. évi 3. sz. 243. old. r— , ' ( * *

2 Statisztikai Szemle

(16)

318

" 'A', mmm-mmm

; mmm ?

' ;. mem_

www www—%n

l ... _ lő. , * Ha

2 ... ' 24 _ zo , 3 ... 25 24 * 4 ... is - m 5 ..._ .. 10, ' ,m

6 ... 4 ' 4

7 és több af. * , s

Forrás: Dr. Bene Lajos—_ Tgk:e Kálmán idézett, cikké; *

2. A megosztások összehasonlításának mtemtzkaz—smthtmz mászom

Előzőkben emlitett példámkban könnyen, eftudtuk dönteni, hogy kellrg számolnunk torzítás, Jelenlétével. A színházlátogatásx peldában szembeotlö

kulonbseget a népszámlálám példában pedig nyilvanvalo egyezest mutattak

a relatív gyakoriságok. A tendencxa azonban sokszor korántsem ilyen egy—

értehnű. Ilyen esetekben a relatlv gyakoriságuk egy—cimem szembeálhtasa

"nem vezet eredményre s igy a matematikm statisztika módszereihez kell _ fofyamodnunk *

Annak elbírálására, hogy két eloszlás egymástól vagy egy tapasztalata eloszlás egy elméleti eloszlástól csupán véletlen okok hatására, vagy gedig

valamely Szisztematikus ok hatására kulonbömk a matematikai statisztika

számos módszerrel rendelkezik. Mi itt mindössze két, igen egyszerűés gyor—

san végrehajtható módszert mutatunk be. Mindkét módszer az ún. ); pró——

bán alapszik. A % elosZ__ás, illetve próba részletes leírására e tanulmány

keretében nem térünk ki, a magyar nye-hü szakirodalomban az ismertetés és ászükséges táblázat több helyen is megtalálható"

Az ún. zlleszkedesmzsgalat végrehajtása a következőképpen torténik ismeretes az alapsokaság mégoszlása valamely (szempontunkból lényeges) ismérv Szerint. A relatív gyakoriságok az egyes osztályokban pl, pg, . . ., p,,

— Cgoportósítjuk a mintát a szóbanforgó ismérv változatai szerint, így kamu];

az ni, 112, , . n gyakoriságokat. A próba megbízható eredményének felté;—

tele, hagy ló—lö—nél kisebb gyakoüSág egy osztályban se forduljon elő

Agyakoriságot: összege,

Eh,—an; ,

** 4—1 '

A kovetkező lepésben képezzük az up, szorzatokat. Ezek az adatok azt mua-

tatják, hogyan oszlik meg egy n elemu' sokaság a szóbanforgóismérv szerint, ha. pontosan az alapsokaság megoszlását követi A próba céljára az alábbi összegre vanszükségünk:

, ' %f:2("i—n?1)*_

4-1 ""?!

_ magán"! Alfréd: Vamazínüsémámítás. Tankönyvkiadó. Budapest. 1954. szi-am. cm.. és!

mögénollanówés Suzi-;. vm.; István. Közgazdasági és meg! Könyvkiadó. Buda'pest momzoo—102. és !!!—116. old.

(17)

A Mmmm— TonzrrAs * 979

;,Tiszta illeszkedésViwgálatról" lévén szó, a próba szabadságfoka (r—l ),

ezt használjuk a táblázati értékkel való öSszehasonlitás során. A x% táblái—

ból ugyanis eldönthetjük; hogy a minta eloszlásának eltérése az alapsokaü ' ságtól szignifikáns vagy nem szignifikáns (kizárólag véletlen okok ered—

ménye). Az előbbi esetben torzítottnak, az utóbbi esetben torzítatlannak ítél- jük a mintát. Torzított mintaesetében az n,- és npl gyakoriságok eloszlásából a torzítás iránya is megítélhető. '

Vizsgáljunk meg egy példát a Központi Statisztikai Hivatal Mező—

gazdasági Főosztályának gyakorlatából. Bizonyos célra szükség volt a ter- melőszövetkezetek sokaságából kiemelt mintára, azzal a megszorítással azonban,-hogy csak azon községekben működő szövetkezetek jöhetnek számí- tásba, amelyekben 1960 nyarán reprezentativ sertésösszeirás történt. Szám szerint ez a mintanagyság elfogadható volt, de felmerült a kérdés, hogy a mintavétel és a megfigyelés egységének különbözősége (lásd II. rész 8. pont) vagy más körülmény nem okozott—e torzítást. Az adatgyűjtést megelőzően az alapsokaság és a mintasokaság adatai két ismérv szerint álltak össze- hasonlítható módon rendelkezésre, ennek megfelelően végeztük el az illesz-

kedésvizsgálatot a következő eredménnyel (lásd a 2. táblát). ,

2. tábla

Példa illeszkedésvizsgálatra

Csoportképzö ismérv Szabadságra]; ] 13 értéke Töblázati érték*

Országrész ... 2 2,08 5,99

Alakulás éve és terület-

növekedés ... 4 l,32 9,49

* A megfelelő szabadságfokhoz és 5 százalékos valószínűségi szinthez tartozó ;;2 érték.

Tekintve, hogy a kapott értékek meg sem közelítik a táblabeli értéke- ket, az eltéréseket véletlennek, a mintát torzítatlannak minősítjük.

A torzítás jelenlétének megítélésénél az illeszkedésvi'zsgálat mellett haszonnal alkalmazható módszer akont'ingencia táblázat készítése. Külö—

nösen alkalmas a non-response torzítás ellenőrzésére és ebben a vonatko- zásban nem csupán reprezentatív, hanem teljeskörű megfigyelésnél is alkal—

mazható, mivel válaszmegtagadás itt is előfordulhat. '

A módszer rövid leírása a következő: különválasztjuk a válaszolók és a nem válaszolók sokaságát és mindkettőt cSoportosítjuk valamely ismérv szerint. Ebből a szempontból természetesen csakis olyan — a Vizsgálat cél—- ját tekintve lényeges —-— ismérv jöhet szóba, amely szerint a nem válaszolók megoszlása is ismeretes. Jelöljük a válaszolók gyakoriságait a csoportképző—

ism—érv r osztálya szerint sorban nu, nu, . . ., nl, szimbólumokkal, a nem válaszolókét pedig mi, nm, . . ., %, betűkkel. Legyen

nli-i—nuzní, (321, 2,...,?')

T '

EM Zn,,-

in-l ! inni

pr; , az: ' '

n ' n

(18)

980 T ' " ' ns. Mentem v amaz

_ Nyilvánvaló, hogy p és e annak, valószínűsége; hogy egy adott egyénaz

aszisyűités (során valaszat illetve nem; válaszul; mamam; ez??? [Vail.—*

* _ínűségek becslései a, nnntából); A 33 ésg értékek kiszámítása utána gya;

koriságok táblázatából e, következő összeget képez'zük: _ , * ' , * , — , ra ("ii—Pm? " '"1 ("n'—"SIWDs

: :: __W_ _a_ , W, _

X iszl Pní is 1 , g "i _

Ezen összeg értékét ismét lá szakkönyvekben található táblázat értékeivel hasonlítjuk össze tetszőleges valószínűségi szintet, választva. A szabadságink

ismét (r'—1). - _ !

; Ismét egy gyakorlati példát ismertetek: a nagyüzemi kukoricstermelés agrotechnikájának és a termelési módszerek eredményességének Vizsgálata céljából a Központi Statisztikai Hivatal megfigyelést hajtott végre Bács—Kis*

kun megye területén az 1960. évre vonatkozóan. A felvétel körébe tartozó termelőszövetkezeteknekm mintegy 16 százaléka nem válaszolt; Két ismérv (a termelőSzövetkezet üzemnagysága és területi 'rmegoszlás) szerint lehetett

ellenőrizni, hogy %; válaszolók és nem válaszblók sokaságának megoszlása mutat-e szignifikáns eltérést az egész sokaság eloszlásához—képest; Az ered—

ményeket a 3. tábla szemlélteti. _

3. tábla

Példa függetlenségvizsgálatm

* ' Táblázati érték

Csoportképző ismérv Szaaiidság x' 5 százalékos 1 százalékos valószínűségi szinten _

Földter ület (kat. hold) 4 1 ,7 7 9,49 1 3,3 Járás ...' ... '7 17,12 14,10 18,ő

A táblából megállapítható, hogy üzemnagyság szempontjából a vála—

szolók sokasága jól reprezentálja az egész sokaságot, a válaszolók és nem válaszolók üzemnagyság—szerinti megoszlása csupán véletlenszerű eltérést mutat. A járási megoszlás tekintetében ilyen egyértelmű megállapítást már nem tudunk tenni, 752 értéke éppen a határán van annak, amit még elfo—- gadhatunk. A megfigyelés eredményét, nagymértékben befolyásoló, durva

torzításról azonban itt sem lehet szó. * —

3. A konfidencia intervallum felhaáználásaxaftorzítás ellenőrzésénél

A mintavételből származó torzítás ellenőrzését eddig mintegy primér

formában, a minta összetételének vizsgálatán keresztül hajtottuk végre.

Sokszor lehetőség nyílik arra; is, hogy a torzítás végső hatását a meg- _figye1és eredményeinek felhasználásával tanulmányozzuk. Előfordul ugyanis, hogy bizonyos eredmények vonatkozásában külső információval, nevezetesen valamely teljeskörű megfigyelésből nyert adattal rendelke- zünk. így például a munkáscsaládokra kiterjedő piackutatásnál igen hasz—

nos információt jelent, ha az átlagos munkabér színvonalát az iparstatisz—

21 Nem tartoztak a felvétel körébe az 1960 tavaszán alakult új szövetkezetek, amelyekben a kukorica vetése (és részben a növényápolás is) még nem nagyüzemi módszerrel történt.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

- a nemzetközi élsport szintjén, mely professzionális (hivatásszerűen foglalkoztatott) sportolók nemzeti és nemzetközi versenyekre, bajnokságokra történő felkészítését,

Olyan kérdésekre keresi a választ, hogy milyen jelenségek szá- mítanak a társadalmi modernizáció szekularizációt elősegítő tényezői közé, hogy merre tart ma a

anyagán folytatott elemzések alapján nem jelenthető ki biztosan, hogy az MNSz2 személyes alkorpuszában talált hogy kötőszós függetlenedett mellékmondat- típusok

In 2007, a question of the doctoral dissertation of author was that how the employees with family commitment were judged on the Hungarian labor mar- ket: there were positive

Jelen tanulmány Magyarország és a külhoni magyar közösségek társadalmi és gazdasági helyzetére irányuló kutatási program eredményeibe enged betekinteni.. A

Beke Sándor • Ráduly János • Álmodtam, hogy

A már jól bevált tematikus rendbe szedett szócikkek a történelmi adalékokon kívül számos praktikus információt tartalmaznak. A vastag betűvel kiemelt kifejezések

A kiállított munkák elsősorban volt tanítványai alkotásai: „… a tanítás gyakorlatát pe- dig kiragadott példákkal világítom meg: volt tanítványaim „válaszait”