Beszámoló a „Hatékony mintavételi és felvétel tervezési megoldások —
Leslie Kish nyomdokain” címû konferenciáról
A Fényes Elek Műhely, a Magyar Statiszti- kai Társaság, valamint a Magyar Szociológiai Társaság Társadalomstatisztikai szakosztálya és a Károli Gáspár Református Egyetem (KRE) Leslie Kish munkásságához kapcsolódóan, 2012.
november 28-án műhelykonferenciát szervezett a hatékony mintavételi és felvételtervezési meg- oldásokról. A műhelykonferencia egyrészt tiszte- legni kívánt a száz éve született, magyar szárma- zású Leslie Kish mintavételi eljárásokkal kap- csolatos munkássága előtt, másrészt bemutatta az általa kidolgozott mintavételi módszerek fel- használását a mai kutatási gyakorlatban.
A konferencia kezdetén a házigazda, Bozsonyi Károly, a KRE rektorhelyettese mon- dott rövid köszöntőt, majd Marton Ádám, a KSH ny. osztályvezetője nyitóelőadásában összefog- lalta Kish pályájának legfontosabb momentuma- it, illetve hozzájárulását a mintavétel különböző elméleti és gyakorlati területeihez. Leslie Kish (vagy ahogy több felszólaló is hivatkozott rá, Laci bácsi) nem csak tudományos eredményeiért érdemel kitüntetett figyelmet, hiszen a magyar statisztikai kultúra fejlesztésében is jelentős sze- repet játszott: nem egy magyar kollégáját segítet- te ösztöndíjakkal amerikai tanulmányutakhoz.
A konferencia második előadásában Né- meth Renáta (Eötvös Loránd Tudományegye- tem – ELTE) a „Kish-kulcs” magyarországi al- kalmazásának lehetőségeit és korlátait mutatta be. Kish a háztartáson belüli véletlen személy- kiválasztásra fejlesztette ki ezt a kulcsrendszert.
A kulcs azonban az amerikai háztartás-
tipológiából indult ki (ahol a felnőtt háztartások jellemzően kétfősek), és a módszer nem kezeli a különböző háztartásnagyságból adódó torzítá- sokat. Ebből következően a magyarországi al- kalmazása során a nők – ezen belül is főleg az idős nők – felülreprezentálódnak azokban a ku- tatásokban, amelyek a Kish-kulcsot használták.
Németh Renáta háromféle lehetőséget sorolt fel a probléma megoldására. A leggyakrabban al- kalmazott megoldás az utólagos rétegzés. Szóba jöhet még a Kish-kulcsnak a magyarországi háztartásszerkezethez illeszkedő átdolgozása.
Végül – és ez a leginkább ajánlható megoldás – a mintavétel módját beépíthetjük az elemzésbe is, vagyis az eltérő mintavételi valószínűségek reciprokával súlyozó Horvitz–Thompson- becslést alkalmazhatjuk, amire a mai statisztikai szoftverek többsége már fel van készítve.
Az előadás társszerzője, Rácz Attila (Szegedi Tudományegyetem – SZTE) hozzászólásában kifejtette, hogy maguk is több kutatásban hasz- nálták már a Németh Renáta és Rudas Tamás ál- tal átdolgozott Kish-kulcsot. Hozzátette, bár mintavételi szempontból sikeresek voltak ezek a kutatások, a gyakorlati tapasztalatok arra hívják fel a figyelmet, hogy nagyobb figyelmet kell fordítani a kulcs pontos használatára az adatfel- vételre való felkészítéskor, helyes alkalmazásá- nak ellenőrzésére pedig az adatfelvétel után.
A konferencia következő előadását Tóth Gergely (ELTE) tartotta, aki Rudas Tamás társszerzőségével a „design” effektről, azaz a mintavételi hatásról beszélt. Az előadás több
oldalról is körbejárta a mintavételi hatás jelen- ségét. Először elméleti szinten közelítette meg a kérdést: bemutatta, hogy az effekt miért is jelenik meg a mintavételi adatok elemzése so- rán, és rámutatott arra, hogy a várható értékek becslésénél milyen természetű hiba származhat belőle. Az előadás következő részében egy népszámlálási adatokon alapuló szimulációs eljárás eredményeivel ismertette meg a hallga- tóságot, amely révén láthatóvá vált, hogy még egy olyan kiemelt szociológiai változó eseté- ben is, mint az iskolai végzettség, figyelembe kell venni a mintavételi hatás megjelenését. A továbbiakban két – a szimuláció eredményein alapuló – állítás fogalmazódott meg:
– a többlépcsős és főként nagymintás adat- felvételek esetében kritikusan fontos az elsődle- ges mintavételi egységek (primer sample unit – PSU) számának helyes megválasztása, mivel azok alacsony volta drasztikusan csökkentheti az effektív mintaméretet, ezáltal növelve a várható érték konfidencia-intervallumát;
– a mintavételi hatás mértéke, az alappo- puláció önmagában vett klaszterezett jellege miatt, a közelítő képletekkel várhatóan felül- becsült, azaz a konkrét megvalósult mintavéte- lek esetén a valódi design effekt mértékének meghatározása nem triviális, és a valóságban várhatóan kisebb.
Az előadás zárásaként, a pártszimpátiáról kérdező mintavételen alapuló több adatfelvétel eredményeinek elemzését mutatta be az előadó a mintavételi hatás szempontjából, ami arra hívta fel a figyelmet, hogy a mintavételi ada- tokból következő pártpreferencia-eredmények hibahatára, főként a kisebb pártok esetében, várhatóan nagyobb, mint amit a bevett közelítő eljárások indokolnának.
Manchin Róbert (Gallup) is megerősítette az előadáson elhangzottak fontosságát és a de- sign effekt vizsgálatának szükségességét. Az el-
hangzottakat azzal egészítette ki, hogy a minta- vétel során a design effekt csak az egyik prob- léma, de legalább ennyire lényeges a nemválaszolás minél hatékonyabb kezelése vagy a mintavételi keret szintjén megvalósuló kiesés (coverage error) minimalizálása.
Az előadások utolsó blokkja a gördülő min- ták (rolling sample) kérdésköréről szólt. Tardos Róbert (Budapesti Corvinus Egyetem – BCE/ELTE) előadásában bemutatta a Kish és Alexander által kifejlesztett gördülő mintás adat- felvételek elméleti alapjait. A módszer elsődleges célja az volt, hogy a népszámlálások között is le- hessen olyan megbízható népességadatokat szol- gáltatni, amelyek mind időbeli, mind térbeli bon- tásban használhatók. Ez az 1980–90-es évekre kibontakozott kutatási cél nem nélkülözött min- den előzményt: a népszámlálási adatok folyama- tos, évenkénti, mintákon alapuló átalakítását Ph.
Hauser még a negyvenes években szorgalmazta, majd a minták kumulálásának, kombinálásának elveit sok tekintetben W. Cochran alapozta meg.
Kish volt azonban az, aki összegyűjtötte e külön- böző, részben még ötletszerű elgondolásokat, és pályafutásának a 90-es évekbe nyúló (végső) szakaszában tanulmányok hosszú során keresztül bontotta ki gyakorlati implikációikat és megvaló- sítási feltételeiket. A gördülő minták módszerére épülő Amerikai Közösségi Adatfelvétel (American Community Survey – ACS) 2010 óta már az amerikai népszámlálás részévé vált, míg Franciaországban a rolling cenzus 2005 óta a ha- gyományos népszámlálás helyére lépett. Az első tapasztalatok átfogó értékelése még folyamatban van, miközben a népszámlálások egész rendsze- rének általános átalakulása során olyan újabb or- szágokban kezdtek – részben akadémiai előké- születek közt – a gördülő modellhez kapcsolódó
„rolling census” tervekbe, mint Nagy-Britannia vagy Új-Zéland.
Kmetty Zoltán (KRE/ELTE) a gördülő mintás adatfelvételek egy speciális változatát a
„rolling cross section” (RCS) módszerét mu-
tatta be, amely lehetővé teszi a rövid távú kampányok dinamikai elemzését. A legjobban telefonos kutatásokban használható módszer a mintavételt állítja az adatfelvétel középpontjá- ba, és a lekérdezési folyamat során a napi min- tavételi szeletek (replikátumok) reprezentativi- tásának biztosítását tűzi ki célul. Mindegyik replikátum egy miniatürizált formája a mintá- nak. A replikák lényegükből fakadóan éppúgy véletlenek, mint ahogy a teljes minta kezdeti kiválasztása is. Előadásában a szerző bemutat- ta az RCS-módszer eddigi magyarországi al- kalmazásait azok lehetőségeivel és korlátaival.
A módszer egyik nagy hátránya, hogy csak igen szigorú naponkénti rétegezési korlátokkal valósítható meg az adatfelvétel, ami a „ha- gyományos” adatfelvételhez képest csökkenti a napi lekérdezhető esetszámot. Az előadás végén a módszerhez kapcsolható lehetséges hibabecslési eljárásokat vizsgálta az előadó.
Az adatfelvétel speciális jellege miatt a para- méteres eljárások torzított becslésekhez vezet- hetnek, tehát a hibabecsléseknél „re-sampling”
technikák használhatók, mint például a bootstrap- vagy a jackknife-módszerek.
A műhelykonferencia második részében a meghívott szakértők kerekasztal-beszélgetést folytattak a növekvő válaszmegtagadás repre- zentativitást érintő problémáiról és a lehetsé- ges kezelési eljárásokról a felvételtervezés, a kutatási terepmunka és az utólagos korrekciók terén. A kerekasztal-beszélgetést Bozsonyi Károly vezette, a résztvevők Feleky Gábor (SZTE), Kurucz Imre (NRC), Letenyei László (BCE), Manchin Róbert, Rudas Tamás (EL- TE) és Závecz Tibor (Ipsos) voltak. A beszél- getést Bozsonyi Károly nyitotta azzal a kér- déssel, hogy jelenleg mekkora probléma Ma- gyarországon a válaszmegtagadás az elmúlt tíz évhez képest, milyen trendek várhatók, és ho- gyan lehet ezekre felkészülni. Feleky Gábor nyitotta a válaszolók sorát. A 2000 óta minden évben (2006-ot kivéve) lezajló (és Leslie Kish
bátorításával beindított) „Szeged Studies”
vizsgálatsorozatban (2007 óta szisztematiku- san mintavételi szempontból) követik a kérde- zőbiztosok tevékenységét. Az ő adataik nem igazolják a válaszmegtagadási arány növeke- dését (ami jelenleg 50 százalék körüli). Ennek Szeged kulturális sajátosságai is okai lehetnek.
A kérdezést végző diákok visszajelzései alap- ján azonban az elutasítás módja változott: év- ről évre radikálisabb a korábbiakhoz képest.
Ugyanakkor a magas válaszadási aránynak többek között az is oka lehet, hogy az adatfel- vétel előtt minden potenciális válaszadónak kiküldenek egy levelet a kutatásról, továbbá, hogy Szegeden magas a kutatás társadalmi el- fogadottsága, ezért a felkeresett személyek szívesen válaszolnak.
Závecz Tibor az Ipsosban (korábban Szon- da-Ipsos) végzett közvélemény-kutatásoknak az elmúlt húsz évben szerzett tapasztalatait osztotta meg a hallgatósággal. Az Ipsosban 1990 óta vé- geznek havi, személyes kérdezéses omnibusz- kutatásokat. A módszertani alapelvek (főcím-, majd kvótaeljárás) végig állandók voltak. A romlás az elmúlt húsz esztendőben radikális volt: 50–70 százalék közötti volt a főcímen le- kérdezettek aránya a 90-es évek kezdetén, a 2000-es évekre azonban ez 30 százalékra (Bu- dapesten 20 százalékra) csökkent. Ezt azzal tud- ják korrigálni, hogy a kérdezőbiztos valamekko- ra döntési szabadságot kap a pótcímezés során.
Mindemellett a kérdezők szakmai felkészültsé- ge is romlik, így egyre nehezebb tőlük elvárni az önállóságot. Mivel a megoldási kulcs egyre inkább a kérdezők kezébe kerül, Závecz Tibor véleménye szerint többet kellene költeni kérde- zői tréningre, illetve ellenőrzésre.
Rudas Tamás az elhangzottakat azzal egé- szítette ki, hogy önmagában nem a válaszmeg- tagadás a legfontosabb kérdés, hanem az, hogy a ténylegesen begyűjtött válaszok hasonlók-e ahhoz, mint amit a főcímen szereplő szemé- lyek lekérdezése esetén kaptunk volna. Ki-
emelte, hogy a nemválaszolók szelekciója az igazán kérdésfüggő. Ezt az „utánfutóhatás”
(bandwagon effect) problematikája kapcsán fejtette ki bővebben. A politikai kutatásokban gyakran látható, hogy a választások után hirte- len jelentősen megugrik a győztes párt támo- gatottsága. Ezt általában azzal magyarázzák, hogy a megkérdezettek egy része megváltoz- tatja „valós” pártpreferenciáját és azt nyilat- kozza, hogy a győztes pártra szavazott. Rudas Tamás azonban kiemelte, hogy ezek a kutatá- sok nem feltétlenül emiatt adnak hamis ered- ményt, hanem az is közrejátszhat, hogy a győztes pártok hívei szívesebben vesznek részt egy választás utáni politikai közvélemény- kutatásban, mint a vesztes pártokra szavazók.
Ez átvezet az adatpótlás és a súlyozás kérdés- körére, amely szintén számos elméleti és gya- korlati problémát vet fel.
Kurucz Imre az online kutatások oldaláról közelítette meg a kérdést. Ezek alap esetben
„bemeneti panelekből” dolgoznak, így az ön- kéntesség már a panelba való regisztrációnál el- dől, már ott megfigyelhető egyfajta kizáró ha- tás. Ezen túl a regisztráltak körében is van vá- laszmegtagadás, de ezekben az esetekben nem tudható, hogy a megkeresett nem akar válaszol- ni, nem látta az e-mailt, esetleg nem volt ideje a rövid válaszadási időszak alatt kitölteni a kérdő- ívet. A tendencia egyrészről az, hogy egyre ne- hezebb bemeneti panelt gyűjteni. Másrészt a vá- laszadók aránya kérdőívenként és időben is vál- tozik, aminek oka lehet a panelfáradás is (azaz, hogy sok kutatással keresik meg a panelban le- vőket). A kérdőív hossza és nehézsége, illetve témája is sokat számít a válaszadási arány szempontjából. Nehezebb és hosszabb kutatá- soknál a kitöltés aránya 10 százalék körüli is le- het, de ugyanez egy két-három perces kérdőív- nél akár 40-50 százalékra is felugrik. Az online kutatásokban az a specifikus, hogy a kérdező- biztos hiánya miatt a kitöltés közben is erős a lemorzsolódás. Ez általában 10 százalék körüli,
de rosszul megszerkesztett, hosszú kutatások esetében akár 50 százalék is lehet.
Manchin Róbert nemzetközi keretbe he- lyezte a nemválaszolási trendeket. A válasz- adás tapasztalatai szerint minden országban li- neárisan csökken, de a jelenlegi szintek erősen kultúrafüggők. Koreában és Japánban 8-10 százalék, Németországban 15 százalék, míg a Balti-országokban 50-60 százalék körül van a válaszadási arány. Manchin Róbert is kiemel- te, hogy nem elsősorban a válaszadási arány a fontos, hanem a válaszmegtagadás torzítása.
Azt szerinte is nehéz elhinni, hogy az a 8-10 százaléknyi japán válaszadó ugyanolyan jelle- gű válaszokat ad, mint a nemválaszoló 90 szá- zalék adna.
Letenyei László a korábban elmondottak- hoz képest egy új szempontot vezetett be. Vé- leménye szerint a legfontosabb kérdés az, ho- gyan lehet lassítani a válaszmegtagadás csök- kenésének folyamatát. A válaszmegtagadás mértékét befolyásolhatja a kérdezőbiztosok külső megjelenése, kora, a kutatócég neve vagy az adott kutatás ismertsége. Véleménye szerint a fő probléma a kérdőívezés standard jellege, mivel az emberek kétirányú kommuni- kációra szocializálódnak. A kutatások elején a következő varázsszavak szoktak elhangzani:
„A válaszadás névtelen és önkéntes, és az eredményeket csak aggregált formában adjuk közre.” Egyes válaszadóknál éppen ez a prob- léma, mivel nem feltétlen akarnak anonimak lenni, szívesen vállalják a véleményüket. Ha azt akarjuk, hogy a válaszadó jó partner legyen a kutatás során, akkor kétoldalúvá kell alakíta- ni a kommunikációt úgy, hogy a kérdezettnek módja legyen kiszakadni a kérdezési szituáci- óból. Ilyen például az a módszer, amikor a kérdezett pontosíthatja a kérdést olyan szem- pontból, hogy ő mit értett rajta.
A kerekasztal-beszélgetés következő kör- kérdése arra vonatkozott, hogy vajon érdemes-e fizetni (akár ajándék formájában a válaszadók-
nak), ahogy ez egyes országokban már bevett gyakorlat. Rudas Tamás válaszában arra muta- tott rá, hogy ha fizetünk a válaszadónak, akkor ezt úgy kellene kikalkulálni, hogy mindenki az órabérének megfelelően kapjon juttatást. Az in- hall tesztek példája jól mutatja, hogy minél több pénzt ajánlunk fel a részvételért, annál maga- sabb társadalmi státusú embereket tudunk be- vonni a kutatásba. Tehát a kérdezetteknek kifi- zetett pénzösszeg nagysága mintaszelekciós szempontból további torzítást okozhat.
Závecz Tibor hozzáfűzte, hogy a piac ezt úgysem tudja megfinanszírozni, tehát nem ér- demes sokat gondolkodni ezen a kérdésen. Cse- rébe a kérdezők jutalmazását kellene növelni és jobb kérdezőkkel nagyobb mintajavulást lehetne elérni. Azonban a kutatócégek közötti verseny- helyzet letöri az árakat, és a megbízók gyakran ár, nem pedig a szakmaiság alapján döntenek.
Kurucz Imre az online panelek kapcsán megjegyezte, hogy mindig is voltak a kitöltés- hez köthető jutalmak. Az NRC időnként na- gyobb tárgynyereményt, havonta kisebb nye- reményeket is kisorsol. Azonban a válaszadási arány fenntartásához lassan minden kutatáshoz ajándéksorsolást kell tartaniuk.
Végül Manchin Róbert megjegyezte, hogy a hagyományos kérdőív-készítési és mintavé- teli technikák lassan el fognak tűnni és más módszerek kerülnek előtérbe, köztük olyanok
is, amelyeket korábban nem tartottunk szakmai szempontból korrektnek, mint például a kvótás lekérdezés vagy a bemeneti panelek.
A műhelykonferencia tanulságait Harcsa István (KSH) összegezte. A korábbi időszak- okhoz képest a jövőben még nagyobb szükség lesz a hatékony mintavételi és felvételtervezési eljárások kidolgozására. A lakossági vizsgála- tokon alapuló tapasztalatok ugyanis azt mutat- ják, hogy jelentősen megnehezült a valósághoz közel álló, releváns adatok begyűjtése, és a felmerülő problémák kezelését szolgáló, eddig bevált eljárások egyre kevésbé hoznak kielégí- tő eredményt. A nehezülő adatfelvételi körül- mények tehát a megfelelő eljárások kidolgozá- sát követelik, aminek csak széles körű szakmai összefogással lehet hatékonyan eleget tenni. A tét meglehetősen nagy, hiszen végső soron a reprezentatív adatgyűjtések szavahihetősége forog kockán, ezért célszerű lenne a jövőben rendszeressé tenni a témakörrel foglalkozó – hasonló jellegű – műhelybeszélgetéseket, to- vábbá az is megfontolandó, hogy az érintett kutatóintézetek közreműködésével a jövőben közös módszertani fejlesztések induljanak el.
Kmetty Zoltán,
az Eötvös Loránd Tudományegyetem és a Károli Gáspár Református Egyetem tanársegéde
E‐mail: zkmetty@yahoo.com
Horváth Piroska (1936—2012)
Horváth Piroska Nagykátán született, kö- zépiskolás évei jelentős részét Jászberényben töltötte, majd Budapestre került, ahol munkába állt. Első munkahelyeinek egyike a Magyar Nemzeti Bank volt. Munka mellett végezte el a
közgazdaság-tudományi egyetemet, s a végzést követően, 1967-től kezdett el dolgozni a Köz- ponti Statisztikai Hivatalban (KSH), ahol a het- venes-nyolcvanas években a nemzeti számlák – akkori szóhasználattal a népgazdasági mérlegek