• Nem Talált Eredményt

Leslie Kish: Kutatások statisztikai tervezése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Leslie Kish: Kutatások statisztikai tervezése"

Copied!
7
0
0

Teljes szövegt

(1)

824 SZEMLE

Az összeírás időpontja

Ország az 1980 körüli ciklusban az 1990 körüli ciklusban

1975—1979 1980—1984 1985-1989 1990—1994

Óceánia

Amerikai Szamoa (USA) . . . . 1980. IV. N L . . . . 1990. N L

Cook-szigetek (Uj—Zéland) . . . 1976. XII. * N L 1981. XII. N L 1986. N L 1991. N L

Francia Polinézia (Fr.) ... 1977. IV. N 1983. X. N . . . . . . . .

Guam (USA) ... 1980. IV. N L 1990. N L

Karácsony—sziget (Ausztrália) 1981. VI. N L . . . . 1991. N L

Kóknsz—szigetek (Ausztrália) 1981. VI. N L . . . . 1991. N L

Niue (Ui-Zéland) ... 1976. IX. N L 1981. IX. N L 1986. IX. N L 1991. N L

Norfolk-sziget (Ausztrália) . . . 1981. VI. N L , . . . 1991. N L

'llakelau-szigetek (Ui-Zéland) 1976. X. N L 1982. X. N L 1986. N L 1992. N Ui-Kaledónia (Fr.) ... 1976. IV. N L 1983. IV. N . . . . . . . .

Wallis és Fatima-szigetek

(Fr.) . . . . ... 1976. III. N -— , .

' Csak Luanda megyében végrehajtott összeírás.

' A különböző források némileg eltérő időpontokat említenek az összeírás befejezéséről.

' 1968 márciusában adminisztratív összeírást hajtottak végre.

' Egyes hivatkozásokban 1975. december 15. szerepel. _ , _

' A tartományi székhelyeken az időpont 1974. december,a fővárosban és a többi városban 1975. február, a Vidéki

körzetekben 1975. június volt. _ , ,

' Valójában az állandó népesség összeírása 1976. december—1977. januárban, a nomádoké 1977. Január—áprilisban

történt. _

" 1970 májusában hajtottak végre népszámlálást. Egynem hivatalos dokumentum említést tesz egy 19811 augusztusr összeírásról is.

' Az északi területek nomádjainak összeírása 1977. május—júliusban történt.

' 1963 novemberében tartottak népszámlálást.

" 1974 decemberében tartottak népszámlálást.

" A nomádokat mintavétellel írták össze.

" A lakásösszeírásra csak a városi körzetekben került sor. _ _ ,

" 1973-ban mikrocenzust hajtottak végre. Említést tesznek egy 1976. szeptemberi összeírásról IS. Az osszeirtak aránya mindkét esetben ismeretlen.

" 1973 májusában tartottak népszámlálást.

" 1962 áprilisában tartottak népszámlálást.

" Nem tartottak népszámlálást.

" 1944 májusában tartottak népszámlálást.

" Márciusban hajtották végre a lakásösszeirást. . _

" Részleges összeírás, amely kiterjed Vientiane városra éskörnyékére, valamint Luang—Prabang,Houersax, Sayeboury, Savannakhet e's Pakse városokra.

" 1970 novemberében reprezentatív népességösszeírás volt. . _

" 1975 áprilisában öt városra, 1978-ban pedig 11 városraés néhány vidéki körzetre kiterjedő mintavételes népesség- összeirást hajtottak végre.

" 1974 szeptemberében tartottak népszámlálást.

" 1973 októberében tartottak népszámlálást.

" 1974 márciusában tartottak népszámlálást.

" 1971 áprilisában tartottak népszámlálást.

" 1971 júniusában tartottak népszámlálást. _

" Különféle nyilvántartásokból származó válaszokkal előnyomtatottkérdőíveket alkalmaztak (a Központi Népesség—

nyilvántartás, illetve a Befejezett Iskolai Végzettségi Nyilvántartás adataival); az adatszolgáltatóktól kérték az esetleges hibás információk korrigálását.

" 1971 februárjában tartottak népszámlálást. '

" Említést tesznek egy 1984 novemberében végrehajtott ,,mini" népszámlálásról, amelyben hét kérdés szerepelt.

" Városi összeírás.

" Az 1986. évi összeírás 1/7 arányú mintán alapult.

" 1931 novemberében, illetve 1967 szeptemberében tartottak népszámlálást.

" Aruba 1986. január 1-je óta nem része a Holland-Antilláknak.

" 1960 novemberében tartottak népszámlálást. Csak téli időszakban lakott.

MAGYAR NYELVÚ SZAKIRODALOM

LESUE KISH! likációja.1 Fiatal emberként, még az 1920-as KUTATÁSOK években hagyta el Magyarországot. Eletéta sta-

STATISZTIKAI TERVEZÉSE tisztikai kutatásoknak szentelte. Nagyon sokat

Statisztikai Kiadó Vállalat.Budapest. 1989. 251 old. publikált, és egyedülállóan magas szinvonalon

A magyar szakemberek, a statisztikai mód- ' _ _ " _.

szertem művelői előtt jól ismert a magyar szár— * Tudomásom szerint L. Kish számos publikáCIÓJa kozul

' ' - eddi csak ,,A közérdekű döntések előkészítését szolgáló

mamu Led"? KISh professzor neve' annak elle- felvégtelek időzítése" c. tanulmánya jelent mega Statisztikai

nére, hogy magyarul eddig alig jelent meg pub— Szemle hasábjain. (1935. évi 1. sz. 544. old.)

(2)

SZEMLE

művelte—műveli napjainkban is ———mint az iro- dalmi tevékenysége alapján egyértelműen meg- állapítható — a statisztikai módszertan elmé- letét és gyakorlatát. Olyan tudós, aki jelentős elméleti tevékenysége mellett mindig a ,,földön járt", diákokat tanítva és kutatókat segítve problémáik megoldásában. Néhány további életrajzi adat: a michigani egyetem nyugalma- zott tanára (Professor Emeritus), egyike volt az 1947-ben alapított Társadalomtudományi Ku- tató Intézet (Institute for Social Research) lét- rehozóinak. 1981- ben ,,Henry Russel előadó"

volt, ami a szakmábanigen nagy megtisztelte- tés. Ö irta a Survey Sampling (Mintavételi eljá—

rások) c. híres könyvet. Dr. Kish elnöke volt 1977-ben az Amerikai Statisztikai Társaságnak (American Statistical Association), 1983 és 1985 között pedig a Mintavételi Módszerekkel Foglalkozók Nemzetközi Társaságának (Inter—

national Association of Survey Statisticians).

Tiszteletbeli tagja a Királyi Statisztikai Társa—

ságnak (Royal Statistical Society), és tagja a Nemzetközi Statisztikai Intézetnek (Inter- national Statistical Institute).

A jelen ismertetésnek nem célja L. Kish ed—

digi életművét áttekinteni, méltatni. Csupán arra vállalkozik, hogy legújabb könyvét, amely ,,Statistical Design for Research" címmel, a hír—

neves John Wiley and Sons-kiadónál, New Yorkban, 1987—ben jelent meg, a magyar nyelvű kiadás megjelenése alkalmából az olvasónak bemutassa. A könyv magyarországi megjele- nése, amivel a magyar statisztikus közösség nagy adósságot törlesztett, fontos hiány pótlá- sát is jelenti. A magyar nyelvű statisztikai szak- irodalomban ugyanis alig vannak korszerü módszertani kérdésekkel foglalkozó széles körű áttekintést adó publikációk, amelyek segitségé—

vel az érdeklődő kutató eligazítást kaphatna ar—

ról, hogyan szervezzen meg egy statisztikai adatgyűjtést, vagy kísérletet úgy, hogy az haté- kony legyen, megfeleljen a korszerű követelmé—

nyeknek, helyes döntésekhez vezessen.

A könyv fülszövege megállapítja: ,,Mielőtt valamilyen kutatás céljára statisztikai adatokat gyűjtenénk, az adatgyűjtés módjaival kapcsolat- ban több olyan fontos kérdést kell eldönteni, amelyek rendkívül nagy hatással vannak mind a vizsgálat eredményének érvényességére, mind annak hatékonyságára. A statisztikai szakiro- dalomnak szinte teljes egésze az elemzés kér—

déseivel foglalkozik, nagyvonalúan megkerülve az adatgyűjtés és a kiválasztás kulcsfontosságú kérdéseit, jóllehet ezek nagyon fontosak mind a statisztikai módszerek, mind pedig a tudo- mányág filozóüájának a szempontjából."

Leslie Kish műve azzal foglalkozik, hogyan kell egy hatékony kutatási tervet elkészíteni úgy, hogy megfelelő eredményeket kapjunk, jó következtetésekre jussunk. (Azt, hogy mit ér- tünk megfelelő eredményen, külön kellene de—

flniálni, ami azonban nem egyszerű. Remél- hető, hogy a következőkben megfelelő választ

825

kap erre az olvasó.) E könyv azonban nem elemi ismeretek összefoglaló, leíró tankönyve, hanem egy négyévtizedes tudományos kutató és gyakorlati feladatokat megoldó életpálya filozofikus, szintetizáló összefoglalása. Segítsé- get nyújt mindazoknak, akik már tudnak vala- mit a matematikai statisztikáról, már terveztek kísérleteket, reprezentatív megfigyeléseket, vé- geztek becsléseket, számítottak mintavételi hi—

bát, sőt azt is tudják, hogy van még nem minta- vételi hiba és/vagy torzítás is. ami néha na- gyobb, fontosabb lehet, mint a mintavételi hiba, azaz az azzal járó ,,tévedés", hogy a részből kö- vetkeztethetünk az egészre.

A könyv a statisztikai megfigyelések és kísér- letek módszertani kérdéseit tárgyalja, rendsze- rezi. Úgy mond újat a statisztikai munka terve- zőinek, hogy feltárja e munka buktatóit, prob- lémáit, ráirányítja a figyelmet a megoldások sokrétűségére, olyan fontos kérdésekre, ame- lyeket sokan hajlamosak mellőzni, elősegítve ezáltal az optimális megoldás megközelítését.

Arra ösztönöz, hogy egy-egy feladatot sok szempontból gondoljunk át, s ha már minden szakmai kérdést feltártunk, megismertük a célt és az eszközöket, akkor lehet csak jó statisztikai terveket és becsléseket készíteni.

A mű tárgyalásmódját az elméleti teljességre törekvés és a gyakorlati feladatok megoldására orientáltság jellemzi. Ezt támasztja alá az is, hogy több, természetszerűleg főként amerikai, illetve a fejlődő országok problémáiból merítő gyakorlati példát említ, s viszonylag kevés ma—

tematikai formulát használ: csak ott, ahol arra feltétlenül szükség van. Egyébként világos gon- dolatmenettel, logikailag építkezik. Ebből kö- vetkezik, hogy a könyv viszonylag kevés mate- matikai ismeret birtokában is jól olvasható.

*

A mű első fejezete a statisztikai vizsgálatok alapfogalmaival, elveivel, a kutatási tervek fel- tételrendszerével, a reprezentációval, a randa- mízációvalz és a realitással foglalkozik. Abból indul ki, hogy minden esetben valamilyen kompromisszumra van szükség akkor, ha nagyszámú, vagy esetleg végtelen sokaságok, vagy ok—okozati összefüggések sajátosságait vizsgáljuk korlátozott számú megfigyelés alap- ján, és még maguk a megfigyelések is ki vannak téve véletlen hatásoknak, ingadozásoknak.

A Vizsgálni kivánt változók körülhatárolása,

definiálása csak reális keretek között történhet, és a különböző ,,kezelések", megfigyelési ismér- vek randomizáltsága, véletlen elrendezése, va—

lamint a kiválasztott megfigyelési egységek rep—

rezentatív volta csak együtt tudja biztosítani

' A magyar szóhasználat nem minden tekintetben kiala- kult és megfelelő. Ezért célszerű az eredeti (angol) kifejezést alkalmazni minden olyan esetben,amikor az a szöveg meg—

értését szolgálja. A mű hazai kiadása elősegíti, hogy isme—

tetlen vagy csak nagyon szűk körben ismert fogalmak el- terjedjenek.

(3)

826

SZEMLE

valamilyen kutatási (vizsgálati) terv eredmé- nyességét.

A kutatási tervek számára egyik legfontosabb szempont, hogy a különböző változókat, ame- lyek valamilyen módon szerepet kapnak a vizs- gálat során, egyértelműen definiáljuk, felismer- jük, elhatároljuk.

A magyarázó változók azok, amelyek a vizs—

gálat tárgyát képezik, az összes többi változó a vizsgálat szempontjából külso", amiket —— mint látni fogjuk —- valamilyen módon kontrollálni,3 randomizálni kell a kutatási terv hatékonyságá- nak biztosítása érdekében. Ezek a kontrollált, a zavaró és a randomíza'lt változók.

A szerző a kutatási tervek három alapvető tí—

pusáról szól: a kísérletekről (experiment), a reprezentatív megfigyelésekről (sample survey) és az irányított megfigyelésekről (controlled in—

vestigation). Egy ,,ideális" kísérletben a vizs—

gálni kívánt Változók egyértelműen elhatárol—

hatók a zavaró változóktól, amelyek hatását megfelelő kontrollal, vagy az egyedek és kezelé- sek randomizálásával kiszűrhetjük.

A kísérleteknek számos előnye van a repre- zentatív és irányított megfigyelésekkel szemben, amennyiben a kísérleti terv, ha hatékony, jól el—

különíti a zavaró változókat megfelelő csopor- tosítás, rétegzés, vagy ha más megoldás nincs, a randomizáció segítségével. E fogalomkörhöz tartoznak a statisztikai próbák (tesztek), ame- lyek célja a veletlen hatások elkülönítése, amennyiben a konfidencia-intervallumok segít- ségével dönthetünk arról, hogy valamely eltérés valós hatásnak, vagy véletlen ingadozásnak tu- lajdonítható—e. Az ismeretlen sokaságok jellem- zésének a reprezentatív megügyele's az eszköze.

Az első fejezet foglalkozik a kutatási tervek rendszerezésével a már említett három fő kuta—

tási stratégián belül, a reprezentáció és a való- színűségi minták kapcsolatával, valamint a mo- delltől f üggő, modelleken alapuló következte- tések problémáival.

A második fejezet a reprezentatív megfigye—

lések néhány kérdését tárgyalja, kiindulva ab—

ból, hogy mindenekelőtt ahhoz, hogy megfelelő következtetéseket tudjunk levonni, körül kell határolni a vizsgálni kívánt sokaságokat. Tisz—

tán kell látni, hogy mi a különbség a minta, a keret, a célsokaság, valamint a között a sokaság között, amelyre következtetéseink vonatkozni fognak. Ennek keretében tekinti át a szerző azo- kat, a sokszor technikai, de nem elhanyagolható nehézségeket, problémákat, amelyek például a nemválaszolásból, a mintavételi keret (például címjegyzékek) hiányosságaiból stb. adódnak.

Ez más szóval a lefedés (coverage) problémája:

vajon mennyire vagyunk képesek jól, pontosan lefedni azt az elméleti sokaságot, amit valójá—

3 A "kontroll" szó kettős jelentésű: egyrészt a kísérleti tervekben a ,,kezeletlen" kontrollcsoportokra vonatkozik, más-részt a reprezentatív megügyeléseknél a különböző, általában zavaró, torzító tényezők kiszűrését, ,,kézben tar- tását", ellenőrzését,kontrollálását jelenti.

ban vizsgálni akarunk. Természetesen, sokszor előfordul, hogy egy, az eredeti sokaságtól el- térő, annál kisebb, eleve szűkebb körű minta- sokaságból (például egy város) következtetünk egy sokkal nagyobb populációra (például egy megye). Bizonyos körülmények között erre van lehetőség, de a szükséges feltételek teljesülését gondos elemzés tárgyává kell tenni.

Ez a gondolat vezet el a sokaság elemeinek, valamint a mintavételi egységeknek fogalmához.

A mintavétel során csak ritkán van lehetőség arra, hogy közvetlenül a vizsgálni kívánt soka- ság elemeit válasszuk ki. Legtöbbször csoportos mintavételi eljárás (cluster sampling) a célra- vezető. Világosan körül kell határolni a külön- böző fogalmakat a mintavételi eljárás megter—

vezése során, mivel igen sok gyakorlati prob- léma okozhat zavart, lehet torzítás forrása.

Például sokszor a család, a lakcím az az egység, ami jegyzékekben szerepel, de ugyanakkor a megfigyelési egység csak egy-egy valamilyen tulajdonsággal rendelkező személy, aki nem is biztos, hogy minden címen előfordul (például gazdaságilag aktív nő).

Viszonylag ismert kérdések merülnek fel a rétegzéses, a csoportos, a többlépcsős, vagy más módon komplex mintákból végzett becslések, következtetések meghatározásánál: az első- rendű, leíró statisztikák (például átlagok, elemi szórás), illetve a másodrendű, a következteté- sekhez szükséges statisztikák (mintavételi hiba, konfidencia-intervallum) kiszámításánál.

A reprezentatív felvételek eredményeinek analitikus elemzése általában a változók külön- böző szintű, részletezettségű alcsoportok, ke- resztosztályok, ,,kisterületek" szerinti becslé- seit: különbségeket, megoszlásokat, összegeket stb. igényli.

A mintavételi eljárások közül az arányos, ré—

tegzéses és a csoportos mintavétel a leggyako- ribb. A mintavételi terv különböző módon be- folyásolja a becslések megbízhatóságát. Kiin- dulva az egyszerű véletlen mintavételből, a ré- tegzés általában javítja (csökkenti) a minta- vételi hibát, míg a csoportos kiválasztás (ami viszont gyakorlatilag egyszerűbb, olcsóbb) nö—

veli. Leslie Kish nevéhez fűződik a mintavételi terv hatása (design eii'ect) ngalmának beveze—

tése, vizsgálata, ami lehetővé teszi, hogy logi—

kailag összefüggő rendszerét alkossuk meg a minta különböző szintjéhez tartozó becslések szórásai közötti kapcsolatnak. E gondolatme- net lényege az, hogy az egyes klaszterek homo- genitása (ami nem független a klaszter elemei- nek számától) határozza meg lényegében a mintavételi terv hatását. A klaszter nagyságá- nak és homogenitásának segitségével viszont olyan ,,átvihető" (portabilis) statisztikák készít- hetők, amelyekből következtetni lehet a külön- böző alcsoportok, tartományok becsléseinek megbízhatóságára.

A fejezet végén a szerző rövid áttekintést ad azokról az objektív és szubjektív akadályokről,

(4)

amelyek a mintán alapuló becsléseket nehezí- tik.

A harmadik fejezet a gyakorlat számára na- gyon fontos kérdéskört, az összehasonlító vizs- gálatokat tárgyalja. Itt lényegében olyan alter—

natív megoldásokról van szó, amelyekben az országos reprezentatív mintákat — alapvetően a költségek csökkentése, a végrehajtás egysze- rűsítése érdekében —— helyettesítik bizonyos ti—

pikus, jellemző helyekhez kötődő vizsgálatok—

kal. A ,,hely" szó fogalma itt általánosan ér- tendő. Nem csak településekről, régiókról, te-

hát valamilyen módon körülhatárolt földrajzi helyekről van szó, hanem lehetnek azok intéz- mények, vállalatok, társadalmi szervezetek stb.

Ez természetesen bizonyos értelemben informá—

cnóveszteséggel jár, viszont a költségek csök- kennek és esetleg szóba kerülhet a vizsgálatok időbeli megismétlése. (Az időbeli -— longitudi- nális —— vizsgálatoknál mindig számolni kell azzal, hogy a keresztmetszeti elemzések részle- tezettsége nem biztosítható.)

Az objektivitás érdekében természetesen szükség van az egyes helyeken belül valószínű- ségi mintákkal dolgozni, valamint ,,ismétlése- ket" alkalmazni: több helyen vizsgálni a szóban forgó kérdést. Ez szükségessé teszi a probléma gyakorlati kezelését: a helyek és az ismétlések számának meghatározását. E kérdéseket rövi—

den, de igen jól használható praktikus taná—

csokkal illusztrálva tárgyalja a szerző.

A kísérleti, kutatási tervek felépítését előse- gíti bizonyos modulok alkalmazása. Valójában a gyakorlatban megoldandó kérdések logikus rendszeréről van szó. Négy alapmodult tárgyal a szerző, amelyekre épülhetnek különböző ösz—

szetett kutatási tervek. Ezek a modulok a keze- lések, illetve a kontrollok, valamint az ellen- őrző, illetve előzetes és utólagos megfigyelések alapvető viszonyát határozzák meg.

A modulokat a szórás, a torzítás (a kettő együtt átlagos négyzetes eltérés), a költségek szempontjából kell vizsgálni úgy, hogy egyér- telműek legyenek a különböző kutatási tervek előnyei és hátrányai. Ezen belül kissé részlete- sebben tárgyalja a könyv a torzítás különböző típusait, forrásait. Ez nagyon fontos, mivel jól tudott, hogy a mintából magából viszonylag könnyen kiszámítható a szórás, és a költségek becslése. A torzítás viszont csak hozzávetőlege- sen, irányát tekintve határozható meg.

Az összehasonlítások vizsgálatához öt alap—

vető kutatási tervet ismertet a szerző. Az első, a legegyszerűbb, az ún. ,,one-shot"—vizsgálat, amikor csak egyetlen hatás, beavatkozás átlagos mértékét kívánjuk vizsgálni anélkül, hogy kife- jezett kontrollcsoportok rendelkezésre állná- nak. Ezért ez a vizsgálat nem is tekinthető iga—

zán kísérletnek. Itt az összehasonlítás alapja csak valamilyen általánosan elfogadott stan- dard. A második terv egyfajta kezelést vizsgál egy csoportnál, azonban méréseket végeznek a beavatkozás előtt és után ugyanazoknál az

egyedeknél. A harmadik terv már tartalmaz ki- fejezett kontrollcsoportot, amelyet valami más—

sal, vagy éppen semmivel sem kezelnek. Itt na- gyon fontos a külső zavaró körülményekre is gondolni és ezért randomizálni a kezelt és a kontrollegyedeket. A negyedik terv valójában a 2. és a 3. tökéletesítését jelenti, amennyiben a kontrollcsoportot mind a kísérlet előtt, mind utána megfigyelik. Az ötödik kísérleti terv a legbonyolultabb; magában foglalja az összes előző variációt és így lehetővé teszi a kölcsön- hatások vizsgálatát is. Ezt a megoldást, amit a pedagógiai vizsgálatoknál alkalmaztak először, azonban ritkán használják, mert nagyon költ—

séges.

E kérdéskörhöz tartozik még a hatások idő- beli alakulásának vizsgálata. Sok esetben, főleg társadalmi folyamatoknál, számolni kell az idő—

ben elhúzódó folyamatok változásával, csilla- podásával. Ezért a beavatkozás/ hatás vizsgálata többszöri, időben egymás után kövatkező mé- rést igényel. Az így megfigyelhető görbék lefu- tása több különböző mintát követhet.

A kontroll néhány fontos gyakorlati kérdésé- vel mint a kutatási tervek szerves részével fog- lalkozik a 4. fejezet. A kontroll itt elsősorban a tágabb értelmezést jelenti: a zavaró tényezők lehető legnagyobb mértékű kiszűrését, illetve sok egyéb gyakorlati szempont figyelembevéte—

lét.

A kísérleti terv elkészítése során egyrészt gondosan mérlegelni kell a különböző lehető- ségek hatékonyságát (a mintavételi hiba nagy- ságát), költségét. Ez viszonylag egyszerű, leg- alábbis elvileg. Másrészt biztosítani kell a za—

varó változók megfelelő kontrollálását (például rétegzéssel), illetve, ha az nem lehetséges, akkor a randomizálást, ami kiküszöböli a torzítást.

A fejezet ez utóbbi problémákkal foglalkozik.

A zavaró változók okozta torzítás kontrollá- lása négyféleképpen lehetséges: a mintavétel, a statisztikai elemzés folyamán direkt, belső módszerekkel (ilyen a rétegzés és súlyozás), va- lamint külső forrásokból származó informá- ciók segítségével, indirekt módon.

A leghatékonyabb kontrollálás a kiválasztás fázisában végezhető. Lényegében arról van szó, hogy bizonyos módon eleve különválasztjuk a változókat aszerint, hogy a megfigyelt értékek milyen tényezők f üggvényei. Például ha a lakos—

ság bizonyos tevékenységekre fordított idejét vizsgáljuk, akkor a nem, a korcsoport stb. na- gyon fontos homogenizáló ismérvek lehetnek.

Ám lehetséges bizonyos modellek alkalmazása is stb. Az elemzés stádiumában ezek a torzító szempontok már nehezebben kezelhetők.

A reprezentatív megfigyelések tervezése ese—

tén a hatékony kontroll természetszerűleg függ attól, hogy miként, milyen mértékben ismerjük fel a zavaró változókat, s rendelkezésre állnak-e azok az eszközök (információk), amelyek segít- ségével például a rétegze's (a mintavétel során, vagy utólag) megvalósítható.

(5)

828

SZEMLE

A kontroll néhány gyakorlati módszerét is ismerteti a könyv mind a reprezentatív meg- figyelések, mind a kísérletek esetében. Ezek kö- zött fontos helyet foglalnak el a különböző sú—

lyozási eljárások, illetve a kovariancia—elemzé- sek. A fejezet végén arra hívja fel a ügyeimet a szerző, hogy a hányadosbecslések, amennyiben megfelelő bázissal rendelkezünk, hatékony esz- közei lehetnek a zavaró változók kontrollálásá- nak. (Erre kerül sor lényegében akkor is, ami- kor két cenzus között egy minta segítségével történik a legfontosabb változók továbbveze- tése.)

Foglalkozni kell röviden a részleges meg- figyelések mellett a teljes körű összeírásokkal, a cenzusokkal is (5. fejezet). (Vannak olyan számbavételek is, amikor a teljeskörűség ,,rész- leges": csak valamilyen intézményre, területi egységre stb. vonatkozik.) A cenzusnak termé- szetesen sok előnye van a részleges megfigyelés- sel szemben, de a nagy volumenű munka, a nem biztosítható anyagi erőforrások gátat szabnak széles körű alkalmazásának. Meg kelljegyezni, hogy az igazán teljes körű számbavételnek kor- látot szab a válaszadási hajlandóság hiánya is, nevezetesen az, hogy sok esetben a lakosságtól.

a gazdálkodó szervezetektől még jogszabályok- kal alátámasztottan sem lehetne hiánytalan és pontos válaszokat kikényszeríteni. De az idő- szerűség is problémát okoz. Jól ismert tény, hogy a mégis sorra kerülő teljes körű felméré- seknél (népszámlálás, vagy egyéb teljes körű mezőgazdasági, ipari vagy kereskedelmi össze—

irás stb.) az adatok előkészítése, feldolgozása meglehetősen hosszú időt vesz igénybe. A gyors tájékoztatás általában a cenzusokból vett min—

ták segítségével biztosítható. Igen gyakori vi—

szont a cenzusok és mintavételes eljárások együttes alkalmazása. A minták lehetővé teszik a cenzusok részletezettségének növelését, az adatok továbbvezetését. A cenzusok adatainak ellenőrzése is bizonyos reprezentatív minta utó—

vizsgálatával történik. Jól használhatók a cen- zusok kis területekre, földrajzi egységekre vagy egyéb módon definiált tartományokra vonat- kozó adatai mint külső információk a későbbi becslések során. Végül azt kell megemlíteni, hogy igen gyakran használják a cenzusok ada—

tait későbbi minták mintavételi kereteként.

A reprezentativ megfigyelések, a különböző kutatások sokszor nem korlátozódnak egy idő—

pontra, hanem bizonyos folyamatok alakulá- sát, események lezajlását, kezelések hatását időben elhúzódva vizsgálják. A (szakirodalom sokat foglalkozik az időbeli (longitudinális) vál- tozások problémáival. A minta, az adatgyűjtés, a mintavételi keret problémáit ebben a vonat- kozásban tekinti át a 6. fejezet. A tárgyalás ter- minológiai kérdésekkel kezdődik: az ismételt, a periodikus, a teljesen vagy részben átfedő, a panel megfigyelési módszerekkel. Időbeni vál- tozások vizsgálatánál különösen fontos tisz—

tázni, mit kívánunk vizsgálni: az egyedi (brut-

tó), vagy az aggregált (nettó) változásokat.

Nyilvánvaló, hogy az első esetben arra van szükség, hogy az egyes megfigyelt elemeket is—

mételten számba vegyük, míg a második eset—

ben nem szükséges azonos egyedekhez ragasz- kodni. További fontos szempont az, hogy a kü—

lönböző keretek, megfigyelési és vonatkozási időpontok megfelelően illeszkedjenek a vizsgá- lat céljához és a mintavételi terv előírásaihoz.

A fejezet viszonylag részletesen tárgyalja a különböző, részben vagy egészben átfedő, pa- nel, többcélú stb. mintákat, bemutat néhány fontos, gyakorlati szempontból jól használható mintavételi tervet. Foglalkozik a mintavételi hiba alakulásának és a mintavételi tervnek az összefüggéseivel.

Az időbeli változások, folyamatok vizsgála—

tában nagy szerepe lehet a ,,külső" változások—

nak, már önmagának az idő múlásának, a kö- rülmények. a családok, az egyes intézmények, szervezetek, adminisztratív egységek megválto- zásának, demográfiai folyamatoknak stb.

Mindezeknek más a hatása a lazább, nem szi—

gorúan ugyanazokra az elemekre irányuló adat- gyűjtéseknél, mint például a paneleknél.

Külön említést érdemelnek azok a mintavé—

teli tervek, amelyek egy—egy időpontra vonat—

kozó, részben vagy egészben különböző eleme- ket tartalmazó mintákat összesítve elemeznek.

Ezáltal a minta terjedelme jelentősen növelhető azon az áron, hogy a kapott információk nem egy, hanem időben eltolódó, egymáshoz kap—

csolódó, vagy bizonyos közökkel egymás után következő, ,,átlagos" megfigyelési időszakra vonatkoznak.

A könyv utolsó fejezete néhány, a statisztikai kutatások fontos ,,egyéb" technikai jellegű kér—

désével foglalkozik. A tárgyalás azonban elmé—

leti jellegű: kijelöli a megoldások irányát.

Komplex mintákból igen sokféle statisztika készíthető, de figyelembe kell venni a minta ter—

mészetét: rétegzés, klaszterek, a kiválasztás va—

lószínűsége, illetve a súlyozás, a felszorzás.

A szokásos átlagok és átlagok különbségei vagy megoszlások mellett végezhetők regressziós és egyéb többváltozós elemzések.

Alapvető kérdés, hogyan számítható ki a mintavételi hiba. Sokszor mellőzik azt, sokszor több vagy kevésbé jó megközelítéseket alkal—

maznak. Ebből a szempontból az egyszerű vé—

letlen minta kezelhető a legkönnyebben, de ha elhanyagoljuk a minta tényleges struktúráját, jelentős hibát követhetünk el. Ahhoz, hogy kor- rekt módszerekkel számítsuk ki a mintavételi hibát komplex módszerek esetén, segítséget nyújtanak a részminták technikáján alapuló kii- lönböző módszerek, így például az ún. jack- knife és bootstrap módszerek.?

Viszonylag új fejezete a mintavételi hiba vizs- gálatának a már említett design effect (Deft) és a homogenitás rátájának (Roh) bevezetése, melyek segítségével a klaszterminták elemezhe- tők, miként és milyen esetben hogyan tér el a

(6)

SZEMLE

829

konkrét mintavételi hiba attól a fiktív minta- vételi, hibától, amivel akkor számolhatnánk. ha az adott mintánk egyszerű véletlen minta lenne.

Ha nagyon sokféle statisztikát készítünk, akkor a mintavételi hiba használata nemcsak azért üt—

közik nehézségbe, mert kiszámítása idő— és szá- mításigényes, hanem azért is, mert közlése ne- hézkes, hiszen gyakorlatilag a használni kívánt adattömeg megkétszerezését jelenti. A Roh és Deft segítségével megalkotható egy olyan egy- szerű modell, amellyel a különböző informá—

ciók ,,átvihetők" az egyik változóról, részosz- tályról a másikra.

Ahhoz természetesen, hogy a mintavételi hiba becslése egyáltalán kiszámítható legyen, a min—

tának bizonyos feltételeket ki kell elégítenie.

A mintavételi hiba azonban csak egyik kompo—

nense annak a ,,hibának", eltérésnek, amivel a becsült érték a tényleges mennyiségtől különbö- zik. Egy másik fontos tényező a torzítás. E két- tőt együtt fejezi ki az átlagos négyzetes hiba, az MSE. Míg a mintavételi hiba elvileg megha- tározható (becsülhető) magából a mintából, ad- dig a torzítást becsülni csak bizonyos további külső információk segítségével lehet, s ebből a szempontból döntő. hogy milyen forrásból származik a torzítás.

A legtöbb reprezentatív megfigyelés nagyon sokféle célt szolgál. Ez jelentheti a változók so- kaságát, az egyes változókon belül a különböző alcsoportok, tartományok vizsgálatát stb. Eb—

ből természetszerűleg adódik, hogy a megfigyelt elemek száma a minta nem egyenletes alloká- ciója miatt nagyon eltérő lehet. E problémákra csak bizonyos nagyon gyakorlatias kompro—

misszumok kínálkoznak, s a konkrét megoldá- sok sajátosságait az elemzés során ügyelembe kell venni.

A fejezet végén néhány érdekes példán ke- resztül illusztrálja a szerző azokat a problémá- kat, amelyek olyan, gyakorlatban egyáltalán nem ritka esetekben adódnak, mint például amikor a kiválasztás ismérve a család, de an-

nak esak bizonyos tulajdonsággal rendelkező tagjait kell megfigyelni, vagy az ún. várakozási (sorban állási) problémák. Lényegében arról van szó, hogy nem megfelelő súlyozás alkalma- zása jelentős torzítás forrása lehet. Ezek a kór- dések ahhoz a problémához vezetnek, amikor arról van szó, hogy a kiválasztási egységek ter- jedelme nem azonos. s ezeket az egységeket két- féleképpen lehet kiválasztani: nagyságukkal arányosan, vagy arra tekintet nélkül, tehát azo- nos valószinűségekkel.

A statisztikai vizsgálatok tervezésének és a statisztikai következtetéseknek a filozófiai vo- natkozásai a műben több alkalommal is elő—

térbe kerülnek. Könyve végén, a 7. fejezetben a szerző frappáns összefoglalását adja azoknak a legfontosabb ismeretelméleti téziseknek, ame- lyek nélkül aligha lehetséges helyesen tájéko—

zódni a statisztikai problémák és következteté- sek rcndszerében. A neves filozófust, K. Pop-

pert idézve, a szerző megvilágítja azt a gondo- latot, amely a cáfolhatőság elvének az alapja,.

majd néhány példát sorol fel ennek alkalmazá- sára. Ebből a gondolatból logikus út vezet ah- hoz az állásponthoz, hogy a szakirodalomban, kiváltképpen a statisztika irodalmában szabad teret kell adni a különböző nézetek, felfogások ütköztetésének, mivel a helyes megoldáshoz, az adott körülmények között optimális közelítés—

hez gyakran csak egészséges szellemű vitákon keresztül vezet az út.

A szöveget 37 ábra, illetve tábla több mint 50 gyakorló feladat, továbbá az idézett forrásmunkák bőséges jegyzéke egészíti ki. Az irodalomjegyzékben pontos utalást találunk arra vonatkozóan, hogy a szöveg melyik részei hivatkoznak az egyes forrásmunkákra.

*

L. Kish könyve a reprezentatív módszerek problémáinak széles körét vizsgálja. Kiterjed Hgyelme a mintavételtől a becslésig szinte min—

denre. Foglalkozik a kísérletek tervezésének, elemzésének kérdésével is, analógiákat keresve a kísérletek és a reprezentatív megfigyelések kö—

zött.

A hivatalos statisztikában a hangsúly ter- mészetszerűleg a felvételeken van, de a kísérleti szemlélet sokszor elősegíti egyes módszerek lé- nyegének megértését. Utal a szerző néhány olyan fontos kérdésre is, ami már kívül esik az egyes fejezetek témakörén, mint például a kér- dőívek tervezése, a felvételek végrehajtása (a terepmunka), a nem mintavételi hiba prob- lémái, amelyek között talán a válaszadási hiba a legfontosabb. Viszonylag röviden foglalkozik a mintavételi hibával kapcsolatban az alapso—

kaság körülhatárolása (covarage), a nemvála- szolás, a hiányzó adatok stb. problémáival.

Magyarországon a statisztikai szolgálat az ország gazdasági és társadalmi fejlődése során az elmúlt negyven évben olyan utat járt be, amelyben a hangsúly a teljes körű megfigyelé—

seken, számbavételeken volt. Már a jelenben, de még inkább a jövőben, a különböző folya- matok bonyolultabbá válása és sok más szem—

pont miatt a hangsúly a reprezentatív módsze- rekre fog áttolódni. Egyre szélesebb körben lesz szükség arra, hogy a részből következtes—

sünk az egészre.

Fel kell hívni a magyar statisztikusok figyel—

mét arra, hogy célszerű a jövőben többet fog- lalkozni a reprezentatív megfigyelések techni- kai, módszertani kérdéseivel. E területnek még viszonylag szegényes a magyar nyelvű szakiro- dalma, de idegen nyelven már nagyon sok pub—

likáció található. Leslie Kish művének magyar

* Erdemes itt idézni a hattyúkra vonatkozó nevezetes példát. Eszerint akárhány fehér hattyú megfigyelése sem jogosít fel arra a következtetésre, hogy ,,minden hattyú fehér"; viszont már egyetlen fekete hattyú megügyelése

?lgpján biztosan állíthatjuk azt, hogy ,,nem minden hattyú e er' .

(7)

830

SZEMLE

kiadása nagy előrelépést jelent. Azt is meg kell azonban jegyezni, hogy ezekre az ismeretekre nemcsak a statisztikai munkát végzőknek, ha—

nem a statisztikai adatok felhasználóinak is szükségük van (természetesen nem azonos mér—

tékben és mélységben). Ugyanis a kapott ered- mények értelmezése, helyes felhasználása csak ily módon lehetséges.

A könyv ismertetésének alkalmát felhasznál- va szeretném néhány olyan gondolatra, szem- pontra felhívni a figyelmet, amelyek a statiszti—

kai adatgyűjtés és publikáció szempontjából fontosak, de nálunk — megítélésem szerint ——

sema statisztikusok, sem a felhasználók részéről mind ez ideig nem kaptak elég ügyelmet.

A könyv nyomatékosan foglalkozik a zavaró változók vizsgálatával és hangsúlyozza, hogy azok megfelelő kontrollálásától nagymértékben függ az eredmények megbízhatósága. A magyar gyakorlat e tekintetben nem kellően körülte- kintő. Általános az, hogy a mintából kapott eredményeket elfogadjuk és megelégszünk az- zal, hogy röviden leírjuk, hogyan számoltunk.

A minta belső összetételének vizsgálata, a he- lyes arányok kialakítása igen nagy mértékben javíthatja az eredményeket. Ha növeljük a min- ta nagyságát, kétségtelenül kedvezően befolyá- soljuk az eredmények megbízhatóságát, de ez nagyon költséges megoldás és a válaszadók tűrőképessége is korlátos. Ehelyett lehetne utó—

lagos rétegeket kialakitani, vagy egyéb külső, illetve bizonyos modellekből adódó informá—

ciókat felhasználni. Nem lehet általános szabá—

lyokat megadni, mert a megoldás lehetőségei nagymértékben függnek a vizsgált változók ter- mészetrajzától. Azt azonban általános érvény—

nyel elmondhatjuk, hogy a kapott eredmények összesítése és szakmai elemzése előtt a minta analitikus vizsgálata igen sokat segíthet, s ehhez az ismertetett mű igen sok ötletet ad.

Ez a gondolat átvezet ahhoz a kérdéshez,

hogy külső információk, nyilvántartások, re- giszterek felhasználása javíthatja a reprezenta—

tív megfigyelések eredményeit. E tekintetben Magyarországon nem rossz a helyzet, de talán még itt is volna mit tenni. Különösen a cenzu- sok és a reprezentatív megfigyelések együttes alkalmazására gondolok, a továbbvezetésre, illetve a cenzusok adatainak a reprezentatív fel-

vételek elemzésénél történő felhasználására.

Nagyon fontos szempont a különböző vizs—

gálni kivánt sokaságok kellő elhatárolása, vala- mint a mintavételi keretek kellő kidolgozása.

Egy minta megtervezése lehet bonyolult, komp- lex feladat, de elvileg jó és hatékony megoldás sokszor azért nem lehetséges, mert nem bizto—

sítható a hozzá szükséges mintavételi keret, amiből a kiválasztási valószínűségeknek megfe—

lelően válogatni lehet. Valójában szinte minden minta több változó vizsgálatát célozza. Tudni kell azonban, hogy nincs általában jó vagy rossz minta. Csak valamilyen előre meghatáro- zott feladathoz viszonyítva lehet jó vagy kevés- bé jó mintáról beszélni. Ez igaz akkor is, ha sok esetben a feladat pontos meghatározása (pél- dául a kérdőív kidolgozása) valamilyen okból már nem tud visszahatni a mintára, ami egy ko- rábbi munka eredményeként már adott. Az adatok analitikus elemzése sok torzítást kikü- szöbölhet.

A legritkább esetben van csak lehetőség egy- szerü Véletlen minták kiválasztására. Ezért na- gyon fontos a komplex mintákkal foglalkozni, vizsgálni a mintavételi terv hatását.

A könyv igen gazdag irodalmi hivatkozások- ban. A bevezetőben már említettük, hogy a ma—

gyar szakirodalom nem bővelkedik a reprezen- tatív felvételi technikákat tárgyaló irodalom- ban. E mögött az a sajnálatos tény húzódik meg, hogy nagyon kevés módszertani vizsgála- tot Végeztek a különböző intézményeknél. En- nek tulajdonítható, hogy a fordítóknak számos terminológiai problémája adódott. A viszony—

lag ritkán használt, vagy szinte teljesen ismeret- len fogalmak és szemléletmód a magyar olvasó- ban nemegyszer kelthet csodálkozást a furcsá—

nak tűnő megfogalmazás, szóhasználat miatt.

Ez azonban óhatatlan minden olyan esetben, amikor szinte teljesen ismeretlen módszertani megoldásokról van szó. Mint azt a bevezetőben már említettük, azért volt szükség az eredeti an—

gol szóhasználathoz ragaszkodni (ami nem is—

méretlen az ilyen kérdésekkel foglalkozó ma- gyar szakstatisztikusok előtt), hogy a fordítás a lehető leghűbben adja vissza az eredeti szöve- get.

Dr. Marton Ádám

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Az elakadás másik lehetõsége, ha olyan feltételeket szab a környezet kimondottan vagy ki- mondatlanul, melyben a serdülõ gúzsba kötve érzi magát, nem reméli, hogy megtalálja

Esetenként nem tisztázott az ok-okozati összefüggések iránya: nem biztos, hogy a közkiadások emelkedése veti vissza a gazdasági növekedést, lehet –

A demográfiai válság ok-okozati rendszere tehát, csak meglehetősen tág összefüggésrendszerben értelmezhető, bizonyos azonban, hogy a fogyasztói társadalom által

Mint minden más jelenség- gel, az irodalommal történő tudományos foglalkozás is térhez, időhöz, gyakorlati élethelyze- tekhez, a társadalmi, gazdasági és

A fő problémát tovább bontjuk ok-okozati összefüggések alapján járulékos problémákra (pl.: belső problémák, bejegyzési rend problémái stb.), majd azokat is tovább

A DM drogériák városszintű eloszlása...

Ok-okozati bizonyítékok hiányában a jelen kutatásban is megfigyelt összefüggések is csak a korai folyadék túltöltés felismerésének fontosságát jelzik, azt

De talán gondolkodásra késztet, hogy hogyan lehet, illetve lehet-e felülkerekedni a hangoskönyvek ellen gyakran felvetett kifogásokon, miszerint a hangos olvasás passzív és