• Nem Talált Eredményt

A reprezentatív módszer alkalmazása a népmozgalmi statisztikában

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A reprezentatív módszer alkalmazása a népmozgalmi statisztikában"

Copied!
13
0
0

Teljes szövegt

(1)

DR. ACSÁDI G YÖRG Y:

A REPREZENTATIV MÓDSZER ALKALMAZÁSA A NÉPMOZGALMI STATISZTIKÁBAN

A növekvő igények, amelyeket a statisztikának ki kell elégítenie, meg— ; követelik a statisztikai szolgálattól, hogy bővítse a megfigyelés körét, ugyan- akkor gyorsítsa meg a feldolgozás menetét, s biztosítsa az adatok megfelelö pontosságát. Mivel a fokozott követelmények megnövelik a statisztikai műve-

letek munkaidő, munkaerő és munkaeszköz szükségletét, természetes, hogy a reprezentatív vagy más néven képviseleti módszert számos előnye miatt egyre gyakrabban használják fel a statisztikai adatok gyüjtés'énél és feldolgo—

zásánál.

A reprezentatív módszer a statisztikai megfigyelés nagyon gazdaságos fajtája. Reprezentatív felvételnek -—-— a teljes felvétellel szemben —— azt az eljá- rást nevezzük, amely a teljes sokaság statisztikai jellemzését meghatározott módon kiválasztott részsokaság (minta) vizsgálata alapján végzi el. A repre-

zentatív módszer használata esetében tehát nem az egész sokaságot, hanem

annak csak kis töredékét kell számbavenni és feldolgozni; ezáltal jelentős megtakarítás érhető el.

A reprezentatív felvétel gazdaságosságának hangsúlyozása nem jelenti azt, hogy ez a módszer csak takarékos szükségmegoldás. Az elmélet és a gya—

korlat egyaránt igazolja, hogy a helyesen kiválasztott mintasokaság alapján előre meghatározható pontossággal jellemezhetjük az egész sokaságot; az adatfelvételkor elkövethető hiba pedig lényegesen könnyebben küszöbölhető ki, mint a teljeskörű megfigyelés esetében, mivel a felvételi egységek számá-

nak csökkenvése pontosabb számbavételt tesz lehetővé.

A magyar statisztikai gyakorl-at ma még viszonylag ritkán alkalmazza a reprezentatív eljárást, pedig használatának a jelenleginél sokkal nagyobb lehetőségei vannak. E tanulmány az alkalmazási lehetőségek megvilágítására a statisztika szerteágazó szakterületeinek csak egyikét, a népességi statisztikát ragadja ki példaképpen, s annak is különösen azt a részét vizsgálja (a mép- mozgalmi statisztikát), ahol eddig a reprezentatív módszert még nem hasz—!

nálták.

A továbbiakban először egy példán keresztül mutatjuk be a reprezentatív módszer alapfogalmait, a jelöléseket és képleteket (I.). Röviden foglalkozunk a reprezentatív módszereknek a népszámlálásnál történő felhasználásával (II.), majd rátérünk a népmozgalmi statisztikai munka három összefüggő gyakorlati fázisában, a számbavétel (III.), a feldolgozás (IV.) és az ellenőrzés (V.) területén kínálkozó alkalmazási lehetőségek ismertetésére. A számbavétel—

területén egyes, a népességi statisztikával rokon szakmai ágak anyagát is

(2)

DR. ACSADI: A REPREZENTATW MÓDSZER A NÉPMOZGALMI STATISZTIKABAN 789

érintjük. A tárgyalás során előbb mindig a megoldásra váró kérdések termé—

szetét vázoljuk, azután utalunk az alkalmazható módszerre, s egyes külön- leges körülményekre. A feldolgozási munkákkal kapcsolatban két gyakorlati példát hozunk a mintacsoport létszámának megválasztására.

1.

Mielőtt a cikk tárgyára rátérnénk, egy példában röviden áttekintjük a

később még szereplő alapfogalmakat, jelölés—eket és képleteket. A példa a férjes nők gyermekszámával, termékenységével foglalkozik. Az adatokat az

alábbi táblázatban mutatjuk be: '

A férjes nök száma Az átlagos gyermekszámtól való eltérések A házasságok-

ból született, értékeinek nőgy- Gyermek- a tettes a minta- gyermekek értékei értékelnek zetei a férjes

szám sokaságban csoportban száma négyzetet nuk szánnám!

súlyozva

(f) (i,) (fx) (x:—§) (x— ív f(x — §):

0 ... 298 000 2 910 0 —— 3 ——l— 9 2 682 000

1 ... 310 000 3050 310 000 2 4— 4 1 240000

2 . . . . . 300 000 3 040 600 000 —— l 4- 1 300 000

3 ... 290 000 2 930 870 000 0 O O

4 ... 270 000 2 670 1 080 000 -l—- l 4— 1 270 000 5 ... 250 000 2 520 1 250 000 4— 2 4- 4 1 000 000

6 ... 150 000 1 610 900 000 _l— 3 —l- 9 1350 000

7 ... 80 000 740 560 OCO —l- 4 -l- 16 1 280 000

8 ... 40 000 400 320 000 -l- 5 4- 25 1 000 000

9 ... 10 000 120 90 000 —1— 6 %- 36 360 000

10 ... 2 000 10 20 000 al- 7 el— 49 98 000

4— 2 000 000 20 000 6 000 000 -— —-—— 9 580 000

A vizsgálni kívánt statisztikai sokaság jellemzőike'nt általában az ismérv értékeinek az átlagát, az átlag körüli szóródását és az adott ismérvvel rendel- kező tagoknak a sokaságban elfoglalt hányadát (arányát) használják.

Példánkban a férjes nők termékenységét az átlagos gyerekszámmal

(számtani átlag, jelölése §) jellemezzük:

2.7 fx 6 000 000

Ef : 2000000 "

EE: .

a

Egy férjes nőre jutó átlagos gyermekszám tehát: 3.

Az átlaggal a sokaságban jelentkező általánosat, tipikusat akarjuk kife—

jezni, ez azonban az ismérv természeténél fogva nem mindig sikerül egyfor- mán, az egyes esetek értékei többé-kevésbbé eltérnek az átlagtól. így az átlag példánkban az esetek alig lön/mának értékével egyezik meg (290 000 asszony 3 gyermekes), a többieknél kisebb vagy nagyobb a gyermekszám, azaz eltér- nek az átlagtól, szóródnak körülötte. A szóródás mértékét az átlagtól való elté- rések (x—x) valamely középértékeként határozzuk meg. Ezek közül a repre- zentatív módszer elméletében és gyakoraltában egyaránt nagy jelentőségű a diszperzió (0-2) és az átlagos négyzetes eltérés (er), a diszperzió négyzet— ,.

gyöke. Példánkban a négyzetes eltérés

3 Statisztikai Szemle.

(3)

790 - , í ma. ACSADI GYÖRGY

a:!V2f(x—EP 1/95anm0 _wm

Ef '" zmomo"

a diszperzió pedig; 0—2: 4,79_

A statisztikai sokaság összetételét igen gyakran a meghatározott ismérv- nek megfelelő rész (M) és az egész sokaság létszáma (N) hányadosával (p) jellemzik. Az előbbi adatokból például meghatározzuk, hogy a férjes nők

mekkora hányada volt terméketlen (0 gyermekszámú). A férjes nőknek:

M 298 000

:":w—f: , . 0 - lt , ' l .

11 N 2 000 000 O,149, azaz 14,9Á) a vo termeket en

A kiválasztott ismérvvel nem. rendelkező egységek száma NHuM, ezeknek a sokasághoz viszonyított arányát (9) is kiszámíthatjuk, A férjes nőknek eszerint

N——M 1 702 000 . ,

g : T : M : 0,851, azaz 85,1%—a volt termekeny.

A teljes sokaság és az ebből reprezentatív úton kiválasztott rűszsokoság (minta) jellemzésére a továbbiakban a felsorolt mutatószámokat használjuk.

A teljes sokaság jellemzésénél az átlagot 37, a diszperziót (702, a négyzetes el—

térést 00, a hányadot p, a meghatározott ismérvvel rendelkező egysegek szá—

mát M, az összlétszámot pedig N betűvel jelöljük, míg ugyanezekre a minta sokaság esetében az X, 02, o', w, m és n jelzéseket vesszük igénybe.

Példánkban a kétmillió házas nő közül találomra huszezret választottunk ki, tehát a teljes sokaságnak mindössze egy százalékát (ez a minta), A teljes-

és mintasokaság jellemzőit alább hasonlítjuk össze:

A teljes sokaság jellemzői: A mintasokaság jellemzői:

eza ' exam

(702 ; 4,79 o'2 : 4,'7'7

(To : :ií 2919

(T : 3: 2,13

p : (),149 w : 0,146

( A példánkban kiválasztott minta jellemzői, bár elég jól közelítik meg a teljes sokaság jellemzőinek értékét, mégis attól bizonyos véletlen hibával eltér—

nek. A minta átlagának hibája (,LL ) annál kisebb, minél kisebb az ismérv szó—

ródása és minél nagyobb a kiválasztott minta tagjainak száma.

__ gyü—_ 4; a 19

" van," min ' 141,4

A minta hányad—ának Véletlen hibáját hasonló képlet. adja meg la hányad szóródásaként itt a po kifejezés szerepel): *

,L : Vg. : 1/ M : ig 00025,

% 7 20 000

. A minta jellemzőinek értékét a véletlen hibával együtt szokták megadni;

tehát a minta alapján az átlagos gyermekszám X : 302 3: 0.0155 (és a termé- ketlen nők aránya w :: 0,146 j; 0,0025.

(4)

A REPREZENTATIV MÓDSZER A NÉPMOZGALMI STATISZTIKABAN ; 791

A véletlen hiba kiszámításának ismertetett képletét csak a találomra tör—

ténő ismétléses mintavételnél használhatjuk.1 Az ismétlés nélküli mintavétel- nek —e áltálában ezt alkalmazzuk a statisztikában a véletlen hibája kisebb.

Ennél az ismétléses mintavétel hibáját az átlag és a hányad esetében egyaránt

% .

VI —— ívkifejezéssel kell megszorozni, amelynek értéke egynél alacsonyabb A találomra történő ismétlés néllkiilci kiválasztást.használva a hiba. képlete tehát a szorzat, eredményeként

_, [ ____

) ) a hányad esetében :v 319 (1 __ 3)

n N (

A tervszerű, rétegezett, sorozatos Vagy mechanikus kiválasztásnál a vétel;

len hibát hasonló módon, de más képletek alapján kell megállapítani. A kép- letek alkalmazásánál, mivel a fősokaság jellemzői általában ismeretlenek. a mintasokaság megfelelő jellemzőit szerepeltetjük.

A véletlen hiba kiszámításával a mintából számított értékek megközelítik a valóságot, a statisztikában azonban meghatározott pontosságú adatokra van szükség. Éppen ezért szükséges annak meghatározása is, hogy a mintacsoport jellemzőihez az átlagos hibának hányszorosát (t) kell hozzáadni, hogy az minden valószínűség szerint megegyezzék a teljes sokaság jellemzőinek érté- keivel. A niintaesoport véletlen hibájának ezt a többszörösét (A ), amelynek határai közé a teljes sokaság jellemzői előre meghatározhatr') valószínűséggel beszoríthatók, a reprezentáció hibahatáránnk nevezzük. Képletben: A : tp,

A t és annak valószínűsége (P) között, hogy a teljes sokaság jellemzőjé—

nek értéke a A értékét nem haladja meg, szoros Összefiiggés van. Minél nagyobb a 1 értéke, tehát minél nagyobb hibahatárt veszünk, annál nagyobb a valószínűség ért—éke ilS (a, P értéke (l-tól l-ig terjed, P :: a teljes bizonyos- ság)

Gyakorlati célokra a ! szorzó és a hibahatárhoz tartozó P valószínűség összetartozó értékei, táblázatban vannak összefogva. A táblázatból kitűnik, hogy a véletlen hibának alig több mint másfélszeresénél már (),9-es valószínű—

séggel állíthatjuk, hogy a teljes sokaság jellemzőinek értéke nem megy túl a

minta hibahatárán, 2—től 26 1 érték mellett pedig a valószínűség értéke

(t,95———0,99,

majdnem bizonyosság. A t :: 3—nál nagyobb érték alkalmazására csak ritkán kerül sor, hiszen itt a P valószínűség már 09973.

Példánk során a mintavétel átlagának hibája í— (l,0155, Az előbbiek

szerint 990/0-05 (pontosabban 09901) a valószínűsége annak, hogy a, teljes sokaság átlaga A : 158 M hibahatáro—k közé esik. A :: 2,58 X(:l;(),0'155) : : §; 0,()4. A teljes sokaság átlaga (3,0) valóban a mintaátlag hibahatárai

(3.02 j: (),04) azaz 3,06 és 2,98 értékek között helyezkedik el.

*

az átlag esetében: V

A mintacsopott létszámának, megválasztásánál a hibahatár képletéből indulunk ki. A találomra tört-ént ismétléses kiválasztásnál az átlag hiba—

határa pl: ,

(To iz 0.02

, ebből n:

ln Az

1) Az egyes mintavételi eljárások ismertetését, s a reprezentatív módszerek alapfogalmainak bővebb kifejtését a Statisztikai Szemle 1054. áprilisi számában (271—283, l.) megjelent cikk tartalmazza. (Szerk.)

***

.;

Azt

(5)

792 DR. ACSADI GYÖRGY

Példánkban a kétmillió nő adatai közül húszezerét választottuk ki a minta—

csoportba. Számítsuk ki, hogy az előbbi 990/0-05 valószínűségnek megfelelő t : 2,58-as hibahatárhoz helyes volt-e 19/o-os mintavételt alkalmazni?

2582 - 4,79 19927

" : 0942 — '

Helyes volt tehát az, hogy az átlag kívánt pontosságú meghatározásához a , mintacsoportba a teljes sokaságnak tolti—át, azaz 20000 nő adatát vettük fel.

A reprezentáció alkalmazásának vagy mellőzésének eldöntéséhez a minta létszámának nagyságát kell először tisztázni. A reprezentatív módszert akkor érdemes alkalmazni, ha egy olyan minta alapján, amely a teljes sokaságnak viszonylag csekély hányada az adatokat kis hibahatárok között, nagy való- színűséggel kapjuk meg. A mintacsoport létszámának megválasztását a fel- dolgozási munkák területén található alkalmazási lehetőségek tárgyalása során a továbbiakban még két gyakorlati példávalivilágitjuk meg.

II.

A reprezentativ módszereknek a népességi statisztikában a népszámlálás a legfontosabb alkalmazási területe. A népszámlálás az egyik legalapvetőbb és legterjedelmesebb időszakos statisztikai adatgyüjtés, amelyhez a nem szorosan vett népességi adatok összeíráSát is hozzá szokták fűzni. Az így kibővített korszerű népszámlálás olyan hatalmas számolási művelet, hogy annak fel—

dolgozása még a gépi technika mai fejlettsége mellett is hosszú időt vesz igénybe, ami az adatok operatív használhatóságát veszélyeztetheti. A nép—

számlálásoknál tehát az időmegtakarítás érdekében -— egyre általánosabban

—— először reprezentativ feldolgozásokat készítenek. A reprezentatív feldolgo—

zás elkészülte után természetesen a népszámlálás teljes anyagát is feldolgoz—

zák. A reprezentáció alapján kiszámítható adatok a népszámlálás teljes fel- dolgozását nemcsak megelőzhetik, hanem az adatgyüjtés terjedelmétől függően a számos kombinatív feldolgozás egyikét vagy másikát helyettesíthetik is.

Ez már nemcsak időben, hanem munkaerőben és anyagban is számottevő megtakarítást jelenthet.

A népszámlálással kapcsolatban meg kell jegyezni, hogy a népesség jel—

lemző tulajdonságok szerinti teljes megszámlálása reprezentatív felvétellel nem helyettesíthető. A reprezentatív eljárással meghatározhatók a sokaság különböző megoszlási arányai (pl: a népesség nem—, kor-, foglalkozas szerinti összetétele, stb.), az egyes ismérvek értékeinek átlagai (pl: átlagos életkor, jövedelem, gyermekszám, stb.) és a sokaságra vonatkozó más statisztikai jellemzők. A sokaság létszáma (pl: a népesség száma) azonban csak teljes felvétellel állapítható meg.

A reprezentatív módszerek használata a népszámlálásoknál és különböző statisztikai összeírásoknál ma már általánosan elterjedt. Az 1949. évi magyar népszámlálás megfelelő tapasztalatok hiányában, az előkészítés nagy munká- jára rendelkezésre álló igen rövid idő alatt nem Svezethette be megnyugtató módon a képviseleti eljárást; a módszer alkalmazáSa azonban nem elvi, hanem technikai okok miatt maradt el. Az elmúlt népszámlálás tapasztalatainak alapján a következő népszámlálás idej-ében történő alapos előkészítéséhez a reprezentatív módszer alkalmazását a legkomolyabb formában meg kell

vitatni. l '

(6)

** A REPREZENTATIV MÓDSZER A NÉPMOZGALMI STATISZTIKABAN 793

III.

A népességi statisztika két nagy ága közül a továbbiakban elsősorban a reprezentatív módszernek kevésbbé szokásos felhasználási területével, a népességi változások (népmozgalom) statisztikájával foglalkozunk. Ezzel egy- részt arra akarjuk felhívni a figyelmet, hogy ezen a területen is sok olyan kérdés van, amelyet a reprezentatív módszer segítségével lehet legcélszerűb- ben megoldani, másrészt pedig e módszereknek a népmozgalmi statisztikában történő kipróbálása útján a népesség állapotának —— bármilyen forrásból (népszámlálás, népösszeírás, népességnyilvántartások) származó _— reprezen- tatív tanulmányozásához is tapasztalatokat szerezhetünk,

*

A népmozgalmi számbavétel területén a reprezentatív módszernek első- sorban az a nagy jelentősége, hogy alkalmazásával lehetővé válik olyan kér—

dések megfigyelése is, amelyekre a viszonylag szükebb körre korlátozódó folyamatos adatgyüjtés nem ad választ. Ezeknek teljeskörű számbavétele szinte megoldhatatlan feladat, a reprezentatív megl'igyelésmód azonban esetenként lehetővé teszi gyakorlati és tudományos szempontból egyaránt igen jelentős tanulmányozásukat.

A reprezentatív módszerrel szükséges például részletesebben megfigyelni a népmozgalom, illetve a népesség reprodukciójának egyik sarkalatos ténye—

zőjét, a termékenységet. A szaporodás változatlan halandósági viszonyok mellett elsősorban a születések számától, a nők termékenységétől függ, s a népesedésnek igen lényeges kérdése az, hogy milyen mértékben biztosítja a születések száma a népesség'megújulását, szaporodását. Mivel a szülőképes—

korú nők legnagyobb része házasságban él, a házasságok termékenységének (terméketlen, egykés, sokgyermekes házasságok) vizsgálata is fontos feladat.

A születési aránynak a termékenységgel kapcsolatos ingadozása bizony—

talanná teszi a születések számának hosszabb időtávlatra történő megbecsü- lését, a népesség összetételének perspektivikus, több évre előre történő szá—

mítását, pedig erre a tervgazdálkodásban nélkülönözhetetlenül szükség van, s számos társadalmi, gazdasági és kulturális kérdés megoldása fűződik hozzá.

A termékenységet a rendszeres adatgyüjtés több oldalról is megvilágítja (hányadik gyermek az újszülött?; a házasságkötés és az egyes születések között eltelt időtartam; a meghalt nők gyermekeinek száma; korral, társa- dalmi és családi állapottal stb. kombinált feldolgozása; stb.), nem derül azonban fény éppen a legjelentősebb kérdésekre, amelyeket a tárgy sokfelé ágazó, gyakran kényes volta miatt sem lehet az általános számbavétel körébe bevonni. Ilyen kérdések például: a terméketlenség oka biológiai vagy társa- dalmi természetű-e? milyen mértékben? milyen társadalmi feltételei vannak a sokgyermekességnek? milyen okból és mértékben terjedt el a születéssza'bá—

lyozás? mi az oka az egykének, kétgyermekrendszernek? stb. Le kellene mérni az egyes kormányzati intézkedések hatásait is, s meg kellene pontosan állapítani a gyermekszámmal kapcsolatban álló társadalmi, gazdasági ténye—

zők befolyását.

A felmerülő kérdésekre reprezentativ adatgyűjtéssel lehet választ kapni.

A termékenység vizsgálatával foglalkozó reprezentációnak ki kell térni a kér- dezett társadalmi, gazdasági és demográfiai viszonyaira, valamint a szüle- tésekkel, illetőleg a gyermekszám szabályozással kapcsolatos helyzetére, ille- tőleg álláspontjára. A reprezentatív megfigyelés fajtái közül ebben az esetben

(7)

794 DR. ACSADI GYÖRGY '

a rétegezett kiválasztást kell előnyben részesíteni. A rétegezés többféle szem—

pontból is elvégezhető: a születési vagy a halálozási lapok alapján, azután társadalmi rétegeződés, kor, a házasság időtartama, családi állapot, terület (város, Vidék), stb. szerint. Amennyiben a válaszok összegyüjtésénél az orvo—

sok (főleg nőgyógyászok, kórházak nőgyógyászati osztályai) közreműködésére lehet számítani, —m— amit az adatok egy részének bizalmas természete nagy mértékben indokot, ——— a kérdések megválaszolását adatszolgáltatónként őwtt) véletlenül kiválasztott személyre (asszonyokra) kell korlátozni. A Vélet—

len ki álasztásnál semmi esetre sem szabad a mintából azokat a nőket ki- hagyni, aki'k nem óhajtanak kimerítő választ adni, mert ez a véletlen kiválasz—

tás elvét nagy mértékben megsértené és a kapott eredl'nény—eket eltorzíthatná (a mintavétel rendszeres hibája).

'A minta létszámát a felvételi célok szerint kiválasztott ismérvek értékei—

nek szóródása alapján úgy kell megállapítani, hogy a mintaesoport hiba—

határa a legnagyobb szóródású ismérv esetében se legyen nagy, Az ismérvek szóródását a már előbb folyamatosan megfigyelt adatok alapján kiválasztott próbaesoport szóródásával pótolhatjnk (a próbaesoport anyaga a minta- csoportba is besorolható).

*

A termékenység n'iezllett számos olyan kérdése van a zié'pimiizgalmi statisztikának. amelyet csak közvetve, hatásaiban mér le, a jelenségek okai—

ról azonban közvetlenül nem gyűjthet adatokat, s így azok társadalmi-gazda—

sági hátterét nem tudja kimutatni, Ezek közül e helyen még a házasságon kívüli születésekkel foglalkozunk.

Az újszülöttek túlnyomó többsége házasságból származik, csak kisebb.

de mégsem elhanyagolható része nem házas, W főleg 20 (wen aluli w— anyák—

tót. A múltban a házasságon kívül született ,,törvénytelenu gyermekek sorsa sokkal rosszabb volt, mint a házasságból született ,,törvényeseké". Ma már a házasságon kívül születetteket semmiféle hátrányos megkülönböztetés nem terheli, demográfiai téren azonban adataik több szempontból még ma is ked—

vezőtlenebbek a házasságból születettekéntél (életképesség, csecsemőhalandó—

ság). Hogy a két csoport közötti különbség oka mennyiben tudható be az anyák korösszetétel különbségének, gazdasági helyzetének, vagy a még eset—

leg meglévő társadalmi megkülönböztetés következményeképp fennálló maga tartásnak stb., ezt ismét csak reprezentatív megfigyelés útján lehet megtudni.

Ennek alapján V'égezl'l—ető az újszülöttek e csoportja érdekében eredményesebb felvilágosító munka, tehetők további hatékony egészségügyi intézkedések, stb. A reprezentatív megfigyelés részben már az állami terhes—vizsgálatoknál megkezdhető, részben pedig a születési, illetőleg a eseesemőhalálozási lapok útján fejezhető be. illetőleg ellenőrizhető.

A népmozgalmi statisztikához hasonlóan a népességi statisztika m— s az ezzel szoros kapcsolatban álló társadalomstatísztikai ágak ———— megfigyelési körét is bővíteni lehet a reprezentáció felhasználásával. Különösen a népes ség állapotának vizsgálata az a terület, amelyre a népszámlálások közötti idő—

ben csak kevés adattal rendelkezünk, holott igen gyakran merülnek fel olyan igények, amelyek a folyamatos népmozgalmi számbavétel alapján nem elé- gíthetők ki. így például reprezentatív alapon lehetne megoldani az Öregkorú

(8)

A REPREZENTATIV MÓDSZER A NÉPMOZGALMI STATISZTIKABANA 795

népesség társadalmi, gazdasági, egészségügyi helyzetének vizsgálatát, a népes—

ség testi fejlettségének felvételét, egyes foglalkozási statisztikai (pl. az egyes népgazdasági ágak dolgozóinak szakképzettség szerinti megoszlása, stb.), lakásstatisztikai (épületek karbantartása, lakások felszereltsége, laksűrűség, stb.), kulturális (főleg a népművelés vonalán) adatok helyesbítését stb. Az ilyen felvételek egyébként _— különösen területi, üzemi vizsgálatok alkalmá- val —— monografikus ,inódszerrel is megoldhatók, abban az esetben azonban.

ha a teljes sokaságról akarunk számszerű adatokat kapni, a reprezentatív eljárást kell választanunk. A felvetett tárgykörök közül az öregkorúak és a testi fejlettség kérdéseivel foglalkozunk bővebben.

A XX. század első felében a magyar népesség korösszetétele jelentősen megváltozott, a népesség öregedett. Ma majdnem kétszerakkora a 60 éven

felüliek száma, mint volt a század elején, az idősebb korcsoportok aránya pedig még ennél is jelentékenyebb mértékben duzzadt meg. A Várható átlagos élettartam további emelkedés—ével kapcsolatban az öregkorúak számának foly- tatólagos emelkedésével lehet számolni, —— annak ellenére, hogy a népmoz- galom jelenlegi alakulása a népesség fiatalodására utal,

A népesség korösszetétele változásának igen fontos társadalmi, gazdasági kihatásai vannak. Ezek között nagyon jelentős kérdés azoknak a terheknek a mértéke (a terhek fedezési módja és elosztása), amelyet a nem kereső népes—

ség eltartása ró a kereső népességre. E kérdéscsoport tanulmányozása, s ennek alapján az öregkorú népesség kérdéseinek megoldása a népszámlálási adatok alapján végezhető el. Az egymástól távoleső népszámlálások között létrejött változások miatt azonban időközben is felmerül újabb adatok szükségessége, s ezért az öregkorúa'k helyzetét is reprezentativ módszerrel kell részletesebben megvizsgálni.

. Az öregkorú népesség megfelelö foglalkoztatása kérdéseinek Vizsgálata.

mint például a munkaképesség életkorral kapcsolatos változásainak, az öreg—

korúak által betölthető munkahelyeknek, a munkaidő hosszúságának, a munkafeltételeknek stb. kutatása másképp, mint reprezentatív felvétellel

nem is képzelhető el. ; .

*

A népesség testi fejlettségétől (az újszülöttek súlyát és hosszúságát kivéve) keveset tudunk. A testi fejlettség kor, nem és terület szerinti megállapítása, 5 a változások figyelemmel kísérése pedig a statisztika egyes szakágainak (egészségügyi, népességi statisztikának) fontos feladata lenne, mert az ada—

tokra a gyakorlat és a tudomány sokfelé ágazó területe tart igényt. Ilyen gyakorlati területek például a közszükségleti fogyasztási cikkek, stb. méretei- nek tervezése; egyenruházati és konfekciós ipar terméktípusai méretezése, az egyes nagyságok gyakoriságának, terül—eti elosztásának meghatározása, véradó szolgálat, stb. és ilyen tudományágak, az orvostudomány: pl. gerontológia;

közegészségtan; antropológia; biológia, stb. ;

A népességnek ezt az ismérvét a népszámlálások kérdésanyaga %— érthetö technikai okokból —————— nem tartalmazza, mindössze a testi )fogyatkozásokat veszi figyelembe. De még ha mód nyíln-ék is rá, akkor sem lenne helyes ilyen adatoknak a teljes sokaságon végzett megfigyelése, mert ez nagy hibalehető—

ségeket rejt magában. A népesség testi fejlettségének vizsgálatánál jól kiválo—

gatott (tehát valamelyik reprezentatív kiválasztási módszer szigorúan követ—, kezetes alkalmazásával végzett) kisszámú mintasokaság pontos felvétele a helyes módszer.

(9)

796 _ , na. AcsAni 'eroaer

A testi fejlettség felvételét egyes tudományos, egészségügyi és gazdasági szervek, intézetek meglehetösen ötletszerűen és egymástól elszigetelten végzik, munkájuk eredménye így nem kielégítő. Ezen a téren nagy szükség lenne arra, hogy a KSH szakmai segítségével, a MTA irányítása mellett a különböző intézmények koordinálják munkájukat, s egy jól [átgondolt és egységesen megvalósított reprezentatív vizsgálattal (amelyben természetesen az eddigi adatok egy része is felhasználható) a régóta vajúdó kérdést megoldják.

(*

Megoldásra váró —— részben számbavételi, részben feldolgozási —-—— kérdé—

seket állít a népmozgalmi statisztikusok elé az a helyzet, hogy az évi feldol—

gozások évről—évre nem egyforma részletességgel vizsgálják a népesség vál—

tozásait és tárják fel az azokat előidéző okokat. Egyes kevésbbé időszerű táblák elmaradnak, mások részletesebb bontásban vagy kevésbbé tagoltan kerülnek elemzésre. A népmozgalmi kérdőíveken szerepelt olyan kérdés is, amely feldolgozásra a multban nem került (például több éven keresztül az egyéni foglalkozás). Az egyes években mellőzött feldolgozásra később azután szükség lehet valamilyen vizsgálat szempontjából.

Ezek rendszeres feldolgozása vagy pótlása ugyancsak reprezentatív úton képzelhető el. Meg kell azonban jegyezni azt is, hogy a különböző kombinatív feldolgozások esetén csak olyan csoportosítást (rétegezést) alkalmazhatunk, amelyben a csoportok száma kevés, illetőleg a csoportok tagjainak a száma nagy. Kis létszámú csoportok esetén —— ha megfelelő pontosságot kívánunk ——

a minta létszáma a teljes sokaság 500/0-át is meghaladhatja, s így tulajdon—

képpen munkamegtakarítás alig érhető el.

IV.

A reprezentatív módszer alkalmazására a természetes népmozgalom sta—

tisztikájában a feldolgozási munkák terűletén elsősorban az eredmények gyorsabb megállapítása érdekében kerülhet'sor. A természetes népmozgalmi statisztika a születések, halálozások és házasságkötések adatait éves'idúőközök- ben dolgozza fel, s az eredményeket csak több hónappal a tárgyidőszak befe- jezte után adhatja meg. (Az év folyamán havonta csak az ü. n. főeredménye—

ket elemzik.) Kis létszámú mintacsoport kiválasztásával az évi eredmények közlését jelentősen meg lehetne gyorsitani, s mód nyílnék az adatok féléven- kénti elemzésére is. A reprezentativ módszerrel meghatározott jellemzőknek az évi teljeskörű feldolgozás eredményeivel való ősszehasonlításából az utóbbi helyessége is ellenőrizhető, s ez úton gyakorlati tapasztalatokat lehetne sze—

rezni a népszámlálás vagy más összeírások reprezentatív módszerű gyors fel—

dolgozásához.

Az említett feldolgozások tárgykörük szerint akár véletlen, akár típus vagy terület szerinti rétegezett kiválasztással a megfigyelések országos feldol- gozását tűzhetik ki célul. A mintacsoport létszámának megválasztásához az n értékét minden egyes feldolgozásra nézve —— az átlag és a hányad tekinteté- ben egyaránt ——4 külön kel l meghatározni, s a legnagyobb n értéket kell figye—

lembe venni. A minta létszámának megállapításához két gyakorlati példát mutatunk be.

Az első példában a születéscknek az anya életkora szerinti megoszlását kell megállapítani. A legegyszerűbb, találomra történő mintavételnél a hányad meghatározásához szükséges minta létszámát az alábbi képletből kapjuk meg:

(10)

A REPREZENTATIV MÓDSZER A NEPMOZGALMI STATISZTIKABAN 797

N tng

N A2 4— tng '

(Ez a képlet kevéssé eltér a bevezetésben közölt képlettől, mert a statisz-

tikai megfigyelésnél általában alkalmazott ismétlés nélküli kiválasztásra vo- natkozik, s nem az átlag, hanem a hányad meghatározásának esetében hasz—

náljuk.) *

A születések korcsoportonkénti megoszlásának p és (] értékeit az alábbi táblázaton tüntetjük fel. Egy—egy korcsoporton belül az összes születéseknek a megadott korcsoportból származó részét a [) oszlop, a fennmaradó hánya—

dokat pedig a (] oszlop adatai tartalmazzák. Az egyes korcsoportokon belül a két oszlop adatainak Összege az Összes születések száz százalékát adja (1) —l— (] : 1), ugyanígy a megfelelő korú anyáktól származó születések összege is (2 p :: 1).

Megoszlás az előző évben:

%:

A születések korcsoportoukénti megoszlása

A hányadok Az anya A születések Érgfgáíicggl a fennmaradó szorzata korcsoportia száma származó szüle- hányadok

tések hányadai (1—9)

(a) (a) (mi)

17 éven aluli . . 1000 0,005 O,995 0,004975 17—19 éves . . . 10 000 0,0.5 O,!)GO 0,(l475 20—24 ,, . . . 69 000 0.345 0,655 0,225975

25—29 ,, . . . 40 000 0,2 0,800 0,16

30—39 ,, . . . 70 000 035 0650 02275

40—49 ,, . . . 10 000 0,05 0,950 (LO—175

—— 200 000 1.000 ——

Ha a megoszlást nagy valószínűséggel (O,997;t——:3) kis híbahatárok között (azaz az abszolút számot ezres pontossággal, a megoszlási viszony—

számot pedig 5 tized százalékos határok közölt; A :: 3: (),005) akarjuk meg- adni, akkor a minlacsoport létszáma a legkisebb szóródású (pg) csoporthoz

(a 17 éven aluliak): —

200 000 X 9 X 0,004975

" : 200 000 x 0,000025 * 9 x 0,004975 : 1775'

a. legnagyobb szóródású csoporthoz (30—39 évesek):

200 000 X 9 X O,2275

% : :: 58 105.

200 000 X 0,000025 4-9 X O,2275

Az egyik esetben tehát a mintacsoport összeállításához a teljes sokaság- nak lo/o—ára sincs szükség, míg a nagyobb szóródású ismérv miatt a teljes sokaságnak több mint negyedrészét kell a mintába beválasztani. A nagyobb szóródású csoportok azonban olyan nagy létszámúak, hogy az elgondoltnál nagyobb hibahatár esetén is megfelelő pontossággal kapjuk meg a kívánt megoszlást. így, ha a 30—39 évesek csoportjánál megelégedhetiink a véletlen hiba kétszeresével, —— ami még mindig nagy pontosságot jelent —, akkor a mintacsoport létszámát a negyedére csökkenthetjük (kb. 15 OOO—re).

(11)

798 DR. ACSADI GYÖRGY

A 15 OOO-nyi mintacsoportból egyébként csak a 30————39 évesek hányadát * kapjuk meg a tervezettnél nagyobb hibahatárral, a 17 éven aluliak hibahatára

ugyanakkora mintacsorportból sakkal kisebb (A : ig 00017).

*

A másik példában a mezőgazdasági munkások átlagm- elhalálozási korá—

nak meghatározása a feladat.

Az átlag esetében a mintacsoport létszámának megállapítása a hányad- hoz hasonló módon, de az átlag véletlen hibájából levezetett képlet alapján történik:

_— N t2 0'02 N 412 4— t2 (roz

Az előző évi adatok a következők (az N a vizsgált időszakban változat—

lanul 20 000):

"I;

l ' 3

Mezőgazdasági ! !

Elhalálozási km— munkások "

száma

(x) , (f) _(fx) , ():—§) (ix—§)? f (xi-§):

20 éven alul _________ 500 s 750 36,56 ! 386,63

?

668 315 20—29 éves ... ; !. 000 25 000 29,06 84448 844 480 30—39 ,, ... [ 3 000 105 000 19,06 _ 36328 1 089 840

40—49 ., ... ; 2 000 90 000 §),06 * 82,08 164 160

50—59 .. ... 2 500 137 500 (),94 0,88 2 200

60 éven felül ... 1] 000 715 000 10,94 tl9,68 ; 1 316 480

§

-— 20 000 I 081 250 —— _ ' 4 085 475

?

, , , . 1 081 250 , . .,

Az atlagos elhalalozam kor az : —————————— : 54,()6 ev, a diszperzm

20 000

a szóródás négyzete):

4 085 475 . , , * . , , .

002 :T— : 20427, igen magas ertek. A magas 0—0Z ertek miatt. nagy

, OOO

pontosságú hibahatárt nem lehet kívánni. Ha a, A értékét if (),l'értékben _ kívánnánk megadni, akkor 0997—es valószínűség mellett

20 000 x 9 x 204227

:: ::1'"9'*' ' tl' so s' 9 0 —"t

n 20000X0,01—%-9X204,27 : 88, azaz, a! eyes ka ag )O/Oa fel kellene venni a mintába.

A hibahatár értékének növelésével a szükséges mintacsoport tagjainak száma gyorsan csökken. A : i (),05 érték esetében a minta létszáma 152 953.

A : j; (),l—nél pedig —— tehát egytized éves pon'tosságnál w— már csak 1804.

Meg kell jegyezni azt is, hogy a példához szándékosan egy viszonylag nem nagy létszámú sokaságot választottunk ki, hogy a reprezentatív módszer hasz- nálhatóságát különböző nagyságú sok'aságok esetében érzékeltessük. Ha a megvizsgálandó teljes sokaság létszáma például N : 40 000 —— az előbbi két—

szerese —— lenne, a minta létszámát még hasonlóan magas diszperzió mellett sem kellene jelentősen növelni, a A : j; (),5 évi hibahatár követelményt pél—

dául 3367—es mintalétszámmal lehetne biztosítani.

(12)

A HLPlth/LXI'XUX MODSZER A NÉPMOZGALMI STATISZTIKÁBAN 799

Amíg a feldolgozás terén a természetes népmozgalom statisztikájában elsősorban a gyorsaság és a tapasztalatszerzés indokolja a reprezentatív módszerek használatát, addig a vándormozgalmi statisztikában a beérkező kérdőívek nau:,"y száma és az itt véy'zendő sokrétű területi csoportosítás nagy munkaig(;ényessége miatt komolyan meg kell vizsgálni annak lehetőségét, hogy egyes országos —— tehát nem területi egységenként végzett —— feldolgozások (gazdasági megtakarítást jelentő reprezentatív módszerre] történjenek. Repre- zentatív úton lehetne például feldolgozni országos szinten a l'axlu'ihelyvz'llto—

zással kapcsolatos foglalkozásváltozást, a lakóhelyvált—ozás célját stb. és egyes kombinációkat (kor—foglalkozás, foglalkozás-családi állapot stb.). Ez esetleg nemcsak a gépi és táblamuníkáekat csökkentené. hanem (( kódolásban is nagy könnyítést jelentene.

V.

A reprezentatív módszer a népmozgalmi adatok fyüjtiésének és feldolgo- zásának ellenőrzésében is felhasználható; alkalmazásának jelentősége avitt kettős. Eg *részt meghatározhatjuk az eddig gyakorlati úton találomra vég—

zett ellenőrzések minimális számát, .s így esetleg munkacsökkentés végrehaj—

tása mellett is meggyőződhetünk arról, hogy ellenőrzéseink biztosítják a, kívánt pontosságot; másrészt megállapíthatjuk azokat a hibahatárokat. amelyekkel

a népmozgalmi eredmény—ek adott viszonyok között megadhatók.

bi:

A feldolgozás területén (( kérdőívek gépi feldolgozásra, 'aló előkészítése- kor (a kódoláskor) követhető el a legtöbb hiba. A hiba megállapításában és kiküszöböléseben (( reprezentatív módszer alkalmazása alig nélkülözhető Jelenleg (1 kódolás ellenőrzését (szuperkontroll) gyakorlati tapasztalaton alapuló mintavételi eljárásssat végzik. A kontroll abban áll, hogy az ellenőr zés során minden harmadik lap kódszáma'it átvizsg'gálják s minden helytelenül bejegyzett szám hibának számít. Ha a megye népmozgalmi kerdőíveiből kivá- lasztott minta k('idszámainak 19/0a hibás (az ún. selejtarányszám). az egész anyagot újra felülvizsgálják. Ellenkező esetben az anyag gépi feldolgozásra kerül.

A minta kiválasztása a mechanikus mintavétel szabályai szerint tőrh'enik.

A kiválasztott mintaesoport létszáma ezer lap közül 333. A p : 0701 (lo/mos) hibát j: 0 00771 hibahatárok között általánosíthatjuk (0 997 valószínűséggel) az 1000 népmozg,almi lapra. Ez annyit jelent hogy ha a mintaesoport lap—

jainak 10/0- ában hibát lehet találni akkor az 1000 lap () 0] j—_ 0 00771 részé ben, azaz 3—18 lapon lehet hiba

A hibahatár a gyakmlatban nagyobb a leírtnál, mert minden lap több kódszámot tartalmaz :; így minden egyes lapot egy-egy sorozat kódszámként lehet felfogni, tehát tulajdonképpen sorozatos mintavétellel állunk szemben.

A kiválasztott minták (sorozatok) száma azonban még így is elegendő, kevéssé tökéletes azonban a hiba arányszám (sel—ejtszázalek) meghatározása.

A népmozgalmi lapokon általában 10—20 kérdés szerepel, ennek meg- felelően egy lapon 40—50 kódszám is lehet. Ha a hibák egyenletesen oszla—

nak meg az egyes ismérvekre adott válaszok között, akkor a végzett kontroll elegendő. Előfordulhat azonban az is, hogy a kódolást végző (tarifálő) dolgozó általában helyesen állapítja meg a kódszámok'at, egy bizonyos ismérv kód- számait azonban sűrűn eltéveszti (lakóhely megállapítása, élve— vagy halva- sziilletés. stb.). Tegyük fel, hogy az ellenőrzött 333 lap 333 X 40 kódszám—

(13)

, 800 DR. ACSADI: A REPREzENTA'rIV MÓDSZER A NÉPMOZGALMI STATISZTIKAB'AN

jegyet tartalmaz és a tarifáló az egyik ismérv kódolását három esetből egy- 111

13 320

az lo/o-ot. A hibásan tarifáit ismérv tehát annak ellenére, hogy a szóban—

forgó kérdésnél Söo/o-os hibát tartalmaz —— keresztülfuthat a kontrollon, s már csak a gépi feldolgozás után, a táblák érdemi ellenőrzésénél küszöbölhető ki nagy idő- és munkatöblettel.

A hibás kódszámok feldolgozásának megakadályozására a szuperkontroll _ után egy ún. csúcsszuper vizsgálat is folyik. A csúcsszuper a szuperhez hasonló ellenőrzés, itt minden 15. lapot nézik újra át. Ez az ellenőrzés nem annyira mechanikus —— selejtarány sincs megállapítva -——, inkább tájékozódó jellegű. A kevésszámú mintavétellel dolgozó csúcsszuper így is gyakran tár fel sorozatos_hib§kat, ezt azonban nem a mintavétel szervezésével, hanem a dolgozók tervszerű és jó munkájával érik el (pl. egyes hibák gyakoribb jelent—

kezésekor lapsorozatokat néznek át, stb.). Helyes lenne azonban akár a szu- per, akár a csúcsszuper ellenőrzésénél a hibaszázalék ismérvekénti megálla—

pitásával szervezetten biztosítani azt, hogy sorozatos hibák ne maradhassanak a feldolgozásra kerülő anyagban.

A hibaszázalék ismérvekénti megállapítása nemcsak a hibák kiszűrésé- nek a teljességét, az eredmények pontosságát növelné, hanem hozzájárulna a népmozgalmi adatok hibahatárainak megállapításához is. A népmozgalmi mutatószámokat ugyanis többnyire ezrednyi, tízezrednyi pontosságra számit—

ják ki, ugyanakkor, amikor a gépi előkészítés nagyon pontos elvégzése is szer elvéti. A hibaszázalék : 0,0083, azaz 0,83%, vagyis nem éri el

bizonyos hibákkal jár. Az eredmények értékelésekor a reprezentatív módszer— "a "

segitségével fel lehetne mérni a feldolgozásból adódó —— esetleg egészen jelen- téktelen — hiba határait.

*

A népmozgalmi mutatószám pontosságát nemcsak a feldolgozáskor elkö—

vetett hibák befolyásolhatják, hanem a népmozgalmi lapok kitöltésekor az adatszolgáltatók által elkövetett hibák is. A területi ellenőrzések során kitű- nik, hogy a statisztikai lap adatai egyes esetekben eltérnek a bizonylat adatai—

tól, sőt az is előfordulhat, hogy a bizonylat sem felel meg teljesen a valóság—

nak. Mindezek a körülmények növelik a népmozgalmi adatok hibalmtárát.

A reprezentatív módszer felhasználásával arra is lehetőség nyílik, hogy az eddig ismeretlen számbavételi és feldolgozási hibák együttes nagyságát meg—

állapítsuk.

A népmozgalmi mutatószámok hibahatárainak megállapításakor külön—

leges szempontokra is ügyelni kell. így például az újszülöttek súlya, hosszú- sága olyan adat, amelyet mérési hibák jelentékenyen befolyásolhatnak. Gyak- ran felületes adatszolgáltatás is előfordul. Ilyen esetekben fontolóra kell azt is venni, hogy egy kismértékű, a területi reprezentáción alapuló próbafelvé—

tellel az országos adatok helyessége mennyire ellenőrizhető.

*

A reprezentáció alkalmazásának —— mint az érintett néhány kérdés mutatja —— a népmozgalmi statisztikai számbavétel, feldolgozás és ellenőrzés terén egyaránt sok lehetősége van. Az alkalmazási lehetőségek szélesebbkörű megvitatása jelentősen emelné az elméleti és gyakorlati statisztikai munka színvonalát.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Nem láttuk több sikerrel biztatónak jólelkű vagy ra- vasz munkáltatók gondoskodását munkásaik anyagi, erkölcsi, szellemi szükségleteiről. Ami a hűbériség korában sem volt

Legyen szabad reménylenünk (Waldapfel bizonyára velem tart), hogy ez a felfogás meg fog változni, De nagyon szükségesnek tar- tanám ehhez, hogy az Altalános Utasítások, melyhez

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A CLIL programban résztvevő pedagógusok szerepe és felelőssége azért is kiemelkedő, mert az egész oktatási-nevelési folyamatra kell koncentrálniuk, nem csupán az idegen

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a

„Én is annak idején, mikor pályakezdő korszakomban ide érkeztem az iskolába, úgy gondoltam, hogy nekem itten azzal kell foglalkoznom, hogy hogyan lehet egy jó disztichont