A STATISZTIKA ÁLTALÁNOS ELMÉLETE És MÓDSZERTANÁ MATEMATIKAI STATISZTIKA
NETER, J. *— WAKSBERG, J.:
VÁLASZHIBÁK A KIADÁSOKRA VONATKOZÓ ADATOK GYÚJTÉSÉNÉL,
HÁZTARTÁSI INTERJÚVAL.
KISÉRLETI TANULMÁNY
a_(Response errors in collection of expendi—
tures lata by household inter-views. An exper- imental study.) Technical Paper No. 11. U. S.
Bureau of the Census. Washington, 1965.
xv —I— 107 p. '
,Jelen beszámoló a lakások fenntar—
tására, tatarozására, kiegészítésére és át—
alakítására fordított költségekre vonat—
kozó, a Census Bureau Építésstatisztikai
osztálya által 1960 óta folytatott rend—
szeres negyedévi adatgyűjtések (az ún.
SORAR program) válaszhibáival foglal—
kozik. A vizsgált típusú építkezési költ—
ségek az Egyesült Államokban összeg—
szerűen jelentősek, a háztartások össz- kiadásainak viszonylag nagy részét teszik ki. Megbízható statisztikai adatok az
1960 előtti évekre azonban gyakorla—
tilag mégsem állnak rendelkezésre és az 1960—ban megindult statisztikai meg—
figyelés adatainak megbízhatóságával
kapcsolatosan is számos probléma merültfel.
A háztartások kiadásainak statisztikai
megfigyelése a megbízhatóság szempont—jából világszerte a statisztikai adatgyűj—
tések egyik problematikus fejezete. En—
nek ellenére a megfigyelések eredményei—
nek pontosságával (a nem mintavételi jellegű hibák, torzítások vizsgálatával) csak a legutóbbi évek szakirodalma kez—
dett intenzívebben foglalkozni. Igaz, az '
ilyen minőségellenőrzési vizsgálatok szá—ma még ma sem túl nagy, az eredmé—
nyek gyakran ellentmondásosak és a ki—
sérletek az ismérvek szempontjából leg—
több esetben ad hoc jellegűek, azonban
már az eddigi kísérletek is jelentős segit—
séget nyújtottak a kiadások megfigyelé-
seinek megszerzésével, végrehajtásával, akérdések! kidolgozásával és- az adatok
értékelésével kapcsolatos technikai kér—
dések tisztázásanoz. Igy korabban rész—
letesen tanulmanyoztak már az adatszol—
gáltatók által vezetett naplók, valamint a tObbszöri kikérdezés alapján megxigyelt fogyasztási kiadások adatainak (relatív és abszolút) pontosságát, a mintába ver—
buvált adatszolgáltatók idő előtti lemor—
zsolódásanak (és egyéb ún. ,,panel—vesz—
teségek") torzításait, a huzamosabb meg—
figyelés (részvétel a panelben) hatásait az adatszolgáltatás minOségére és az adat-—
szolgáltatók viselkedésére (az ún. ,,kon—
dicionális effektusok"—at), a kiadások be—
vallásának memóriahibákból származó el-
maradását, valamint a kiadások időpont—
jának hibás bevallásait. Ez utóbbi vonat—
kozásban elsősorban a visszaemlékezési periódus (azaz azon időnek, amelyben realizált kiadásokat összeírják az adott
felvételnél) hosszának hatásai az adatok
minőségére és a teleszkóp—effektus (ten—' denciák az adatszolgáltatókn'ál, ra kiadá—sok időpontjának a ténylegesnél korábbi
vagy későbbi időszakra való kitolása)
állottak a figyelem középpontjában. Egy sor tanulmány foglalkozott a háztartás egyes tagjaitól (a háztartás fejétől, a fele—ségtől stb.) kapott információk értéké- vel, a kérdések megfogalmazásának ha-
tásaival az adatok minőségére stb. A fel—sorolt kérdések vizsgálatai azonban a leg—
több felvételnél csak esetleges jellegűek voltak, sajnos korábban nem merült fel e problémák szisztematikus áttekintésé—
nek a minőségellenőrzési eljárások komp—
lex próbájának szükségessége, amely le—
hetővé tette volna az addig egymástól izoláltan kezelt nem mintavételi jellegű torzító hibák együttes hatásainak tanul—
mányozását.
A jelen kísérletnél, amely ugyanazon
háztartás többszöri (maximálisan '3, hóff
napi visszaemlékezési periódusú) szemé-4
lyes kikérdezésén alapult, 6 lehetséges
nem mintavételi jellegű hibaíorrás komp——
STATISZ'I'IKAI IRODALMI FIGYELO
1039
lex vizsgálatára került sor. Ennek során
az egy- és háromhónapos visszaemlé—
kezési periódusok alkalmazása, a kiadá- sok időpontjának teleszkópozása, a kü- lönböző háztartástagok (a háztartás feje,
ennek felesége, a férj, feleség együtt ésvégül bármely felnőtt háztartástag) kije- lölése az összeírás adatszolgáltatójaként, a mintabeli háztartások többszöri össze- írása, a felvilágosítási időszak (az a teljes időszak, amelyre vonatkozóan a kérdések
bevallását kérik, és amely nem feltétle—nül esik egybe a bevallási -— visszaemlé- kezési ——- periódussal) hossza és végül a
kérdések típusa, mint hibaforrás szere—
pelt a legfontosabb tisztázandó problé- mák listáján.
A vizsgálat véletlen minták összeírásá—
nak eredményein alapult (a népszámlá—
lási minőségellenőrzési munkálatoknál oly
jól bevált lajstromos ellenőrzés módsze—rét időhiányra hivatkozva nem alkal—
mazták), ezek egésze pedig az Egyesült
Államok 1—4 lakásegység tulajdonjogá—
val rendelkező állampolgárait reprezen—
tálta. (Ez a népességcsoport 1960—ban a
lakások összes átalakitási és javítási költ—
ségeinek mintegy 70 százalékát fedezte.)
A teleszkóp— —effektus tanulmányozásá—
hoz a korlátos és nem korlátos vissza—
emlékezés technikáját egyaránt kipró—
bálták. (Az előbbinél nincs lehetőség a kiadások hibás időpontjának ellenőrzé—
sére, mig az utóbbinál, amely egy ház—
tartás második vagy további összeírása—
kor realizálható csak, a számlálóbiztos ismerteti az adatszolgáltatóval az előző
interjú alkalmával bevallott adatokat és
csak azután tesz— fel kérdéseket az idő—közben eszközölt kiadásokról.) Ennek során négy különböző típusú eljárással dolgoztak: nem korlátos visszaemléke- zés egy—, illetve hathónapos felvilágosí—
tási időszakkal, valamint korlátos vissza- emlékezés egy— illetVe háromhónapos felvilágosítási időszakkal. A háztartáson belül a legjobb adatszolgáltató kijelö-
léséhez az összeírás során négyféle ki—sérletet végeztek, amelyekben az adat- szolgáltató rendre a háztartás feje, a fele—- ség, a háztartás feje és a feleség együtte—
sen valamint a háztartás bármely felnőtt tagja volt.
A vizsgálatnál egy háztartás négyszeri
összeírásának ciklusával dolgoztak rotá-ciós'émával, azaz az egyes hónapokban részben" új háztartásokat Választottak a mintába és" befejezett ciklusú háztartáso- kat iktattak ki a mintából. -
A minta egyes paneljei összesen 300
háztartást magábanfoglaló 50 területi
szegmentből állanak, amelyeket 70 elsőd—leges mintavételi egység fix keretéből
választottak ki. Minden hónap elején ?.
új panel anyagát vonták be a megfigye—
lésbe (egyik egyhónapos, a másik hat- hónapos felvilágosítási időszakkal, nem korlátos visszaemlékezési eljárással), majd
háromszori, havonként megismétlődő kor-látos visszaemlékezéses interjú után ki—
estek a mintából. Ily módon minden
hónap elején általában egyszerre 12 panel anyagát írták össze és a vizsgálat a ISO-ik panel megfigyelésével zárult. Mindenpanelen belül 20—20—20—40 arányban
szerepeltek háztartások a legjobb adat—szolgáltató kiválasztásához szükséges 4—
féle említett eljárás kipróbálásához. Min—
den számlálóbiztos az összes típusú kí—
sérletben részt vett. A vizsgálat eredmé—
nyeinek elemzése (hányados—becslés al—
kalmazásával számolt) standard hibáinak
összehasonlításával történt.
A kiadvány részletesen foglalkozik a vizsgálat több eredményeivel. Többek között megállapítható, hogy a teleszkóp—
effektus különösen a nagyobb összegű kiadásoknál jelentkezik, például a nem korlátos egyhónapos visszaemlékezéses felvételnél a 100 dollárnál drágább mun—
kálatok 55 százalékkal többnek mutat—
koztak, mint a megfelelő korlátos vissza-
emlékezéses felvételnél, a bevallott mun—kálatok időpontjának nagyfokú nettó el-
tolódása következtében. A minta nagy—
sága nem tette lehetővé a háztartás leg- jobb adatszolgáltatójának kiválasztását,
bár a kiadvány megjegyzi, hogy fino—
mabb technikával esetleg szignifikáns különbségeket lehetett volna kimutatni a különböző adatszolgáltatók válaszainak minőségében.
A minőségellenőrzési vizsgálat eredmé—
nyeképpen jelentős módosításokat esz—
közöltek a SORAR technikájában (a minta elemszámát növelték, a negyedévi
megfigyelések mellett kisebb mintával
havi megfigyeléseket is folytatnak, csakkorlátos visszaemlékezési időszak adatai—
val dolgoznak tovább stb.) és 18 pontból álló programot jelöltek meg a (kérdések
szövegezése és a teleszkóp—effektus kap—csolataival, a visszaemlékezési időszak
hatásosabb korlátozási eljárásaival, a
megfigyelések végrehajtásával többcélú mintavételi eljárás keretében, a kondicio—nális—effektusok és az összeírások száma
közötti kapcsolatokkal stb. összefüggő kérdések tisztázására irányuló) további
kutatások számára.A kiadvány közli a minőségellenőrzési vizsgálat 'kérdőíveit, legfontosabb eredj
ményeit és a kérdéskörre vonatkozó (68 munkára kiterjedő) bibliográfiát.A válaszhibák komplex és körűl-
tekintő vizsgálatát igen precízen és rész—
1040
STATISZTIKAI IRODAM FIGYELUletesen ismertető kiadvány, amellett, hogy ismételten felhívja a ,figyelmet a hibák okozta nagy torzításokra és ezek vizsgá—
latainak fontosságára, hasznos elméleti
és gyakorlati segítséget nyújt a háztar—tások kiadásainak statisztikai megfigye—
lését tervező és ilyen vizsgálatok ered—
ményeit felhasználó szakemberek szá—
mára.
(Ism.: Tekse Kálmán)
*
JORGENSON, DALE W.:
GAZDASÁGI IDÖSOROK SZEZONALIS K ! IGAZfTÁSA
(Minimum variance, linear, unbiased season- al adjustment of economic time series) (Journal of the American statistical Asso-
ciation. 1964. szept. 681—724. p.)
A tanulmány célja, hogy a statisztikai irodalomban már régen kialakult és a gyakorlatban is alkalmazott módszerek eredményeit felhasználva egy új, statisz—
tikai, illetve valószínűségszámitási szem- pontból Vizsgálja meg a szezonalitás kér- dését, s ennek alapján új számítási mód—
szert nyújtson.
Közgazdászok és statisztikusok meg—
egyeznek abban, hogy gazdasági idősorok két determináló tényezőt (trend és
szezon) és egy véletlen tényezőt foglal—
nak magukban. Ezek szerint, ha vala—
mely idősort a determináló tényezők
függvényében vizsgálunk (1 egyenletes modellt állítunk fel), akkor világossáválik, hogy a komponensek megállapí—
tása becslési probléma. Ez a becslési eljárás az általános statisztikai modellek
becslésének módszertanán alapul, mivela modell változói valószínűségi változók, melyeket statisztikai idősorok reprezen—
tálnak.
Az idősort alakító különböző tényezők közötti kapcsolatot additivnak feltéte—
lezve, az egyenletet a következő formá- ban írhatjuk:
:d—l—s—i—e
ahol:
?l— az idősor,
d— a trendtényező,
s— a szezonális tényező, s— a véletlen tényező.
A véletlen tényezőről feltételezzük, hogy várható értéke nulla. Ezek után a determináló tényezőket felírjuk a vál—
tozók és a paraméterek lineáris kombi- nációjaként.
*A szezonális tényező figyelembevétele:
s : S a'
ahol:
arr a változó értékeit reprezentáló egységmatrix, melynek trendje megegyezik az idények (hónapok vagy negyedévek) számával
a'—-— a szezonális paraméterek vektoraA nem szezonális (trend) tényezőt két—
féleképpen vehetjük figyelembe.
a) Az első eljárás szerint előbb kiszűr- '
jük a trendet, s csak utána becsüljük meg a szezonális paramétereket.A trendtényező kiküszöbölését az ere—'—
deti sor egy bizonyos lineáris transz—
formációjával végezzük. Feltételezve, hogy ez a transzformáció mozgó átlagolás, és a mozgó átlag súlyait L matrix tartal—- mazza, a trendtényező kiküszöbölését a
következő reláció jelöli:Ld:0
b) A másik módszer a trendtényező
szimultán, a szezontényező' becslésévelegyidőben történő megközelítése.
Ebben az esetben, ha a trendválto'zó értékeit a D matrix, paramétereit pedig a övektor jelenti, a trendtényezőt adó
lineáris kombinációt a következőképpen írhatjuk:d : Dö
Jorgensen rámutat arra, hogy a kétféle
eljárás ekvivalens. Valamely idősor sze—zonális számításainál a modell felállítá- sánál el kell dönteni, hogy az avagya'b módszert fogjuk-e alkalmazni a trend—
tényező figyelembevételénél, s ennek
megfelelően L mátrixot vagy a D mat—rixot kell előállítanunk.
Az említett matrixok előállítása az egész számítási menet legfontosabb pont—
ja. A lényeg egy —— az n elemű euklideszi térben végzett —— lineáris transzformáció, amely az L matrix sorait, illetve a D
matrix oszlopait jelentő orthogonális vek—torokat szolgáltatja.
Az előbbiekben elmondottak szerint a modell egyenletének felírása, s így a becslés is kétféleképpen történhet.
a/ LyzL(Dö—1—Sa'-i-e)zLScr—i—Le
Ahonnan az Aitken által kidolgozott
általános becslési módszer szerint a sze—zontényező paraméterének a legkisebb
szóráson alapuló torzítatlan' esztimátora (ő- ) a következő:
a- : [S'L'(LL')*'1LS]'1S'L' (LE)—11.31