VITA A STATISZTIKA MINŐSÉGÉRŐL Mit nyújthat a statisztikus felhasználóinak? – te-
szik fel a kérdést R. Platek és C.-E. Särndal (mind- ketten a Kanadai Statisztikai Hivatal tanácsadói) nagy port felkavaró tanulmányukban.1
A Journal of Official Statistics c. svéd folyóirat csaknem a teljes 2001. évi 1. számát, a napjaink hiva- talos statisztikai szolgálatának kereteit, de főként az adatok minőségét tárgyaló vitának szentelte. R. Platek és C.-E. Särndal bevezető tanulmányát 21 neves sta- tisztikus, 16 hozzászólásban közreadott kritikai meg- jegyzései, kiegészítései követik. (Comments 21–112.
old.) Az alapos vitát a tanulmány szerzőinek részle- tekbe menő összefoglaló válasza zárja le. (Platek, R. – Särndal, C.-E.: Rejoinder. 113–127. old.)
Az alaptanulmány szerzői bevezetőjükben hangsúlyozzák, hogy a statisztikai hivatalok, intéz- mények törekvése, hogy minél jobb minőségű ada- tokat szolgáltassanak. A minőségbiztosítás egyik eszköze az ún. komplex minőségbiztosítási rendszer (Total Quality Manegement – TQM).
A minőség fogalmát, tartalmát több nemzeti statisztikai szervezet definiálja, mint például a svéd (1994) és a kanadai (1998). Ezekhez hasonlóan fo- galmazza meg a hivatalos statisztika minőségfogal- mát E. Elvers és B. Rosén a Statisztikai tudomány enciklopédiája (1998) c. műben. Ebben öt fő terüle- tet emelnek ki: 1. a tartalmat, 2. a pontosságot, 3. az időszerűséget, 4. a koherenciát, ezen belül különösen az összehasonlíthatóságot, valamint 5. a hozzáfér- hetőséget és átláthatóságot.
A „minőség” fogalmára azonban nem sikerült egységesen és általánosan elfogadott definíciót adni;
bár a kanadai és a svéd megfogalmazás egyaránt a fel- használói igényekre, a felhasználók érdekeire, érintett- ségére helyezi a hangsúlyt. A felhasználói orientáció a TQM-ben is érvényesül. Az adatgyűjtés módszertana – a Kanadai Statisztikai Hivatal szerint – „…a gya- korlat összegyűjtése megtámogatva egy bizonyos el-
1 Platek, R.– Särndal, C.-E. (2001): Can a statistician deliver? Journal of Official Statistics, 17. évf. 1. sz. 1–20. old.
méleti és empirikus értékeléssel, melyek közül a szak- emberek speciális céljaiknak megfelelően választhat- nak”. A szerzők megjegyzik, hogy a legalább száz- éves tudományos törekvés ellenére, a hivatalos sta- tisztika mögötti elméleti háttér meglehetősen gyenge.
Különbség van ugyanis aközött, hogy a gyakorlat egy szilárd elméleten nyugszik-e, vagy pedig a bevált gyakorlat tapasztalatait gyűjtik össze. Ez utóbbi eset- ben ugyanis hiányzik a holisztikus szemlélet, hiányzik a gyakorlatot egységbe fogó közös elméleti keret. Le- het, hogy egy-egy bevált módszer, vagy eljárás mögött van külön-külön elmélet, de ezek nem állnak össze egységes egésszé. Ez a tény óriási terhet ró a hivatalos statisztikai szolgálatra.
Jónéhány országban elkészültek azok a kézi- könyvek, amelyek összefoglalják a legjobbnak tartott módszereket, a statisztikai gyakorlatot (például a Current Best Methods – CBM, „Jelenlegi Legjobb Módszerek” Svédországban, vagy a „Minőségi Út- mutató” Kanadában). Ezek sokszor hétköznapi nyel- ven íródnak, hogy ne csak az adott terület szakembe- rei, hanem a statisztikusok szélesebb köre számára is hasznosak legyenek. A minőségbiztosítás célja, hogy ne csak a mintavételi hibát csökkentse, hanem a fel- vétel teljes (mintavételi és nem mintavételi) hibáját is.
A szerzők a címben a „deliver” szót használják.
Talán kissé provokatívnak tűnik a választott szó- használat, de ezzel is ki szeretnék emelni a hivatalos statisztikusokkal szemben megfogalmazott azon
„fogyasztói” igényt, hogy a kívánt árut, vagyis az adatokat, nemcsak időben, hanem „fogyasztható”
formában, megfelelő minőségben kell „leszállítani”
a fogyasztónak. A felhasználók bízhatnak-e a minő- ségben, kaphatnak-e minőségi garanciát, amelyet bármely más termék esetében joggal várhatnak.
A szerzők arra keresik a választ, hogy miért tudnak a statisztikusok nehezen eleget tenni ennek a feladatnak. A cikk első része azzal foglalkozik, hogy a statisztikai végtermék számos közreműködő révén születik meg, akiknek egyenként is megvannak a maguk minőségi követelményei, nem is beszélve a
felhasználók sokaságának eltérő igényeiről. A cikk további része a mintavételi hiba és a minőség össze- függéseit feszegeti, majd pedig általánosabban tár- gyalja az adatfelvétel hibáit, sőt kitér az adatgyűjtés elméletének hiányosságaira is.
Ki a statisztikus? — teszik fel a kérdést a szer- zők a cikk 2. fejezetének címében. Álláspontjuk sze- rint mindenki, aki hozzájárul a statisztikai produk- tum létrejöttéhez, az elméleti kérdésekkel foglalkozó statisztikusoktól kezdve az informatikusokon át egé- szen a menedzserekig. A közreműködőknek kollek- tív felelősséget kell vállalniuk munkájuk eredmé- nyéért.
A 3. fejezet címét szintén kérdés formában fo- galmazták meg: Mi az adatminőség? A válaszuk az, hogy a minőség minden egyes statisztikus számára más-más, tekintet nélkül arra, hogy mi a szervezet hivatalos minőségfogalma, felfogása. Hiszen minden résztvevő a saját személyiségének, képzettségének, szakterületének, részfeladatának megfelelően érté- keli a minőséget. Teljesen más ugyanezen kérdésben a felhasználók nézőpontja. Számukra az a fontos, hogy: a) az eredmények, az adatok összehasonlítha- tók, illetve konzisztensek legyenek a más forrásból származó adatokkal, b), megfelelő időben férjenek hozzá az információhoz, c) tegyék lehetővé számuk- ra az összehasonlítást a korábbi időszakokra vonat- kozó adatokkal, s a mért változás hihető, megbízható legyen, d) el tudják fogadni a használt mérési mód- szereket, a nemválaszolások miatti pótlási és a többi alkalmazott statisztikai eljárást, valamint e) az ada- tok könnyen érthetők legyenek, és megfeleljenek a célnak. A felhasználók nézőpontja egybeeshet, vagy nagyon hasonló lehet, mint az adott terület szaksta- tisztikusáé, de bizonyára messze esik a módszertani felelős, vagy az informatikus álláspontjától.
Az utóbbi években egyre fontosabbá válik a mi- nőség esetében a felhasználói igények figyelembe vétele, és egyre inkább kitágul a statisztikai pontos- ságot hangsúlyozó minőségfogalom. A statisztikai pontosság fontos dolog, de ez számos tényezőtől függ, a felvétel megtervezésétől a kérdőív kialakítá- sán át egészen a mintavételi hiba kiszámításáig.
A cikk 4. fejezetében a szerzők felhívják a fi- gyelmet arra, hogy az adatgyűjtési folyamatnak az adatfelvétel komplex megtervezésén kell alapulnia.
Az adatgyűjtési folyamatnak meg kell felelnie az al- kalmazott tudománnyal szemben támasztott köve- telményeknek is. Vannak olyan felvételtervezési fel- adatok, amelyek nem mérhetők, s a felhasználók számára sem túl informatívak, de a felvétel sikere szempontjából nélkülözhetetlenek. Ilyen például a kérdezőbiztosok felkészültségének biztosítása, a képzés fontossága.
Az 5. fejezet az egyes műveletekhez kapcsolódó hiba fogalmával foglalkozik. A matematikai statisz- tikus, a módszertanos számára az adatfelvétel hibája lefordítható Ŷ – Y különbségére, ahol Ŷ az Y becsült, azaz publikált értéke. Logikáját tekintve a teljes hiba ugyanígy felírható minden egyes adatfelvételi lépés- re. Sajnos, amikor a statisztikusok pontosságról be- szélnek, akkor legtöbbször csak egyetlen hibára gondolnak, mégpedig a mintavételi hibára. Ez pedig egyszerűen leírható és számszerűsíthető valamilyen statisztikai mutatószámmal, legtöbbször a szórás- négyzettel, a varianciával. Ez azonban manapság a szűk értelemben vett „pontosság” mérése szem- pontjából is megkérdőjelezhető, hiszen az adatok feldolgozása során a hiányzó adatokat a statisztikus
„mesterséges”, imputált adatokkal pótolja.
A továbbiakban a szerzők arra hívják fel a fi- gyelmet, hogy a megbízhatóság, a pontosság szem- pontjából számos egyéb tényezőt is figyelembe kell venni, ilyenek a nemválaszolási sajátosságok, az imputáció, a súlyozás és átsúlyozás, a lefedettség, a felhasznált adminisztratív források, valamint a fel- használt regiszterek jellemzői. Ezeket az informáci- ókat szintén nyilvánosságra kell hozni, a felhaszná- lók tudtára kell adni.
Az adatfelvételek elméleti kérdései tehát a szűk mintavételi nézőpont feladásával sokasodnak. A szerző a „kisterületi becslés” nem megfelelően mér- hető pontosságát és az imputáció hatásából adódó variancia mérésének szükségességét hozza fel pél- daként.
A 8. fejezet címében a szerzők újra kérdést in- téznek az olvasóhoz, de leginkább önmagukhoz: le- hetséges-e az adatfelvételi folyamat során összeadó- dó teljes hiba számbavétele, a teljes hiba modelljé- nek megalkotása, vagy ez csak megvalósíthatatlan álom? Az adatfelvételi hiba modellje egységes el- méleti keretbe rendezné a felvételek egyes lépései- hez, tevékenységeihez kapcsolódó hibákat. Ez a koncepció, elméleti gyökereit tekintve, M.
Hansennek és társainak nevéhez fűződik, és a hatva- nas évek elejéig nyúlik vissza. Miközben Hansenék a mintavételi hibát pontosították, jöttek rá arra, hogy a nemmintavételi hiba legalább olyan fontos, ha nem fontosabb, mint a mintavételből származó. Sajnos a gondolat továbbfejlesztése, modellé formálása elma- radt. Plateknek és G. B. Graynek sikerült az adatfel- vétel komplex kezelése révén három hibatípust – a mintavételi hibát, a válaszolási arány hibáját és az imputációs hibát – számszerűsíteni, de a modell túl bonyolult lett. Többen hangot adtak pesszimizmu- suknak egy ilyen integrált rendszer kialakíthatóságát illetően. Napjainkban a hiba számszerűsítése helyett inkább a minőség nem statisztikai jellegű aspektu
saira helyeződik a hangsúly. Mindezek ellenére a szerzők rendkívül fontosnak tartanák a teljes hiba modelljét, hiszen ezáltal egyrészt minden egyes hi- bafajta relatív súlya, fontossága meghatározható lenne, s ily módon a felvétel pontosságát is maxima- lizálni lehetne, másrészt a felhasználók számára is egzakt módon megadható lenne a megbízhatóság.
A 9. fejezetben arra keresik a szerzők a választ, hogy válságban van-e az adatfelvétel elmélete és gyakorlata? Miért van az, hogy a nemzeti statisztikai hivatalok a bevált gyakorlatok összegyűjtésére vál- lalkoznak anélkül, hogy egy egységes elméleti ke- retbe helyeznék a felgyűlt tudást? A tudományfejlő- dés klasszikus modellje szerint csak abban az eset- ben beszélhetünk fejlődésről, ha a tudás egymásra épül; a kumulatív tudás az ideális tudás. A szerzők szerint nem vezet eredményre „… a különböző meg- figyelésekre különböző elmélet” teória. A hatékony tudományos megoldásnak a tények nem egy meg- határozott kis területére, hanem a lehető legszéle- sebb körére kell érvényesnek lennie. Manapság kü- lönböző „trükköket” alkalmazunk a „korrekció” so- rán és ezek szükségszerűen együtt járnak más manő- verekkel, s e folyamat létrehozhat, eredményezhet gyenge, ahogy a szerzők nevezik, „erőtlen” elméle- teket is. Ez legtöbbször kielégíti az elméleti szakem- berek óhaját is, hiszen megtalálják a saját szűkebb problémájukra is „a megoldást”, nem is beszélve a gyakorlati statisztikusokról, akiknek csak gondot jelentene, hogy egy átfogó elméletből levezessék a gyakorlatra érvényes irányelveket. A szerzők nem adják fel a reményt, abban bíznak, hogy a nagy telje- sítményű számítógépek korszakában eljön az idő a minőség fogalmának komplex modellszerű kiter- jesztésére és mérésére.
A cikk végkövetkeztetéseként Platek és Särndal leszögezi, hogy a nemzeti statisztikai hivatalok sokat tesznek a jó minőség eléréséért, melyben elsősorban a jól képzett statisztikusaik egyéni hozzájárulására építenek. Ugyanakkor az egyes statisztikus számára ez egyre nehezebb az adatgyűjtési folyamat szerte- ágazó komplex körülményei között. A cikk ezek kö- zül emel ki néhányat.
1. A minőség sokdimenziós fogalom. Az egyes statisztikusok számára meglehetősen nehéz dolog tekintetbe venni e sokoldalú minőségfogalom min- den egyes komponensét. 2. Az adatgyűjtés mód- szertana a bevált gyakorlatok együttese egy átfogó, koherens elmélet nélkül. Ha lenne ilyen, a statiszti- kusok segítségére lenne abban, hogy igazolni tudják a napi gyakorlatot és biztonságot és megerősítést kapjanak ehhez. A nagy, átfogó elmélet azonban vá- rat magára. 3. A felhasználók megbízhatóságot vár- nak el az adatgyűjtés teljes menetére kiterjedően. A
statisztikai szervezetek publikálnak is erre vonatko- zó számszerű adatokat, de ezek a felvételi folyamat meghatározott körére terjednek ki. A statisztikusok nem szolgálnak világos és átfogó üzenettel arra vo- natkozóan, hogy mi a felvétel egészének megbízha- tósági szintje. Ez az információ nemcsak a felhasz- náló, hanem a felvétel lebonyolítója számára is ha- szonnal járna. 4. A statisztikai hiba esetében a variancia túl nagy hangsúlyt kap, miközben a többi hibatípusról alig esik szó. 5. A teljes hiba modellje egy csodálatos elképzelés (álom) a teljes felvételi pontosság szisztematikus számbavételére, és egyben a minőség egyik kulcskérdése is. Bár a statisztikusok ilyen ígéretekkel nem kecsegtetik a felhasználókat, mutatkozik némi remény a nemmintavételi hibák némelyikének értékelésére is.
Ismertetésünk második részében a Hozzászólá- sokat (Comments) vesszük szemügyre. Ezek eredeti sorrendjét követve, néhány fontos és aktuális gon- dolatot emelünk ki vázlatosan, a teljesség igénye nélkül.
B. A. Bailar szerint a minőség nyilvánvalóan többdimenziós fogalom. Az elméleti statisztikusok hajlamosak arra, hogy a mintavételi hibára össz- pontosítsanak. A Total Survey Error (TSE) miszti- kus fogalom, amit több tényező határoz meg és nincs átfogó modellje. Meglehetősen részletes ismereteink vannak például a válaszok pontosságát meghatározó körülményekről. Ugyanakkor az egész felvételi hiba nem mindig azonosítható a pontossággal.
Igazuk van a szerzőknek abban – írja Bailar –, hogy a statisztikusok mind ez ideig nem dolgozták ki a M. Hansen és kollégái által elképzelt teljes felvételi hiba modelljét. Nem sok történt az 1950–1960-as évek óta atekintetben, hogy a felhasználókat tájékoztassák a becslések bizonytalanságának két fontos komponensé- ről, a mintavételi hiba mellett, a nemmintavételi hiba forrásáról, természetéről, nagyságáról.
E problémakör nagyon összetett. Függ:
– a különböző adatgyűjtési módszerektől, – az erőforrások allokációjának optimalizálásától, – a nem mintavételi hiba különböző forrásainak keze- lésétől,
– a begyűjtött adatok minőségétől és a becslési eljárá- sok jóságától stb.
P. P. Biemer véleménye szerint szükség van a reprezentatív felvételek Total Error Concept-jének átgondolására.
A. Désrosières és társai azt mondják, hogy a minőséget meghatározó öt tényező közül az idősze- rűség, az elérhetőség másik dimenziója, egymásra merőleges fogalmak, mint a pontosság vagy a fon- tosság, azaz a koherencia.
Ezek közül vannak, amelyek elsősorban a fel- használók igényeinek kielégítésétől függnek. A sta- tisztikusok leginkább a pontosság kérdéseivel fog- lalkoznak, amit magát nagyon sok tényező befolyá- sol (például kötelező vagy önkéntes adatgyűjtés, nemválaszolás stb.).
E. Elvers és L. Nordberg szerint a minőség megítélése függ a felhasználóktól, akik saját szem- pontjaiktól függően más-más tényezőt tartanak fon- tosnak. Sok felhasználó pedig tényként fogadja el azt, amit kap, mert nem szereti a bizonytalanságot. A pontosság megítélése a statisztikus segítsége nélkül lehetetlen. Szeretik a statisztikusok azokat a ténye- zőket előtérbe helyezni, amelyek jól leírhatók, ér- telmezhetők (például időszerűség–pontosság).
Az természetes, hogy mindenki a legjobb minő- ségű adatokat akarja. Ez megegyezik a statisztikusok törekvésével is.
A munka a tervezéssel kezdődik és a végrehaj- tással folytatódik. Ez utóbbihoz kapcsolódik a TQM (Total Quality Management) vagy CQI (Continous Quality Improvement) koncepciója, amely a folya- mat lehető legjobb minőségű végrehajtására törek- szik.
Nem kétséges, hogy a statisztikai hivatalok el- fogadható adatokat tudnak létrehozni, azonban az eredmény mégsem kielégítő, mivel (a költségek nagysága miatt) nem kielégítő a nemmintavételi hiba mérése, vagy éppen nem alakult ki e kérdések keze- lésének megfelelő „kultúrája”.
I. Fellegi hozzászólását a tanulmány címének értelmezésével kezdi. Szerinte a „statisztikus” szó nyilvánvalóan a hivatalos statisztikusokra vonatko- zik, de a „deliver” szó értelmezése többféle lehet. Az ő értelmezésében a szerzők azt a minőségre vonat- koztatják. Ehhez kapcsolva megjegyzi, hogy a hiva- talos statisztika „életben maradása” (survival) függ az adatszolgáltatók iránti figyelmességtől, valamint az információk hitelességétől, melynek a pontosság csak egyik, bár fontos része.
Hozzászólásában kifejti, hogy a válaszolók (megkérdezettek) szempontjából nagyon fontos, hogy a hivatalos statisztika biztosítsa az egyedi adatok bizalmas kezelését, a megbízhatóság garanci- áit, valamint az adatszolgáltatással kapcsolatos ter- hek körültekintő felmérését. Ez utóbbi nem egysze- rűen az adatszolgáltatói terhek minimálisra csök- kentését jelenti.
A hitelességet illetően kifejti, hogy nem egysze- rűen a pontosságról van szó, hanem az átláthatóság- ról, a politikamentes tárgyilagosságról, valamint az adatok fontosságáról.
Nem lehet azonosnak tekinteni az egyes statisz- tikák, valamint az egész statisztikai szolgálat minő-
ségét. Ugyanakkor a minőség függ a kapott adatok helyességétől, valamint a feldolgozás milyenségétől.
Ezek azonban nem függetlenek egymástól. Hozzá- szólásában részletezi a minőség sokdimenziós fo- galmát és annak nyomon követését, mérését a hiva- talos statisztika keretei között. De arról sem szabad elfeledkezni, hogy mindezek megvalósítása megle- hetősen költséges – hívja fel a figyelmet.
Végül megjegyzi, hogy a szerzők leginkább a pontosság problémáival foglalkoztak. Egyéb tekin- tetben inkább a pesszimizmus érződik tanulmányuk- ból. Ha azonban a hivatali munka minden részletére kellő figyelmet fordítunk, akkor sokkal optimistáb- bak lehetünk. Hibás lenne azonban a megvalósítást (perfomance) a pontossággal azonosítani. Sokféle megoldás lehetséges, azonban az egész statisztika megítélése legalább olyan sokrétű és összetett, mint a „deliver” szó értelmezése.
R. M. Groves és N. A. Mathiowetz hozzászólá- sukban az elmúlt 15 év szakirodalmában tárgyalt té- mákra, eredményekre hívják fel a figyelmet. Megálla- pítják, hogy a statisztikai módszertan fejlesztése során a tanulmányban tárgyalt valamennyi kérdés hosszabb- rövidebb ideje vita tárgya. A teljes felvételi hiba mo- dellje azonban kétségtelen csak részlegesen feltárt, márpedig a hivatalos statisztikai munka multidiszciplináris jellegű. Mindemellett arra is te- kintettel kell lenni, hogy vannak ún. „design-based” és
„model-based” becslések, következtetések.
Jelentősen fejlődött az emberi magatartásformák és kognitív módszerek elmélete, ráirányult a figye- lem a statisztikai hiba csökkentésének fontosságára, ami itt a válaszadási torzulást és szórást jelenti. Ezek a fejlesztések párhuzamosak a valószínűség- számítás és matematikai statisztika fejlesztésével.
Az évről évre fejlődő módszerek eredményei azon- ban nem kellően érzékelhetők a statisztikai publiká- ciókban.
D. Holt megállapítja, hogy a minőség a felvétel végrehajtásának minden lépésével összefügg, s va- lóban jó lenne, ha átfogó elmélet szabályozná az egész folyamatot. Számolni kell azonban azzal, hogy ha valamilyen tekintetben optimális a terv egy másik változó tekintetében már nem lesz szükségképpen az. A nemválaszolás kezelésének van koherens el- mélete, de a teljes felvételi hiba sokrétű fogalma nem kezelhető elvek alapján.
A minőség fogalmát sokszor leegyszerűsítve, a felvételi adatokra korlátozzák, ami azt sugallja, hogy ha a kérdőíveken található adatok mind pontosak lennének, akkor teljes lenne a siker. Ez azonban nincs így, mert számolni kell a klaszterhatással, a rotációval. Mindez különösen fontos, ha (viszonylag kicsi) változásokat kell vizsgálni, értékelni.
Végül, egyetért azzal, hogy a komprehenzív rendszer irányába kell haladni és nem az egyetlen üdvözítő elméletet keresni. A professzionális meg- ítélés az, amiről nem szabad lemondani.
A portugál M. Madalenos idézi azt a véleményt, miszerint a minőség technikai kérdés. Azt jelzi, hogy egy termék megfelel-e a felhasználó igényeinek (ISO 8402). A TQM biztosíthatja, hogy egy hivatal kiválóan eleget tegyen a kívánalmaknak. Mégis se- gíteni, orientálni kell a felhasználókat, akik megle- hetősen különböző felkészültségűek.
A portugál statisztikai hivatalban megfelelően képzett minőségellenőrök működnek, akik ellenőrzik a végrehajtás szabályosságát, szükség esetén javas- latokat tesznek, dokumentálják és közreadják ta- pasztalataikat, észrevételeiket. Az EUROSTAT köz- reműködésével alakult ki olyan minőségi figyelő- rendszer, amely lehetővé teszi a folyamat különböző fázisaiban előforduló hibák feltárását. (Válaszadási arány, kérdőívtervezés, editálás stb.)
A portugál hivatalban is erős hangsúlyt kapott a mintavételi hiba mellett a nemmintavételi hiba elemzése.
A minőség kulcsfontosságú a statisztikai hiva- talok megítélése szempontjából, de az imázs nem azonosítható magával a minőséggel.
P. Martín-Guzmán szerint a spanyol statisztikai hivatal számára a minőség mélyen összefügg a hite- lességgel, nem szabad azonban túlhangsúlyozni.
Ugyanakkor a felhasználók igényeik függvényében a minőség (pontosság, időszerűség stb.) egyes ténye- zőit nagyon eltérően értékelhetik.
A statisztikai hivatalon belül a minőséget meg- határozó folyamatokat kellőképpen elemezni, fo- lyamatosan követni, és fáradságot nem kímélve, a különböző területeket egyeztetve folyamatosan fej- leszteni kell. Ha nincs is elérhető közelségben a fel- vételi hiba átfogó modellje, sok tennivaló van az egyes részek minőségi fejlesztése területén.
Ph. Nanopoulos szerint, a tanulmány nagy ér- deme, hogy átfogó vitát nyitott a hivatalos statiszti- kai tevékenységről. A XXI. század elején azért is nagyon aktuális ez, mert a statisztika számára nagy kihívást jelent az információs társadalom és a globalizáció. A nemzeti statisztikai szolgálatok ki- lépnek országuk keretei közül, ami számos új sta- tisztikai és koncepcionális probléma megoldását igényli.
A hozzászólás, érthetően, az EUROSTAT gya- korlatából és problémáiból kiindulva közelíti meg a fontos kérdéseket. Sok tekintetben kritizálják a szer- zők amerikai gondolkodásának, tapasztalatainak túl- súlyát, amely nem mindig jellemző az európai gya- korlatra. Szembeállítja a „total theory”-t a Current
Best Methods-szal (CBM). Ez lényegében arra utal, hogy vajon a jó gyakorlati megoldások vagy azok elméleti modelljei a fontosak.
A felvételi hiba komplexitását az is jelzi, hogy az EU 15 nemzeti statisztikai rendszerét össze kell hangolni. Számos példa mutatja, hogy az egyes or- szágok gyakorlata, különböző megközelítést igényel.
Erősen kétségesnek tartja egy általános európai mo- dell előállíthatóságát. (Mi ez a modell? Kinek és mi- ért van rá szüksége? Lehetséges-e egyáltalán? Ha igen kinek kell megvalósítania?)
Nanopoulos vitatkozik a statisztikus definíció- jával, túl tágnak, általánosnak tekinti azt, de a fel- használók szerepével, és annak értelmezéseivel sem ért teljesen egyet. Szerinte a felhasználó elsősorban az intézménybe helyezi bizalmát, s nem az egyes adatokat vitatja. Felveti azt a kérdést is, hogy vajon egy ISO-féle megközelítés eléggé hitelessé teszi-e a hivatalos statisztikai adatokat.
Megemlíti, hogy az EUROSTAT és számos hi- vatal a TQM elveit követi, de az is igaz, hogy sziszte- matikus és átfogó vita még nem alakult ki. A tanul- mány ebbe az irányba teszi meg az első lépéseket.
Meddig lehet elmenni a nemzetközi statisztikák minőségét illetően? Mind az ENSZ, mind az EU, és az ECE számos irányelvet, útmutatást dolgozott ki, amelyek célja a jó és összehasonlítható adatok elő- állítása. A hozzászólás felteszi a kérdést: vajon ezek az irányelvek kompatibilisek-e a szerzők vélemé- nyével, illetve mennyiben felelnek meg a „Total Quality” ajánlásoknak.
Végül a hozzászóló megjegyzi, hogy nem telje- sen érthető számára az „integrated theory” iránti többször emlegetett igény, amikor a szerzők nem fejtették ki, mit is értenek ezen. Érezhető bizonyos elutasítás a CBM-mel szemben, azonban nem szabad arról sem megfeledkezni, hogy számos fejlődő or- szág örömmel élne az általa nyújtott lehetőségekkel.
Ambivalensnek tekinthető az is, hogy a statisz- tikusok munkájának bizonyos hiányosságait emle- getve egyúttal eredményességüket hangsúlyozzák.
A hozzászólás négy konkrét megállapítás vitatá- sával fejeződik be, eszerint:
– nem jellemző, hogy az EU-ban csak a mintavételi hi- bára helyezik a hangsúlyt;
– kérdéses, hogy az EU-ban a nemválaszolást megfe- lelő súllyal kezelik-e;
– túlzó az imputálás gyakorlatának beállítása;
– nem mellékes a mintavételi keret lefedési hiba vizs- gálata sem az EU-ban.
A statisztika iránti sokféle igény képviselőit ne- héz azonosítani. Fontos kérdés azonban, milyen szintű adatokat igényelnek. Miért nem elégségesek a statisz- tikai publikációk? Miért kellenek mikroadatok?
A modern információs technológia (IT) mellett növekszik az igény az adatbázisok, illetve az ala- csony aggregáltságú adatok iránt, amelyeket a fel- használók maguk kívánnak kedvük szerint feldol- gozni. Ez olyan helyzetet teremthet, hogy a sta- tisztikai publikációk a katalógus szerepét fogják játszani.
A minőséggel kapcsolatban S. Nordbotten felte- szi a kérdést, van-e lehetőség arra, hogy a mintavétel statisztikus szakértőinek érdeklődését ráirányítsuk a nemmintavételi hibákra. Ezen belül az egyes hibák vizsgálata nagyon különböző nehézségű, kérdés, hogy a nemzeti statisztikai intézetek preferenciái megegyeznek-e a felhasználókéval.
A minőségi mutatók viszonylagos hiánya abból is következhet, hogy a hivatalok meglehetős mono- polhelyzetben vannak. Ha nincs verseny, akkor a mi- nőség másodlagos szerepet játszik. Vannak azonban versenyhelyzetek is, mint például a munkaügyi sta- tisztika helyzete Finnországban (a Központi Statiszti- kai Hivatal és a Munkaügyi Minisztérium között).
E. Pahkinen fontos kérdésnek tartja azt, hogy a nemmintavételi hiba lényegében nem véletlen (tor- zítás), mint például a nemválaszolás.
J. S. McCarthy a jól kidolgozott elméleti háttér- rel becsült mintavételi hiba mellett a nemmintavételi hibát tárgyalva kijelenti, hogy valószínűleg soha nem lesz olyan elméleti modell, amely lehetővé teszi annak (és így total survey error-nak) is a mérését.
Másokhoz hasonlóan megjegyzi, hogy egyes részte- rületeken jelentős eredmények születtek. Szerinte is igaz az, hogy amíg a hivatalok számos információt közölnek a minőségről, a felhasználók nem tanúsíta- nak nagy érdeklődést iránta. Elfogadják, hogy a hi- vatalok megfelelő adatokat szolgáltatnak.
A nagyszámú hozzászólásokat R. Platek és C.- E. Särndal viszontválasza (Rejoinder) követi, akik köszönetet mondva a hozzászólók gondos munkájá- ért, hasznos észrevételeiért, kritikai megjegyzéseiért, előrebocsátják, nem tudnak minden felvetett kérdés- re részletesen válaszolni, de mindenképpen hasznos- nak tartják, hogy ily módon lehetőség adódott széles körű, részletekbe menő eszmecserére.
Mindenek előtt a tanulmány címének jelentését tisztázzák. A „deliver” szó (nyújt, teljesít) szerintük itt azt jelenti, hogy „beváltja ígéretét”. Arról van szó ugyanis, hogy az a statisztikusok feladata, hogy a közvéleményt megfelelő információkkal lássák el.
Ezt a feladatot azonban a statisztikusok meglehető- sen eltérő módon értelmezik.
A hozzászólások különböző felfogásokat képvi- selnek, abban azonban, egységesek, hogy senki sem gondolja, a statisztika akadályoktól és kátyúktól mentes széles, sima út.
A szerzők tanulmányának célja az volt, hogy objektív megállapításokat rögzítsen. Nem kíván sem pesszimista, sem optimista lenni. Inkább bizonyos önelemzés, önértékelés, sőt talán önkritika a célja, hogy ezzel is felkészítsen az informatikai társada- lom, a globalizáció, az új gazdaság kihívásaira.
A statisztikus fogalmát válaszukban tágan ér- telmezik. Olyan személyeket értenek rajta, akik egy statisztikai intézmény keretei között hivatásszerűen foglalkoznak a statisztika előállításával, akár mint módszertannal foglalkozók, közgazdászok, informa- tikusok, akár mint szakelemzők, felvételeket végre- hajtók stb. Így a tanulmány címét módosítva azt is lehetne mondani, úgy is lehetne értelmezni, hogy képes-e egy statisztikai intézmény megfelelő telje- sítményre. (Can a statistical agency deliver?) Ez azonban ugyancsak vitára ad okot, hiszen a hozzá- szólásokból az is kitűnik, hogy egyes személyek, il- letve azok intézményeinek megítélése eltérő lehet.
A tanulmány megjelenésének időzítése nem véletlen. A globalizáció, az információs társadalom mind újabb kihívásokkal lep meg. Fel kell vetni azt a kérdést, hogy a különböző területek (ágazatok, régi- ók, társadalmi folyamatok stb.) információs igénye megfelelően kielégíthető-e.
A továbbiakban a válasz a nemzeti statisztikai hivatalok tevékenységével kapcsolatosan felvetett kérdéseket három téma köré csoportosítja. (A tudo- mányos és szakmai felfogás, az elmélet szerepe, a minőség koncepciója.)
Egy statisztikai hivatal kétoldalú: a statisztiká- kat egyrészt begyűjti másrészt kibocsátja és publi- kálja. A bizalmat, a hitelességet, a tekintélyt mindkét irányban biztosítani kell.
Az adatgyűjtés, a terepmunka jó megszervezé- sének, végrehajtásának hiányosságai nemcsak a megtagadásokat, a válaszadási hiba nagyságát növe- lik, hanem kihatnak az intézmény tekintélyére is.
A közeljövőt illetően kardinális kérdés, hogy kik lesznek a felhasználók, s milyen elérhetőséget (például Internet) kell számukra biztosítani.
A bizalom megtartásában nagyon fontos, hogy biztosított legyen a statisztikai adatok gondos és feltételek nélküli bizalmas kezelése. Ugyanakkor fontos az is, hogy a felhasználók bízzanak a statisz- tikai adatok korrektségében, pontosságában. Az azonban, hogy mi is a pontosság, illetve ez milyen kapcsolatban van a hitelességgel, nem határozható meg egyértelműen. Ez országonként eltérő lehet, a rendelkezésre álló erőforrások korlátai miatt.
Az elméleti megfontolások segítik a munkát, de az elmélet értékelése nagyon bizonytalan. Az, hogy nincs a felvételek végrehajtásainak átfogó elméleti modellje, az nem azt jelenti, hogy nincs egységes
matematikai modell, hiszen a matematika nem sokat tud kezdeni e problémák nagy részével. Nem csak matematikai megfontolásokról van szó. A minőség sokdimenziós fogalom, melynek alapjait a kutatók tu- dományos megfontolások segítségével hozzák létre.
Egyes vélemények szerint az elmúlt 40 év során nem sok haladás történt a Hansen-féle Total Survey Error (TSE-) modell kidolgozásában. A TSE több tényező eredője s ez egyrészt segített felismerni a hatásokat, másrészt viszont azok mérési módszerei nem alakultak ki, csak fontos részeredmények van- nak.
E modellek létrehozását többen, több okból lehe- tetlennek tartják. A valószínűség és a valószínű hiba fogalmaival ebben az esetben nem lehet operálni.
Talán előrevisz, ha megkülönböztetjük a speci- fikus (helyi) és az átfogó (komprehenzív) elméletet.
Az első csak egy vagy néhány folyamat vizsgálatára irányul, míg a második az egész folyamat áttekinté- sére törekszik, amire viszont nincs megoldás. El kell fogadni, hogy csak a részek vizsgálatára, fejlesztésé- re szorítkozunk (például mintavételi hiba, kérdőív- tervezés stb.).
Az alapkérdés a pontosság. Annak ellenére azonban, hogy az elméleti alapok gyengék, lehet, hogy a felhasználók céljaira megfelelnek. A pontos- ságot két irányból közelíthetjük meg. Az egyik ér- telmezhető úgy, mint a megfigyelt és tényleges érték közti különbség. A megfigyelt adat számos munka- fázis elvégzésének eredménye. A statisztikusok arra törekednek, hogy az egész felvételt a lehető legjob- ban hajtsák végre. A becslések elkészítése során a különböző elkerülhetetlen hiányosságokat (például nemválaszolás) igyekezzenek valamilyen módon kompenzálni.
A másik megközelítés, hogy a felvétel előké- szítése során, majd folyamatában lépésről lépésre a legpontosabb adatokat kell begyűjteni.
Ez a kétféle megközelítés különböző szakértő- ket igényel. Az egyikhez a megkérdezettek viselke- dését vizsgáló szakemberekre (behavioral survey methodologists) van szükség, míg a másik témakör- höz a felvételi technikákat értő statisztikusokra (statistical survey methodologists).
A csoportosítás illusztrálható úgy is, hogy az egyik csoportba a hibát csökkenteni igyekvők (reducers) tartoznak, míg a másikba a korrekciókat végzők (adjusters). (A nemválaszolás kezelése, kül- ső adatforrások felhasználása, modellezés stb.).
A mintavételi és nemmintavételi hiba termino- lógia népszerű és elterjedt. Ez azonban meghaladott felfogás. Talán jobb az a megkülönböztetés, hogy a hibák egy része a felvétel végrehajtása előtt keletke- zik, míg másik része a végrehajtása után.
A gyakorlatban az elmondottak egyrészt úgy valósulnak meg, hogy a statisztikusok az adatokban tapasztalható szórást, kölcsönhatást stb. elemzik. A másik esetben pedig az a feladat, hogy a kérdéseket jól fogalmazzák meg, segítsék a pontos válaszok lét- rehozását.
A fejtegetések hátterében vitathatatlan tudomá- nyos megfontolások, eredmények vannak. Ezeknek a matematikai statisztikai része a legismertebb. A fel- vételek, minták tervezése számos matematikai mód- szereket felhasználó általánosításokhoz vezetett, mint például az ún. design-based és a model-based következtetések (inference) módszere. A mintavételi hibát nehezen elemző statisztikusok esetében felme- rül az a gyanú, hogy talán sohasem hallottak nemválaszolásról.
A vélemények megoszlanak. Vannak, akik elé- gedettek a jelenlegi helyzettel és/vagy nem látnak alternatívát. De vannak olyanok is, akik további ku- tatásokat tartanak szükségesnek a pontosságot (accuracy) illetően. Új felfogásra, célokra van szük- ség. A jelenlegi gyakorlat, ami felsorolja a hibafor- rásokat beleértve a mintavételi hibát is, a jövőben nem lesz kielégítő.
Az új modell abból indulhat ki, hogy a pontos- ság miként jelenik meg az adatgyűjtés előtt és után.
A mintavételi hibával számolni kell bármilyen rep- rezentatív felvételről legyen is szó. Ez valójában el- különíthető a többi hibaforrástól, amelyek nem füg- getlenek az adott felvételtől. De országonként is különbözők a felvételek. A nemzetközi szakiroda- lomból sok hasznos tapasztalat adódik arról, hogy melyek a hibák fő forrásai s azok külön-külön mi- ként csökkenthetők.
A tanulmány másik fontos kérdése, a statiszti- kák minőségének értelmezése, mérése. A minőség- nek többféle felfogása létezik, de annak egyértelmű definícióját megalkotni, elfogadtatni véget nem érő folyamatnak látszik. Mindenképpen összetevőkből áll, s más-más lehet a tartalma attól függően, hogy a statisztikai szolgálat egészéről, vagy egy-egy konk- rét statisztikáról van-e szó.
A TQM alkalmazása egyféle garanciája lehet a minőségnek, ami úgy tűnik, egyre jobban felváltja a pontosság (valamivel szűkebb) fogalmát. Ez az ösz- szetett fogalom különbözik egy tipikus tudományos modelltől.
A vita során kifejezésre jutott az is, hogy a sta- tisztikai hivatalok kialakult gyakorlata, tekintélye sok országban (még ha a fejlettségtől, anyagi lehetősé- gektől függően különbözőképpen is) önmagában bi- zonyos normát jelent. A minőség követelményeit kül- ső (a felhasználói) szereplőktől függően (ami szintén nagyon különböző lehet) kellene meghatározni.
A vitában megkülönböztethető a tudományos megközelítés és a TQM-felfogás. A TQM- megközelítésben a „fogyasztó kielégítése” a meg- határozó szempont. Az is igaz, hogy általános igény, hogy a jövőben a statisztikai hivatalok több és jobb minőségű adatokat gyorsabban hozzanak létre a költségek csökkentésével egyidejűleg.
A szerzők a tudományos megközelítés mellett foglalnak állást a jövőt illető kutatások tekintetében.
Végül meg kell említeni a vitában többek által említett kérdések közül hármat a minőséggel kap- csolatban.
1. A vitában részt vevők különböző fontosságot tulaj- donítottak a minőséget meghatározó 6-7 tényezőnek. Meg- oszlottak a vélemények arról is, hogy miként mérjük ezeket.
Legtöbben a pontosságot hangsúlyozták. Viszonylag keve- sen voltak azok, akik minden tényező vizsgálatának fontos- ságot tulajdonítottak.
2. A Current Best Methods (CBM) kézikönyvek, ame- lyek a lehető legjobb megoldásokat ajánlják, segítenek. A
„legjobb” (best) szót azonban értelmezni kell, hiszen anyagi és egyéb korlátok miatt nem lehet például a mintát tetszés szerint növelni. Korlátozottak a lehetőségek a meghiúsulá- sok kezelését illetően is.
3. A minőség komponensei között a fontosság (relevance) érdekes megközelítést kapott. Ez ugyanis elvá- laszthatatlan a pontosságtól. Egy statisztikai adatnak nem csak pontosnak, fontosnak is kell lennie, hogy használható információ legyen. Figyelni kell az igényeket. A rendelke- zésre álló adatok sokszor nem azt mérik amire szükség van.
A szakstatisztikus számára a fontosság az elsődleges, míg módszertani értelemben a statisztikus a pontosságot vizs- gálja.
A válasz két fontos részt tartalmaz: az elmélettel foglalkozót (5. pont) és a minőségfogalom (quality concept) tárgyalását (6. pont). A cikk megírásakor nem gondoltak ilyen csoportosításra, de a 14 hozzá- szólás után több szempontból ez látszott célszerű- nek. A munkának mennie kell, s e tekintetben a TQM-módszer segítséget adhat. A tudományos megközelítés is lényeges, még akkor is, ha vannak olyanok, akik az egységes elméleti modellre irá- nyuló törekvéseket nem tartják fontosnak. Annyi azonban bizonyos, hogy az előbb vagy utóbb meg- születő átfogó elméleti modelleket mindenki öröm- mel üdvözölné.
Havasi Éva – Marton Ádám
VÁLTOZÓ GAZDASÁG ÉS TÁRSADALOM – GLOBALIZÁCIÓ – STATISZTIKA C. KONFERENCIA A Magyar Statisztikai Társaság 2001. évi konfe-
renciáját Balatonöszödön tartotta október 10–11-én.
A Human – Jövő 2000 Egészségmegőrző és Oktatási Kht. által üzemeltetett Balaton-parti komplexum ideális helyszín volt a konferencia lebonyolítására, a konferenciaterem minden igényt kielégített.
A szervezőbizottság új lebonyolítási formát, az egyre inkább terjedő moderátoros formát választotta.
Ennek lényege, hogy a moderátor az előadásokat vitára késztető, gondolatébresztő módon vezeti be, illetve kommentálja. A négy moderátor a négy kü- lönböző ülés eltérő témájára és előadói személyisé- geire reagálva eltérő stílusban, formában, de egy- aránt sikeresen végezte tevékenységét.
Az első ülés témája a nemzetközi tapasztalatok kiértékelése volt, és a levezető elnök dr. Soós Lő- rinc, az MST elnöke, a KSH elnökhelyettese volt.
Két nagytekintélyű nemzetközi statisztikus tartott előadást.
A legrangosabb statisztikusnak minősíthető dr.
Marcel van der Broecke, a Nemzetközi Statisztikai Intézet igazgatója, „Globalizáció és statisztika válto- zó gazdasági és társadalmi környezetben” címmel tartotta meg angol nyelvű előadását. (A konferencián a kommunikációt kitűnő angol–magyar, illetve ma- gyar–angol szinkrontolmácsolás segítette.) Az elő-
adó kifejtette, hogy intézete, az ISI több mint a hi- vatalos statisztikusok intézete, szolgálja a statisztikai témájú kutatásokat, a vállalati, intézményi szinten folyó statisztikai tevékenységet is. A globalizáció kapcsán kifejtette, hogy a felületes szemlélő számára a globalizáció megítélése kapcsán két szembenálló, egymással nem is kommunikáló tábor létezik: a globalizációt mozgató befolyásos személyekből álló establishment és az ezt kiszolgáló intézményrend- szer, valamint az antiglobalista tüntetéseken résztve- vő ellenzők. Véleménye szerint a kép sokkal ár- nyaltabb, a globalizációs folyamatokban sok az el- lentmondás, a kritikát megfogalmazók sok megálla- pítása jogos és megszívlelendő. A konferencia nem hivatalos jelmondatának a Nyitrai Ferencné profesz- szor asszony által idézett Keit Muhakamizi ugandai politikus mondata: „A statisztika a politika csinálói- nak a szeme” tekinthető. Ilyen megközelítésben az előadás az „Összetett szem” jelzőt hangsúlyozta, az összetett statisztikai tevékenységre utalva.
A következő előadó és nemzetközi statisztikai szaktekintély Paolo Garonna, az ENSZ Statisztikai főosztályának vezetője volt. Előadásának címe:
„Gazdasági–társadalmi változások követése: az ENSZ statisztikai kihívásai”. Az előadó véleménye szerint a statisztikai tevékenység számára a legna-