SZEMLE 1021
„A nemválaszolás elemzése a magyar munkaerő- felmérésben – hogyan csináljuk?” (Analysing nonresponse in the Hungarian Labour Force Survey – How shall we do it?) c. dolgozatnak, amelyet ennek a beszámolónak a szerzője mutatott be, az volt a célja, hogy egy meglehetősen kezdeti szakaszban levő mun- kánk megoldásához minél több ötletet, esetleg egy-két kritikai észrevételt kapjunk. Viszonylag kevés javas- lat, kommentár hangzott el, ezt azonban értelmezhet- jük úgy, hogy az előadásban és különösképpen az elő- zetes egyoldalas összefoglalóban vázolt elképzelések- kel és vizsgálati módszerekkel a résztvevők egyetér- tettek. A feladattal kapcsolatban Stephanie Freeth (Nagy-Britannia) megígérte, hogy eljuttat hozzánk egy dokumentációt, amely a statisztikai összekapcso- lás egy eredményes alkalmazását írja le.
Az egyik kiscsoportos vitaülésen a súlyozás sze- repe volt a téma a meghiúsulásából származó torzí- tás csökkentésében. E sorok írója felszólalásában ki- fejtette, hogy tulajdonképpen két különböző mód- szerről van szó, és ezek egymáshoz való viszonyát és esetleges együttes alkalmazásuk kérdését kellene tisztázni. A módszerek egyik csoportja a meghiúsu- lás – speciális esetben: válaszmegtagadás – valószí- nűségét modellezi a válaszmegtagadók bizonyos tu- lajdonságai alapján, és gyakorlatilag e valószínűsé- gek reciprokával súlyozza a válaszolókat, vagy mó- dosítja azok mintasúlyát. A módszerek másik cso- portja a kalibrálás. Mint később kiderült a „kalibrá- lás” többek számára ismeretlen fogalom volt. Itt nincs szó a meghiúsulás természetének vizsgálatáról, a mintából kimaradó egységeket külső, az esetek többségében demográfiai információ segítségével pótoljuk, éspedig rekordszinten (háztartás- statisztikai felvételekről van szó). Bár a vita résztve- vői között jelen voltak mind a kétféle módszer al- kalmazói, illetve kutatói (a kalibrálást Barry
Schouten és Jelke Bethlehem (Hollandia) képvisel- ték), érdemi vita nem alakult ki a kérdésben, pedig sok esetben indokolt lehet a kétféle módszer kombi- nálása. Valószínűleg nem sikerült kellőképpen fel- hívni a figyelmet a problémára.
A plenáris vitákon és a műhelyvitát bezáró megbeszélésen a résztvevők áttekintették az előadá- sok főbb gondolatait, és egy-egy résztvevő összegez- te a kiscsoportos viták főbb következtetéseit. Lars Lyberg (Svédország) értékelte az eddigi műhelyviták történetét és eredményeit, megemlítve, hogy ez utóbbiak közé sorolható mintegy 300 dolgozat és egy-két könyv is. A jövőről szólva, úgy vélekedett, hogy a nemválaszolási arány csökkentése helyett in- kább a nemválaszolásból adódó torzítás csökkenté- sére, vagy még inkább a felvétel teljes hibájának (Total Survey Error – TSE) csökkentésére kell töre- kedni. A záró vitán különös hangsúlyt kaptak egyes témakörök, mint az optimális tervezés és a minőség- biztosítás ún. legjobb módszerei. Ger Snijkers (Hol- landia) bejelentette, hogy a 15. nemzetközi műhely- vita a nemválaszolásról Maastricht-ban lesz, 2004.
augusztus 23. és 25. között, a Holland Statisztikai Hivatal és az Utrechti Egyetem szervezésében. A dolgozatokat és az előadás-kivonatokat ki lehet majd tenni a műhelyvita honlapjára, melynek címe:
http://nonresponse.stat.ucla.edu. Itt egyébként fontos információk találhatók az eddigi műhelyvitákról, ide- értve a legutóbbi rendezvény programját, valamint résztvevőinek címét is. Lars Lyberg javasolta, hogy a műhelyvita résztvevőinek a száma lehetőleg maradjon az ötvenes határ alatt. Minthogy a Trine M. Dale által bevezetett újítás (5 perces előadás, a dolgozat és az összefoglaló előzetes megküldése) jól bevált, a jövő- ben is alkalmazni fogják.
Mihályffy László
MAGYAR SZAKIRODALOM
HAJDÚ OTTÓ:
TÖBBVÁLTOZÓS STATISZTIKAI SZÁMÍTÁSOK (Statisztikai módszerek a társadalmi és gazdasági elemzésekben. Központi Statisztikai Hivatal. Budapest.
2003. 457 old.)
A bőséges ismeretanyagot tartalmazó könyv a statisztika alapozó módszereit jelentősen meghaladó eljárások gyűjteménye. A példaként bemutatott szá- mítások részletessége műfaját a tankönyvhöz közelí- ti, az elméleti tisztánlátást szolgáló világos érvelé- seknek, összefüggéseknek köszönhetően szak-
könyvként is használható. Ugyanakkor a fejezetek többségét követő példák és gyakorlati feladatok a példatár jelleget idézik fel.
A könyv a többváltozós statisztikai módszerek bemutatását tűzte ki célul, de az első rész, Tendenci- ák a szóródásban címmel, általános statisztikai meg- alapozást is ad. Ez a megalapozás nagyon fontos, hi- szen az általános statisztikát régebben tanult olvasó- nak az ismeretek felfrissítését, a naprakész tudással rendelkezőnek pedig az egységes jelölési és megkö- zelítési módot mutatja be. Fentiekből az is követke- zik, hogy e munkát azok forgathatják hatékonyan, akiknek előtanulmányaik vannak a standard általá-
SZEMLE 1022
nos statisztikai ismeretanyagban vagy matematikai statisztikai stúdiumokat végeztek. Ez a megállapítás nem jelenti azt, hogy a könyv – a szükséges statisz- tikai terminus technikusok tárgyalásával – nem ala- pozza meg a bemutatandó módszertant. A tömörség (például a becslés, illetve a hipotézisellenőrzés 4-4 oldal) csak a matematikai statisztika iránt igazán fo- gékonyak számára teszi lehetővé a könyv ismeret- anyagának előtanulmányok nélküli maradéktalan hasznosulását. A szerző segítséget is ad az olvasó- nak, és az előszóban megemlít olyan tankönyveket és szakkönyveket, amelyek segítségével a tárgyalt módszerek alkalmazásának szakmai megalapozása elvégezhető. Ezen kiemelt munkák mellett természe- tesen a nagyon gondosan szerkesztett irodalomjegy- zék is segít a témában alaposan tájékozódni kívá- nóknak.
A könyv didaktikailag kiforrott érett munka. Ér- ződik a szerző felsőoktatásban szerzett két évtizedes gyakorlata, az e témában korábban publikált művek megalkotásával szerzett tapasztalata. Minőségét az is garantálja, hogy lektorai: Tallos Péter kandidátus, tanszékvezető egyetemi tanár és Rappai Gábor kan- didátus, egyetemi docens voltak.
A szerző részletesen bemutatja a tárgyalt eljá- rások, algoritmusok elméletét, és számszakilag is nyomon követi a modellekkel nyert eredmények formálódását. Ezt azért teszi, mert a módszert értő és alkotó módon működtetni is kell annak ellenére, hogy a felhasználó számára elsősorban az eredmé- nyek interpretálása a fontos. Ezért lényeges az el- méleti felkészültség, ami természetesen eljárás- és példafüggő. Egyes esetekben a „fekete dobozként”
történő megközelítés is elegendő, más esetekben a hatékony modellezés elméleti ismereteket is meg- kíván.
A felhasználók számára segítség, hogy a legfej- lettebb szoftverek szinte szakértőrendszerként mű- ködnek, de mind az inputjuk, mind az outputjuk módszertani terminológiát használ. A tárgyalt feje- zetek egy része a magyar szakirodalomban – részle- tesen feldolgozva és példákkal illusztrálva – e mun- kában jelenik meg először. Ilyen például a korres- pondenciaanalízis egyszerű és többszörös változata, a boolean faktoranalízis, a blokk-klaszterezés, a polichotom logisztikus regresszió ordinális modell- jei, az egzakt logisztikus regresszió, illetve a lineáris strukturális egyenletek illeszkedésvizsgálatának át- fogó eszközrendszere.
Újszerű megvilágításban tárgyalja a szerző a fő- komponens-változó elméletét, amikor azokat a SVD-eljárás (Singular Value Decomposition) kere- tében tárgyalja. A szerző is jelzi, hogy ez az eljárás a hazai szakirodalomban mostohán van kezelve.
A módszerek tárgyalása egy sajátos, egyedi, variancia–kovariancia központú megközelítésben történik, ami a bemutatott módszereket jól ismerő kutatók számára is érdekessé teszi e munkát.
Olyan ismert módszerek kapcsán is újszerű tár- gyalási módot találunk, mint a lineárisregresszió- számítás. A mintaelemek jobb reprodukálását min- denekfelett favorizáló szemléletmóddal szemben az ésszerű modellkritériumoknak való megfeleltetést sem kezeli a szerző másodlagos szempontként.
Nagymértékben növeli e munka felhasználható- ságát az a körülmény, hogy a módszereket hármas megközelítésben ismerteti, illetve mutatja be. Elő- ször egy verbális leírás, majd a matematikai statisz- tikai jelölésrendszer és szimbólumok, végül a példa- illusztráció jelennek meg. Ez a matematika statiszti- kában kevésbé járatos felhasználó számára is lehető- vé teszi a problémafelismerést, azt hogy a megvála- szolandó kérdéskörre létezik hatásos modellezési le- hetőség, és a szakirodalom tanulmányozásával, szakértői segítségkéréssel jól használható válaszokat kaphat kérdéseire.
Az olvasóban némi hiányérzetet kelt, hogy ez a hármas megközelítés a későbbi fejezeteknél már nem valósul meg. A szerző ezt részben megmagya- rázza előszavában, ahol a módszerek fontosságuk, bonyolultságuk és alkalmazási gyakoriság szerinti differenciált csoportosításáról beszél.
A munka kiemelkedő erénye a kitűnő példa- gyűjtemény. A példák egy része egyszer alkalma- zott, illetve egyedi, míg más része más módszerhez is kapcsolódik, illetve egy problémakört visz tovább- fejlesztve végig. A példákat túlnyomórészt a min- dennapi életből meríti, ezért változatosak, sokszínű- ek, és nagyban elősegítik, hogy mindenki megértse az ismerni kívánt kérdéskörök természetét és alkal- mazásukat.
Mindenki autózik, mindenki telefonál, mindenki tisztában van a környezetszennyezés mérésének fon- tosságával, sokan érdeklődnek a labdarúgás iránt.
Könnyű bármelyik kiragadott példán bemutatni a sokváltozós módszereket. A 8.1-es gyakorló feladat az 1998-as világbajnokság 13 legeredményesebb labdarúgójára vonatkozóan az ún. „kanadai tábláza- ton” (rúgott gól 3 pont, gólpassz 1 pont) mért ered- ményesség alapján végez elemzéseket. A felületes szemlélő azt mondhatja, hogy a gólok, illetve gól- passzok jelentőségének összehasonlító elemzése (összevetés például a 2002. évi labdarugó világbaj- noksággal) egyszerű, viszonyszámos elemzéssel is megoldható. A legjobb 13, vagy a legalább 3 pontot elért labdarúgók körében a gólok, gólpasszok meg- oszlási és dinamikus viszonyszámos elemzése kielé- gítően jellemzi az eredményességhez való hozzájá-
SZEMLE 1023 rulást. Ez azonban több viszonyszám keletkezésével
jár, míg a javasolt többváltozós módszer hatékonyan tömöríti az információkat, kimutatva a két eredmé- nyességi faktor szerepét.
Valamennyi módszer alkalmazása előtt felme- rülhet a kérdés, hogy hasznosíthatók-e az eredmé- nyek és kinek értékesek a nyert információk. E prob- lémakör kapcsán is megszólalhat az ördög ügyvédje, hasznos információ-e a kapott eredmény. A gólpasz- szok jelentőségének növekedése az éllovasok eseté- ben a szervezett kombinatív szemléletű labdarúgást valószínűsíti, míg ennek háttérbe szorulása a defenzívebb, kontrajátékos, véletlen labdaszerzésen alapuló, illetve egyetlen sztárcsatárt kiszolgáló takti- kát. A 1998-as győztes (18 pontos 6 rúgott góllal), Suker csapata, azaz Horvátország sem jutott a döntő- ig éllovas góllövő szereplése ellenére sem. A labda- rúgás szakembereinek éppúgy, mint a labdarúgás iránt érdeklődőknek is fontos információkat adhat- nak tehát a fenti témakörben készült modellek ered- ményei.
Még egy ilyen leegyszerűsített probléma esetén is megmutatkozik a sokváltozós elemzési technika előnye – az eredményváltozót csak két tényező, kü- lön-külön determisztikus módon alakítja –, ezen előny még inkább megjelenik összetettebb problé- makör esetén.
A könyv szerkezete világos, áttekinthető: a négy részből álló munka 16 fejezetre tagolt, a fejezetek pedig változó számú kisebb alfejezetekből állnak.
Az I., már tárgyalt rész (mely 6 fejezetből áll), a Tendenciák a szóródásban címet viseli és a módszer- tani megalapozást szolgálja. A II. rész a 7–9. fejeze- teket tartalmazza. A szerző tárgyalja a nevezetes el- oszlások regressziós modelljeit, a klasszikus lineárisregresszió-számítást és az általános lineáris modellt is. A III. rész (10–12. fejezet) a klasszifiká- ciós módszereket gyűjti csokorba. Különösen ebben a részben ütközik ki a szerző felhasználói szemléle- tének sokoldalúsága. Bár közgazdász alapdiplomájú, és a felsőoktatásban szerzett tapasztalatainak megha- tározó részét az egyetemi szintű közgazdászképzés- ben szerezte, a módszerek kiválasztása és tárgyalása során nemcsak a gazdasági-ökonometriai preferen- ciarendszernek a szempontjait veszi figyelembe, ha- nem más tudományterületeknek, a legkülönbözőbb ágazatoknak és szinteknek is megfelelő ez a mód- szertani kínálat. Elsőként a logisztikus regressziót tárgyalja, majd a bayesi klasszifikációt. A fejezetet a K-középpontú klaszterezés ismertetése zárja.
A szerző különösen fontosnak ítéli a faktorana- lízis eszköztárát, ezért az utolsó, a IV., különösen kiérlelt, kiforrott részt (13–16. fejezet) ennek szente- li. Ebben a témakörben a szerzőnek színvonalas pub-
likációi születtek e könyv megjelenését megelőzően is. A 13. fejezetben a faktormodell általános ismerte- tése kapott helyet. A fejezet 14. számú alfejezete az exploratív faktoranalízis nevét viseli, amely három alapvető modellre bontható: komponensanalízis, kö- zös faktoranalízis, illetve az imageanalízis. Ez a fe- jezet nem a jelzett szempontrendszer szerint tagoló- dik, a szerző e három irányt felfűzi az ún. kanonikus faktorok elvére, bár a kifejtésnél áttételesen megje- lenik az említett klasszikus tagolódás. A következő fejezet a konfirmatív faktoranalízis címet viseli, majd ezt követi a Dichotom (boolean) faktoranalízis című záró fejezet.
A könyv igen didaktikusan, „Jelölések, szimbó- lumok” címszóval rendszerezi az általa használt ka- tegóriákat. Az előszó számos tanáccsal szolgál a ha- tékony felhasználáshoz. A szerző felhívja az olvasó figyelmét, hogy didaktikai okokból egyes számpél- dák alacsony elemszámú adatbázison készültek. A szükséges adatbázisméret változó és módszerfüggő, és a megfelelő nagyságú adatbázis a hatékony mo- dellezés előfeltétele.
A táblák és a grafikonok elsősorban a számító- gépes szoftveroutputok megjelenései, és így a fel- használót segítik a módszer alkalmazásnál, de az ügyes szerkesztői munka eredményeképpen jól bele- illenek a szöveg struktúrájába. A grafikus megjelení- tés nagyban segíti a megértést. A szerzőnek a sok- változós módszerek jellegéből adódóan csak korlá- tozott lehetőségei voltak a grafikus illusztrációra, hi- szen a vizsgált jelenségek, folyamatok több dimen- ziósak, így többdimenziós térben helyezendők el. A kézikönyvszerű használatot különösen segíti a jól szerkesztett tárgymutató. Az irodalomjegyzék is mu- tatja, hogy a szerző alapos kutatásokat végzett e könyv megírása érdekében, melynek értékét nagy- mértékben növeli az alapos, logikus szerkesztés, és az igényes nyomdai kivitelezés.
Fontos célja egy könyvismertetésnek, hogy a szerző kinek, milyen jelleggel ajánlja elolvasásra, felhasználásra a művet. A sokrétű felhasználhatóság lehetővé teszi, hogy különböző célcsoportoknak a kötet eltérő jellegű felhasználását javasoljam.
Hasznos olvasmány e mű valamennyi általános statisztikát oktatónak, általános statisztikai eszköz- rendszert felhasználó kutatónak. E körben teljes- körűen elvárható a felhasználói szintű ismeret a többváltozós statisztikai módszerek felsorolt eljárá- saiban. Alapműként javasolt nemcsak a könyvespol- con tartani, hanem olvasni is Hajdu Ottó munkáját.
Egyes tudományágak, a jogtudomány, a demográfia, a szociológia, a pszichológia – általában a biometria – bizonyos tárgyalt módszereket nagyobb, más mód- szereket kisebb súllyal vagy egyáltalán nem hasz-
SZEMLE 1024
nálnak fel a tárgyaltak közül. Az e területeken tevé- kenykedők számára kézikönyvként hasznosítható a mű. Hasonló felhasználás javasolható olyan, kevesek által művelt tudományágakban és szakterületeken is, mint a meteorológia, a geológia, a szeizmológia stb.
A tárgyalt módszerek széles köre és a tárgyalás mélysége nem teszi lehetővé, hogy e művet standard tananyagként a gazdasági felsőoktatásban oktassák.
Az általános statisztikában a matematikusok képzé- sében a matematikai statisztika iránt mélyebben ér- deklődőknek, az emelt szintű graduális és a poszt- graduális képzésben, a választható tárgyként oktató kurzusokon azonban a standard tárgyként történő felhasználás mindenképpen indokolt. Annál is in- kább, mert e mű jelentős része tananyagként már több felsőoktatási intézményben a múltban is hasz- nosult.
Számos olyan kutató és döntéshozó van, akik- nek munka- és tevékenységi területén e módszerek hasznosíthatók lennének, de nélkülözik hozzá a sta- tisztikai és matematikai előképzettséget, illetve a sta-
tisztikai programcsomagok kellő szintű ismeretét.
Számukra is értékes olvasmány e mű, hiszen a mód- szeralkalmazási lehetőségek verbális előadása és a színes, sokrétű mintapéldák elindíthatnak egy alkotó problémamegfogalmazást. Ezen kutatók és döntés- hozók ekkor segítséget kérhetnek intézetük, intéz- ményük, cégük hozzáértő szakembereitől, és egy szakértői csoport együttműködése hatékonyan meg- oldhatja a felmerülő problémát. Ha az intézményen, intézeten, cégen belül nincsenek meg a megfelelő tárgyi és személyi feltételek, akkor igénybe lehet venni az erre szakosodott szakemberek segítségét.
Ilyen esetekben a könyv megtanít kérdezni.
„Statisztikai módszerek a társadalmi és gazda- sági elemzésekben” – így szól a sorozat címe, mely- ben Hajdu Ottónak ez a könyve megjelent, és amely hasznos segítséget nyújt a sokrétű társadalmi és gaz- dasági elemzésekben.
Herman Sándor