• Nem Talált Eredményt

Hajdu Ottó: Többváltozós statisztikai számítások

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Hajdu Ottó: Többváltozós statisztikai számítások"

Copied!
4
0
0

Teljes szövegt

(1)

SZEMLE 1021

„A nemválaszolás elemzése a magyar munkaerő- felmérésben – hogyan csináljuk?” (Analysing nonresponse in the Hungarian Labour Force Survey – How shall we do it?) c. dolgozatnak, amelyet ennek a beszámolónak a szerzője mutatott be, az volt a célja, hogy egy meglehetősen kezdeti szakaszban levő mun- kánk megoldásához minél több ötletet, esetleg egy-két kritikai észrevételt kapjunk. Viszonylag kevés javas- lat, kommentár hangzott el, ezt azonban értelmezhet- jük úgy, hogy az előadásban és különösképpen az elő- zetes egyoldalas összefoglalóban vázolt elképzelések- kel és vizsgálati módszerekkel a résztvevők egyetér- tettek. A feladattal kapcsolatban Stephanie Freeth (Nagy-Britannia) megígérte, hogy eljuttat hozzánk egy dokumentációt, amely a statisztikai összekapcso- lás egy eredményes alkalmazását írja le.

Az egyik kiscsoportos vitaülésen a súlyozás sze- repe volt a téma a meghiúsulásából származó torzí- tás csökkentésében. E sorok írója felszólalásában ki- fejtette, hogy tulajdonképpen két különböző mód- szerről van szó, és ezek egymáshoz való viszonyát és esetleges együttes alkalmazásuk kérdését kellene tisztázni. A módszerek egyik csoportja a meghiúsu- lás – speciális esetben: válaszmegtagadás – valószí- nűségét modellezi a válaszmegtagadók bizonyos tu- lajdonságai alapján, és gyakorlatilag e valószínűsé- gek reciprokával súlyozza a válaszolókat, vagy mó- dosítja azok mintasúlyát. A módszerek másik cso- portja a kalibrálás. Mint később kiderült a „kalibrá- lás” többek számára ismeretlen fogalom volt. Itt nincs szó a meghiúsulás természetének vizsgálatáról, a mintából kimaradó egységeket külső, az esetek többségében demográfiai információ segítségével pótoljuk, éspedig rekordszinten (háztartás- statisztikai felvételekről van szó). Bár a vita résztve- vői között jelen voltak mind a kétféle módszer al- kalmazói, illetve kutatói (a kalibrálást Barry

Schouten és Jelke Bethlehem (Hollandia) képvisel- ték), érdemi vita nem alakult ki a kérdésben, pedig sok esetben indokolt lehet a kétféle módszer kombi- nálása. Valószínűleg nem sikerült kellőképpen fel- hívni a figyelmet a problémára.

A plenáris vitákon és a műhelyvitát bezáró megbeszélésen a résztvevők áttekintették az előadá- sok főbb gondolatait, és egy-egy résztvevő összegez- te a kiscsoportos viták főbb következtetéseit. Lars Lyberg (Svédország) értékelte az eddigi műhelyviták történetét és eredményeit, megemlítve, hogy ez utóbbiak közé sorolható mintegy 300 dolgozat és egy-két könyv is. A jövőről szólva, úgy vélekedett, hogy a nemválaszolási arány csökkentése helyett in- kább a nemválaszolásból adódó torzítás csökkenté- sére, vagy még inkább a felvétel teljes hibájának (Total Survey Error – TSE) csökkentésére kell töre- kedni. A záró vitán különös hangsúlyt kaptak egyes témakörök, mint az optimális tervezés és a minőség- biztosítás ún. legjobb módszerei. Ger Snijkers (Hol- landia) bejelentette, hogy a 15. nemzetközi műhely- vita a nemválaszolásról Maastricht-ban lesz, 2004.

augusztus 23. és 25. között, a Holland Statisztikai Hivatal és az Utrechti Egyetem szervezésében. A dolgozatokat és az előadás-kivonatokat ki lehet majd tenni a műhelyvita honlapjára, melynek címe:

http://nonresponse.stat.ucla.edu. Itt egyébként fontos információk találhatók az eddigi műhelyvitákról, ide- értve a legutóbbi rendezvény programját, valamint résztvevőinek címét is. Lars Lyberg javasolta, hogy a műhelyvita résztvevőinek a száma lehetőleg maradjon az ötvenes határ alatt. Minthogy a Trine M. Dale által bevezetett újítás (5 perces előadás, a dolgozat és az összefoglaló előzetes megküldése) jól bevált, a jövő- ben is alkalmazni fogják.

Mihályffy László

MAGYAR SZAKIRODALOM

HAJDÚ OTTÓ:

TÖBBVÁLTOZÓS STATISZTIKAI SZÁMÍTÁSOK (Statisztikai módszerek a társadalmi és gazdasági elemzésekben. Központi Statisztikai Hivatal. Budapest.

2003. 457 old.)

A bőséges ismeretanyagot tartalmazó könyv a statisztika alapozó módszereit jelentősen meghaladó eljárások gyűjteménye. A példaként bemutatott szá- mítások részletessége műfaját a tankönyvhöz közelí- ti, az elméleti tisztánlátást szolgáló világos érvelé- seknek, összefüggéseknek köszönhetően szak-

könyvként is használható. Ugyanakkor a fejezetek többségét követő példák és gyakorlati feladatok a példatár jelleget idézik fel.

A könyv a többváltozós statisztikai módszerek bemutatását tűzte ki célul, de az első rész, Tendenci- ák a szóródásban címmel, általános statisztikai meg- alapozást is ad. Ez a megalapozás nagyon fontos, hi- szen az általános statisztikát régebben tanult olvasó- nak az ismeretek felfrissítését, a naprakész tudással rendelkezőnek pedig az egységes jelölési és megkö- zelítési módot mutatja be. Fentiekből az is követke- zik, hogy e munkát azok forgathatják hatékonyan, akiknek előtanulmányaik vannak a standard általá-

(2)

SZEMLE 1022

nos statisztikai ismeretanyagban vagy matematikai statisztikai stúdiumokat végeztek. Ez a megállapítás nem jelenti azt, hogy a könyv – a szükséges statisz- tikai terminus technikusok tárgyalásával – nem ala- pozza meg a bemutatandó módszertant. A tömörség (például a becslés, illetve a hipotézisellenőrzés 4-4 oldal) csak a matematikai statisztika iránt igazán fo- gékonyak számára teszi lehetővé a könyv ismeret- anyagának előtanulmányok nélküli maradéktalan hasznosulását. A szerző segítséget is ad az olvasó- nak, és az előszóban megemlít olyan tankönyveket és szakkönyveket, amelyek segítségével a tárgyalt módszerek alkalmazásának szakmai megalapozása elvégezhető. Ezen kiemelt munkák mellett természe- tesen a nagyon gondosan szerkesztett irodalomjegy- zék is segít a témában alaposan tájékozódni kívá- nóknak.

A könyv didaktikailag kiforrott érett munka. Ér- ződik a szerző felsőoktatásban szerzett két évtizedes gyakorlata, az e témában korábban publikált művek megalkotásával szerzett tapasztalata. Minőségét az is garantálja, hogy lektorai: Tallos Péter kandidátus, tanszékvezető egyetemi tanár és Rappai Gábor kan- didátus, egyetemi docens voltak.

A szerző részletesen bemutatja a tárgyalt eljá- rások, algoritmusok elméletét, és számszakilag is nyomon követi a modellekkel nyert eredmények formálódását. Ezt azért teszi, mert a módszert értő és alkotó módon működtetni is kell annak ellenére, hogy a felhasználó számára elsősorban az eredmé- nyek interpretálása a fontos. Ezért lényeges az el- méleti felkészültség, ami természetesen eljárás- és példafüggő. Egyes esetekben a „fekete dobozként”

történő megközelítés is elegendő, más esetekben a hatékony modellezés elméleti ismereteket is meg- kíván.

A felhasználók számára segítség, hogy a legfej- lettebb szoftverek szinte szakértőrendszerként mű- ködnek, de mind az inputjuk, mind az outputjuk módszertani terminológiát használ. A tárgyalt feje- zetek egy része a magyar szakirodalomban – részle- tesen feldolgozva és példákkal illusztrálva – e mun- kában jelenik meg először. Ilyen például a korres- pondenciaanalízis egyszerű és többszörös változata, a boolean faktoranalízis, a blokk-klaszterezés, a polichotom logisztikus regresszió ordinális modell- jei, az egzakt logisztikus regresszió, illetve a lineáris strukturális egyenletek illeszkedésvizsgálatának át- fogó eszközrendszere.

Újszerű megvilágításban tárgyalja a szerző a fő- komponens-változó elméletét, amikor azokat a SVD-eljárás (Singular Value Decomposition) kere- tében tárgyalja. A szerző is jelzi, hogy ez az eljárás a hazai szakirodalomban mostohán van kezelve.

A módszerek tárgyalása egy sajátos, egyedi, variancia–kovariancia központú megközelítésben történik, ami a bemutatott módszereket jól ismerő kutatók számára is érdekessé teszi e munkát.

Olyan ismert módszerek kapcsán is újszerű tár- gyalási módot találunk, mint a lineárisregresszió- számítás. A mintaelemek jobb reprodukálását min- denekfelett favorizáló szemléletmóddal szemben az ésszerű modellkritériumoknak való megfeleltetést sem kezeli a szerző másodlagos szempontként.

Nagymértékben növeli e munka felhasználható- ságát az a körülmény, hogy a módszereket hármas megközelítésben ismerteti, illetve mutatja be. Elő- ször egy verbális leírás, majd a matematikai statisz- tikai jelölésrendszer és szimbólumok, végül a példa- illusztráció jelennek meg. Ez a matematika statiszti- kában kevésbé járatos felhasználó számára is lehető- vé teszi a problémafelismerést, azt hogy a megvála- szolandó kérdéskörre létezik hatásos modellezési le- hetőség, és a szakirodalom tanulmányozásával, szakértői segítségkéréssel jól használható válaszokat kaphat kérdéseire.

Az olvasóban némi hiányérzetet kelt, hogy ez a hármas megközelítés a későbbi fejezeteknél már nem valósul meg. A szerző ezt részben megmagya- rázza előszavában, ahol a módszerek fontosságuk, bonyolultságuk és alkalmazási gyakoriság szerinti differenciált csoportosításáról beszél.

A munka kiemelkedő erénye a kitűnő példa- gyűjtemény. A példák egy része egyszer alkalma- zott, illetve egyedi, míg más része más módszerhez is kapcsolódik, illetve egy problémakört visz tovább- fejlesztve végig. A példákat túlnyomórészt a min- dennapi életből meríti, ezért változatosak, sokszínű- ek, és nagyban elősegítik, hogy mindenki megértse az ismerni kívánt kérdéskörök természetét és alkal- mazásukat.

Mindenki autózik, mindenki telefonál, mindenki tisztában van a környezetszennyezés mérésének fon- tosságával, sokan érdeklődnek a labdarúgás iránt.

Könnyű bármelyik kiragadott példán bemutatni a sokváltozós módszereket. A 8.1-es gyakorló feladat az 1998-as világbajnokság 13 legeredményesebb labdarúgójára vonatkozóan az ún. „kanadai tábláza- ton” (rúgott gól 3 pont, gólpassz 1 pont) mért ered- ményesség alapján végez elemzéseket. A felületes szemlélő azt mondhatja, hogy a gólok, illetve gól- passzok jelentőségének összehasonlító elemzése (összevetés például a 2002. évi labdarugó világbaj- noksággal) egyszerű, viszonyszámos elemzéssel is megoldható. A legjobb 13, vagy a legalább 3 pontot elért labdarúgók körében a gólok, gólpasszok meg- oszlási és dinamikus viszonyszámos elemzése kielé- gítően jellemzi az eredményességhez való hozzájá-

(3)

SZEMLE 1023 rulást. Ez azonban több viszonyszám keletkezésével

jár, míg a javasolt többváltozós módszer hatékonyan tömöríti az információkat, kimutatva a két eredmé- nyességi faktor szerepét.

Valamennyi módszer alkalmazása előtt felme- rülhet a kérdés, hogy hasznosíthatók-e az eredmé- nyek és kinek értékesek a nyert információk. E prob- lémakör kapcsán is megszólalhat az ördög ügyvédje, hasznos információ-e a kapott eredmény. A gólpasz- szok jelentőségének növekedése az éllovasok eseté- ben a szervezett kombinatív szemléletű labdarúgást valószínűsíti, míg ennek háttérbe szorulása a defenzívebb, kontrajátékos, véletlen labdaszerzésen alapuló, illetve egyetlen sztárcsatárt kiszolgáló takti- kát. A 1998-as győztes (18 pontos 6 rúgott góllal), Suker csapata, azaz Horvátország sem jutott a döntő- ig éllovas góllövő szereplése ellenére sem. A labda- rúgás szakembereinek éppúgy, mint a labdarúgás iránt érdeklődőknek is fontos információkat adhat- nak tehát a fenti témakörben készült modellek ered- ményei.

Még egy ilyen leegyszerűsített probléma esetén is megmutatkozik a sokváltozós elemzési technika előnye – az eredményváltozót csak két tényező, kü- lön-külön determisztikus módon alakítja –, ezen előny még inkább megjelenik összetettebb problé- makör esetén.

A könyv szerkezete világos, áttekinthető: a négy részből álló munka 16 fejezetre tagolt, a fejezetek pedig változó számú kisebb alfejezetekből állnak.

Az I., már tárgyalt rész (mely 6 fejezetből áll), a Tendenciák a szóródásban címet viseli és a módszer- tani megalapozást szolgálja. A II. rész a 7–9. fejeze- teket tartalmazza. A szerző tárgyalja a nevezetes el- oszlások regressziós modelljeit, a klasszikus lineárisregresszió-számítást és az általános lineáris modellt is. A III. rész (10–12. fejezet) a klasszifiká- ciós módszereket gyűjti csokorba. Különösen ebben a részben ütközik ki a szerző felhasználói szemléle- tének sokoldalúsága. Bár közgazdász alapdiplomájú, és a felsőoktatásban szerzett tapasztalatainak megha- tározó részét az egyetemi szintű közgazdászképzés- ben szerezte, a módszerek kiválasztása és tárgyalása során nemcsak a gazdasági-ökonometriai preferen- ciarendszernek a szempontjait veszi figyelembe, ha- nem más tudományterületeknek, a legkülönbözőbb ágazatoknak és szinteknek is megfelelő ez a mód- szertani kínálat. Elsőként a logisztikus regressziót tárgyalja, majd a bayesi klasszifikációt. A fejezetet a K-középpontú klaszterezés ismertetése zárja.

A szerző különösen fontosnak ítéli a faktorana- lízis eszköztárát, ezért az utolsó, a IV., különösen kiérlelt, kiforrott részt (13–16. fejezet) ennek szente- li. Ebben a témakörben a szerzőnek színvonalas pub-

likációi születtek e könyv megjelenését megelőzően is. A 13. fejezetben a faktormodell általános ismerte- tése kapott helyet. A fejezet 14. számú alfejezete az exploratív faktoranalízis nevét viseli, amely három alapvető modellre bontható: komponensanalízis, kö- zös faktoranalízis, illetve az imageanalízis. Ez a fe- jezet nem a jelzett szempontrendszer szerint tagoló- dik, a szerző e három irányt felfűzi az ún. kanonikus faktorok elvére, bár a kifejtésnél áttételesen megje- lenik az említett klasszikus tagolódás. A következő fejezet a konfirmatív faktoranalízis címet viseli, majd ezt követi a Dichotom (boolean) faktoranalízis című záró fejezet.

A könyv igen didaktikusan, „Jelölések, szimbó- lumok” címszóval rendszerezi az általa használt ka- tegóriákat. Az előszó számos tanáccsal szolgál a ha- tékony felhasználáshoz. A szerző felhívja az olvasó figyelmét, hogy didaktikai okokból egyes számpél- dák alacsony elemszámú adatbázison készültek. A szükséges adatbázisméret változó és módszerfüggő, és a megfelelő nagyságú adatbázis a hatékony mo- dellezés előfeltétele.

A táblák és a grafikonok elsősorban a számító- gépes szoftveroutputok megjelenései, és így a fel- használót segítik a módszer alkalmazásnál, de az ügyes szerkesztői munka eredményeképpen jól bele- illenek a szöveg struktúrájába. A grafikus megjelení- tés nagyban segíti a megértést. A szerzőnek a sok- változós módszerek jellegéből adódóan csak korlá- tozott lehetőségei voltak a grafikus illusztrációra, hi- szen a vizsgált jelenségek, folyamatok több dimen- ziósak, így többdimenziós térben helyezendők el. A kézikönyvszerű használatot különösen segíti a jól szerkesztett tárgymutató. Az irodalomjegyzék is mu- tatja, hogy a szerző alapos kutatásokat végzett e könyv megírása érdekében, melynek értékét nagy- mértékben növeli az alapos, logikus szerkesztés, és az igényes nyomdai kivitelezés.

Fontos célja egy könyvismertetésnek, hogy a szerző kinek, milyen jelleggel ajánlja elolvasásra, felhasználásra a művet. A sokrétű felhasználhatóság lehetővé teszi, hogy különböző célcsoportoknak a kötet eltérő jellegű felhasználását javasoljam.

Hasznos olvasmány e mű valamennyi általános statisztikát oktatónak, általános statisztikai eszköz- rendszert felhasználó kutatónak. E körben teljes- körűen elvárható a felhasználói szintű ismeret a többváltozós statisztikai módszerek felsorolt eljárá- saiban. Alapműként javasolt nemcsak a könyvespol- con tartani, hanem olvasni is Hajdu Ottó munkáját.

Egyes tudományágak, a jogtudomány, a demográfia, a szociológia, a pszichológia – általában a biometria – bizonyos tárgyalt módszereket nagyobb, más mód- szereket kisebb súllyal vagy egyáltalán nem hasz-

(4)

SZEMLE 1024

nálnak fel a tárgyaltak közül. Az e területeken tevé- kenykedők számára kézikönyvként hasznosítható a mű. Hasonló felhasználás javasolható olyan, kevesek által művelt tudományágakban és szakterületeken is, mint a meteorológia, a geológia, a szeizmológia stb.

A tárgyalt módszerek széles köre és a tárgyalás mélysége nem teszi lehetővé, hogy e művet standard tananyagként a gazdasági felsőoktatásban oktassák.

Az általános statisztikában a matematikusok képzé- sében a matematikai statisztika iránt mélyebben ér- deklődőknek, az emelt szintű graduális és a poszt- graduális képzésben, a választható tárgyként oktató kurzusokon azonban a standard tárgyként történő felhasználás mindenképpen indokolt. Annál is in- kább, mert e mű jelentős része tananyagként már több felsőoktatási intézményben a múltban is hasz- nosult.

Számos olyan kutató és döntéshozó van, akik- nek munka- és tevékenységi területén e módszerek hasznosíthatók lennének, de nélkülözik hozzá a sta- tisztikai és matematikai előképzettséget, illetve a sta-

tisztikai programcsomagok kellő szintű ismeretét.

Számukra is értékes olvasmány e mű, hiszen a mód- szeralkalmazási lehetőségek verbális előadása és a színes, sokrétű mintapéldák elindíthatnak egy alkotó problémamegfogalmazást. Ezen kutatók és döntés- hozók ekkor segítséget kérhetnek intézetük, intéz- ményük, cégük hozzáértő szakembereitől, és egy szakértői csoport együttműködése hatékonyan meg- oldhatja a felmerülő problémát. Ha az intézményen, intézeten, cégen belül nincsenek meg a megfelelő tárgyi és személyi feltételek, akkor igénybe lehet venni az erre szakosodott szakemberek segítségét.

Ilyen esetekben a könyv megtanít kérdezni.

„Statisztikai módszerek a társadalmi és gazda- sági elemzésekben” – így szól a sorozat címe, mely- ben Hajdu Ottónak ez a könyve megjelent, és amely hasznos segítséget nyújt a sokrétű társadalmi és gaz- dasági elemzésekben.

Herman Sándor

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A vándorlás sebességét befolyásoló legalapvetőbb fizikai összefüggések ismerete rendkívül fontos annak megértéséhez, hogy az egyes konkrét elektroforézis

(Véleményem szerint egy hosszú testű, kosfejű lovat nem ábrázolnak rövid testűnek és homorú orrúnak pusztán egy uralkodói stílusváltás miatt, vagyis valóban

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A CLIL programban résztvevő pedagógusok szerepe és felelőssége azért is kiemelkedő, mert az egész oktatási-nevelési folyamatra kell koncentrálniuk, nem csupán az idegen

A pszichológusokat megosztja a kérdés, hogy a személyiség örökölt vagy tanult elemei mennyire dominán- sak, és hogy ez utóbbi elemek szülői, nevelői, vagy inkább

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a