• Nem Talált Eredményt

Az ökonometria speciális tesztjei

Az eddigiekben bemutattuk az ökonometria legáltalánosabb modelljét és ennek legegyszerűbb (egy-szersmind leggyakoribb) paraméterbecslési módszerét (legkisebb négyzetek módszere), valamint az LNM alkalmazási feltételeit.

A modell létezésén, egyes magyarázó változók szükségességén, illetve a becslési módszer kiválasz-tásának helyességén túl még számos kérdést meg kell vizsgálnunk, mire kijelenthetjük, hogy ideális (de legalábbis optimális) modellt alkottunk. Azt az összetett, sok különböző tesztet tartalmazó el-járás-sorozatot, mellyel valamennyi lehetséges problémát végig vizsgálunk, specifikációanalízisnek nevezzük. Ebben az alfejezetben néhány, az ökonometriában gyakran használatos specifikációana-lízist szolgáló próbát (illetve kérdésfeltevést) mutatunk be.

3.5.1 Kihagyott, illetve felesleges változó esete

Mindeddig úgy tárgyaltuk a regressziós modelleket, mintha az a kérdés, hogy melyek legyenek az egyenlet magyarázó változói, magától értetődő, vagy eleve elrendelt lenne. Az ökonometriai mo-dellezés gyakorlata azonban nem ez. Sokkal gyakrabban fordul elő, hogy miközben az eredmény-változó adott (a vizsgálat célja által meghatározott), addig több potenciális magyarázó eredmény-változót tar-talmazó adatállományból kell kiválasztanunk az „optimális” specifikációt.

Könnyen belátható, hogy amennyiben kihagyunk egy fontos tényezőváltozót, akkor – eltekintve attól a rendkívül ritka esettől, amikor a kihagyott változó független az eredményváltozótól – a becs-lésünk torzított és inkonzisztens lesz. Mivel ebben az esetben a tengelymetszetre (konstansra) vo-natkozó becslésünk torzított, az egész modell (praktikusan az eredményváltozó előrejelzése) is tor-zított. Ekkor a standard hibákat felülbecsüljük, melynek következtében a próbák nem alkalmazha-tók, vagyis a modell ellenőrzése sem valósítható meg korrekt módon.

Némiképpen más a helyzet, ha a modellbe felesleges változót is beépítünk. Abban a ritka esetben, amikor a redundáns magyarázó változóhoz tartozó regressziós együttható 0, a parciális t-próba kiszűri a hibás specifikációt és elhagyhatjuk a változót. Ám ennél sokkal gyakoribb az az eset, ami-kor a felesleges magyarázó változó ami-korrelál az eredményváltozóval és a többi tényezőváltozóval is.

Ilyenkor a paraméterekre vonatkozó becsléseink ugyan torzítatlanok és konzisztensek, de nem ha-tásosak: a standard hibákat felülbecsüljük, a szokásos tesztek nem használhatók, az eredményvál-tozóra vonatkozó előrejelzésünk bizonytalan.

Mindkét esetben azzal a problémával állunk szemben, hogy két, ún. egymásba ágyazott modell között kell választanunk. Példaként legyen a két modellünk az alábbi

86

 bővebb (korlátozás nélküli: unrestricted) modell

0 1 1 2 2 1 1, ,

         U

i i i k ki k k i k m k m i i

y b b x b x b x b x b x e

 a szűkebb (korlátozott: restricted) modell

0 1 1 2 2

      R

i i i k ki i

y b b x b x b x e

Láthatjuk, hogy a második modellben m darabbal kevesebb magyarázó változó és – értelemszerűen –ugyanennyivel kevesebb paraméter van. Könnyen átlátható, hogy amennyiben igaz a

1 2 0

 

k k k m

b b b

paraméter-restrikció, akkor a két modell ekvivalens egymással.

Jelölje USSE a korlátozás nélküli, RSSEa korlátozott modell esetén keletkező reziduális eltérés-négyzetösszeget. Maddala (2004) bebizonyítja, hogy

  

RSSE USSE n k m

F USSE m (3.45)

F-eloszlást követ ,m n k m szabadságfok-párral és így alkalmas a restrikció szükségességének   tesztelésére.41

A próba nullhipotézise, hogy nincs szükség további változókra (elég csak a szűkebb modell), az alternatív hipotézis pedig, hogy a modellből lényeges változókat hagytunk ki. (Vegyük észre, hogy mivel mindenképpen igaz, hogyRSSE USSE , ezért a próbafüggvény értéke nemnegatív és annál távolabb van a 0-tól, minél nagyobb a két modell közötti illeszkedésbeli különbség.)

3.5.2 Helytelen függvényforma kimutatása

A lineáris regressziós modell – nevéből adódóan is – egyik alapfeltevése, hogy a változók közötti kapcsolat lineáris (kétváltozós esetben egy egyenessel ábrázolható). Ugyanakkor – mélyebb magya-rázat nélkül is – belátható, hogy a gazdasági (pénzügyi) összefüggések jelentős részénél a linearitás feltételezése túlságosan egyszerűsíti a jelenség vizsgálatát, éppen ezért tárgyaltuk az alapmodell ki-terjesztései között a nemlineáris specifikációt is. Annak megállapítására, hogy egy ökonometriai modell valóban lineáris-e, elsőként Ramsey (1969) ajánlott széles körben alkalmazható teszteljárást, melyet RESET-próbának nevezünk.

Az eljárás alapgondolata, hogy amennyiben a tényleges összefüggés a magyarázó változó(k) és az eredményváltozó között nem lineáris, akkor a modell maradéktagja nem független az eredményvál-tozó hatványaitól. Az eljárás során tehát elsőként illesztünk egy „szokásos” többváleredményvál-tozós lineáris modellt, meghatározzuk az eredményváltozó értékeinek ezen modellel becsült értékeit, majd ezek

41 A két regressziófüggvény eltérés-négyzetösszegének összehasonlításán alapuló próbák az ún. Wald-próbák, melyek-ről bővebben a 3.3 alfejezetben olvashatunk.

87 segítségével felírunk egy pótlólagos regressziót a becsült véletlen változó értékekre, az alábbi mó-don

A pótlólagos regresszió magyarázó erejéből képezhető T R2pótl próbafüggvény – akárcsak a koráb-ban bemutatott LM-próbák –pszabadságfokú 2-eloszlást követ és ezáltal alkalmas a linearitás hipotézisének tesztelésére (azaz amennyiben a nullhipotézist elvetjük, akkor elvetjük a feltevést, miszerint a modell lineáris).

A próba egyik gyakran használt változatában a kétlépcsős eljárást minimális módosítással végezzük.

Első lépésben itt is LNM-mel becsüljük az eredeti regressziót, második lépésben azonban a

2 3 2

0 1 1 2 2 2ˆ 3ˆ ˆ

         

i i i k ki i i p i i

y b b x b x b x a y a y a y u

modellt illesztjük, és erre vonatkozóan Wald-próba elven képzett F-teszttel ellenőrizzük, hogy a

0 : 23  p 0

H a a a

nullhipotézis igazolható-e. Amennyiben igen (a nullhipotézist elfogadjuk), a modell linearitása nem hibás feltevés. Ha azonban a nullhipotézist el kell vetni, modellünk vélelmezhetően nem lineáris.

Illusztratív céllal tekintsük még egyszer a kor és a sportcélú kiadások összefüggését taglaló példánkat! Illesszünk – a korábban bemutatott ábra alapján is indokolatlannak tűnő módon – lineáris modellt, melyben a kor a magyarázó, a kiadás az eredményváltozó. A modellbecslés eredménye:

Noha a globális F-próba a modell létezése mellett foglal állást, a magyarázó erő viszont elég alacsony, így nem lehetünk biztosak abban, hogy helyes függvényformát választottunk. Alkal-mazzuk a RESET-próbát:

RESET test for specification -

Null hypothesis: specification is adequate Test statistic: F(2, 496) = 178,368

with p-value = P(F(2, 496) > 178,368) = 4,34e-059

88 A próba eredménye önmagáért beszél: minden ésszerű szignifikancia szinten el kell vetnünk a nullhipotézist, miszerint a lineáris specifikáció adekvát, tehát nemlineáris függvényformával kell próbálkoznunk!

3.5.3 Strukturális törés kimutatása, paraméterek stabilitásának vizsgálata Az idősor-elemzés során erősen hangsúlyozzuk, hogy a vizsgált időszaknak homogénnek, az idő-intervallumra vonatkozó változóknak törésmentesnek kell lenni. Ugyanakkor ez – a gazdasági ada-tokat mélyebben elemző ökonometriában – könnyen azt eredményezheti, hogy a jelentős változá-sok olyan közel vannak egymáshoz, hogy a törésmentes időszakok nem elég hosszúak a hatékony modellezéshez. Amennyiben strukturális törés keletkezik az idősorainkban (gazdasági válság, a baj-nokság átszervezése, a játékos-állomány jelentős változása, stb.), a korábban bemutatott regresszió becslésünk nem lesz hatékony, hiszen a becsült paraméterek a mintaperiódusban nem állandók.

Ezért aztán fontos, hogy idősoros adatállomány esetén azt is megvizsgáljuk, nincs-e strukturális törés a regressziós modellben.

A strukturális törés (amikor egy váratlan vagy előre látható esemény következtében a folyamat, vagyis az idősor jellege drasztikusan megváltozik) kimutatása tulajdonképpen visszavezethető a regresz-sziós együtthatók stabilitásának vizsgálatára, így a tesztelés során használatos Chow-próba is ezzel a szemlélettel konstruálódott. A próba végrehajtásához osszuk a vizsgált időszakot két részre; az osz-tópont legyen a strukturális törés feltételezett helye. Illesszünk három regressziós modellt: egyet a teljes időszakra, egyet az idősor elejére (az első megfigyeléstől a töréspontig), egyet az idősor végére (a törésponttól a végéig). Az így keletkezett, három regressziós modellből származó eltérés-négy-zetösszeget jelölje rendre SSE, SSE és  1 SSE . Képezhető az alábbi próbafüggvény  2

ami a nullhipotézis (nincs strukturális törés) teljesülése esetén F-eloszlást követ, k T, 2k szabad-ságfok-párral. (A próba logikája hasonlatos a (3.45) teszthez: mivel a két részre bontott időszakra a külön-külön illesztett regresszió biztosan jobban42 illeszkedik, mint a teljes időszakra illesztett közös regresszió, ezért SSE(1)SSE kisebb vagy egyenlő, mint ( 2) SSE. Így a próbafüggvény első ténye-zője az illeszkedés javulását viszonyítja a jobban illeszkedő modell eltérés-négyzetösszegéhez, és akkor lesz kicsi, ha a feltételezett törés nem változtatja jelentősen a modell paramétereit.)

Az ökonometriának rohamléptekkel fejlődő ága az ún. eseményelemzés (event study analysis), amely egy jól körülhatárolható ok, vagyis ismert törés időpont esetén keresi a modellben a törés hatását. (Az eseményelemzés módszertanára a könyv 5.6 alfejezetében látunk példát.) Ugyanakkor látható, hogy a próba végrehajtásának neuralgikus pontja lehet, hogy számos vizsgálatban nem

42 A korrekt kijelentés úgy szól, hogy a két „rész-regresszió” eltérés-négyzetösszegének összege nem nagyobb, mint a teljes időszakra becsült regressziófüggvény esetén meghatározott eltérés-négyzetösszeg. Belátható, hogy az egyenlőség csak akkor fordulhat elő, ha nincs strukturális törés, hiszen ilyenkor a két rész-regresszió pontosan „ráül” a teljes reg-resszióra.

89 nosítható be valamilyen egyértelmű ok, mint a strukturális törés kiváltója. Ebben az esetben a mo-dellezőnek kellene javaslatot tenni a törés helyére, ami nem feltétlenül életszerű, hiszen nagyon sok esetben éppen a teszttől várnánk, hogy „keresse meg” a töréspontot. Szerencsére a programcso-magok mai fejlettsége mellett mindez nem okoz lényeges problémát, mivel képesek vagyunk a pró-bát többször végrehajtani: a feltételezett töréspontot végigfuttatva az időhorizonton, a maximális F-érték kiválasztásával meghatározhatjuk a törés legvalószínűbb helyét. (Az ilyen „automatizált”

vizsgálat esetén ügyeljünk arra, hogy egyik rész-időszak se legyen túl rövid, hiszen amennyiben a megfigyelések száma nem haladja meg lényegesen a becsülendő paraméterek számát, a becslés nem lesz hatékony.)

A strukturális törést tartalmazó idősor modellezésének leghatékonyabb módja, ha eredeti model-lünket kiegészítjük egy dummy változóval. Esetünkben a dummy változó értéke legyen 0 a vélel-mezett strukturális törésig, és 1 azt követően. Ezután becsüljük a módosított regressziófüggvényt (az átláthatóság kedvéért két magyarázó változót tartalmazó modellt mutatunk, más modellekre a módosított regresszió felírása értelemszerű):

0 1 1 2 2 0 1 1 2 2

      

t t t t t t t t t

y b b x b x a D a D x a D x e

Az előbbi modell – mint korábban ezt már tárgyaltuk – két lineáris modell:

0 1 1 2 2

   

t t t t

y b b x b x e

a töréspontig és

0 0

 

1 1

1

2 2

2

      

t t t t

y b a b a x b a x e

a törésponttól. Azaz a dummy változó beépítésével egy becsléssel képesek voltunk a két időszakra eltérő paraméterekkel rendelkező modellt becsülni. Érdemes észrevenni, hogy a dummy változót tartalmazó modell tulajdonképpen alkalmas lehet a strukturális modell meglétének tesztelésére is, hiszen amennyiben ebben a modellben a dummy, illetve az azt szorzótényezőként tartalmazó va-lamennyi változó felesleges változónak tűnik (ennek tesztelési lehetőségét korábban megismertük!), akkor az időszak törésmentes.