• Nem Talált Eredményt

3.4 Az LNM alkalmazási feltételei

3.4.2 Normalitás-próbák

A 3-4. táblázat harmadik feltétele értelmében az LNM csak akkor hatásos becslési módszer, ha a véletlen változó eloszlása normális. Amennyiben a táblázatban felsorolt első két feltétel is teljesül, akkor a kritérium ennél jóval szigorúbb: hiszen ilyenkor azt várjuk, hogy a véletlen változó 0 várható értékű, konstans és véges szórású normális eloszlást kövessen.

A normalitásvizsgálatnak számos fajtája ismert, a grafikus ábrázolástól a különböző nemparaméteres próbákig. Az általános statisztikában tanult illeszkedésvizsgálat nemparaméteres 2-próbája nem a legerősebb normalitás teszt: az eredmények ugyanis erősen függnek az osztályközök megválasztá-sától. Az ökonometriában leggyakrabban alkalmazott normalitás próba a Jarque-Bera teszt. A próba (Jarque-Bera, 1987) az eloszlás harmad- és negyedrendű momentumaira építve teszteli a normalitás nullhipotézisét a nem normális eloszlás, mint alternatívával szemben. A próba konstruálása során arra építünk, hogy a momentumok segítségével meghatározható, hogy a vizsgált empirikus eloszlás szimmetriája, illetve csúcsossága (lapultsága) milyen mértékben tér el a normális eloszlás esetén várt elméleti értékektől.

A nullhipotézis teljesülése esetén a

2 2

próbafüggvény 2 szabadságfokú 2-eloszlást követ, így alkalmas a kiinduló hipotézis tesztelésére.

Érdemes megjegyezni, hogy a Jarque-Bera próba csak nagymintákon alkalmazható, kismintás eset-ben inkább alkalmazzunk Kolmogorov-Szmirnov próbát (lásd Hajdu és mtsai, 1994).

79 3.4.3 Reziduális autokorreláció

Az LNM hatásos alkalmazhatóságának negyedik feltétele volt, hogy idősoros adatállomány esetén a véletlen változó értékei legyenek függetlenek saját korábbi értékeiktől. A feltétel teljesülése esetén a modellt autokorrelálatlannak, ellenkező esetben autokorreláltnak nevezzük.37 Az autokorreláció káros jelenség: megjelenése esetén az LNM-mel végzett paraméterbecslés nem lesz hatásos; a stan-dard hibákat felülbecsüljük; a szokásos próbák nem használhatók.

Akárcsak a heteroszkedaszticitás esetén, a véletlen grafikonjának tanulmányozása az autokorreláció feltárásában is segítségünkre lehet. Egyértelműen kihagyott változóra utal (ami az autokorreláció egyik leggyakoribb okozója), ha a véletlen változó empirikus értékeit az időben ábrázolva valami-lyen jól felismerhető tendencia rajzolódik ki. A 3-4. ábra ivalami-lyen eseteket mutat:

3-4. ábra: Autokorrelált reziduum (kihagyott változó)

Hasonlóan autokorrelációra gyanakodhatunk – igaz ennek oka általában a helytelenül választott függvényforma – ha a reziduumok ábrája valamilyen könnyen azonosítható analitikus (pl. polinom) függvényformát rajzol ki, lásd a 3-5. ábra:

3-5. ábra: Autokorrelált reziduum (helytelen függvényforma)

A hipotézisvizsgálat során a

 

37 Az autokorreláció jelensége nem kizárólag idősoros esetben, hanem rendezett sokaságok esetén is (pl. térbeli ada-toknál térbeli autokorreláció) értelmezhető. A könyvben tárgyalt sportgazdasági modellek adatbázisai ilyen típusú ren-dező elvvel nem rendelkeznek, ezért itt csak az időbeli autokorrelációt tárgyaljuk. Ebből következően ebben az alpont-ban a megfigyeléseket nem i, hanem t futóindexszel jelöljük.

X

80 hipotézisrendszert teszteljük. Vegyük észre, hogy az előbbiek alapján nem csak egy, hanem több nullhipotézist is megfogalmaztunk. Vizsgálhatjuk az autokorreláció meglétét az egymást közvetle-nül követő e e reziduális tagok között – ekkor elsőrendű reziduális autokorrelációról beszélünk t, t1 – de elképzelhető a véletlen megfigyelések között nagyobb távolság is, ilyenkor – általánosságban – p-ed rendű autokorreláció áll az elemzés középpontjában.

Az autokorreláció jelenségére is számos próbát dolgoztak ki az ökonometria művelői, bizonyos tesztek az évek során fel-, illetve leértékelődtek. Könyvünkben két tesztet mutatunk be:

az egyik legelterjedtebbb, igaz nem a legerősebb DurbWatson-próbát (manapság már in-kább általános diagnosztikai próbaként használjuk38), illetve

a Breusch-Godfrey-próbát.

Az autokorreláció kimutatására szolgáló legrégebbi, széles körben alkalmazott tesztet Durbin és Watson javasolta (Durbin-Watson, 1950). Az eljárás az elsőrendű autokorrelációt teszteli, és az alábbi próbafüggvényre épül:

A próba elterjedtségét indokolja, hogy könnyen interpretálható: hiszen, mivel E e

 

t 0, ezért

 

2 Valamint, ha élünk a közelítéssel, miszerint 2 21

2 2

ahol ˆ a becsült elsőrendű autokorrelációs együttható.

Ugyanakkor napjainkra kimutatták, hogy a Durbin-Watson próba korántsem a legerősebb teszt az autokorreláció feltárásában, ráadásul nehezíti a használatát, hogy a döntést egy „saját” tábla alapján kell meghozni úgy, hogy ez a tábla bizonyos esetekben „bizonytalan”. A tábla használatáról bőveb-ben lásd pl. Hajdu és mtsai (1987) úttörő tankönyvét.

38 A Durbin-Watson próba általános diagnosztikai próbaként történő felfogását javasolja Kőrösi és mtsai (1990).

81 Az említett hiányosságok kiküszöbölése, illetve a magasabb rendű autokorreláció jelenségének tesz-telhetősége érdekében kifejlesztett számos eljárás közül a Breusch-Godfrey-próbát mutatjuk be, ugyanis logikájában nagyban hasonlít a heteroszkedaszticitás White-próbájára. Elsőként itt is elvé-gezzük a regressziós modell becslését LNM-mel, majd – akárcsak korábban – szintén pótlólagos regressziót illesztünk. Ennek formája az alábbi:

0 1 1 2 2 1 1 2 2

ˆt   tt   k kt  ˆt   ˆt   r t pˆt

e b b x b x b x e e e u

A pótlólagos regresszióban szereplő késleltetett rezidumok száma határozza meg, hogy hányad-rendű autokorrelációt tesztelünk (esetünkben p-ed rendű autokorrelációt vizsgálunk). Amennyi-ben a pótlólagos regresszió magyarázó ereje nagy, akkor – kihasználva, hogy a

T p R

2pótl kifeje-zés autokorrelálatlanság esetén p szabadságfokú 2-eloszlást követ – a nullhipotézis elfogadásáról, vagy elvetéséről tudunk dönteni.

Amennyiben a tesztjeink alapján úgy döntünk, hogy a modell autokorrelált, két úton indulhatunk el ennek kiküszöbölése érdekében:

 kísérletet tehetünk a modellspecifikáció javítására (kihagyott változó felkutatása és mo-dellbe építése, vagy függvényforma-változtatás),

más becslési módszer (pl. a már említett ALNM, vagy Cochrane-Orcutt eljárás39) alkalmazása.

Végezetül tekintsük át a legkisebb négyzetek módszere alkalmazási feltételeinek teljesülésének tesz-telését egy példán!

Az USA nemzeti statisztikai hivatala (Bureau of Census) által gyűjtött adatok alapján megvizs-gáltuk az emberek jövedelme és a sportcélú kiadások közötti kapcsolat időbeli alakulását (for-rás: National Sporting Goods Association). Az alábbi ábra szemlélteti a kiadások és a jövede-lem közötti kapcsolatot 1996. január és 2016. augusztus között:

39 A Cochrane-Orcutt eljárás bemutatása meghaladja a könyv kereteit, az érdeklődőknek javasoljuk pl. Maddala (2004) könyvét.

3500 4000 4500 5000 5500 6000 6500 7000 7500 8000 8500

51000 52000 53000 54000 55000 56000 57000 58000

Sportcélú kiadások (millió $/év)

Mediánjövedelem az USA-ban ($/év)

82 A két változó kapcsolatát leíró lineáris regressziós modell becslésének eredményei (immár ki-egészítve az LNM alkalmazási feltételeinek tesztjével is):

A becslési és tesztelési eredmények alapján látható, hogy hiába létezik a modell a globális F-próba alapján, továbbá hiába elfogadható a magyarázó erő (33,2%), a modell mégsem alkalmas a kapcsolat korrekt leírására. A homoszkedaszticitás, normalitás, illetve autokorrelálatlanság nullhipotézisét egyaránt el kell vetni (alacsony p-értékek), ami azt sejteti, hogy sem a függvény-forma nem adekvát, sem az egyetlen magyarázó változó alkalmazása nem kielégítő. Mindezt jól mutatja a maradéktag (reziduum) ábrája is, melyen egyértelmű időbeli tendencia rajzolódik ki:

OLS, using observations 1992:01-2016:08 (T = 296) Dependent variable: SportGoods

Coefficient Std. Error t-ratio p-value

const −7759,85 1161,18 −6,683 <0,0001 ***

Income 0,254455 0,0210600 12,08 <0,0001 ***

Mean dependent var 6259,324 S.D. dependent var 951,4458 Sum squared resid 1,78e+08 S.E. of regression 779,0706 R-squared 0,331793 Adjusted R-squared 0,329520

F(1, 294) 145,9836 P-value(F) 1,47e-27

White's test for heteroskedasticity -

Null hypothesis: heteroskedasticity not present Test statistic: LM = 47,1072

with p-value = P(Chi-square(2) > 47,1072) = 5,89928e-011 Test for normality of residual -

Null hypothesis: error is normally distributed Test statistic: Chi-square(2) = 47,1035 with p-value = 5,91019e-011

LM test for autocorrelation up to order 12 - Null hypothesis: no autocorrelation Test statistic: LMF = 636,265

with p-value = P(F(12, 282) > 636,265) = 2,63666e-196

-1500 -1000 -500 0 500 1000 1500 2000

1995 2000 2005 2010 2015

Rezidum

83 A fentiek alapján tehát kijelenthető, hogy a sportcélú kiadások modellezése csak ennél össze-tettebb specifikációval oldható meg.

3.4.4 Multikollinearitás

A regressziós modellezés, illetve a paraméterbecslés során alkalmazott legkisebb négyzetek mód-szerének alapvetően fontos feltétele a tényezőváltozók közötti függetlenség. Joggal várhatjuk el egy regressziós modelltől, hogy a regressziós együtthatók ne változzanak annak függvényében, hogy milyen magyarázó változókat tartalmaz a modellünk. Ennek azonban csak akkor lehet megfelelni, ha a tényezőváltozók egymástól teljesen függetlenek. A gyakorlatban ugyanakkor ez a feltétel ritkán teljesül. Általában számítani kell a tényezőváltozók közötti sztochasztikus kapcsolatra, amelyet mul-tikollinearitásnak nevezünk. Az egyébiránt káros jelenségnek két fajtája van:

tökéletes vagy extrém multikollinearitás, amikor valamely magyarázó változó kifejezhető a többi magyarázó változó lineáris kombinációjaként (determinisztikus a kapcsolat): ilyenkor a paraméterbecslést nem lehet elvégezni, mivel az X XT mátrix szinguláris;

sztochasztikus multikollinearitás esetén a tényezőváltozók között szignifikáns, ám semmikép-pen sem függvényszerű a kapcsolat.

Az extrém multikollinearitás esete csak ritkán áll fenn és egyértelműen a modellező hibájának tud-ható be. A tökéletes multikollinearitás a modell körültekintőbb specifikációjával orvosoltud-ható.

A sztochasztikus multikollinearitás ugyanakkor az adatok, információk adottsága – vagyis nem spe-cifikációs hiba, – ám ennek ellenére káros jelenség. Hátránya, hogy – noha a becslések torzítatlanok lesznek, – indokolatlanul nőnek a regressziós együtthatók standard hibái. A magas standard hibák alacsony parciális t-statisztikákkal járnak együtt, így fontos változót hagyhatunk ki a modellből. Az erős multikollinearitás megnehezíti a tényezőváltozók eredményváltozóra gyakorolt hatásainak el-különítését, hiszen szinte értelmezhetetlenné teszi a „ceteris paribus” (mindent mást változatlannak feltételezve) kifejezést. Meg kell azonban jegyezni, hogy a multikollinearitás javíthatja a modell elő-rejelző képességét, igaz csak akkor, ha a változók közötti összefüggés struktúrája állandó.

Mivel a multikollinearitás az adatállomány sajátossága, így teljes kiküszöbölésére nincsen mód, leg-feljebb mérsékelhetjük káros hatását. A multikollinearitás felismerésére, mérésére sokféle módszert ismer a szakirodalom, ezekből könyvünkben kettőt mutatunk be.

Ismeretes, hogy a második fejezetben megismert korrelációs mátrix tartalmazza valamennyi változó totális korrelációs együtthatóját. Ha a tényezőváltozók közötti korrelációs együtthatók valamelyikét – tesztelés nélkül – erősnek tartjuk (értéke közel esik az 1-hez), a multikollinearitás létezésére gya-nakodhatunk.40

A magyarázó változók közötti determinációs együtthatókra épül a varianciát infláló faktor (VIF) mu-tatója. A mutatószám – melyet általában kettőnél több magyarázó változó esetén használunk – azt méri, hogy a multikollinearitás jelenléte milyen mértékben növeli a becsült paraméterek standard hibáit. Kiszámítása:

40 A multikollinearitás meglétének teszteléséről lásd Mundruczó (1981).

84

2

1

1

j

j

VIF R (3.44)

ahol R2j a j-edik magyarázó változó és a többi tényezőváltozó közötti többszörös determinációs együttható, mely könnyen meghatározható egy redukált (csak a tényezőváltozók közötti kapcsola-tot mutató) korrelációs mátrix inverzéből.

A mutató 1 és végtelen között értelmezett (hiszen a determinációs együttható 0 és 1 között lehet).

Amennyiben a j-edik magyarázó változó lineárisan független a többitől, a mutató értéke 1. A gya-korlatban súlyosnak tekintik a multikollinearitást, ha a VIF mutató értéke megközelíti a 10-et.

A VIF mutató reciprokát tolerancia mutatónak hívjuk, amelynek határai:

0Tj 1

Könnyen átlátható módon a tolerancia mutató alacsony (0-hoz közeli) értéke multikollinearitást, magas (1-hez közeli) értéke „tolerálható” zavaró hatást mutat.

A 3.2.1 alpontban bemutattunk egy példát, melyben a sportszergyártó cégek árbevételét (ezer

€) a K+F ráfordítások (ezer €), a dolgozók létszáma (fő) és bérköltsége (ezer €) magyarázta.

A bemutatott modellezési eredmények mellett elvégeztük a multikollinearitás kimutatását is, amelyhez a VIF-mutatókat használtuk. Eredményeink:

Láthatjuk, hogy a VIF-mutató egyik változó esetén sem mutat zavaró mértékű multikollineari-tást, ami kicsit meglepő, hiszen az eredeti modellben a parciális t-próba a létszám változójának feleslegességét sugallta.

A felsorolt mutatószámok segítségével kiválaszthatjuk azt a tényezőváltozót, amelyiknek a legerő-sebb a zavaró hatása. A megoldás a változó elhagyása lenne, azonban ennek gyakran ellentmonda-nak elméleti közgazdasági megfontolások. A multikollinearitást tartalmazó modell esetén, anellentmonda-nak érdekében, hogy értelmezhető regressziós együtthatókat kapjunk, szükség lehet a becslési módszer megváltoztatására. Kőrösi és mtsai (1990) több eljárást is ismertet, a leggyakrabban alkalmazottak

a főkomponens-regresszió, illetve

a ridge-regresszió.

Variance Inflation Factors Minimum possible value = 1.0

Values > 10.0 may indicate a collinearity problem KF 1,038

LETSZ 1,012 BERKTG 1,028

VIF(j) = 1/(1 - R(j)^2), where R(j) is the multiple correlation coefficient between variable j and the other independent variables

85 A legkisebb négyzetek módszerének alkalmazási feltételei csak nagyon ritkán teljesülnek maradék-talanul, ezért nagyon gondosan kell eljárnunk a káros jelenségeket tartalmazó modellek felhaszná-lása terén. Ugyanakkor azt is tudnunk kell, hogy tökéletes modell szinte biztosan nem létezik, a valóság egyszerűsítése kompromisszumokat igényel, a modellező legfontosabb feladata ezen komp-romisszumok optimális szintjének megtalálása.

3.5 Az ökonometria speciális tesztjei

Az eddigiekben bemutattuk az ökonometria legáltalánosabb modelljét és ennek legegyszerűbb (egy-szersmind leggyakoribb) paraméterbecslési módszerét (legkisebb négyzetek módszere), valamint az LNM alkalmazási feltételeit.

A modell létezésén, egyes magyarázó változók szükségességén, illetve a becslési módszer kiválasz-tásának helyességén túl még számos kérdést meg kell vizsgálnunk, mire kijelenthetjük, hogy ideális (de legalábbis optimális) modellt alkottunk. Azt az összetett, sok különböző tesztet tartalmazó el-járás-sorozatot, mellyel valamennyi lehetséges problémát végig vizsgálunk, specifikációanalízisnek nevezzük. Ebben az alfejezetben néhány, az ökonometriában gyakran használatos specifikációana-lízist szolgáló próbát (illetve kérdésfeltevést) mutatunk be.

3.5.1 Kihagyott, illetve felesleges változó esete

Mindeddig úgy tárgyaltuk a regressziós modelleket, mintha az a kérdés, hogy melyek legyenek az egyenlet magyarázó változói, magától értetődő, vagy eleve elrendelt lenne. Az ökonometriai mo-dellezés gyakorlata azonban nem ez. Sokkal gyakrabban fordul elő, hogy miközben az eredmény-változó adott (a vizsgálat célja által meghatározott), addig több potenciális magyarázó eredmény-változót tar-talmazó adatállományból kell kiválasztanunk az „optimális” specifikációt.

Könnyen belátható, hogy amennyiben kihagyunk egy fontos tényezőváltozót, akkor – eltekintve attól a rendkívül ritka esettől, amikor a kihagyott változó független az eredményváltozótól – a becs-lésünk torzított és inkonzisztens lesz. Mivel ebben az esetben a tengelymetszetre (konstansra) vo-natkozó becslésünk torzított, az egész modell (praktikusan az eredményváltozó előrejelzése) is tor-zított. Ekkor a standard hibákat felülbecsüljük, melynek következtében a próbák nem alkalmazha-tók, vagyis a modell ellenőrzése sem valósítható meg korrekt módon.

Némiképpen más a helyzet, ha a modellbe felesleges változót is beépítünk. Abban a ritka esetben, amikor a redundáns magyarázó változóhoz tartozó regressziós együttható 0, a parciális t-próba kiszűri a hibás specifikációt és elhagyhatjuk a változót. Ám ennél sokkal gyakoribb az az eset, ami-kor a felesleges magyarázó változó ami-korrelál az eredményváltozóval és a többi tényezőváltozóval is.

Ilyenkor a paraméterekre vonatkozó becsléseink ugyan torzítatlanok és konzisztensek, de nem ha-tásosak: a standard hibákat felülbecsüljük, a szokásos tesztek nem használhatók, az eredményvál-tozóra vonatkozó előrejelzésünk bizonytalan.

Mindkét esetben azzal a problémával állunk szemben, hogy két, ún. egymásba ágyazott modell között kell választanunk. Példaként legyen a két modellünk az alábbi

86

 bővebb (korlátozás nélküli: unrestricted) modell

0 1 1 2 2 1 1, ,

         U

i i i k ki k k i k m k m i i

y b b x b x b x b x b x e

 a szűkebb (korlátozott: restricted) modell

0 1 1 2 2

      R

i i i k ki i

y b b x b x b x e

Láthatjuk, hogy a második modellben m darabbal kevesebb magyarázó változó és – értelemszerűen –ugyanennyivel kevesebb paraméter van. Könnyen átlátható, hogy amennyiben igaz a

1 2 0

 

k k k m

b b b

paraméter-restrikció, akkor a két modell ekvivalens egymással.

Jelölje USSE a korlátozás nélküli, RSSEa korlátozott modell esetén keletkező reziduális eltérés-négyzetösszeget. Maddala (2004) bebizonyítja, hogy

  

RSSE USSE n k m

F USSE m (3.45)

F-eloszlást követ ,m n k m szabadságfok-párral és így alkalmas a restrikció szükségességének   tesztelésére.41

A próba nullhipotézise, hogy nincs szükség további változókra (elég csak a szűkebb modell), az alternatív hipotézis pedig, hogy a modellből lényeges változókat hagytunk ki. (Vegyük észre, hogy mivel mindenképpen igaz, hogyRSSE USSE , ezért a próbafüggvény értéke nemnegatív és annál távolabb van a 0-tól, minél nagyobb a két modell közötti illeszkedésbeli különbség.)

3.5.2 Helytelen függvényforma kimutatása

A lineáris regressziós modell – nevéből adódóan is – egyik alapfeltevése, hogy a változók közötti kapcsolat lineáris (kétváltozós esetben egy egyenessel ábrázolható). Ugyanakkor – mélyebb magya-rázat nélkül is – belátható, hogy a gazdasági (pénzügyi) összefüggések jelentős részénél a linearitás feltételezése túlságosan egyszerűsíti a jelenség vizsgálatát, éppen ezért tárgyaltuk az alapmodell ki-terjesztései között a nemlineáris specifikációt is. Annak megállapítására, hogy egy ökonometriai modell valóban lineáris-e, elsőként Ramsey (1969) ajánlott széles körben alkalmazható teszteljárást, melyet RESET-próbának nevezünk.

Az eljárás alapgondolata, hogy amennyiben a tényleges összefüggés a magyarázó változó(k) és az eredményváltozó között nem lineáris, akkor a modell maradéktagja nem független az eredményvál-tozó hatványaitól. Az eljárás során tehát elsőként illesztünk egy „szokásos” többváleredményvál-tozós lineáris modellt, meghatározzuk az eredményváltozó értékeinek ezen modellel becsült értékeit, majd ezek

41 A két regressziófüggvény eltérés-négyzetösszegének összehasonlításán alapuló próbák az ún. Wald-próbák, melyek-ről bővebben a 3.3 alfejezetben olvashatunk.

87 segítségével felírunk egy pótlólagos regressziót a becsült véletlen változó értékekre, az alábbi mó-don

A pótlólagos regresszió magyarázó erejéből képezhető T R2pótl próbafüggvény – akárcsak a koráb-ban bemutatott LM-próbák –pszabadságfokú 2-eloszlást követ és ezáltal alkalmas a linearitás hipotézisének tesztelésére (azaz amennyiben a nullhipotézist elvetjük, akkor elvetjük a feltevést, miszerint a modell lineáris).

A próba egyik gyakran használt változatában a kétlépcsős eljárást minimális módosítással végezzük.

Első lépésben itt is LNM-mel becsüljük az eredeti regressziót, második lépésben azonban a

2 3 2

0 1 1 2 2 2ˆ 3ˆ ˆ

         

i i i k ki i i p i i

y b b x b x b x a y a y a y u

modellt illesztjük, és erre vonatkozóan Wald-próba elven képzett F-teszttel ellenőrizzük, hogy a

0 : 23  p 0

H a a a

nullhipotézis igazolható-e. Amennyiben igen (a nullhipotézist elfogadjuk), a modell linearitása nem hibás feltevés. Ha azonban a nullhipotézist el kell vetni, modellünk vélelmezhetően nem lineáris.

Illusztratív céllal tekintsük még egyszer a kor és a sportcélú kiadások összefüggését taglaló példánkat! Illesszünk – a korábban bemutatott ábra alapján is indokolatlannak tűnő módon – lineáris modellt, melyben a kor a magyarázó, a kiadás az eredményváltozó. A modellbecslés eredménye:

Noha a globális F-próba a modell létezése mellett foglal állást, a magyarázó erő viszont elég alacsony, így nem lehetünk biztosak abban, hogy helyes függvényformát választottunk. Alkal-mazzuk a RESET-próbát:

RESET test for specification -

Null hypothesis: specification is adequate Test statistic: F(2, 496) = 178,368

with p-value = P(F(2, 496) > 178,368) = 4,34e-059

88 A próba eredménye önmagáért beszél: minden ésszerű szignifikancia szinten el kell vetnünk a nullhipotézist, miszerint a lineáris specifikáció adekvát, tehát nemlineáris függvényformával kell próbálkoznunk!

3.5.3 Strukturális törés kimutatása, paraméterek stabilitásának vizsgálata Az idősor-elemzés során erősen hangsúlyozzuk, hogy a vizsgált időszaknak homogénnek, az idő-intervallumra vonatkozó változóknak törésmentesnek kell lenni. Ugyanakkor ez – a gazdasági ada-tokat mélyebben elemző ökonometriában – könnyen azt eredményezheti, hogy a jelentős változá-sok olyan közel vannak egymáshoz, hogy a törésmentes időszakok nem elég hosszúak a hatékony modellezéshez. Amennyiben strukturális törés keletkezik az idősorainkban (gazdasági válság, a baj-nokság átszervezése, a játékos-állomány jelentős változása, stb.), a korábban bemutatott regresszió becslésünk nem lesz hatékony, hiszen a becsült paraméterek a mintaperiódusban nem állandók.

Ezért aztán fontos, hogy idősoros adatállomány esetén azt is megvizsgáljuk, nincs-e strukturális törés a regressziós modellben.

A strukturális törés (amikor egy váratlan vagy előre látható esemény következtében a folyamat, vagyis az idősor jellege drasztikusan megváltozik) kimutatása tulajdonképpen visszavezethető a regresz-sziós együtthatók stabilitásának vizsgálatára, így a tesztelés során használatos Chow-próba is ezzel a szemlélettel konstruálódott. A próba végrehajtásához osszuk a vizsgált időszakot két részre; az osz-tópont legyen a strukturális törés feltételezett helye. Illesszünk három regressziós modellt: egyet a teljes időszakra, egyet az idősor elejére (az első megfigyeléstől a töréspontig), egyet az idősor végére (a törésponttól a végéig). Az így keletkezett, három regressziós modellből származó eltérés-négy-zetösszeget jelölje rendre SSE, SSE és  1 SSE . Képezhető az alábbi próbafüggvény  2

ami a nullhipotézis (nincs strukturális törés) teljesülése esetén F-eloszlást követ, k T, 2k szabad-ságfok-párral. (A próba logikája hasonlatos a (3.45) teszthez: mivel a két részre bontott időszakra a külön-külön illesztett regresszió biztosan jobban42 illeszkedik, mint a teljes időszakra illesztett közös regresszió, ezért SSE(1)SSE kisebb vagy egyenlő, mint ( 2) SSE. Így a próbafüggvény első ténye-zője az illeszkedés javulását viszonyítja a jobban illeszkedő modell eltérés-négyzetösszegéhez, és akkor lesz kicsi, ha a feltételezett törés nem változtatja jelentősen a modell paramétereit.)

Az ökonometriának rohamléptekkel fejlődő ága az ún. eseményelemzés (event study analysis), amely egy jól körülhatárolható ok, vagyis ismert törés időpont esetén keresi a modellben a törés hatását. (Az eseményelemzés módszertanára a könyv 5.6 alfejezetében látunk példát.) Ugyanakkor látható, hogy a próba végrehajtásának neuralgikus pontja lehet, hogy számos vizsgálatban nem

42 A korrekt kijelentés úgy szól, hogy a két „rész-regresszió” eltérés-négyzetösszegének összege nem nagyobb, mint a teljes időszakra becsült regressziófüggvény esetén meghatározott eltérés-négyzetösszeg. Belátható, hogy az egyenlőség csak akkor fordulhat elő, ha nincs strukturális törés, hiszen ilyenkor a két rész-regresszió pontosan „ráül” a teljes reg-resszióra.

89 nosítható be valamilyen egyértelmű ok, mint a strukturális törés kiváltója. Ebben az esetben a mo-dellezőnek kellene javaslatot tenni a törés helyére, ami nem feltétlenül életszerű, hiszen nagyon sok esetben éppen a teszttől várnánk, hogy „keresse meg” a töréspontot. Szerencsére a programcso-magok mai fejlettsége mellett mindez nem okoz lényeges problémát, mivel képesek vagyunk a

89 nosítható be valamilyen egyértelmű ok, mint a strukturális törés kiváltója. Ebben az esetben a mo-dellezőnek kellene javaslatot tenni a törés helyére, ami nem feltétlenül életszerű, hiszen nagyon sok esetben éppen a teszttől várnánk, hogy „keresse meg” a töréspontot. Szerencsére a programcso-magok mai fejlettsége mellett mindez nem okoz lényeges problémát, mivel képesek vagyunk a