4 ALKALMAZOTT MÓDSZEREK
4.1 Dekompozíció
4.1.1 Trendszámítás
4.1.1.3 A reziduális változóra vonatkozó feltételek tesztelése
Miután ellenőriztük, hogy a becsült összefüggésünk mennyire jó, célszerű megvizsgálni a számítások kezdetén megfogalmazott feltételeket. A számítás kritériumai között szerepel négy, amelyek a maradékváltozóra vonatkoznak. Ezek meglétének ellenőrzése diagnosztikai tesztek segítségével történik. Kivéve az első feltételt, amely a hibatagok várható értékére
12 OLS - Ordinary Least Squares, azaz LNM - Legkisebb négyzetek módszere
vonatkozik, ami OLS becslés estében mindig teljesül, így nem szokás ellenőrizni. A megvizsgálandó három előfeltétel tehát:
autokorreláció
heteroszkedaszticitás
maradékok normális eloszlása 1. Autokorreláció
Amikor az idősor egymást követő maradékai között korreláció van, akkor autokorrelációról beszélünk. Ez a kapcsolat fennállhat az egymást követő tagok között, és ekkor elsőrendű autokorrelációról beszélünk. Létezik ezen kívül másod-, harmad-, p-ed fokú autókorreláció, ahol a reziduum és az azt követő második, harmadik, p-dik reziduum között áll fenn sztochasztikus kapcsolat.
Az autokorreláció kialakulásának több oka lehet. Legtöbbször a függvénytípus nem megfelelő kiválasztása vagy a szükséges magyarázóváltozó szerepetetésének hiánya okozza13.
Az autokorreláció megléte már egy olyan egyszerű ábrán is jól látszik, ahol a maradékok értékeit tüntetjük fel (lásd 3. ábra). Természetesen léteznek kvantitatív tesztelési eljárások.
Ezek közül a leginkább használt a Durbin-Watson próba [19] [20] . A próba azonban csak az elsőrendű autokorreláció tesztelésére alkalmas. A magasabb rendű autokorreláció tesztelésére alkalmasabb lehet az LM-próba, illetve az ezen alapuló Breusch–Godfrey-próba [11] [24] . A Box-Jenkins modellek harmadik lépése a diagnosztikai ellenőrzés, mely során az autokorrelációt is ellenőrizni kell. Ehhez a lépéshez dolgozták ki a Box-Pierce tesztet, melynek ma inkább egy továbbfejlesztett változatát, a Ljung-Box próbát alkalmazzák a statisztikusok, ha kifejezetten az autokorreláció tesztelése a cél, hiszen itt a nullhipotézis szerint a maradék tag WN. (A portmanteau próbákról részletesebben a 4.2. fejezetben írok.)
3. ábra: Tipikus autokorrelációs esetek
A Durbin-Watson próba menete:
1. Hipotézisek felállítása: H0:0 0 : H1
ahol a t-dik megfigyelésből kiindulva yt 0 1xtt.
13 Az autokorrelációnak Kőrösi et. al. [36] ennél több okot sorol fel.
Autokorreláció fennállása esetén , azaz a reziduum értéke az előző reziduum és egy véletlen változó (t) függvénye.
A nullhipotézis tehát azt jelenti, hogy két egymást követő maradék között nincs kapcsolat, vagyis az induló regressziós feltétel teljesül.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
A regressziós maradékból képzett Durbin-Watson statisztika
ismeretében a döntési szabály meglehetősen bonyolult:• Ha d értéke a 0dLtartományba esik, pozitív autokorrelációról beszélünk
• Ha d értéke a dLdU tartományba esik, nem tudunk döntést hozni (semleges ahol a t-dik megfigyelésből kiindulva
t
azaz a reziduum értéke az előző reziduumok és egy véletlen változó (t) függvénye.
A nullhipotézis tehát azt jelenti, hogy egymást követő maradékok között nincs kapcsolat, azaz lineárisan függetlenek.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
A regressziós maradékból képzett Breusch–Godfrey - próba statisztikája R2
n (4.7.)
azaz a minta elemszám és a korrigálatlan R2 szorzata, ami egy pszabadságfokú 2p eloszlást követ.
3. Döntés a hipotézisekről:
A kritikus érték meghatározása után amennyiben a számított statisztika nagyobb, mint a kritikus (nR2 2p), úgy az alaphipotézist elutasítjuk, azaz létezik valamilyen fokú autokorreláció a hibatagok között.
Autokorreláció fennállása esetén az OLS becslés elveszíti BLUE-ságát, így a közelítő értékek nem lesznek hatásosak. Szintén gondot jelent ilyenkor, hogy a paraméterek szórásnégyzetei torzítottak, s így az illeszkedés jósági foka jelentősen fölé becsülhető.
Az autokorrelációs probléma legegyszerűbben úgy szüntethető meg, ha egy másik modellformát választunk, vagy megvizsgáljuk, hogy mely fontos változót hagytuk ki a modellből, ami így nem lett megfelelő.
2. Heteroszkedaszticitás
Ha a maradékváltozó különböző xi értékekhez tartozó varianciája állandó, akkor homoszkedaszticitásról beszélünk. Ezen feltétel meglétét könnyen ellenőrizhetjük, ha ábrázoljuk a hibatényezőt. A 4. ábra első fele egy olyan esetet mutat, ahol teljesül a feltétel, míg az ábra második felén jól látható, hogy x értékének növekedésével a hibatényező értéke is nő, azaz heteroszkedaszticitás esete áll fenn.
4. ábra: Homoszkedaszticitás és heteroszkedaszticitás
A homoszkedaszticitás tesztelésére alkalmas eljárások közül az LM próbák, azon belül is a Breusch-Pagan próba [10] a leginkább használt, mert általánosan alkalmazható. A próba hátulütője hogy feltételezi a homoszkedaszticitásra vonatkozó előzetes ismeretek, előfeltevések meglétét. Ezt a hibát küszöböli ki a White próba [60] , mely szintén nagymintás LM próba.
A Breusch-Pagan próba
A próba során a modellünk a következő formában írható fel:
t tk k t
t
t x x x
y 0 1 12 2 (4.8.) ahol t2 E(t2 xt) az eltérésváltozó szórásnégyzete:
tp p t
t
t z z z
0 1 1 2 2
2 (4.9.)
ahol zti ismert adatokkal rendelkező iváltozó t időpontbeli megfigyelt értéke.
1. Hipotézisek felállítása: H0 :i 0 minden i2,3,,p
1:
H legalább egy i 0
Amennyiben a számított érték az elfogadási tartományba esik, a homoszkedaszticitás feltétele megvalósul. Amikor azonban a tartományon kívül, az elutasítási tartományba esik, heteroszkedaszticitás esete áll fenn.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
2
21 SSR
LM
(4.10.)azaz a 2-re vonatkozó segédregresszió regressziós eltérés négyzetösszegének a fele, amely
1
p szabadságfokú 2p1 eloszlást követ.
3. Döntés a hipotézisekről:
A 2p1 kritikus értékének meghatározása után akkor tudjuk a nullhipotézit elutasítani, ha a számított statisztikánk értéke magasabb a táblázatból kikeresett értéknél (LM 2p1).
White próba
A próba során azt feltételezzük, hogy var(i)i2 2f(xi), ahol xi az ismeretlen változó. A White próba keretében az t2 maradékváltozó négyzetére írunk fel egy segédregressziót, melyben a reziduumokat egy konstanssal, az összes magyarázóváltozóval, azok négyzeteivel és a magyarázóváltozók keresztszorzataival magyarázzuk. Összesen p darab magyarázóváltozónk van.
A White próba elvégezhető úgy is, ha csupán a változók négyzeteit vesszük, a keresztszorzatokat nem.
A próba menete megegyezik a korábban bemutatott Breusch-Pagan próbáéval, a különbség csupán a tesztstatisztikában van, amely itt
(4.11.)
vagyis a minta elemszám és a segédregresszió korrigálatlan R2-ének szorzata, ami egy p szabadságfokú 2p eloszlást követ.
A homoszkedaszticitás hiánya azért jelent gondot egy elemzés során, mert az alapösszefüggésünket nem lehet OLS módszerrel becsülni, hiszen az így már nem hatásos.
14 Általános szabály alapján, ha a konstanssal együtt kszámú magyarázó változóval magyarázzuk az y-t, akkor k(k1)/ számú magyarázóváltozó (konstanssal együtt!) szükséges a segédregresszióba.
Az ilyenkor alkalmazható becslési eljárás a WLS15, azaz a súlyozott legkisebb négyzetek módszere és a maximum likelihood (ML) becslés.
Heteroszkedaszticitás esetén szintén problémát jelent, hogy a varianciákra vonatkozó becslések nem torzítatlanok, s így a szokásos szignifikanciákkal nem tudunk dolgozni.
3. A hibatényező normalitása
A maradék eloszlásáról feltételezzük, hogy normális. Ennek teljesülését legkönnyebben normál valószínűségi ábra alapján ellenőrizhetjük. Az ábrán a reziduumokat a normális eloszlás estén várható értékük (e*i) függvényében ábrázoljuk.
A várható érték
(4.12.) ahol: i - a reziduum sorszáma
- normális eloszlás értéke helyen se- a reziduális szórás.
Amennyiben az így kapott ábra közel lineáris (5. ábra), azt mondhatjuk, hogy a normalitás feltétele teljesül. Ugyanerre a célra alkalmazható a Q-Q (quantile-quantile) plot, mely sokkal elterjedtebb16.
5. ábra: Normál valószínűségi ábra
A normális eloszlást másik grafikus eszközzel is szemléletesen lehet megmutatni. Ez a maradékok hisztogramja. Normális eloszlásnál a hisztogram haranggörbe alakú.
15 Weighted Least Squares
16 Elsősorban annak köszönhetően, hogy a statisztikai programcsomagok beépített opcióként kínálják.
Amennyiben a vizuális élményt szeretnénk számokkal is alátámasztani, akkor a legegyszerűbb megoldás egy illeszkedésvizsgálat elvégzése, ahol a H0 hipotézisünk szerint a vizsgált minta normális eloszlást követ, míg az ellenhipotézis szerint nem.