A reziduális változóra vonatkozó feltételek tesztelése

4 ALKALMAZOTT MÓDSZEREK

4.1 Dekompozíció

4.1.1 Trendszámítás

4.1.1.3 A reziduális változóra vonatkozó feltételek tesztelése

Miután ellenőriztük, hogy a becsült összefüggésünk mennyire jó, célszerű megvizsgálni a számítások kezdetén megfogalmazott feltételeket. A számítás kritériumai között szerepel négy, amelyek a maradékváltozóra vonatkoznak. Ezek meglétének ellenőrzése diagnosztikai tesztek segítségével történik. Kivéve az első feltételt, amely a hibatagok várható értékére

12 OLS - Ordinary Least Squares, azaz LNM - Legkisebb négyzetek módszere

vonatkozik, ami OLS becslés estében mindig teljesül, így nem szokás ellenőrizni. A megvizsgálandó három előfeltétel tehát:

autokorreláció

heteroszkedaszticitás

maradékok normális eloszlása 1. Autokorreláció

Amikor az idősor egymást követő maradékai között korreláció van, akkor autokorrelációról beszélünk. Ez a kapcsolat fennállhat az egymást követő tagok között, és ekkor elsőrendű autokorrelációról beszélünk. Létezik ezen kívül másod-, harmad-, p-ed fokú autókorreláció, ahol a reziduum és az azt követő második, harmadik, p-dik reziduum között áll fenn sztochasztikus kapcsolat.

Az autokorreláció kialakulásának több oka lehet. Legtöbbször a függvénytípus nem megfelelő kiválasztása vagy a szükséges magyarázóváltozó szerepetetésének hiánya okozza¹³.

Az autokorreláció megléte már egy olyan egyszerű ábrán is jól látszik, ahol a maradékok értékeit tüntetjük fel (lásd 3. ábra). Természetesen léteznek kvantitatív tesztelési eljárások.

Ezek közül a leginkább használt a Durbin-Watson próba [19] [20] . A próba azonban csak az elsőrendű autokorreláció tesztelésére alkalmas. A magasabb rendű autokorreláció tesztelésére alkalmasabb lehet az LM-próba, illetve az ezen alapuló Breusch–Godfrey-próba [11] [24] . A Box-Jenkins modellek harmadik lépése a diagnosztikai ellenőrzés, mely során az autokorrelációt is ellenőrizni kell. Ehhez a lépéshez dolgozták ki a Box-Pierce tesztet, melynek ma inkább egy továbbfejlesztett változatát, a Ljung-Box próbát alkalmazzák a statisztikusok, ha kifejezetten az autokorreláció tesztelése a cél, hiszen itt a nullhipotézis szerint a maradék tag WN. (A portmanteau próbákról részletesebben a 4.2. fejezetben írok.)

3. ábra: Tipikus autokorrelációs esetek

A Durbin-Watson próba menete:

1. Hipotézisek felállítása: H₀:0 0 : H₁ 

ahol a t-dik megfigyelésből kiindulva y_t ₀ ₁x_t_t.

13 Az autokorrelációnak Kőrösi et. al. [36] ennél több okot sorol fel.

Autokorreláció fennállása esetén , azaz a reziduum értéke az előző reziduum és egy véletlen változó (_t) függvénye.

A nullhipotézis tehát azt jelenti, hogy két egymást követő maradék között nincs kapcsolat, vagyis az induló regressziós feltétel teljesül.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Durbin-Watson statisztika

 

ismeretében a döntési szabály meglehetősen bonyolult:

• Ha d értéke a 0d_Ltartományba esik, pozitív autokorrelációról beszélünk

• Ha d értéke a d_Ld_U tartományba esik, nem tudunk döntést hozni (semleges ahol a t-dik megfigyelésből kiindulva

azaz a reziduum értéke az előző reziduumok és egy véletlen változó (_t) függvénye.

A nullhipotézis tehát azt jelenti, hogy egymást követő maradékok között nincs kapcsolat, azaz lineárisan függetlenek.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Breusch–Godfrey - próba statisztikája R2

n (4.7.)

azaz a minta elemszám és a korrigálatlan R² szorzata, ami egy pszabadságfokú ²_p eloszlást követ.

3. Döntés a hipotézisekről:

A kritikus érték meghatározása után amennyiben a számított statisztika nagyobb, mint a kritikus (nR²  ²_p), úgy az alaphipotézist elutasítjuk, azaz létezik valamilyen fokú autokorreláció a hibatagok között.

Autokorreláció fennállása esetén az OLS becslés elveszíti BLUE-ságát, így a közelítő értékek nem lesznek hatásosak. Szintén gondot jelent ilyenkor, hogy a paraméterek szórásnégyzetei torzítottak, s így az illeszkedés jósági foka jelentősen fölé becsülhető.

Az autokorrelációs probléma legegyszerűbben úgy szüntethető meg, ha egy másik modellformát választunk, vagy megvizsgáljuk, hogy mely fontos változót hagytuk ki a modellből, ami így nem lett megfelelő.

2. Heteroszkedaszticitás

Ha a maradékváltozó különböző x_i értékekhez tartozó varianciája állandó, akkor homoszkedaszticitásról beszélünk. Ezen feltétel meglétét könnyen ellenőrizhetjük, ha ábrázoljuk a hibatényezőt. A 4. ábra első fele egy olyan esetet mutat, ahol teljesül a feltétel, míg az ábra második felén jól látható, hogy x értékének növekedésével a hibatényező értéke is nő, azaz heteroszkedaszticitás esete áll fenn.

4. ábra: Homoszkedaszticitás és heteroszkedaszticitás

A homoszkedaszticitás tesztelésére alkalmas eljárások közül az LM próbák, azon belül is a Breusch-Pagan próba [10] a leginkább használt, mert általánosan alkalmazható. A próba hátulütője hogy feltételezi a homoszkedaszticitásra vonatkozó előzetes ismeretek, előfeltevések meglétét. Ezt a hibát küszöböli ki a White próba [60] , mely szintén nagymintás LM próba.

A Breusch-Pagan próba

A próba során a modellünk a következő formában írható fel:

t tk k t

t x x x

y 0 1 12 2   (4.8.) ahol  _t² E(_t² x_t) az eltérésváltozó szórásnégyzete:

tp p t

t   z  z  z

  0  1 1 2 2 

2 (4.9.)

ahol z_ti ismert adatokkal rendelkező iváltozó t időpontbeli megfigyelt értéke.

1. Hipotézisek felállítása: H₀ :_i 0 minden i2,3,,p

H legalább egy _i 0

Amennyiben a számított érték az elfogadási tartományba esik, a homoszkedaszticitás feltétele megvalósul. Amikor azonban a tartományon kívül, az elutasítási tartományba esik, heteroszkedaszticitás esete áll fenn.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

2 1 SSR



LM 

_(4.10.)

azaz a ²-re vonatkozó segédregresszió regressziós eltérés négyzetösszegének a fele, amely

1

p szabadságfokú ²_p_₁ eloszlást követ.

3. Döntés a hipotézisekről:

A ²_p_₁ kritikus értékének meghatározása után akkor tudjuk a nullhipotézit elutasítani, ha a számított statisztikánk értéke magasabb a táblázatból kikeresett értéknél (LM ²_p_₁).

White próba

A próba során azt feltételezzük, hogy var(_i)_i² ²f(x_i), ahol x_i az ismeretlen változó. A White próba keretében az _t² maradékváltozó négyzetére írunk fel egy segédregressziót, melyben a reziduumokat egy konstanssal, az összes magyarázóváltozóval, azok négyzeteivel és a magyarázóváltozók keresztszorzataival magyarázzuk. Összesen p darab magyarázóváltozónk van.

A White próba elvégezhető úgy is, ha csupán a változók négyzeteit vesszük, a keresztszorzatokat nem.

A próba menete megegyezik a korábban bemutatott Breusch-Pagan próbáéval, a különbség csupán a tesztstatisztikában van, amely itt

(4.11.)

vagyis a minta elemszám és a segédregresszió korrigálatlan R²-ének szorzata, ami egy p szabadságfokú ²_p eloszlást követ.

A homoszkedaszticitás hiánya azért jelent gondot egy elemzés során, mert az alapösszefüggésünket nem lehet OLS módszerrel becsülni, hiszen az így már nem hatásos.

14 Általános szabály alapján, ha a konstanssal együtt kszámú magyarázó változóval magyarázzuk az y-t, akkor k(k1)/ számú magyarázóváltozó (konstanssal együtt!) szükséges a segédregresszióba.

Az ilyenkor alkalmazható becslési eljárás a WLS¹⁵, azaz a súlyozott legkisebb négyzetek módszere és a maximum likelihood (ML) becslés.

Heteroszkedaszticitás esetén szintén problémát jelent, hogy a varianciákra vonatkozó becslések nem torzítatlanok, s így a szokásos szignifikanciákkal nem tudunk dolgozni.

3. A hibatényező normalitása

A maradék eloszlásáról feltételezzük, hogy normális. Ennek teljesülését legkönnyebben normál valószínűségi ábra alapján ellenőrizhetjük. Az ábrán a reziduumokat a normális eloszlás estén várható értékük (e^*_i) függvényében ábrázoljuk.

A várható érték

(4.12.) ahol: i - a reziduum sorszáma

- normális eloszlás értéke helyen se- a reziduális szórás.

Amennyiben az így kapott ábra közel lineáris (5. ábra), azt mondhatjuk, hogy a normalitás feltétele teljesül. Ugyanerre a célra alkalmazható a Q-Q (quantile-quantile) plot, mely sokkal elterjedtebb¹⁶.

5. ábra: Normál valószínűségi ábra

A normális eloszlást másik grafikus eszközzel is szemléletesen lehet megmutatni. Ez a maradékok hisztogramja. Normális eloszlásnál a hisztogram haranggörbe alakú.

15 Weighted Least Squares

16 Elsősorban annak köszönhetően, hogy a statisztikai programcsomagok beépített opcióként kínálják.

Amennyiben a vizuális élményt szeretnénk számokkal is alátámasztani, akkor a legegyszerűbb megoldás egy illeszkedésvizsgálat elvégzése, ahol a H₀ hipotézisünk szerint a vizsgált minta normális eloszlást követ, míg az ellenhipotézis szerint nem.

In document Statisztikai idősorelemzés a tőzsdén (Pldal 21-27)