• Nem Talált Eredményt

A reziduális változóra vonatkozó feltételek tesztelése

4 ALKALMAZOTT MÓDSZEREK

4.1 Dekompozíció

4.1.1 Trendszámítás

4.1.1.6 A reziduális változóra vonatkozó feltételek tesztelése

Miután ellenıriztük, hogy a becsült összefüggésünk mennyire jó, célszerő megvizsgálni a számítások kezdetén megfogalmazott feltételeket. A számítás kritériumai között szerepel négy, amelyek a maradékváltozóra vonatkoznak. Ezek meglétének ellenırzése diagnosztikai tesztek segítségével történik. Kivéve az elsı feltételt, amely a hibatagok várható értékére vonatkozik, ami OLS becslés estében mindig teljesül, így nem szokás ellenırizni. A megvizsgálandó három elıfeltétel tehát:

1. autokorreláció 2. heteroszkedaszticitás

3. maradékok normális eloszlása

1. Autokorreláció

Amikor az idısor egymást követı maradékai között korreláció van, akkor autokorrelációról beszélünk. Ez a kapcsolat fennállhat az egymást követı tagok között, és ekkor elsırendő autokorrelációról beszélünk. Létezik ezen kívül másod-, harmad-, p-ed fokú autókorreláció, ahol a reziduum és az azt követı második, harmadik, p-dik reziduum között áll fenn sztochasztikus kapcsolat.

Az autokorreláció kialakulásának több oka lehet. Legtöbbször a függvénytípus nem megfelelı kiválasztása vagy a szükséges magyarázóváltozó szerepetetésének hiánya okozza17.

Az autokorreláció megléte már egy olyan egyszerő ábrán is jól látszik, ahol a maradékok értékeit tüntetjük fel (lásd 5. ábra). Természetesen léteznek kvantitatív tesztelési eljárások.

Ezek közül a leginkább használt a Durbin-Watson próba [19] [20] . A próba azonban csak az elsırendő autokorreláció tesztelésére alkalmas. A magasabb rendő autokorreláció tesztelésére alkalmasabb lehet az LM-próba, illetve az ezen alapuló Breusch–Godfrey-próba [11] [24] . A Box-Jenkins modellek harmadik lépése a diagnosztikai ellenırzés,

17 Az autokorrelációnak Kırösi et. al. [36] ennél több okot sorol fel.

mely során az autokorrelációt is ellenırizni kell. Ehhez a lépéshez dolgozták ki a Box-Pierce tesztet, melynek ma inkább egy továbbfejlesztett változatát, a Ljung-Box próbát alkalmazzák a statisztikusok, ha kifejezetten az autokorreláció tesztelése a cél, hiszen itt a nullhipotézis szerint a maradék tag WN. (A portmanteau próbákról részletesebben az 1.3.3.

fejezetben írtam.)

5. ábra: Tipikus autokorrelációs esetek

A Durbin-Watson próba menete:

1. Hipotézisek felállítása: H0:ρ=0 0 : H1 ρ≠

ahol a t -dik megfigyelésbıl kiindulva yt01xtt.

Autokorreláció fennállása esetén εt =ρεt1t, azaz a reziduum értéke az elızı reziduum és egy véletlen változó (ηt) függvénye.

A nullhipotézis tehát azt jelenti, hogy két egymást követı maradék között nincs kapcsolat, vagyis az induló regressziós feltétel teljesül.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Durbin-Watson statisztika

( )

=

=

= n

t t n

t

t t

d

1 2 2

2 1

ε ε ε

(4.10.)

értéke 0 és 4 közé esik, méghozzá úgy hogy az eloszlás a d=2 pontra szimmetrikus.

3. Döntés a hipotézisekrıl:

Ennél a tesztnél egy alsó (dL) és egy felsı (d ) kritikus értéket határoznak meg, majd U azok ismeretében a döntési szabály meglehetısen bonyolult:

• Ha d értéke a 0−dLtartományba esik, pozitív autokorrelációról beszélünk

• Ha d értéke a dL −dU tartományba esik, nem tudunk döntést hozni (semleges zóna)

• Ha d értéke a dU

(

4−dU

)

tartományba esik, nincs autokorreláció

• Ha d értéke a

(

4−dU

) (

− 4−dL

)

tartományba esik, nem tudunk döntést hozni (semleges zóna)

• Ha d értéke a

(

4dL

)

4tartományba esik, negatív autokorrelációról beszélünk

A Breusch–Godfrey-próba menete

1. Hipotézisek felállítása: H012 =Kp =0 H1 : legalább egyρi ≠0

ahol a t -dik megfigyelésbıl kiindulva

t tk k t

t x x

y =β +β +K+β +ε

1 1

0 4.11.)

autokorreláció fennállása esetén

t p t p t

t

t ρε ρ ε ρ ε η

ε = + +K+ +

2 2 1

1 (4.12.)

azaz a reziduum értéke az elızı reziduumok és egy véletlen változó (ηt) függvénye.

A nullhipotézis tehát azt jelenti, hogy egymást követı maradékok között nincs kapcsolat, azaz lineárisan függetlenek.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Breusch–Godfrey - próba statisztikája R2

n⋅ (4.13.)

azaz a minta elemszám és a korrigálatlan R szorzata, ami egy p szabadságfokú 2 χ2p eloszlást követ.

3. Döntés a hipotézisekrıl:

A kritikus érték meghatározása után amennyiben a számított statisztika nagyobb, mint a kritikus (nR22p), úgy az alaphipotézist elutasítjuk, azaz létezik valamilyen fokú autokorreláció a hibatagok között.

Autokorreláció fennállása esetén az OLS becslés elveszíti BLUE-ságát, így a közelítı értékek nem lesznek hatásosak. Szintén gondot jelent ilyenkor, hogy a paraméterek szórásnégyzetei torzítottak, s így az illeszkedés jósági foka jelentısen fölé becsülhetı. Az autokorrelációs probléma legegyszerőbben úgy szüntethetı meg, ha egy másik modellformát választunk, vagy megvizsgáljuk, hogy mely fontos változót hagytuk ki a modellbıl, ami így nem lett megfelelı.

2. Heteroszkedaszticitás Ha a maradékváltozó különbözı

xi értékekhez tartozó varianciája állandó, akkor homoszkedaszticitásról beszélünk. Ezen feltétel meglétét könnyen ellenırizhetjük, ha ábrázoljuk a hibatényezıt. A 6. ábra elsı fele egy olyan esetet mutat, ahol teljesül a feltétel, míg az ábra második felén jól látható, hogy x értékének növekedésével a hibatényezı értéke is nı, azaz heteroszkedaszticitás esete áll fenn.

6. ábra: Homoszkedaszticitás és heteroszkedaszticitás

A homoszkedaszticitás tesztelésére alkalmas eljárások közül az LM próbák, azon belül is a Breusch-Pagan próba [10] a leginkább használt, mert általánosan alkalmazható. A próba hátulütıje hogy feltételezi a homoszkedaszticitásra vonatkozó elızetes ismeretek, elıfeltevések meglétét. Ezt a hibát küszöböli ki a White próba [60] , mely szintén nagymintás LM próba.

A Breusch-Pagan próba

A próba során a modellünk a következı formában írható fel:

t tk k t

t

t x x x

y =β +β +β +K+β +ε

2 2 1 1

0 (4.14.)

ahol σt2 =Et2 xt) az eltérésváltozó szórásnégyzete:

tp p t

t

t α α z α z α z

σ = + + +K+

2 2 1 1 0

2 (4.15.)

ahol z ismert adatokkal rendelkezti ı i változó t idıpontbeli megfigyelt értéke.

1. Hipotézisek felállítása: H0i =0 minden i=2,3,K,p

1 :

H legalább egy αi ≠0

Amennyiben a számított érték az elfogadási tartományba esik, a homoszkedaszticitás feltétele megvalósul. Amikor azonban a tartományon kívül, az elutasítási tartományba esik, heteroszkedaszticitás esete áll fenn.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

2

2

1 SSR

σ

LM =

(4.16.)

azaz a σ2-re vonatkozó segédregresszió regressziós eltérés négyzetösszegének a fele, amely p−1szabadságfokú χ2p1 eloszlást követ.

3. Döntés a hipotézisekrıl:

A χ2p1 kritikus értékének meghatározása után akkor tudjuk a nullhipotézit elutasítani, ha a számított statisztikánk értéke magasabb a táblázatból kikeresett értéknél (LM > χ2p1).

White próba

A próba során azt feltételezzük, hogy var(εi)=σi22f(xi), ahol x az ismeretlen i változó. A White próba keretében az εt2 maradékváltozó négyzetére írunk fel egy segédregressziót, melyben a reziduumokat egy konstanssal, az összes magyarázóváltozóval, azok négyzeteivel és a magyarázóváltozók keresztszorzataival magyarázzuk. Összesen p darab magyarázóváltozónk van.

Ha tehát csupán két változóval magyaráztuk meg az eredményt: yt01xt1t, akkor 3 (c,x,x2), ha 3-mal yt01xt12xt2t, akkor 6 (c,x1,x2,x12,x22,x1x2) ha 4-el

t t t

t

t x x x

y01 12 23 3 +ε , akkor 10 (c,x1,x2,x3,x12,x22,x32,x1x2,x1x3,x2x3) változóval tudjuk a εt2 -t magyarázni18.

A White próba elvégezhetı úgy is, ha csupán a változók négyzeteit vesszük, a keresztszorzatokat nem.

A próba menete megegyezik a korábban bemutatott Breusch-Pagan próbáéval, a különbség csupán a tesztstatisztikában van, amely itt

nR2

LM = (4.17.)

vagyis a minta elemszám és a segédregresszió korrigálatlan R -ének szorzata, ami egy 2 p szabadságfokú χp2 eloszlást követ.

A homoszkedaszticitás hiánya azért jelent gondot egy elemzés során, mert az alapösszefüggésünket nem lehet OLS módszerrel becsülni, hiszen az így már nem hatásos.

Az ilyenkor alkalmazható becslési eljárás a WLS19, azaz a súlyozott legkisebb négyzetek módszere és a maximum likelihood (ML) becslés.

18 k y

Heteroszkedaszticitás esetén szintén problémát jelent, hogy a varianciákra vonatkozó becslések nem torzítatlanok, s így a szokásos szignifikanciákkal nem tudunk dolgozni.

3. A hibatényezı normalitása

A maradék eloszlásáról feltételezzük, hogy normális. Ennek teljesülését legkönnyebben normál valószínőségi ábra alapján ellenırizhetjük. Az ábrán a reziduumokat a normális eloszlás estén várható értékük (e ) függvényében ábrázoljuk. *i

A várható érték

Amennyiben az így kapott ábra közel lineáris (7. ábra), azt mondhatjuk, hogy a normalitás feltétele teljesül. Ugyanerre a célra alkalmazható a Q-Q (quantile-quantile) plot, mely sokkal elterjedtebb20.

7. ábra: Normál valószínőségi ábra

20 Elsısorban annak köszönhetıen, hogy a statisztikai programcsomagok beépített opcióként kínálják.

A normális eloszlást másik grafikus eszközzel is szemléletesen lehet megmutatni. Ez a maradékok hisztogramja. Normális eloszlásnál a hisztogram haranggörbe alakú.

Amennyiben a vizuális élményt szeretnénk számokkal is alátámasztani, akkor a legegyszerőbb megoldás egy illeszkedésvizsgálat elvégzése, ahol a H hipotézisünk 0 szerint a vizsgált minta normális eloszlást követ, míg az ellenhipotézis szerint nem.