4 ALKALMAZOTT MÓDSZEREK
4.1 Dekompozíció
4.1.1 Trendszámítás
4.1.1.6 A reziduális változóra vonatkozó feltételek tesztelése
Miután ellenıriztük, hogy a becsült összefüggésünk mennyire jó, célszerő megvizsgálni a számítások kezdetén megfogalmazott feltételeket. A számítás kritériumai között szerepel négy, amelyek a maradékváltozóra vonatkoznak. Ezek meglétének ellenırzése diagnosztikai tesztek segítségével történik. Kivéve az elsı feltételt, amely a hibatagok várható értékére vonatkozik, ami OLS becslés estében mindig teljesül, így nem szokás ellenırizni. A megvizsgálandó három elıfeltétel tehát:
1. autokorreláció 2. heteroszkedaszticitás
3. maradékok normális eloszlása
1. Autokorreláció
Amikor az idısor egymást követı maradékai között korreláció van, akkor autokorrelációról beszélünk. Ez a kapcsolat fennállhat az egymást követı tagok között, és ekkor elsırendő autokorrelációról beszélünk. Létezik ezen kívül másod-, harmad-, p-ed fokú autókorreláció, ahol a reziduum és az azt követı második, harmadik, p-dik reziduum között áll fenn sztochasztikus kapcsolat.
Az autokorreláció kialakulásának több oka lehet. Legtöbbször a függvénytípus nem megfelelı kiválasztása vagy a szükséges magyarázóváltozó szerepetetésének hiánya okozza17.
Az autokorreláció megléte már egy olyan egyszerő ábrán is jól látszik, ahol a maradékok értékeit tüntetjük fel (lásd 5. ábra). Természetesen léteznek kvantitatív tesztelési eljárások.
Ezek közül a leginkább használt a Durbin-Watson próba [19] [20] . A próba azonban csak az elsırendő autokorreláció tesztelésére alkalmas. A magasabb rendő autokorreláció tesztelésére alkalmasabb lehet az LM-próba, illetve az ezen alapuló Breusch–Godfrey-próba [11] [24] . A Box-Jenkins modellek harmadik lépése a diagnosztikai ellenırzés,
17 Az autokorrelációnak Kırösi et. al. [36] ennél több okot sorol fel.
mely során az autokorrelációt is ellenırizni kell. Ehhez a lépéshez dolgozták ki a Box-Pierce tesztet, melynek ma inkább egy továbbfejlesztett változatát, a Ljung-Box próbát alkalmazzák a statisztikusok, ha kifejezetten az autokorreláció tesztelése a cél, hiszen itt a nullhipotézis szerint a maradék tag WN. (A portmanteau próbákról részletesebben az 1.3.3.
fejezetben írtam.)
5. ábra: Tipikus autokorrelációs esetek
A Durbin-Watson próba menete:
1. Hipotézisek felállítása: H0:ρ=0 0 : H1 ρ≠
ahol a t -dik megfigyelésbıl kiindulva yt =β0 +β1xt +εt.
Autokorreláció fennállása esetén εt =ρεt−1+ηt, azaz a reziduum értéke az elızı reziduum és egy véletlen változó (ηt) függvénye.
A nullhipotézis tehát azt jelenti, hogy két egymást követı maradék között nincs kapcsolat, vagyis az induló regressziós feltétel teljesül.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
A regressziós maradékból képzett Durbin-Watson statisztika
( )
∑
∑
=
= − −
= n
t t n
t
t t
d
1 2 2
2 1
ε ε ε
(4.10.)
értéke 0 és 4 közé esik, méghozzá úgy hogy az eloszlás a d=2 pontra szimmetrikus.
3. Döntés a hipotézisekrıl:
Ennél a tesztnél egy alsó (dL) és egy felsı (d ) kritikus értéket határoznak meg, majd U azok ismeretében a döntési szabály meglehetısen bonyolult:
• Ha d értéke a 0−dLtartományba esik, pozitív autokorrelációról beszélünk
• Ha d értéke a dL −dU tartományba esik, nem tudunk döntést hozni (semleges zóna)
• Ha d értéke a dU−
(
4−dU)
tartományba esik, nincs autokorreláció• Ha d értéke a
(
4−dU) (
− 4−dL)
tartományba esik, nem tudunk döntést hozni (semleges zóna)• Ha d értéke a
(
4−dL)
−4tartományba esik, negatív autokorrelációról beszélünkA Breusch–Godfrey-próba menete
1. Hipotézisek felállítása: H0 :ρ1 =ρ2 =K=ρp =0 H1 : legalább egyρi ≠0
ahol a t -dik megfigyelésbıl kiindulva
t tk k t
t x x
y =β +β +K+β +ε
1 1
0 4.11.)
autokorreláció fennállása esetén
t p t p t
t
t ρε ρ ε ρ ε η
ε = − + − +K+ − +
2 2 1
1 (4.12.)
azaz a reziduum értéke az elızı reziduumok és egy véletlen változó (ηt) függvénye.
A nullhipotézis tehát azt jelenti, hogy egymást követı maradékok között nincs kapcsolat, azaz lineárisan függetlenek.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
A regressziós maradékból képzett Breusch–Godfrey - próba statisztikája R2
n⋅ (4.13.)
azaz a minta elemszám és a korrigálatlan R szorzata, ami egy p szabadságfokú 2 χ2p eloszlást követ.
3. Döntés a hipotézisekrıl:
A kritikus érték meghatározása után amennyiben a számított statisztika nagyobb, mint a kritikus (n⋅R2 >χ2p), úgy az alaphipotézist elutasítjuk, azaz létezik valamilyen fokú autokorreláció a hibatagok között.
Autokorreláció fennállása esetén az OLS becslés elveszíti BLUE-ságát, így a közelítı értékek nem lesznek hatásosak. Szintén gondot jelent ilyenkor, hogy a paraméterek szórásnégyzetei torzítottak, s így az illeszkedés jósági foka jelentısen fölé becsülhetı. Az autokorrelációs probléma legegyszerőbben úgy szüntethetı meg, ha egy másik modellformát választunk, vagy megvizsgáljuk, hogy mely fontos változót hagytuk ki a modellbıl, ami így nem lett megfelelı.
2. Heteroszkedaszticitás Ha a maradékváltozó különbözı
xi értékekhez tartozó varianciája állandó, akkor homoszkedaszticitásról beszélünk. Ezen feltétel meglétét könnyen ellenırizhetjük, ha ábrázoljuk a hibatényezıt. A 6. ábra elsı fele egy olyan esetet mutat, ahol teljesül a feltétel, míg az ábra második felén jól látható, hogy x értékének növekedésével a hibatényezı értéke is nı, azaz heteroszkedaszticitás esete áll fenn.
6. ábra: Homoszkedaszticitás és heteroszkedaszticitás
A homoszkedaszticitás tesztelésére alkalmas eljárások közül az LM próbák, azon belül is a Breusch-Pagan próba [10] a leginkább használt, mert általánosan alkalmazható. A próba hátulütıje hogy feltételezi a homoszkedaszticitásra vonatkozó elızetes ismeretek, elıfeltevések meglétét. Ezt a hibát küszöböli ki a White próba [60] , mely szintén nagymintás LM próba.
A Breusch-Pagan próba
A próba során a modellünk a következı formában írható fel:
t tk k t
t
t x x x
y =β +β +β +K+β +ε
2 2 1 1
0 (4.14.)
ahol σt2 =E(εt2 xt) az eltérésváltozó szórásnégyzete:
tp p t
t
t α α z α z α z
σ = + + +K+
2 2 1 1 0
2 (4.15.)
ahol z ismert adatokkal rendelkezti ı i változó t idıpontbeli megfigyelt értéke.
1. Hipotézisek felállítása: H0 :αi =0 minden i=2,3,K,p
1 :
H legalább egy αi ≠0
Amennyiben a számított érték az elfogadási tartományba esik, a homoszkedaszticitás feltétele megvalósul. Amikor azonban a tartományon kívül, az elutasítási tartományba esik, heteroszkedaszticitás esete áll fenn.
2. Mintánk alapján a próbastatisztika értékének kiszámítása:
2
21 SSR
σLM =
(4.16.)azaz a σ2-re vonatkozó segédregresszió regressziós eltérés négyzetösszegének a fele, amely p−1szabadságfokú χ2p−1 eloszlást követ.
3. Döntés a hipotézisekrıl:
A χ2p−1 kritikus értékének meghatározása után akkor tudjuk a nullhipotézit elutasítani, ha a számított statisztikánk értéke magasabb a táblázatból kikeresett értéknél (LM > χ2p−1).
White próba
A próba során azt feltételezzük, hogy var(εi)=σi2 =σ2f(xi), ahol x az ismeretlen i változó. A White próba keretében az εt2 maradékváltozó négyzetére írunk fel egy segédregressziót, melyben a reziduumokat egy konstanssal, az összes magyarázóváltozóval, azok négyzeteivel és a magyarázóváltozók keresztszorzataival magyarázzuk. Összesen p darab magyarázóváltozónk van.
Ha tehát csupán két változóval magyaráztuk meg az eredményt: yt =β0 +β1xt1 +εt, akkor 3 (c,x,x2), ha 3-mal yt =β0 +β1xt1 +β2xt2 +εt, akkor 6 (c,x1,x2,x12,x22,x1x2) ha 4-el
t t t
t
t x x x
y =β0 +β1 1+β2 2 +β3 3 +ε , akkor 10 (c,x1,x2,x3,x12,x22,x32,x1x2,x1x3,x2x3) változóval tudjuk a εt2 -t magyarázni18.
A White próba elvégezhetı úgy is, ha csupán a változók négyzeteit vesszük, a keresztszorzatokat nem.
A próba menete megegyezik a korábban bemutatott Breusch-Pagan próbáéval, a különbség csupán a tesztstatisztikában van, amely itt
nR2
LM = (4.17.)
vagyis a minta elemszám és a segédregresszió korrigálatlan R -ének szorzata, ami egy 2 p szabadságfokú χp2 eloszlást követ.
A homoszkedaszticitás hiánya azért jelent gondot egy elemzés során, mert az alapösszefüggésünket nem lehet OLS módszerrel becsülni, hiszen az így már nem hatásos.
Az ilyenkor alkalmazható becslési eljárás a WLS19, azaz a súlyozott legkisebb négyzetek módszere és a maximum likelihood (ML) becslés.
18 k y
Heteroszkedaszticitás esetén szintén problémát jelent, hogy a varianciákra vonatkozó becslések nem torzítatlanok, s így a szokásos szignifikanciákkal nem tudunk dolgozni.
3. A hibatényezı normalitása
A maradék eloszlásáról feltételezzük, hogy normális. Ennek teljesülését legkönnyebben normál valószínőségi ábra alapján ellenırizhetjük. Az ábrán a reziduumokat a normális eloszlás estén várható értékük (e ) függvényében ábrázoljuk. *i
A várható érték
Amennyiben az így kapott ábra közel lineáris (7. ábra), azt mondhatjuk, hogy a normalitás feltétele teljesül. Ugyanerre a célra alkalmazható a Q-Q (quantile-quantile) plot, mely sokkal elterjedtebb20.
7. ábra: Normál valószínőségi ábra
20 Elsısorban annak köszönhetıen, hogy a statisztikai programcsomagok beépített opcióként kínálják.
A normális eloszlást másik grafikus eszközzel is szemléletesen lehet megmutatni. Ez a maradékok hisztogramja. Normális eloszlásnál a hisztogram haranggörbe alakú.
Amennyiben a vizuális élményt szeretnénk számokkal is alátámasztani, akkor a legegyszerőbb megoldás egy illeszkedésvizsgálat elvégzése, ahol a H hipotézisünk 0 szerint a vizsgált minta normális eloszlást követ, míg az ellenhipotézis szerint nem.