A reziduális változóra vonatkozó feltételek tesztelése

4 ALKALMAZOTT MÓDSZEREK

4.1 Dekompozíció

4.1.1 Trendszámítás

4.1.1.6 A reziduális változóra vonatkozó feltételek tesztelése

Miután ellenıriztük, hogy a becsült összefüggésünk mennyire jó, célszerő megvizsgálni a számítások kezdetén megfogalmazott feltételeket. A számítás kritériumai között szerepel négy, amelyek a maradékváltozóra vonatkoznak. Ezek meglétének ellenırzése diagnosztikai tesztek segítségével történik. Kivéve az elsı feltételt, amely a hibatagok várható értékére vonatkozik, ami OLS becslés estében mindig teljesül, így nem szokás ellenırizni. A megvizsgálandó három elıfeltétel tehát:

1. autokorreláció 2. heteroszkedaszticitás

3. maradékok normális eloszlása

1. Autokorreláció

Amikor az idısor egymást követı maradékai között korreláció van, akkor autokorrelációról beszélünk. Ez a kapcsolat fennállhat az egymást követı tagok között, és ekkor elsırendő autokorrelációról beszélünk. Létezik ezen kívül másod-, harmad-, p-ed fokú autókorreláció, ahol a reziduum és az azt követı második, harmadik, p-dik reziduum között áll fenn sztochasztikus kapcsolat.

Az autokorreláció kialakulásának több oka lehet. Legtöbbször a függvénytípus nem megfelelı kiválasztása vagy a szükséges magyarázóváltozó szerepetetésének hiánya okozza¹⁷.

Az autokorreláció megléte már egy olyan egyszerő ábrán is jól látszik, ahol a maradékok értékeit tüntetjük fel (lásd 5. ábra). Természetesen léteznek kvantitatív tesztelési eljárások.

Ezek közül a leginkább használt a Durbin-Watson próba [19] [20] . A próba azonban csak az elsırendő autokorreláció tesztelésére alkalmas. A magasabb rendő autokorreláció tesztelésére alkalmasabb lehet az LM-próba, illetve az ezen alapuló Breusch–Godfrey-próba [11] [24] . A Box-Jenkins modellek harmadik lépése a diagnosztikai ellenırzés,

17 Az autokorrelációnak Kırösi et. al. [36] ennél több okot sorol fel.

mely során az autokorrelációt is ellenırizni kell. Ehhez a lépéshez dolgozták ki a Box-Pierce tesztet, melynek ma inkább egy továbbfejlesztett változatát, a Ljung-Box próbát alkalmazzák a statisztikusok, ha kifejezetten az autokorreláció tesztelése a cél, hiszen itt a nullhipotézis szerint a maradék tag WN. (A portmanteau próbákról részletesebben az 1.3.3.

fejezetben írtam.)

5. ábra: Tipikus autokorrelációs esetek

A Durbin-Watson próba menete:

1. Hipotézisek felállítása: H₀:ρ=0 0 : H₁ ρ≠

ahol a t -dik megfigyelésbıl kiindulva y_t =β₀ +β₁x_t +ε_t.

Autokorreláció fennállása esetén ε_t =ρε_t₋₁+η_t, azaz a reziduum értéke az elızı reziduum és egy véletlen változó (η_t) függvénye.

A nullhipotézis tehát azt jelenti, hogy két egymást követı maradék között nincs kapcsolat, vagyis az induló regressziós feltétel teljesül.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Durbin-Watson statisztika

( )

∑

= − −

= _n

t t n

t t

1 2 2

2 1

ε ε ε

(4.10.)

értéke 0 és 4 közé esik, méghozzá úgy hogy az eloszlás a d=2 pontra szimmetrikus.

3. Döntés a hipotézisekrıl:

Ennél a tesztnél egy alsó (d_L) és egy felsı (d ) kritikus értéket határoznak meg, majd _U azok ismeretében a döntési szabály meglehetısen bonyolult:

• Ha d értéke a 0−d_Ltartományba esik, pozitív autokorrelációról beszélünk

• Ha d értéke a d_L −d_U tartományba esik, nem tudunk döntést hozni (semleges zóna)

• Ha d értéke a dU−

(

4−dU

)

tartományba esik, nincs autokorreláció

• Ha d értéke a

(

4−dU

) (

− 4−dL

)

tartományba esik, nem tudunk döntést hozni (semleges zóna)

• Ha d értéke a

(

⁴−^dL

)

−⁴tartományba esik, negatív autokorrelációról beszélünk

A Breusch–Godfrey-próba menete

1. Hipotézisek felállítása: H₀ :ρ₁ =ρ₂ =^K=ρp =0 H₁ : legalább egyρi ≠0

ahol a t -dik megfigyelésbıl kiindulva

t tk k t

t x x

y =β +β +K+β +ε

1 1

0 4.11.)

autokorreláció fennállása esetén

t p t p t

t ρε ρ ε ρ ε η

ε = ₋ + ₋ +K+ ₋ +

2 2 1

1 (4.12.)

azaz a reziduum értéke az elızı reziduumok és egy véletlen változó (η_t) függvénye.

A nullhipotézis tehát azt jelenti, hogy egymást követı maradékok között nincs kapcsolat, azaz lineárisan függetlenek.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

A regressziós maradékból képzett Breusch–Godfrey - próba statisztikája R2

n⋅ (4.13.)

azaz a minta elemszám és a korrigálatlan R szorzata, ami egy p szabadságfokú ² χ²_p eloszlást követ.

3. Döntés a hipotézisekrıl:

A kritikus érték meghatározása után amennyiben a számított statisztika nagyobb, mint a kritikus (n⋅R² >χ²_p), úgy az alaphipotézist elutasítjuk, azaz létezik valamilyen fokú autokorreláció a hibatagok között.

Autokorreláció fennállása esetén az OLS becslés elveszíti BLUE-ságát, így a közelítı értékek nem lesznek hatásosak. Szintén gondot jelent ilyenkor, hogy a paraméterek szórásnégyzetei torzítottak, s így az illeszkedés jósági foka jelentısen fölé becsülhetı. Az autokorrelációs probléma legegyszerőbben úgy szüntethetı meg, ha egy másik modellformát választunk, vagy megvizsgáljuk, hogy mely fontos változót hagytuk ki a modellbıl, ami így nem lett megfelelı.

2. Heteroszkedaszticitás Ha a maradékváltozó különbözı

xi értékekhez tartozó varianciája állandó, akkor homoszkedaszticitásról beszélünk. Ezen feltétel meglétét könnyen ellenırizhetjük, ha ábrázoljuk a hibatényezıt. A 6. ábra elsı fele egy olyan esetet mutat, ahol teljesül a feltétel, míg az ábra második felén jól látható, hogy x értékének növekedésével a hibatényezı értéke is nı, azaz heteroszkedaszticitás esete áll fenn.

6. ábra: Homoszkedaszticitás és heteroszkedaszticitás

A homoszkedaszticitás tesztelésére alkalmas eljárások közül az LM próbák, azon belül is a Breusch-Pagan próba [10] a leginkább használt, mert általánosan alkalmazható. A próba hátulütıje hogy feltételezi a homoszkedaszticitásra vonatkozó elızetes ismeretek, elıfeltevések meglétét. Ezt a hibát küszöböli ki a White próba [60] , mely szintén nagymintás LM próba.

A Breusch-Pagan próba

A próba során a modellünk a következı formában írható fel:

t tk k t

t x x x

y =β +β +β +K+β +ε

2 2 1 1

0 (4.14.)

ahol σ_t² =E(ε_t² x_t) az eltérésváltozó szórásnégyzete:

tp p t

t α α z α z α z

σ = + + +K+

2 2 1 1 0

2 (4.15.)

ahol z ismert adatokkal rendelkez_ti ı i változó t idıpontbeli megfigyelt értéke.

1. Hipotézisek felállítása: H₀ :αi =0^mindenⁱ=²^,³^,^K^,^p

1 :

H legalább egy α_i ≠0

Amennyiben a számított érték az elfogadási tartományba esik, a homoszkedaszticitás feltétele megvalósul. Amikor azonban a tartományon kívül, az elutasítási tartományba esik, heteroszkedaszticitás esete áll fenn.

2. Mintánk alapján a próbastatisztika értékének kiszámítása:

2 1 SSR

LM =

_(4.16.)

azaz a σ²-re vonatkozó segédregresszió regressziós eltérés négyzetösszegének a fele, amely p−1szabadságfokú χ²_p₋₁ eloszlást követ.

3. Döntés a hipotézisekrıl:

A χ²_p₋₁ kritikus értékének meghatározása után akkor tudjuk a nullhipotézit elutasítani, ha a számított statisztikánk értéke magasabb a táblázatból kikeresett értéknél (LM > χ²p₋₁^).

White próba

A próba során azt feltételezzük, hogy var(ε_i)=σ_i² =σ²f(x_i), ahol x az ismeretlen _i változó. A White próba keretében az ε_t² maradékváltozó négyzetére írunk fel egy segédregressziót, melyben a reziduumokat egy konstanssal, az összes magyarázóváltozóval, azok négyzeteivel és a magyarázóváltozók keresztszorzataival magyarázzuk. Összesen p darab magyarázóváltozónk van.

Ha tehát csupán két változóval magyaráztuk meg az eredményt: y_t =β0 +β1x_t1 +ε_t, akkor 3 (c,x,x²), ha 3-mal y_t =β₀ +β₁x_t₁ +β₂x_t₂ +ε_t, akkor 6 (c,x₁,x₂,x₁²,x²₂,x₁x₂) ha 4-el

t t t

t x x x

y =β₀ +β₁ ₁+β₂ ₂ +β₃ ₃ +ε , akkor 10 (c,x₁,x₂,x₃,x₁²,x₂²,x₃²,x₁x₂,x₁x₃,x₂x₃) változóval tudjuk a ε_t² -t magyarázni¹⁸.

A White próba elvégezhetı úgy is, ha csupán a változók négyzeteit vesszük, a keresztszorzatokat nem.

A próba menete megegyezik a korábban bemutatott Breusch-Pagan próbáéval, a különbség csupán a tesztstatisztikában van, amely itt

nR2

LM = (4.17.)

vagyis a minta elemszám és a segédregresszió korrigálatlan R -ének szorzata, ami egy ² p szabadságfokú χ_p² eloszlást követ.

A homoszkedaszticitás hiánya azért jelent gondot egy elemzés során, mert az alapösszefüggésünket nem lehet OLS módszerrel becsülni, hiszen az így már nem hatásos.

Az ilyenkor alkalmazható becslési eljárás a WLS¹⁹, azaz a súlyozott legkisebb négyzetek módszere és a maximum likelihood (ML) becslés.

18 k y

Heteroszkedaszticitás esetén szintén problémát jelent, hogy a varianciákra vonatkozó becslések nem torzítatlanok, s így a szokásos szignifikanciákkal nem tudunk dolgozni.

3. A hibatényezı normalitása

A maradék eloszlásáról feltételezzük, hogy normális. Ennek teljesülését legkönnyebben normál valószínőségi ábra alapján ellenırizhetjük. Az ábrán a reziduumokat a normális eloszlás estén várható értékük (e ) függvényében ábrázoljuk. ^*_i

A várható érték

Amennyiben az így kapott ábra közel lineáris (7. ábra), azt mondhatjuk, hogy a normalitás feltétele teljesül. Ugyanerre a célra alkalmazható a Q-Q (quantile-quantile) plot, mely sokkal elterjedtebb²⁰.

7. ábra: Normál valószínőségi ábra

20 Elsısorban annak köszönhetıen, hogy a statisztikai programcsomagok beépített opcióként kínálják.

A normális eloszlást másik grafikus eszközzel is szemléletesen lehet megmutatni. Ez a maradékok hisztogramja. Normális eloszlásnál a hisztogram haranggörbe alakú.

Amennyiben a vizuális élményt szeretnénk számokkal is alátámasztani, akkor a legegyszerőbb megoldás egy illeszkedésvizsgálat elvégzése, ahol a H hipotézisünk ₀ szerint a vizsgált minta normális eloszlást követ, míg az ellenhipotézis szerint nem.

In document STATISZTIKAI IDİSORELEMZÉS A TİZSDÉN (Pldal 49-56)