• Nem Talált Eredményt

Előrejelzések készítése

1 1 2 1

1 1

            

  

vagyis a súlyok relatív gyakoriságoknak tekinthetők. Fontos kitétel, hogy az exponenciális simítás modelljében  értékét nem becsüljük, hanem különböző külső információk alapján adottnak téte-lezzük fel. Gyakori modellezői stratégia, hogy néhány potenciálisan szóba jövő, versengő kisimító konstans közül választjuk ki  értékét úgy, hogy valamilyen előre adott célfüggvényt (például az eltérésnégyzet-összeg minimumot) tartunk szem előtt. Ezt az eljárás nevezzük mai szóhasználattal kalibrálásnak.

Az exponenciális simítás mellett szól a könnyen interpretálható modell, ugyanakkor a modellillesz-tés számos nehézséggel jár. Egyrészt nyilvánvalóan valahol csonkolnunk kell a modellt, hiszen vég-telen sorokkal nehéz dolgozni, másrészt  becslése is csak iteratív úton oldható meg. Jelentős hibája a modellnek, hogy ebben a formában előrejelzésre nem alkalmas, hiszen – megfigyelés hiá-nyában – a mintán kívüli időszakra vonatkozó előrejelzés konstans. Az exponenciális simítás mo-delljeinek egyértelmű háttérbe szorulását jelentette, hogy Granger-Newbold (1986) bebizonyította, a modell ekvivalens egy ARIMA(0,1,1) modellel, ahol    1 1 , így a korábbi fejtegetés alapján kalibrálással meghatározható kisimító paraméter korrektül megbecsülhetővé vált.

4.4 Előrejelzések készítése

Számos modellező véleménye, hogy egy modell használhatóságát annak alapján lehet megítélni, hogy milyen pontosan képes előre jelezni az eredményváltozó korábban nem ismert értékeit. Az előrejelzés (predikció, prognózis) – noha a magyar szóhasználatban nem feltétlenül így értjük – egyaránt vonatkozhat keresztmetszeti és idősoros adatállományon készített modellre. Az előrejel-zések vonatkozhatnak olyan időszakokra, melyek adatait felhasználtuk a paraméterbecsléshez –

116 vagyis részét képezik azon mintának, amelyen a modellt illesztettük (in-sample előrejelzés), – illetve készíthetünk olyan időszakokra előrejelzéseket, melyek nem szerepeltek a mintában (out-of sample előrejelzés). Ez utóbbinak az ökonometriában kitüntetett szerepe van: kis túlzással azt állíthatjuk, hogy ez az idősor-modellezés célja! Noha a statisztikai-módszertani bevezetőben egyértelműen az intervallumbecslés mellett érveltünk, a továbbiakban csak pontbecslésekkel foglalkozunk, vagyis egy-egy jövőbeni időpontra vonatkozó értéket határozunk meg. A standard hibák ismeretében az intervallumbecslés a szokásos módon előállítható.

Rendkívül lényeges, hogy megkülönböztessük az előrejelzések egy másik csoportosítással keletkező két fajtáját az

ex post és az

ex ante

becsléseket. Az előbbi esetben olyan időszakra vonatkozik a predikciónk, amelynek adatát ugyan nem használtuk az előrejelzés készítése során, de mára már ismert. Ilyen ex post előrejelzéseket készítünk olyankor, amikor az adatok olyan nagy gyakorisággal keletkeznek, hogy képtelenség (hi-szen a modellezésnek is van időigénye) mindig a legfrissebb adatot is felhasználni. Ennél talán fon-tosabb és gyakoribb oka az ex post előrejelzésnek, hogy tesztelni kívánjuk modellünk működését.

Mindezt úgy tesszük, hogy szándékosan nem veszünk figyelembe adatokat (általában a mintaidő-szak végéről vágunk le megfigyeléseket), vagyis ezek nélkül végezzük a modell paraméterbecslését.

Ezt követően a becsült regressziófüggvénybe helyettesítve a kihagyott időszakok magyarázó válto-zóit, megvizsgáljuk, hogy az előrejelzés és a tényleges megfigyelés mennyiben esik egybe. Az ex ante előrejelzés ezzel szemben kifejezetten olyan időszak(ok)ra vonatkozik, amely(ek) tekintetében sem a modellbecslés során, sem annak ellenőrzése során nincs adatunk.

A különböző szemléletű előrejelzések folyamán használt minta-, illetve előrejelzési időszakok átte-kintését szolgálja a 4-3. ábra, ahol a következőket tételezzük fel: rendelkezésünkre áll egy

1, 2, ,

tT megfigyelési időszak, amelyből t 1, 2, ,T1 megfigyelések alapján becsüljük a mo-dellt. A t T 1 1,T12, ,T megfigyeléseket a modellellenőrzés céljából kivettük a paraméter-becslésnél alkalmazott mintából.

4-2. ábra: Előrejelzések időhorizontja

Vegyük észre, hogy az ex post előrejelzés és a tényadat összevetése a modell használhatósága szem-pontjából kulcsfontosságú, éppen ezért számos mutatószámot is kidolgoztak az előrejelzések ha-tékonyságának vizsgálata érdekében. Ha a rendelkezésünkre álló t 1, 2, ,T megfigyelési időszak

1 2 … t T1T T+1 T+2 …

in sample out of sample

ex post ex ante

117 első T1 időpontja alapján becsüljük a modellt, akkor a paraméterbecslést követően meghatározhat-juk a pontbecslés (ex post out of sample előrejelzés) értékeit az ismert időszak végére is (a becsült értékek ˆyT11, ˆyT12, ,ˆyT). A modell alkalmazhatóságának megítélése érdekében használhatjuk az átlagos eltérés-négyzetösszeg (MSE) mutatót

 

vagy az átlagos abszolút százalékos hiba (MAPE) mutatót

1 1

Szintén lényeges, főképpen az autoregresszív modellek esetén jelentőséggel bíró fogalmi megkü-lönböztetés az egy-, illetve több lépésre vonatkozó előrejelzés. Az előbbinél mindig csak a követ-kező időszakra vonatkozó előrejelzést határozzuk meg, és a követkövet-kező időszakokkal „bevárjuk” az újonnan keletkező tényadatot, a második esetben (többlépcsős előrejelzés) egyszerre elkészítjük a következő, hosszabb periódusra vonatkozó prognózisunkat. Az előrejelzések osztályozása során különbséget szoktunk még tenni

a statikus, illetve

a dinamikus

előrejelzés között. Az előbbinél az out of sample időszakra vonatkozó becslésnél mindig csak in sample adatokat használunk, míg az utóbbinál egy későbbi időszak előrejelzéséhez már használjuk a modellbecsléskor még nem ismert, de az előrejelzést megelőző időszakra vonatkozó becsült ér-tékeket. Mindez könnyen formalizálható: ha a T k -adik megfigyelésre54 kívánunk előrebecslést készíteni, akkor

Összességében az előrejelzés egy (vagy több) feltételes várható érték meghatározását (becslését) jelenti. A következő (a becslés során még nem használt) időszakra vonatkozó

T 1 T

E y

54 Innentől kezdve, az egyszerűbb jelölés kedvéért nem teszünk különbséget ex post és ex ante előrejelzés között, vagyis az első előrebecsülendő időszak T 1, és például a k-adik előrebecslés a T k időszakra vonatkozik.

118 feltételes várható érték megmutatja, hogy mi a legvalószínűbb értéke az eredményváltozónak a kö-vetkező időszakban, ha ismert számunkra valamennyi releváns, az T információhalmazban ösz-szegyűjtött magyarázó tényező a T-edik (utolsó megfigyelt), és valamennyi azt megelőző időpont-ban. Érdemes felfigyelni két lényeges dologra

E y

T1  T

E y

 

t , vagyis az eredményváltozó jövőbeli értékére vonatkozó feltételes, illetve az idősor valamennyi értékére vonatkozó feltétel nélküli várható érték nem esik egybe szükségszerűen, hiszen az előbbi számos olyan információt (pl. a változó korábbi értékei, az előrejelzés korábbi hibái) is szem előtt tart, amely az utóbbiban elsikkad;

 az előrejelzés azzal a feltevéssel készül, hogy E

T1  T

0, vagyis a rendelkezésünkre álló információk alapján a véletlen változó jövőbeli értéke 0 (ami logikus, hiszen, ha nullától különböző értékét várnánk, akkor ez olyan információ lenne, amit be kellene építenünk a modellbe!).

A legegyszerűbb előrejelzések az ún. naiv modellek. Ezekben a jövőre vonatkozó előrejelzésünk ér-téke megegyezik a mára vonatkozó ismeretünkkel, vagyis

T 1 T

T

E y   y

Vizsgáljuk meg ezek után, hogy milyen módon lehet előrejelzéseket készíteni a fejezetben tárgyalt AR-, MA-, vagy ARMA-modellekkel!

Elöljáróban meg kell jegyeznünk, hogy a mozgóátlag folyamatok esetében az előrejelzés maximális időhorizontja megegyezik a folyamat „emlékezetével” (vagyis az MA(q) modell rendjével). Példa-ként tekintsünk egy MA(3) modellt

1 1 2 2 3 3

t t t t t

y             

Amennyiben logikusan alkalmazzuk az előbbieket, felírhatjuk az alábbi három összefüggést

1 1 1 2 1 3 2

T T T T T

y             

2 2 1 1 2 3 1

T T T T T

y             

3 3 1 2 2 1 3

T T T T T

y             

Korábban bevezetett jelöléseinkkel felírható például az első előrejelzésre vonatkozó feltételes vár-ható érték

T 1 T

 

T 1 1 T 2 T 1 3 T 2

E y  E            

ami – kihasználva, hogy jelen információs bázison a véletlen változó jövőbeni várható értéke 0 – tovább egyszerűsíthető:

T 1 T

1 T 2 T 1 3 T 2

E y            

119

vagyis az előrejelzett érték konstans (egyenlő az idősor átlagával).

Ellentétben a mozgóátlag folyamatokkal, az autoregresszív modellek „végtelen memóriával” ren-delkeznek. Példaként nézzünk egy AR(2) folyamatot:

1 1 2 2

t t t t

y     y   y  

A korábbiakhoz hasonlóan írjuk fel három későbbi, nem megfigyelt időszakra a modellt

1 1 2 1 1 Az előrejelzés első lépésében tekintsünk előre egy időszakot

T 1 T

 

1 T 2 T 1 T 1

1

 

T 2

T 1

E y  E    y   y      E y   E y ami kihasználva, hogy T időszakig az értékeket ismerjük

T 1 T

1 T 2 T 1

E y      y   y adja eredményül.

A második lépésben írjuk fel a két időszakkal későbbi előrejelzést

T 2 T

 

1 T 1 2 T T 2

1

T 1

2

 

T

120 Látható, hogy az előrejelzés értéke az autoregresszivitás rendjénél hosszabb időszakra vonatkozóan sem lesz konstans, hiszen pl. a harmadik lépésben a következő értéket kapjuk

T 3 T

 

1 T 2 2 T 1 T 3

1

T 2

2

T 1

A sor természetesen folytatható és így beláthatjuk, hogy az előrejelzett értékek mindvégig az utolsó két tényadattól függnek (ne feledjük, másodrendű autoregresszív folyamatot vizsgálunk!), csak ezek súlya változik időszakról időszakra.

Az ARMA-folyamatok előrejelzése az előzőek kombinálásával megoldható.

Tételezzük fel, hogy előző példánkban elfogadtuk az Akaike-féle identifikációt és az ADIDAS részvény árfolyamára ARIMA(2,1,2) modellt illesztettünk. A becsült modell a következő:

1 2 1 2

0,305 0,734 0, 231 0,607 0,393

t t t t t t

P P P

     

Készítsünk előrejelzést a következő 10 napra, és ábrázoljuk a kapott értékeket:

Az elsőrendű autoregresszív modell természetét ismerve nem lepődhetünk meg azon, hogy az in sample előrejelzett értékek kis késéssel követik a változásokat. Annál érdekesebbek az out of sample előrejelzések: ezek egyenletesen csökkenő tendenciát mutatnak, az ábra alapján egyre nagyobb standard hibával.

60

121 Ebben a fejezetben áttekintettük az egyváltozós idősor-elemzés alapfogalmait és leggyakrabban al-kalmazott modelljeit, ugyanakkor láthattuk, hogy ezek a modellek nem feltétlenül hatékonyak. A következőkben a módszertant kiterjesztjük a többváltozós elemzések irányába.