4.5 Többváltozós idősori modellek
4.5.2 Vektor autoregresszív modellek
A vektor autoregresszív modellek (VAR-modellek) az egyváltozós autoregresszív modellek többváltozós általánosításai. A VAR-modellek többegyenletes rendszerek, praktikusan ez magával vonja, hogy egynél több eredményváltozó együttes vizsgálatára alkalmasak. Ugyanakkor ezek a modellek – el-lentétben a 3. fejezetben bemutatott szimultán többegyenletes modellekkel – nem igényelnek rész-letekbe menő, előzetes modellspecifikációt.
A legegyszerűbb (kétváltozós, csak elsőrendű késleltetéseket tartalmazó) esetben a modell a követ-kező
0 20000 40000 60000 80000 100000
0 20 40 60 80 100 120
0 2000 4000 6000 8000 10000
Nézőszám (fő) Bevétel (ezer €)
Néző (left) Bevétel (right)
125
A (4.31) modell két irányban is könnyen általánosítható:
egyrészt, nyilván elképzelhető, hogy az egyenletek nem csak autoregresszív, hanem mozgó-átlag tagot is tartalmaznak, ekkor jutunk a VARMA-modellekhez,
másrészt – és ez a gyakoribb kiterjesztés – többváltozós VAR-modellek is felírhatók, amik komplexebb összefüggések vizsgálatát is lehetővé teszik.
Írjuk fel a (4.31) modellt mátrix alakban:
1 10 11 12 1, 1 1
Ez utóbbi formula már alkalmas a VAR-modell (az alábbiakban VAR(k)-modell) általános alakjá-nak felírására:
0 1 1 2 2
t t t k t k t
y b Β y Β y Β y ε (4.32)
ahol y tetszőleges számú eredményváltozó t-edik időpontban megfigyelt értékéből képzett vektor. t A VAR-modellek az elmúlt 40 évben hihetetlen népszerűségre tettek szert. Mára gyakorlatilag el-képzelhetetlen az időben változó jelenségek ökonometriai modellezése a vektor autoregresszivitás feltételezése nélkül.57 A modellek elterjedtsége mellett szólnak az alábbi érvek:
a kutatóknak nem kell foglalkozniuk az endogenitás-exogenitás kérdésével, mivel minden, a modellben szereplő változó endogén (ez első pillantásra rendkívül kellemetlen, hiszen alulidentifikáltságot okoz, ám éppen Sims megmutatta, hogy az identifikáció érdekében tett megszorítások többet ártanak a szimultán modelleknek, mint az alulidentifikált eset para-méterbecslési nehézségei),
a modell jellegéből adódóan az egyes változók előrejelzése során nem csak saját korábbi értékeiket, illetve egy véletlen változót használtunk, hanem a többi endogén változót is, ami azt eredményezi, hogy a modell sokkal gazdagabb, az előrejelzés sokkal komplexebb mó-don történik, ezáltal hatásosabb lesz,
57 A modellek elterjedését Sims (1980) cikke indította. A tanulmány jelentőségét jól mutatja, hogy a szerző elsősorban az ebben foglalt eredményeiért kapta meg a Nobel-díjat 2011-ben. A hivatalos méltatás szerint a díjat „a gazdasági folyamatokban az okok és hatások különválasztásáról szóló elméletekért” adták.
126
a kiinduló modell egyes egyenletei akár LNM-mel is illeszthetők, hiszen az egyenletek jobb oldalán csak predeterminált változók állnak.
Természetesen ellenérveket is lehet felsorolni, hiszen
a modellek alkalmazása nem igényel semmilyen elméleti specifikációt, így megvan az esélye, hogy átgondolatlanul alkalmazzuk a vizsgálat során,
nehezen meghatározható a modellben szereplő (és valamennyi endogén változóra általáno-san érvényes) késleltetés hossza,
a modell meglehetősen sok paramétert tartalmaz (g változó és k késleltetési rend esetén g kg 2 darabot), ami meglehetősen lecsökkenti a becslés szabadságfokát (praktikusan fo-galmazva már viszonylag kis modell becsléséhez is hosszú idősorokra van szükség),
a modell feltételezi, hogy valamennyi, benne szereplő endogén változó stacionárius legyen, ugyanakkor – elsősorban a gazdasági modellekben – ez nem mindig van így.
Természetesen a kutatók valamennyi, előbb felsorolt nehézséget (problémát) megkísérelték orvo-solni. A gyakorlati modellező számára ezek közül a legfontosabb a késleltetés rendjének meghatá-rozása. Erre több megoldást is ismer a szakirodalom, például:
empirikus tapasztalatokon nyugvó megfontolás, hogy maximum olyan hosszú késleltetést alkalmazzunk, amivel a becsülendő paraméterek száma az idősor hosszának 10%-a alatt marad (így pl. 2 változós VAR-modell esetén az elsőrendű késleltetés legalább 60 megfi-gyelést, a másodrendű késleltetés 120 megfigyelést igényel),
gyakran használatos, bár a véletlen változók normalitása miatt csak korlátozottan alkalmaz-ható az egymásba ágyazott modellek közötti választást segítő LR-próba (Rappai, 2013),
dönthetünk információs kritériumok alapján, ahol a kritériumok az egyegyenletes eset többegyenletes általánosításai, vagyis
2
formájúak, ahol ˆΣ jelöli a véletlen változók variancia-kovariancia mátrixának determi-nánsát, g kg 2az összes becsülendő paraméter számát, T az idősor hosszát, és valameny-nyi információs kritérium esetén a minimális értéket keressük,
végül érdemes arra is tekintettel lenni, hogy periodikus ingadozást (szezonalitást) tartal-mazó idősorokban a késleltetés rendje legyen egyenlő a periódusok számával, vagy annak egész számú többszörösével.
127 Mindemellett a gyakorlati modellezés során gyakran iterál a modellező: különböző késleltetésekkel becsüli meg a VAR-modell paramétereit, és figyeli, hogy melyik specifikáció mellett nyer értelmez-hető, a 0-tól szignifikánsan különböző paramétereket.
A VAR-modellek egyik legfontosabb alkalmazása, hogy segítségükkel viszonylag egyszerűen feltár-hatók a bonyolult struktúrákon belüli ok-okozati viszonyok is. A változók közötti okság tesztelé-sének alapgondolata azonos a Granger-okságnál elmondottakkal, vagyis paraméter-restrikciókat (bizonyos paraméterek 0-val való egyezőségét) kell tesztelnünk, de ebben az esetben több paramé-ter-kombináció szerepel a célkeresztben.
Tekintsünk egy viszonylag egyszerű, kétváltozós, harmadrendű késleltetést tartalmazó VAR-mo-dellt. Az egyszerűbb kezelhetőség érdekében némiképp átparamétereztük:
1, 1 1, 2 1, 3
A fenti modell segítségével a következő Granger-okságok tesztelhetők (zárójelben a szükséges pa-raméter-megszorítások): Az előbbi paraméterrestrikciók a korábban bemutatott LR-próbával tesztelhetők.
További kézenfekvő kiterjesztése a VAR-modelleknek, ha a jobb oldalon olyan változókat is sze-repeltetünk, melyek a modell szempontjából teljes mértékben exogének, vagyis empirikus értékeik a modellen kívül határozódnak meg. Vegyünk például egy exogént változókat is tartalmazó VAR(1)-modellt:
0 1 1
t t t t
y b B y CX ε (4.33)
ahol X az exogén változó(k) mátrixa, t C az ezekhez tartozó regressziós együtthatók mátrixa.
Az ilyen (bizonyos irodalomban VARX-szel jelölt) modellek esetén is tesztelhető (a C mátrix ele-meire megfogalmazott megszorítások alapján) akár az exogén változó szükségessége, akár az exo-gén és az endoexo-gén változók közötti okság megléte.
A kutatók a VAR-modellek által kínált lehetőségek közül leggyakrabban a véletlenül bekövetkezett sokkok hatásának egzakt vizsgálatát alkalmazzák, ami a szakirodalomban az impulzus-reakció (im-pulse responses) elemzés néven ismert. Amennyiben a VAR-modelleket alkalmasan választott vektor
128 mozgóátlag modellekké (emlékezzünk a Wold-dekompozícióra!) alakítjuk, lehetőséget kapunk arra, hogy egy véletlen sokk (outlier, nem várt egyszeri esemény, stb.) átfutását a rendszeren (ha úgy tetszik „lecsengését”) nyomon kövessük.
Mindennek könnyebb megértéséhez nézzünk egy illusztratív példát!58 Legyen egy elsőrendű vektor autoregresszív modell az alábbi:
1 1, 1 2, 1 1
Tételezzük fel, hogy az eredményváltozók várható értéke mindkét esetben 0, de az első változó a kiinduló pillanatban egységnyi sokkal terhelt, miközben a második változó a kiinduló időpontban a várakozásoknak megfelelően alakult, vagyis
11 1 21 0
Írjuk fel a következő (t 2) időpontra vonatkozó, a fenti modell alapján becsült endogén változó értékeket:
Ismételjük meg ezt a harmadik időpontra vonatkozóan
3 1 2
Ha folytatjuk a sort, láthatjuk, hogy az y1 változóban a sokk hatása lassan elmúlik, miközben a másik változóban a hatás meg sem jelent.
Érdekes megvizsgálni, hogy mi történik abban az esetben, ha a véletlen sokk nem az első, hanem a második változót éri! Ekkor a változók idősora így alakul
1
58 A Rappai (2013) könyvében szereplő példa minimális átalakítása.
129
Vagyis ebben az esetben a második változót ért sokk az első változóra is „átterjed”, és – a paramé-ter-szerkezet okán – viszonylag sokáig kifejti hatását.
Folytassuk előző példánkat és nézzük meg, hogy kimutatható-e kölcsönös okság a nézőszám és a merchandising bevételek között! Vizsgáljuk meg azt is, hogy milyen hatással van egy-egy kiugró érték (pl. nagy rangadó nézőszáma, vagy egy új játékos érkezését követő extrém meny-nyiségű mez-eladás) a másik változóra!
A kérdésfelvetés VAR-modell felírását igényli. Nem tudjuk ugyanakkor eldönteni, hogy milyen állhatatosak a nézők, így felírunk egy VAR(1) modellt is (ebben feltételezzük, hogy csak a leg-utóbbi eredmény befolyásolja a vásárlásokat, illetve a következő mérkőzésre történő kilátoga-tást), meg egy VAR(5) modellt is (ez kb. egy hónapos emlékezetet tételez fel).
A 120 mérkőzés adatai alapján illesztettük mindkét modellt, és meghatároztuk az Akaike-féle információs kritérium értékeit:
vagyis elég a kisebb modell, tehát a drukkerek csak az elmúlt meccsre emlékeznek!
Az okság-tesztek eredményei (a kisebb modell alapján):
417, 42 0, 000
Tehát változók között erőteljes feedback kapcsolat áll fenn, mind a nézőszám meghatározza az üzlet bevételét, mind a bevételben megjelenő kiugró értékeket követi a kiugró nézőszám.
Érdemes megnéznünk az impulzus-reakció függvény alakulását:
130 Anélkül, hogy mélyebben elemeznénk az eredményeket, láthatjuk, hogy az egyes változókban keletkező egységnyi sokkok viszonylag hamar, mintegy 1-2 bajnokság alatt lecsengenek, vagyis – sportmenedzser szemmel nézve – a sikereket gyorsan bevételre kell váltani, mert néhány mérkőzés után már nem emlékeznek rá a nézők. (Nem elemeztük, de nyilvánvalóan érdekes lenne annak vizsgálata is, hogy milyen arányban vannak bérletesek a stadionban, akik – vélel-mezhetően – a szezon elején megvásárolják az ereklyéket és ezt követően már nem látogatják a fan-shopot.)
Eddig nem hangsúlyoztuk, de roppant fontos szem előtt tartani, hogy a VAR-modellek kizárólag akkor használhatók, ha valamennyi, a vizsgálatba vont idősor stacionárius. Tudjuk ugyan, hogy dif-ferencia-képzéssel valamennyi idősor előbb-utóbb stacionáriussá tehető, ám a modellezés során ne feledkezzünk meg arról, hogy csak értelmezhető jelenségeket érdemes vizsgálni. Ügyeljünk arra, hogy pusztán módszertani megfontolásokból ne „lúgozzuk ki” az idősorból a tényleges tartalmat!
A következő alpontban a nemstacioner változók többváltozós modelljeit mutatjuk be.