Vektor autoregresszív modellek - Többváltozós idősori modellek

4.5 Többváltozós idősori modellek

4.5.2 Vektor autoregresszív modellek

A vektor autoregresszív modellek (VAR-modellek) az egyváltozós autoregresszív modellek többváltozós általánosításai. A VAR-modellek többegyenletes rendszerek, praktikusan ez magával vonja, hogy egynél több eredményváltozó együttes vizsgálatára alkalmasak. Ugyanakkor ezek a modellek – el-lentétben a 3. fejezetben bemutatott szimultán többegyenletes modellekkel – nem igényelnek rész-letekbe menő, előzetes modellspecifikációt.

A legegyszerűbb (kétváltozós, csak elsőrendű késleltetéseket tartalmazó) esetben a modell a követ-kező

0 20000 40000 60000 80000 100000

0 20 40 60 80 100 120

0 2000 4000 6000 8000 10000

Nézőszám (fő) Bevétel (ezer €)

Néző (left) Bevétel (right)

125

A (4.31) modell két irányban is könnyen általánosítható:

 egyrészt, nyilván elképzelhető, hogy az egyenletek nem csak autoregresszív, hanem mozgó-átlag tagot is tartalmaznak, ekkor jutunk a VARMA-modellekhez,

 másrészt – és ez a gyakoribb kiterjesztés – többváltozós VAR-modellek is felírhatók, amik komplexebb összefüggések vizsgálatát is lehetővé teszik.

Írjuk fel a (4.31) modellt mátrix alakban:

1 10 11 12 1, 1 1

Ez utóbbi formula már alkalmas a VAR-modell (az alábbiakban VAR(k)-modell) általános alakjá-nak felírására:

0 1 1 2 2

t   t  t   k t k  t

y b Β y Β y Β y ε (4.32)

ahol y tetszőleges számú eredményváltozó t-edik időpontban megfigyelt értékéből képzett vektor. _t A VAR-modellek az elmúlt 40 évben hihetetlen népszerűségre tettek szert. Mára gyakorlatilag el-képzelhetetlen az időben változó jelenségek ökonometriai modellezése a vektor autoregresszivitás feltételezése nélkül.⁵⁷ A modellek elterjedtsége mellett szólnak az alábbi érvek:

 a kutatóknak nem kell foglalkozniuk az endogenitás-exogenitás kérdésével, mivel minden, a modellben szereplő változó endogén (ez első pillantásra rendkívül kellemetlen, hiszen alulidentifikáltságot okoz, ám éppen Sims megmutatta, hogy az identifikáció érdekében tett megszorítások többet ártanak a szimultán modelleknek, mint az alulidentifikált eset para-méterbecslési nehézségei),

 a modell jellegéből adódóan az egyes változók előrejelzése során nem csak saját korábbi értékeiket, illetve egy véletlen változót használtunk, hanem a többi endogén változót is, ami azt eredményezi, hogy a modell sokkal gazdagabb, az előrejelzés sokkal komplexebb mó-don történik, ezáltal hatásosabb lesz,

57 A modellek elterjedését Sims (1980) cikke indította. A tanulmány jelentőségét jól mutatja, hogy a szerző elsősorban az ebben foglalt eredményeiért kapta meg a Nobel-díjat 2011-ben. A hivatalos méltatás szerint a díjat „a gazdasági folyamatokban az okok és hatások különválasztásáról szóló elméletekért” adták.

126

 a kiinduló modell egyes egyenletei akár LNM-mel is illeszthetők, hiszen az egyenletek jobb oldalán csak predeterminált változók állnak.

Természetesen ellenérveket is lehet felsorolni, hiszen

 a modellek alkalmazása nem igényel semmilyen elméleti specifikációt, így megvan az esélye, hogy átgondolatlanul alkalmazzuk a vizsgálat során,

 nehezen meghatározható a modellben szereplő (és valamennyi endogén változóra általáno-san érvényes) késleltetés hossza,

 a modell meglehetősen sok paramétert tartalmaz (g változó és k késleltetési rend esetén g kg 2 darabot), ami meglehetősen lecsökkenti a becslés szabadságfokát (praktikusan fo-galmazva már viszonylag kis modell becsléséhez is hosszú idősorokra van szükség),

 a modell feltételezi, hogy valamennyi, benne szereplő endogén változó stacionárius legyen, ugyanakkor – elsősorban a gazdasági modellekben – ez nem mindig van így.

Természetesen a kutatók valamennyi, előbb felsorolt nehézséget (problémát) megkísérelték orvo-solni. A gyakorlati modellező számára ezek közül a legfontosabb a késleltetés rendjének meghatá-rozása. Erre több megoldást is ismer a szakirodalom, például:

 empirikus tapasztalatokon nyugvó megfontolás, hogy maximum olyan hosszú késleltetést alkalmazzunk, amivel a becsülendő paraméterek száma az idősor hosszának 10%-a alatt marad (így pl. 2 változós VAR-modell esetén az elsőrendű késleltetés legalább 60 megfi-gyelést, a másodrendű késleltetés 120 megfigyelést igényel),

 gyakran használatos, bár a véletlen változók normalitása miatt csak korlátozottan alkalmaz-ható az egymásba ágyazott modellek közötti választást segítő LR-próba (Rappai, 2013),

 dönthetünk információs kritériumok alapján, ahol a kritériumok az egyegyenletes eset többegyenletes általánosításai, vagyis





formájúak, ahol ˆΣ jelöli a véletlen változók variancia-kovariancia mátrixának determi-nánsát, g kg ²az összes becsülendő paraméter számát, T az idősor hosszát, és valameny-nyi információs kritérium esetén a minimális értéket keressük,

 végül érdemes arra is tekintettel lenni, hogy periodikus ingadozást (szezonalitást) tartal-mazó idősorokban a késleltetés rendje legyen egyenlő a periódusok számával, vagy annak egész számú többszörösével.

127 Mindemellett a gyakorlati modellezés során gyakran iterál a modellező: különböző késleltetésekkel becsüli meg a VAR-modell paramétereit, és figyeli, hogy melyik specifikáció mellett nyer értelmez-hető, a 0-tól szignifikánsan különböző paramétereket.

A VAR-modellek egyik legfontosabb alkalmazása, hogy segítségükkel viszonylag egyszerűen feltár-hatók a bonyolult struktúrákon belüli ok-okozati viszonyok is. A változók közötti okság tesztelé-sének alapgondolata azonos a Granger-okságnál elmondottakkal, vagyis paraméter-restrikciókat (bizonyos paraméterek 0-val való egyezőségét) kell tesztelnünk, de ebben az esetben több paramé-ter-kombináció szerepel a célkeresztben.

Tekintsünk egy viszonylag egyszerű, kétváltozós, harmadrendű késleltetést tartalmazó VAR-mo-dellt. Az egyszerűbb kezelhetőség érdekében némiképp átparamétereztük:

1, 1 1, 2 1, 3

A fenti modell segítségével a következő Granger-okságok tesztelhetők (zárójelben a szükséges pa-raméter-megszorítások): Az előbbi paraméterrestrikciók a korábban bemutatott LR-próbával tesztelhetők.

További kézenfekvő kiterjesztése a VAR-modelleknek, ha a jobb oldalon olyan változókat is sze-repeltetünk, melyek a modell szempontjából teljes mértékben exogének, vagyis empirikus értékeik a modellen kívül határozódnak meg. Vegyünk például egy exogént változókat is tartalmazó VAR(1)-modellt:

0 1 1

t   t  t  t

y b B y CX ε (4.33)

ahol X az exogén változó(k) mátrixa, _t C az ezekhez tartozó regressziós együtthatók mátrixa.

Az ilyen (bizonyos irodalomban VARX-szel jelölt) modellek esetén is tesztelhető (a C mátrix ele-meire megfogalmazott megszorítások alapján) akár az exogén változó szükségessége, akár az exo-gén és az endoexo-gén változók közötti okság megléte.

A kutatók a VAR-modellek által kínált lehetőségek közül leggyakrabban a véletlenül bekövetkezett sokkok hatásának egzakt vizsgálatát alkalmazzák, ami a szakirodalomban az impulzus-reakció (im-pulse responses) elemzés néven ismert. Amennyiben a VAR-modelleket alkalmasan választott vektor

128 mozgóátlag modellekké (emlékezzünk a Wold-dekompozícióra!) alakítjuk, lehetőséget kapunk arra, hogy egy véletlen sokk (outlier, nem várt egyszeri esemény, stb.) átfutását a rendszeren (ha úgy tetszik „lecsengését”) nyomon kövessük.

Mindennek könnyebb megértéséhez nézzünk egy illusztratív példát!⁵⁸ Legyen egy elsőrendű vektor autoregresszív modell az alábbi:

1 1, 1 2, 1 1

Tételezzük fel, hogy az eredményváltozók várható értéke mindkét esetben 0, de az első változó a kiinduló pillanatban egységnyi sokkal terhelt, miközben a második változó a kiinduló időpontban a várakozásoknak megfelelően alakult, vagyis

11 1 21 0

Írjuk fel a következő (t 2) időpontra vonatkozó, a fenti modell alapján becsült endogén változó értékeket:

Ismételjük meg ezt a harmadik időpontra vonatkozóan

3 1 2

Ha folytatjuk a sort, láthatjuk, hogy az y₁ változóban a sokk hatása lassan elmúlik, miközben a másik változóban a hatás meg sem jelent.

Érdekes megvizsgálni, hogy mi történik abban az esetben, ha a véletlen sokk nem az első, hanem a második változót éri! Ekkor a változók idősora így alakul

58 A Rappai (2013) könyvében szereplő példa minimális átalakítása.

129

Vagyis ebben az esetben a második változót ért sokk az első változóra is „átterjed”, és – a paramé-ter-szerkezet okán – viszonylag sokáig kifejti hatását.

Folytassuk előző példánkat és nézzük meg, hogy kimutatható-e kölcsönös okság a nézőszám és a merchandising bevételek között! Vizsgáljuk meg azt is, hogy milyen hatással van egy-egy kiugró érték (pl. nagy rangadó nézőszáma, vagy egy új játékos érkezését követő extrém meny-nyiségű mez-eladás) a másik változóra!

A kérdésfelvetés VAR-modell felírását igényli. Nem tudjuk ugyanakkor eldönteni, hogy milyen állhatatosak a nézők, így felírunk egy VAR(1) modellt is (ebben feltételezzük, hogy csak a leg-utóbbi eredmény befolyásolja a vásárlásokat, illetve a következő mérkőzésre történő kilátoga-tást), meg egy VAR(5) modellt is (ez kb. egy hónapos emlékezetet tételez fel).

A 120 mérkőzés adatai alapján illesztettük mindkét modellt, és meghatároztuk az Akaike-féle információs kritérium értékeit:

vagyis elég a kisebb modell, tehát a drukkerek csak az elmúlt meccsre emlékeznek!

Az okság-tesztek eredményei (a kisebb modell alapján):

417, 42 0, 000

Tehát változók között erőteljes feedback kapcsolat áll fenn, mind a nézőszám meghatározza az üzlet bevételét, mind a bevételben megjelenő kiugró értékeket követi a kiugró nézőszám.

Érdemes megnéznünk az impulzus-reakció függvény alakulását:

130 Anélkül, hogy mélyebben elemeznénk az eredményeket, láthatjuk, hogy az egyes változókban keletkező egységnyi sokkok viszonylag hamar, mintegy 1-2 bajnokság alatt lecsengenek, vagyis – sportmenedzser szemmel nézve – a sikereket gyorsan bevételre kell váltani, mert néhány mérkőzés után már nem emlékeznek rá a nézők. (Nem elemeztük, de nyilvánvalóan érdekes lenne annak vizsgálata is, hogy milyen arányban vannak bérletesek a stadionban, akik – vélel-mezhetően – a szezon elején megvásárolják az ereklyéket és ezt követően már nem látogatják a fan-shopot.)

Eddig nem hangsúlyoztuk, de roppant fontos szem előtt tartani, hogy a VAR-modellek kizárólag akkor használhatók, ha valamennyi, a vizsgálatba vont idősor stacionárius. Tudjuk ugyan, hogy dif-ferencia-képzéssel valamennyi idősor előbb-utóbb stacionáriussá tehető, ám a modellezés során ne feledkezzünk meg arról, hogy csak értelmezhető jelenségeket érdemes vizsgálni. Ügyeljünk arra, hogy pusztán módszertani megfontolásokból ne „lúgozzuk ki” az idősorból a tényleges tartalmat!

A következő alpontban a nemstacioner változók többváltozós modelljeit mutatjuk be.

In document Ökonometriai modellek alkalmazása a sportgazdaságban (Pldal 124-130)