• Nem Talált Eredményt

Az autokorreláció vizsgálata regressziós modellekben

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az autokorreláció vizsgálata regressziós modellekben"

Copied!
19
0
0

Teljes szövegt

(1)

AZ AUTOKORRELÁCIÓ VIZSGÁLATA REGRESSZIÓS MODELLEKBEN

KOVÁCS ILONA

Közgazdasági elemzéseink alapjait nagyon sok esetben gazdasági idősorok ké-

pezik, amelyek a gazdasági élet különböző elemeinek (nemzeti jövedelem, fogyasz- tás, beruházás, árak. személyes jövedelem stb.) időbeli alakulását. változását fe—

jezik ki egy adott időszakban.

ldősorok szolgálnak alapul ahhoz. hogy regressziós függvénykapcsolatok se- gitségével megállapítsuk. milyen összefüggés van a gazdaság különböző tényezői között, vagy ahhoz, hogy rövidebb és hosszabb távú előrejelzéseket készítsünk.

Ilyen jellegű munkák elvégzése során nagyon gyakran habozás nélkül nyúlunk a klasszikus értelemben vett legkisebb négyzetek módszeréhez, amely — mint ismere- tes —- az analitikus trendszámitás, a regressziós függvényösszefüggések paraméter- becsléseinek egyik alapvető eszköze. A legkisebb négyzetek módszerét azonban nem alkalmazhatjuk feltétel nélkül. Nagyon gyakori, hogy a regressziószámitás so- rán éppen azért kapunk értelmezhetetlen eredményeket, mert a legkisebb négy-

zetek módszerét felhasználtuk anélkül. hogy ellenőriztük volna alkalmazási fel—

tételeinek teljesülését.

Dolgozatomban röviden összefoglalom a legkisebb négyzetek alkalmazásának feltételeit, illetve a becslés során nyert paraméterek tulajdonságait, majd a to—

vábbiakban a feltételezések közül részletesen foglalkozom a függetlenségi feltétel—

lel, ami azt a követelményt fogalmazza meg, hogy a regressziós függvény hibái kö—

zött ne legyen autokorrelácíó. Alapvető célom az, hogy bemutassam azokat a ma—

tema'tikai statisztikai próbákat, amelyek az autokorreláció kimutatására szolgálnak.

Végül - csak utalásszerűen — foglalkozom azzal. hogy mit lehet tenni. ha a leg- kisebb négyzetek módszerének alkalmazása során olyan szignifikáns autokorrelá- ciót észlelünk a hibák között, amely kérdésessé teszi a paramétereknek e módszer—

rel történő becslését.

Úgy érzem, annál is inkább fokozódó jelentősége van annak. hogy megvizs- gáljukva gyakorlatban a legkisebb négyzetek módszere alkalmazása feltételeinek teljesülését, mivel a számítógép egyre szélesebb körű elterjedése következtében a

módszer alkalmazására most sokkal inkább van lehetőség. mint bármikor.

A LEGKlSEBB NÉGYZETEK MÓDSZERE ÉS A PARAMÉTERBECSLÉS

Adott statisztikai mintára felírhatjuk a következő elsőfokú regressziós függ- vényt (amelyben Y a függő változó, X pedig a független változó, elemeik idősorok esetén egymást követő megfigyelések, keresztmetszeti vizsgálatban például a külön-

(2)

604 KOVÁCS ILONA

böző fogyasztói rétegekre vonatkozó megfigyelések értéke):

Y :atpxla-si (íz1, 2,...,n) /1/

ahol:

5;— a regressziós függvény hibája, amelyre vonatkozóan nem állnak rendelkezésünkre megfigyelések (tartalmazza mindazoknak "a befolyásoló tényezőknek a hatását, amelyek kifejezetten nem szerepelnek magyarázó változóként, valamint a mérési hibákat).

Csak olyan regressziós modellekkel foglalkozunk, amelyekben a független vál- tozó értékei állandók, és nem szerepelhet független változóként (: függő változó

valamilyen késleltetett (lagged) érté-ke.

Az a célunk, hogy a—l— [9 X-re. pontosabban a és [? ismeretlen paraméterekre becslést végezzünk az Y-ra és az X-re vonatkozó megfigyeléseink alapján. Ameny- nyiben a paraméterbecslés a klasszikus legkisebb négyzetek módszerével történik.

úgy a hibák valószínűségi eloszlásóra vonatkozóan bizonyos feltételezésekkel kell

élnünk.1

Az alábbi feltételi rendszert E. Malinvaud magyarul is megjelent könyve (11)

alapján állítottuk fel: '

1. feltétel: az /1/ függvényben szereplő Y és X,- megfigyelt mennyiségek. amelyek nem tartalmaznak mérési hibát; a,. megfigyelhetetlen véletlen változó 0 várható értékkel;

2. feltétel: a hibák eloszlása független í-től és X -től (i: 1. 2. T), a hibaeloszlós szórása a2 (vagyis a hibák homoscedasztikusak):

3. feltétel: két különböző, i és t időpontra vonatkozó megfigyeléshez tartozó 5,- és a' hibák kölcsönösen függetlenek; ez a feltétel fogalmazza meg az autokorreláció nemlétét.

Bármilyen módszerrel is végezzük a paraméterbecslést._az (: célunk, hogy a

paraméterbecslések minél ,,jobbak" legyenek. A feltételrendszerrel párhuzamosan röviden összefoglaljuk, melyek is a ,.jó" becslés kritériumai:

a) torzítatlan az a paraméter a becslése akkor. ha az a várható értéke egyenlő a-val, a becsült paraméterrel, vagyis E(a)vz a; e tulajdonsághoz az 1. feltétel teljesülése szüksé-

ges;

b) konzisztens az a paraméter a becslése akkor. ha az a-nak (: becsült érték körüli szórása zérus. miközben T tart a végtelenhez, vagyis E (a) :: a, és lim D2 (a) : O; konzisztens

_vu:

becslést akkor nyerünk, ha a feltételi rendszer 1.. 2. és 3. feltétele teljesül;

c) hatásos az a paraméter a becslése akkor. ha az a az összes torzítatlan becslés. közül

a legkisebb szórással rendelkezik: l'

d) legjobb lineáris torzítatlan becslésről beszélünk akkor, ha a becslést lineáris reg- resszióból nyertük. és ugyanakkor a becslés torzítatlan, valamint minimális szórással rendel—

kezik.

Minél több feltétel teljesül a regressziós függvény hibatényezőjére vonatkozóan.

annál több tulajdonsággal rendelkeznek a legkisebb négyzetek módszerévelnyert paraméterbecslések. A gyakorlati számítások során azonban elég gyakran előfor—

dul, hogy az említett feltételek teljesülését — kényelemből. vagy mert nem ismerjük az erre szolgáló módszereket —— nem ellenőrizzük. A továbbiakban a feltételi rend-

szerből kiemelem a függetlenségi követelményt, és részletesen foglalkozom a hibák

autokorrelóciójával. '

1A regressziós modellek poraméterbecslési módszereivel dr. Mundruczó György (15) részletesen fog- lalkozott. Ismertette a legkisebb négyzetek módszere feltételeinek rendszerét, (: paraméterbecslések tulajdon—

ságait. Ennek ellenére nem tartom feleslegesnek feleleveníteni azt (] feltételi rendszert. amelynek egyik feltételével foglalkozom a továbbiakban.

(3)

AZ AUTOKORRELACIO VIZSGÁLATA

605 AZ AUTOKORRELÁClÓ M EG HATÁROZÁSA

Általánosságban úgy határozzuk meg az autokorrelációt, mint egy adott idő—

sorban ugyanazon változó szomszédos értékei közötti korrelációt. amelyet elsőrendű

autokorrelációs együtthatóval (ri) fejezünk ki. Másrés zt kiszámíthatjuk általában az

egymástól k távolságra levő tagok közötti, vagyis az i és az i értéktől k távolságra levő érték közötti korrelációs együtthatót, amelyet k-ad rendű autokorrelációs együtt-

hatónak (rk) nevezünk.

Ké'pletben:

r : cov (ui, uHkl k D( u'.) D( uHk)

A meghatározásban még általánosságban. bármely tetszőleges változó autokor—

relációjáról van szó. dolgozatomban azonban kizárólag a véletlen hibaváltozó auto- korrelációjával foglalkozom, mivel a legkisebb négyzetek módszerének alkalmazá—

sakor ez okozza az egyik problémát. A. C. Aitken (1) kimutatta. hogy elsősorban

a hibák közötti. nem pedig a függő, illetve független vá ltozók közötti autokorrelációt kell kiküszöbölni. Lehetséges ugyanis autokorreláció a függő vagy független vál- tozók értékei között, miközben a hibák egymástól fü ggetlenek. hiszen a hibák for—

rásául szolgáló különböző tényezők úgy mozoghatnak, hogy végül is az eredményül

kapott hibák függetlenek lesznek.

Mi okozza gazdasági idősorokban a hibák autokorrelációját, s milyen követ- kezményekkel jár, ha a legkisebb négyzetek módszerét autokorrelált idősorokra al-

kolmazzuk?

Nyomon követve az autokorreláciával foglalkozó nemzetközi szakirodalmat, lát—

hatjuk. hogy nagyon sok statisztikust, matematikai statisztikust foglalkoztatott ez a

téma. Magát a jelenséget elsők között G. U. Yule (21) ismerte fel. s már 1921—ben

késleltetett sorozatkorreláció (lagged serial correlation) néven használja időso- rokban az egymást követő értékek közötti korrelációt. Az 1950—es évek elején G. Tint-

ner (18) és R. L. Anderson (2) foglalkozott behatóan a kérdéssel. Arra vonatko—

zóan, hogy gazdasági idősorokban mi okozhat autokorrelációt, D. Cochrane és G.

H. Orcutt (3) végzett kutatásokat. Eredményeikre támaszkodva összegezem és elem- zem azokat a tényezőket. amelyek pozitív irányú autokorrelációt idézhetnek elő.

Azt hiszem. túlzás nélkül állíthatjuk, hogy az idősorokban majdnem mindig van bizonyos mértékű autokorrelácíó, de éppen az a feladatunk. hogy kimutassuk. vajon ez a mérték alatta vagy fölötte van-e a szignifikancia korlátoknak.

1. A regressziós függvény formájának helytelen kiválasztása. Gyakran előfor- dulhat, hogy két vagy több változó közötti függvénykapcsolatot helytelenül hatá- rozunk meg. Az egyszerűség kedvéért ugyanis gyakran elsőfokú kapcsolatot tétele—

zünk fel, bár az igazi függvényösszefüggést nem is elsőfokú, hanem mondjuk má—

sodfokú (vagy egyéb) függvény írná le helyesen. Ilyen esetben. jóllehet az igazi függvénykapcsolatban (másodfokú függvényben) a hibák autokorrelálatlanok. az illesztett elsőfokú függvényben szereplő cluasi hibák nem függetlenek X—től, a füg—

getlen változótól, és lehetséges, hogy ezáltal a hibák is autokorreláltak lesznek.

C. Christ (4) konkrét példát hoz M. Nerlove (12) tanulmányából, amelyben a szerző a villamos energia költségének alakulását vizsgálja a termelés függvényében. mind- két változó logaritmusát véve alapul. M. Nerlove erősen pozitiv autokorrelációt jelző

együtthatókat kapott eredményül az autokorrelációs próba alapján, és Christ ró-

mutatott: ennek oka az. hogy a Nerlove által kiválasztott függvénykapcsolat nem tükrözi hűen a két változó valóságos összefüggését.

(4)

606

KOVÁCS iLONA

2. Fontos tényezők nem szerepelnek a modellben független változóként. A hi- bák autokorrelációját okozhatja az is. hogy kihagytunk valamilyen lényeges válto- zót, és ennek hatása a hibatényezőben jut kifejezésre.

Viszonylag egyszerű módszer kínálkozik annak megvizsgálására, hogy a rezi—

duumok korreláltak—e egy olyan változóval, amely a függvényösszefüggésben nem szerepel. de mégis azt gyanítjuk, hogya függő változóra valamilyen hatást gyako—

rol. Grafikusan ábrázolhatjuk a reziduumokat és a modellből kihagyott változó értékeit az idő függvényében. Ha a két grafikon csúcsai és mélypontjai megegyezi nek, vagy állandó késéssel (lag) vagy sietéssel (lead) eltérnek egymástól. akkor a függvény felírásakor kihagyott változónak fontos hatása van a függő változóra.

tehát feltétlenül be kell építeni a függvénybe. Ugyanezt az eredményt akkor is megkaphatjuk, ha a reziduumokat a kihagyott változó értékeinek függvényében

ábrázoljuk. Gyorsan észrevehetjük. hogy milyen szoros összefüggés van köztük, és megközelítőleg lineáris—e ez. Ha úgy találjuk, hogy a kihagyott változó kapcsolat—

ban van a reziduumokkal. mindenesetre tanácsos ezt a változót figyelembe venni

a függvényben. Egy egyszerű példa: ha a margarin keresletének alakulását vizs—

gáljuk a margarin árának és a jövedelemnek a függvényében, nagyon valószínű.

hogy a függvényösszefüggésből számított reziduumok korrelációt mutatnak a vaj árával. mivel a magasabb vajárak arra ösztönzik a fogyasztókat, hogy több marga—r

rint vásároljanak. Tehát sokkal inkább a valóságnak megfelel ő a függvényösszefüg—

gés akkor, ha abban a vaj ára is mint független változó kifejezésre jut. Szorosan ide kapcsolódik az az eset. amikor például a fogyasztás adott évi értékét nemcsak az adott évi jövedelem, hanem az azt megelőző évi jövedelem is befolyásolja. Ha ez utóbbit kihagyjuk a modellből, akkor hatása —- más hatásokkal együtt — a hiba—

tényezőben jut kifejezésre.

3. Autokorrelációt okozhatnak (: hibákban a magyarázó változók mérési hi—

bói is, mert előfordulhat, hogy több. egymást követő megfigyelést a mérési hibák ugyanúgy befolyásolnak.

'

4. A nem elég hosszú idősor szintén eredményezheti a hibák autokorreláció—

iát. H. Theil és A. L. Nagar (17) még a 20 adatból álló idősort is ,,rövid" vagy jó

esetben ,,tűrhető" hosszúságú idősornak tekinti. Ha elfogadjuk e szerzőknek az idősorok hosszára vonatkozó kikötését. akkor távolról sem állíthatjuk. hogy a hazai, fogyasztási statisztika bővelkednék olyan idősorokban, amelyeket minőségileg jobb jelzőkkel lehetne illetni, mint ,,rövid" vagy ,,tűrhető". Itt azonban meg kell jegyez—

nünk, hogy az eredmények közgazdasági értékelése szempontjából nem feltétlenül a minden áron való hosszú idősor a ..jó" idősor. Előfordulhat. hogy egy hosszabb időtávlat olyan időszakokat ölel fel, amelyekben a vizsgált jelenségek eltérő tenden- ciákat mutatnak. Ilyen esetben nem célravezető egyetlen függvényt ráerőszakolni a teljes időszakra.

D. Cochrane és G. H. Orcutt (3) arra nézve is végzett kutatásokat. hogy milyen következményekkel jár, ha a legkisebb négyzetek módszerét autokorrelált időso- rokra alkalmazzuk. Vonatkozó kutatásaik fontosabb eredményeit a következőkben foglalhatjuk össze:

a) a hibák erős autokorrelációja esetén is torzítatlan paraméterbecsléseket nyerünk, de a regressziós koefficiensek becsléseinek szórása túlságosan nagy lesz egyéb becslési mód- szerek révén nyert paraméterbecslésekhez hasonlítva; ha valamilyen módon csökkenthető a hibák autokorrelációja. a paraméterek szórása nagymértékben csökken;

b) ha a hibák pozitív autokorrelációt mutatnak. a hibák szórásképlete a szórás jelentős alulbecslését eredményezi:

c) a különböző szignifikancia—próbák — a Student—féle t—próba, valamint F-próba —- el- veszítik érvényüket;

'

(5)

AZ AUTOKORRELÁCIÓ VIZSGÁLATA

607 d) autokorrelált idősorok alapján nem kivánatos előrejelzéseket végezni, mert az előre jelzett értékekből még kellő óvatossággal és körültekintéssel sem lehet messzemenő következ-

tetéseket levonni.

AZ AUTOKORRELÁCIÓ KlMUTATÁSÁRA SZOLGÁLÓ TESZTEK

Tanulmányom fő célja. hogy bemutassam azokat a lehetséges módszereket.

amelyek segítségével az idősorokban az autokorreláció feltárható. 5 gyakorlati hasznosíthatóságuk a témával foglalkozó nemzetközi szakirodalom szerint kiemel- kedő.

Mielőtt rátérnék az egzaktabb matematikai statisztikai módszerek ismertetésére, bemutatok egy grafikus módSzert, amely nagyon hozzávetőleges információt nyújt a hibák autokorrelációjáról. Mivel a hibák elméleti értékek. konkrét adataink csak a regressziós függvényből kiszámított rezíduumokra vannak. Ezeket koordináta—

rendszerben ábrázoljuk úgy, hogy a vízszintes tengelyre mérjük fel az időt, a füg—

gőleges tengelyre pedig a rezíduumokat. Ha a rezíduumok egy negatívból pozitívba (vagy megfordítva) átcsapó trendet mutatnak, vagy általában magas értéket magas.

alacsony értéket alacsony követ, mint például egy viszonylag síma lefutású hullám- trend esetén, ahol inkább a folytonos fölfelé, vagy lefelé irányuló mozgás a jel- lemző. mint az irányváltoztatások, akkor majdnem biztosra vehető, hogy a hibák pozitív autokorrelációt mutatnak. Ha viszont állandóan pozitív és negatív értékek váltogatják egymást, akkor negatív autokorrelációról beszélhetünk.

A rezíduumok grafikonja azonban csak hozzávetőleges. és csak az autokorre—

láció előjelére nézve ad útmutatást. annak mértékére nem.

Grafikusan ugyanilyen hozzávetőlegesen tudjuk ábrázolni a hibák eloszlását is. A vízszintes tengelyen felmérjük a rezíduumokat. a függőlegesen pedig az egyes értékek előfordulási gyakoriságát. Az osztályközöket akkorának kell választani. hogy mindegyiknek legyen néhány tagja. de elég kicsinek ahhoz. hogy legyen legalább 4—5' intervallum. Ha ehhez nem rendelkezünk elég megfigyeléssel, akkor ez (: gra—

fikus módszer nem sokat mond. Ha a felmért gyakoriságok megközelítőleg harang alakú görbét eredményeznek, akkor a hibák megközelítőleg normális eloszlásúak.

Kis minta (kevés számú megfigyelés) esetében nem meglepő, ha a normális el-

oszlástól lényeges eltérést tapasztalunk.

YuIe—KendalI-módszer2

Az egyik legkorábbi próba G. U. Yule és—M. G. Kendall (22) nevéhez fűződik.

Egy sorozat véletlenszerűségének vizsgálatára javasolnak viszonylag egyszerű mód—

szert, amely ugyan nem tekinthető egzaktnak, de nagyon jó kiindulási alapul szol—

gálhat a véletlenszerűség kimutatásához. A sorozat véletlenszerűsége egyik mé—

rőszámának tekintik az egy sorozatban előforduló csúcspontok és mélypontok gya—

koriságát.

..Az uj, ug, u,, . . ., uHk tagokból álló sorozat az tagját akkor nevezzük csúcspontnak, ha uh, ( u,) Uzu: mélypontnak pedig akkor. ha u,_1) u,(uH_1.

Mindkét esetben az ut -t fordulópontnak nevezzük. A két fordulópont közötti inter- vallumot fázisnak nevezzük. Ha két vagy több egymás utáni érték egyenlő, és egy- idejűleg nagyobb, mint a szomszédos értékek. akkor egyetlen olyan értéket tekin- tünk csúcspontnak, amely az egyenlő értékek terjedelmének középpontjában helyez-

kedik el. Ugyanez vonatkozik a mélypontra is.

2 A Yule—Kendall-módszer Moore—Wallis-prőba néven is ismert.

(6)

608 KOVÁCS KLONA'

Bebizonyítható. hogy egy n tagú véletlen sorozat fordulópontjai p—számának!

várható értéke E(p) és szórásnégyzete D2(p) egyenlő az alábbiakkal:

sip) : % (n—Z)

Ha a sorozat tagjainak száma nagyon nagy. akkor az egységre jutó forduló?

pontok átlagos száma 2/3, tehát az átlagos fázis (két fordulópont közötti átlagos távolság) 1.5. Ebből következően a csúcspontok (vagy mélypontok) közötti átlagos—

távolság 3, és ez az, ami véletlen sorozat esetében várható."3 Neumann-módszer

]. Neumann módszerét eredetileg ballisztikus kísérletek során használták fel, Neumann azonban felismerte általános voltát. és gazdasági idősorokban is alkal—

mazta az autokorreláció kimutatására (13). ,?

A módszer kidolgozásánál Neumann abból indult ki. hogy a változók értékei véletlenek és megfigyelhetők. Szigorúan véve ezért Neumann módszere nemal- kalmazható a hibák véletlenszerűségének kimutatására. mert a gyakorlatban a hi—

bák helyett mindig a rezíduumokkal dolgozunk, ezek pedig — mint tudjuk — nem , A megfigyelt. hanem a regressziós függvényből kiszámítottértékek. Ennek ellenére Neumann módszerét szokták autolkorrelált idősorokra alkalmazni. de főképpen a megfigyelhető függő, illetve független változók autokorrelációjának kimutatására használatos. '

A Neumann—mutató nem más, mint egy változó egymást követő különbségei

négyzetes átlagának (52). valamint a változó szórásának (55) a hányadosa:

r—1

52 ;: (le—xtP/(T—n

53 r * 2

221 (xi—x) /T

ahol xi, xz. . . . , xT egy változó egymást követő értékei.

Neumann valószínűségi változóként kezelte a mutatót. amelynek eloszlása

aszimptotikUSan normális; átlaga 2Tl(T—-1). vagyis 2 körüli érték. A Neumann-mu-

tató valószínűségi eloszlását az 1. ábrán mutatjuk be. A mutató eloszlására vonat—

kozó küszöbértékeket B. !. Hart (9) foglalta táblákba 5 és 1 százalékos valószí- nűségi szinteken, különböző nagyságú minták mellett.

Az ábrán a mutató értékeinek terjedelme három részre oszlik: a középső rész (őz/53046! 4T/(T—1) ——(62/SZ)0-ig jelképezi azt a területet, amelyben a zéró autokar-

reláció hipotézist elfogadjuk. A (52/52)0 az az alsó határ,..amely alatt szignifikáns

pozitív autokorreláció van. vagyis a zéró autakorreláció hipotézisét elvetjük. A jobb

oldali sáv 4T/(T—1) - (52/52)0-tól 4T/(T—1)-ig jeleníti meg a negatív autokarrelációt.

ltt szintén elvetjük a zéró autokorreláció hipotézisét.

Mint már megjegyeztem. a Neumann-módszer csak megfigyelhető változók

autokorrelációjának kimutatására alkalmas. Ennek ellenére érdemes volt bemu- tatni e mutatót. mert Durbin és Watson a gyakorlatban az autokarreláció kimu-é

3 Lásd: (22) 629. old.

(7)

AZ AUTOKORRELACIÓ VIZSGÁLATA 609

tatására leggyakrabban használt módszert a Neumann-módszerből kiindulva dol—

gozta ki.

1. ábra. A Neumann-mutató eloszlásának ábrázolása

52 *

Sz' ! ,

ra/ásszűséy— * pr. Pld Jl

saw/segg paű—bx/w/éZ/Lsfl W//-/7/pa/Áz/s/ íűűű'ÚWÚ/ÉZ/Éfl Nye/jü : megfa/l/jz/Á' l e/z/e/jzík :

paz/h'z/ l ! vega/Ú l

aufa/fmwűr/b' aufp/áa/v/fe/ác/űl

! l l i l

l

l

)._,___. x

7

27 47 _( a) 47

% Ax %% NN V %

7—7 7—7 52 0 7-7

Durbin—Watson-próba

!. Durbin és G. 5. Watson (5) úgy fejlesztette tovább a Neumann-módszert,

hogy az alkalmas legyen a regressziós függvényből kiszámított rezíduumok függet—

lenségi vizsgálatára. A Durbin—Watson-mutatót — másképpen d vagy D—W mutatót

—- kiterjedten alkalmazzák gazdasági idősorok elemzésében a hibák függetlenségé—

nek kimutatására. E mutatót a következőképpen számítjuk ki:

T

tg (Vt—' 'It—1)2

T

2 V2

tz'l

ahol v! a regressziós függvényből kiszámított rezíduum. A Durbin—Watson—mutató megjelenésében a Neumann-mutató módosított változata, a kettő közötti eltérést egy T/(T—l) tényező adja. lgy a két mutató számszerű értéke közel azonos, de a Durbin és Watson által különböző valószínűségi szintekre számított szignifikancia—

táblázatok eltérnek Hartnak a Neumann- mutató eloszlására vonatkozó táblázatai- tól.

A d- mutató eloszlását a 2. ábrán mutatjuk be, amelyből nagyjából látható, hogy a mutató eloszlása szimmetrikus. átlaga egyenlő 2- vel. -

Minden statisztikai próbának az a lényege. hogy felállítjuk kiinduló. nullhipo- tézisünket. jelen esetben azt, hogy nincs autokorreláció a regressziós függvény hi—

bái között, szemben azzal az alternatív hipotézíssel, hogy van autokorreláció. A kö- vetkező lépésben kiszámítjuk a D—W mutató értékét a megadott képlet alapján. Ha a mutató értéke 2 körüli. akkor nincs, vagy nagyon kis mértékű autokorreláció van

a szóban forgó változó értékei között.

Durbin és Watson nem tudott pontos szignifikancia-értékeket számítani a d- mutatóra, helyette alsó és felső korlátokat (dA és d;) határoztak meg. 5. 2. illetve

d::

4 Statisztikai Szemle

(8)

610 KOVÁCS ILONA

1 százalékos valószínűségi szinteken T : 15—100-lg, k : 1—5-ig. ahol T a meg—

figyelések szóma, k a magyarázó változók száma. Az 5, illetve 1 százalékos való—

színűségi szintekre vonatkozó korlátokat az 1. és 2. tóblóban mutatjuk be.

A kiszámított d-mutatót a 2. ábra és az 1. illetve 2. tábla segítségével a követ- kezőképpen értékeljük:

1. ha d kisebb, mint dA. akkor el kell vetni kiinduló feltételezésünket, mert a hibák kö- zött az adott valószínűségi szinten pozitív autokorrelóció van:

2. ha d nagyobb. mint dr. de kisebb. mint 4-dF, akkor kiinduló feltételezésünket meg- tartjuk. mert az adott valószínűségi szinten a hibák függetlenek; *

3. ha d az alsó és a felső határok közé esik, dA ( d ( dr, akkor az autokorrelóció el- döntésére szolgóló próba nem ad lehetőséget egyértelmű következtetések levonására.

1. tábla

Az alsó és a felső korlátok szignifíkancia-pontiai 1 százalékos valószínűségi szinten

A szignifikancia

A megfigyelések alsó ] felső ! alsó l felső [ alsó l felső ! alsó ! felső l alsó [ felső

!zcma . . : , ,

korlatja. ha a valtozok szama

kz1 l kzz ] kzs ( kuA ] ch

15 . . . . . . 0.81 1.07 0.70 1.25 0.59 1,46 0.49 1.70 0.39 1,96

'ló . . . . . . 0.84 1.09 0.74 1.25 0.63 1.44 0,53 1,66 0.44 1.90

17 . . . . . . 0.87 'l,10 0.77 125 0.67 1 .43 0.57 1.63 0.48 1,85

18 . . . . . . 0.90 'l,12 0.80 1.26 0.71 1.42 0.61 1.60 0.52 1.80

19 . . . . . . 0.93 1.13 0.83 1.26 0.74 1.41 0.65 1.58 0.56 1.77

20 . . . . . . 0.95 1.15 0.86 1.27 0.77 1.41 0.68 1.57 0.60 1.74

21 . . . 0.97 1.16 0.89 1.27 0.80 1.41 0.72 1.55 0.63 1.71

22 . . . . . . 1.00 1.17 0.91 1.28 0.83 1.40 0.75 1.54 0.66 1.69

23 . . . 1,02 1 .19 0.94 1.29 0.86 1.40 0.77 1.53 0,70 1.67

24 1.04 1.20 0.96 1.30 0.88 1.41 O,80 1.53 0.72 1.66

25 1,05 1.21 0.98 1.3!) 0.90 1.41 0.83 1.52 0.75 1.65

26 1.07 1.22 1.00 1.31 0,93 1,41 0.84 1.52 0.78 1.64

27 1,09 1.23 1.0? 1,32 0.95 1.41 0.88 1.51 0.81 1.63

23 1.10 1.24 1.04 1,32 0.97 1.41 090 1.51 0.83 1.62

29 1.12 1.25 1.05 133 0.99 1.42 0.92 1.51 0.85 1.61

30 1.13 'l,26 1,07 1.34 1.01 1.42 0.94 1.51 0.88 1.61

31 1.15 1.27 1.08 1,34 1.02 1.42 D,9ó 1.51 0.90 1.60

32 1.1 6 1.28 1,'lO 1.35 1.04 1.43 0.98 1.51 0.92 1.60

33 1,17 1.29 1.11 1.36 1.05 1.43 1.00 1.51 0.94 1.59

34 1.18 1,30 1.13 1,36 1.07 1.43 1.01 1.51 0.95 1.59

35 1,19 1,31 1.14 1.37 1.08 1.44 1.03 1.51 0.97 1.59

36 . . . _ . _ _ 1.21 1,32 1.15 1.38 1.10 1.44 1.04 1.51 0.99 1.59

37 _ _ _ _ _ _ 1,22 1,32 1.16 1.38 1.11 1.45 1.06 1.51 1.00 1,59

38 _ _ _ _ _ _ 1.23 1.33 1.18 1.39 1.12 1.45 1,07 1.52 1.02 1.58

39 _ _ _ _ 124 1.34 1.19 1.39 1.14 1.45 1.09 1.52 1.03 1.58

40 1.25 1.34 1.20 1.40 1.15 1.45 1.10 1.52 1.05 1.58

45 1.2? 1.38 1.24 1.42 1.20 1.48 1.16 1.53 1.11 1.58

50 1.32 1.40 1.28 1.45 1.24 1.49 1.20 1.54 1.16 1.59

55 1,36 1,43 1.32 1.47 1.28 1.51 1.25 1.55 1.21 1.59

60 1.38 1.45 1.35 1.48 1.32 1.52 1.28 'l,56 1.25 1.60

65 1.41 1.47 1.38 1.50 1.35 1.53 1.31 1.57 1.28 1.61

70 1.43 1.49 1.40 1.52 1.37 1.55 1.34 1.58 1.31 1.61

75 1,45 1.50 1.42 1.53 1.39 1.56 1.37 1.59 1.34 1.62

80 1.47 1.52 1.44 1.54 1.42 1.57 139 1.60 1.36 1.62

85 1.48 1.53 1.46 1.55 1.43 1.58 1.41 1.60 1.39 1.63

90 1.50 1.54 1.47 1.56 1.45 1.59 'l,43 1.61 1.41 1.64

95 1,51 1,55 1.49 1.57 1.47 1.60 1.45 1.62 1.42 1.64

100 1.52 1.56

1.50

1.58 1.48 1.60 1.46 1.63 1.44 1.65

(9)

AZ AUTOKORRELACIÓ VIZSGÁLATA 611

Úkc'mometriai elemzésekben előfordul, hogy idősorokban nem pozitív. hanem negatív autokorrelóció kimutatása lenne kívánatos. Gyakori például az az eset, amikor inkább a megfigyelt értékek első differenciált elemezzük az eredeti meg—

figyelések helyett. így azonban megvan annak a veszélye, hogy a transzformáció révén negativ autokorrelóciót létesitünk a hibák között.

A Durbin—Watson—féle d—mutatót az előzőkhöz hasonlóan számítjuk ki. és ki- vonjuk 4—ből. A 4—d értéket ugyanúgy kezeljük. mint d-t pozitív autokorrelóció ese—

tén. lgy ha (4—d)(dA, akkor szignifikáns negativ autokorrelóció van a hibák kö-

zött, ha (4—d))dp, akkor pedig nincs autokorrelóció. Minden egyéb esetben a próba

eredménytelen.

2. tábla

Az alsó és a felső kar/átok szignifikancía—pontiai 5 százalékos valószínűségi szinten

A szignifikancia

Amegfigyelések alsó ] felső l alsó l felső ] alsó [ felső [ alsó ] felső ] alsó l felső

szama . . , ; :

karizma. ha a valtozok szama

k : 1 l k : 2 I k : 3 I k : 4 ] k : 5

15 1.08 1.36 0.95 1.54 0.82 1.75 0,69 1,97 0,56 2.21

16 1.1 0 1,37 0,98 1,54 0.86 1.73 0.74 1.93 0.62 2.15

17 1.13 ! 1,38 1.02 1,54 0.90 1.7] 0.78 1.90 O,67 2.10

18 1,16 , 1.39 1.05 1.53 093 l,69 0.82 1.87 0.71 2,06

19 l,18 ' 1.40 1.08 1.53 0.97 1.68 0.86 1,85 0.75 2,02

20 1.20 1.41 1.10 1.54 1.00 1.68 O,9O 1.83 0.79 1.99

21 . 1,22 1.42 1.13 1.54 1.03 1.67 0.93 1.81 0.83 1.96

22 ' 1,24 1.43 1.15 1.54 1.05 1.66 0,96 1.80 0.86 1.94

23 1.26 1.44 1,17 1.54 1.08 1.66 0.99 1.79 O,80 192

24 1,27 1,45 'l,19 1.55 1.10 1,66 1.0'1 1.78 0.93 1.90

25 1,29 1,45 1.21 1,55 1,12 1,66 1,04 1.77 0.95 1.89

26 1.30 1,46 1,22, 1.55 1.14 1.65 1.06 1.76 0.98 1.88

27 1.32 1.47 1,24 1.56 1.16 1.65 1.08 1.76 1.01 1.86

28 1.33 1,48 1,26 1,56 1.18 1.65 1.10 1.75 1.03 1.85

29 1.34 1.48 1,27 1.56 1.20 1.65 1,12 1,74 1.05 1.84

30 1.35 1.49 128 1.57 1.21 1.65 1,14 1,74 1.07 1.83

31 1,36 1.50 1.30 1.57 1,23 1.65 1.16 1,74 1.09 1,83

32 1.37 1.50 'l,31 1.57 1,24 1,65 1,18 1.73 1," 1.82

33 1.38 1.51 1.32 1.58 1,26 1.65 1.19 1.73 1.13 1.81

34 1.39 1.51 1.33 1.58 1.27 1.65 1,21 1.73 1.15 1.81

35 1,40 1.52 1.34 1.58 1.28 1.65 122 1.73 1.16 1.80

36 1,41 1.52 1.35 1.59 1.29 1.65 1.24 1.73 1,18 1.80

37 1.42 1.53 1.36 1.59 1.31 1.66 1.25 1.72 1.19 1.80

38 1,43 1.54 1.37 l,59 1.32 1,66 1,26 1.72 1.21 1.79

39 1,43 1.54 1,38 1,60 1,33 'l,66 1,27 1,72 1,22 1.79

40 1.44 1,54 1,39 1.60 1.34 1,66 1,29 1.72 1,23 1,79

45 1,48 1.57 1.43 1,62 1,38 1.67 1.34 1.72 1,29 1,78

50 1.50 1.59 1.46 1.63 1.42 1.67 1.38 1.72 'l,34 1.77

55 1.53 1.60 1.49 1.64 1,45 1.68 1.41 1.72 1.38 1.77

60 1.55 1.62 1,5i1 1,65 1,48 1.69 1.44 1.73 1.41 1.77

65 1.57 1.63 1.54 1,66 1.50 1,70 1.47 1,73 1,44 1,77

70 1.58 1.64 1.55 1.67 1.52 1,70 1.49 1,74 1.46 1.77

75 1,60 1,65 1.57 1.68 1,54 1,71 1.51 1,74 1.49 1.77

80 1.61 1.66 1.59 1.69 1.56 1,72 1.53 1.74 1.51 1.77

85 1,62 1.67 1.60 1.70 1.57 1.72 1.55 1,75 1.52 1.77

90 1,63 1.68 1.61 1.70 1.59 1.73 1.57 1.75 1.54 1,78

95 1,64 1.69 1.62 1,71 1,60 1,73 1,58 1,75 1,56 1,78

100 1.65

1.69 1.63

1.72

1.61 1.74 1,59 1,76 1.57 1.78

4—

(10)

KOVÁCS lLONA

2. ábra. A Durbín—Watson-mutató eloszlásának ábrázolása

__a_'_ va/ószínűség—

sűrűsége

._ l . .

00//—/1/'pa/éZ/19f: l fla/Fb/pafe'Z/s/ ! lnu//—/7/,aa/émfl

Nye/júli ] E/fapaa'juk ] e/ye/jűk

? ?

4——.—-,————ol . ! ! . %4———-—l

pan/xy x

JUfűÉűFFE/ő'ő/í ] l

;

A 2. ábrán látható két kérdőjeles, az alsó és a felső korlátok közé eső sáv. az ún. tudatlansági övezet (region of ignorance) csökkenti a Durbin—Watson—móclszer

értékét, mert ha (: d-mutató kiszámított értéke ebbe a sávba esik, akkor semmit

sem tudunk mondani arról. hogy van-e outokorreláció a hibák között. Különösen

akkor okozhat ez nehézségeket, ha ez az övezet nagy. Márpedig ez annál nagyobb.

minél alacsonyabb a megfigyelések száma. A 3. ábra szemléletesen bemutatja en- nek (: tudotlcnsági övezetnek a változását a megfigyelt értékek számának, illetve a változók számának (k : 1. 2. 3, 4. 5) változása esetén. 5 százalékos valószínű- ségi szinten.

l

l

l l l

! l ! l ;,

, ' nincs au/aáome/a'c/á ! l l

] l l inega/ír l

l : ! lau/oíamelí'n'ó :

l !

! l l l l _

l l l l l l * d

0 44 d,; 2 4'df 4'44 4

3. ábra. Az ún. tudatlanságí övezet terjedelme (d) és a megfigyelések száma (n)

d' Haiku/ár

""" yik/só kan/át

al5l.l.l.l.l.l.l.l.

(11)

AZ AUTOKORRELÁCIÓ VIZSGÁLATA

613

Durbin és Watson megközelítő módszert javasolt arra az esetre, ha az auto—

korrelóciós próba nem eredményes, vagyis a d-mutató értéke a tudatlansági öve——

zetbe esik, de a javasolt módszer elég bonyolult. A gyakorlatban általában bevett szokás. hogy amennyiben a d-mutató a tudatlansági övezetbe esik, akkor úgy te—

szünk. mintha autokorrelóció lenne a hibák között, tehát nullhipotézisünket elvet—

jük.

Az autokorrelóciónak a D—W-mutatóval történő ellenőrzésére bemutatunk két fogyasztási statisztikából vett példát. Az egy főre jutó 1950—1972. évi burgonya-, illetve tojásfogyasztóst vizsgáljuk, az egy főre jutó reáljövedelem és az egységárak függvényében.

Tételezzük fel, hogy a burgonya-, illetve tojásfogyasztás alakulását az alábbi függvény helyesen fejezi ki:

V : UML—l" azxz 'l— 8

ahol (az eredeti értékek helyett azok logaritmusaival számoltam):

Y — az egy főre jutó burgonya- illetve tojósfogyasztás logaritmusa.

x, -— az egy főre jutó reáljövedelem logaritmusa.

xg — a burgonya és a tojás egységárának logaritmusa.

Nem szükséges, hogy itt az adatokat és a részletes számításokat közzétegyem/i ezért csak a D—W-mutató kiszámított értékét adom meg a két termékre vonatko-

zóan: a burgonyánál 0.885. a tojásnál 0.1688.

Az 1. és 2. küszöbértéktáblában 1. illetve 5 százalékos valószínűségi szinteken n : 23 és k : 2. az alsó korlát dA : 0.91, illetve 1,15. Ha ezekkel az értékekkel ösz- szevetjük a kiszámított d-mutatókat, megállapíthatjuk, hogy mind a burgonya-. mind a tojásfogyasztásra vonatkozó Durbin—Watson-együttható mindkét valószínűségi szinten a küszöbértékeknél alacsonyabb. Ennek alapján levonhatjuk a következ—

tetést. hogy pozitív autokorrelóció van a hibák között. Az autokorrelóció mértéke azonban a két termék fogyasztására vonatkozóan nyilvánvalóan különböző. A bur- gonya esetében 1 százalékos valószínűségi szinten a d—mutató alig valamivel ki- sebb, mint 091. mondhatnánk azt is, hogy éppen súrolja a kritikus határt. 5 szó—

zalékos valószínűségi szinten már lényegesen nagyobb az eltérés. ! A Durbin—Watson-próba alkalmazása során E. !. Hannan (8) kimutatta, hogy ha a regressziós függvényben a független változóknak az első, a második és így tovább. k-adik hatványai szerepelnek változókként, akkor az autokorrelóciós mu- tató felső korlátja nagyon jól megközelíti azt az elfogadási szintet, amely fölött nullhipotézisünket megtartjuk, illetve amely alatt elvetjük. Orcutt és Cochrane ku- tatásai is azt bizonyítják, s erre Durbin és Watson is utal, hogy a d—mutatóra vo—

natkozó helyes elfogadási szint közelebb van a felső korláthoz, mint az alsóhoz.

Ezért a táblákban a d-mutatóra vonatkozóan gyakran csak a felső korlátot tekintjük

szignifikancia—pontnak, és ehhez viszonyítjuk a mutató kiszámított értékét.

Theil—Nagar-próba

H. Theil és A. L. Nagar (17) —— annak elismerése mellett. hogy Durb'in lés Wat- son nyújtotta e témakörben a legnagyobb tudományos hozzájárulást — bírálja ered- ményük részlegességét. mivel nem pontos szignifikancia-korlátokat, hanem alsó és

felső korlátokat állítottak fel a d-mutatóra. Theil és Nagar megkísérelte kiküszö-

4 A részletes számításokat az érdeklődők megtalálhatják (10) alatt.

(12)

614

KOVÁCS ILONA

bölni a Durbin—Watson-próba hátrányát. Olyan esetekre sikerült is, amikor a füg-

getlen változók első és második dlfferenciái abszolút értékben kicsik ahhoz az ln?

tervallumhoz viszonyítva. amelyben maguk az eredeti változók különböző értékei

mozognak.— Ennek a feltételezésnek a legtöbb idősor eleget tesz. mert általában a megfigyelt értékek a független változó növekvő értékei szerinti sorrendben helyez—

kednek el. Kivétel, ha már eleve a változók első differenciálval dolgozunk, erre az esetre a módszer nem javasolható. Theil és Nagar kimutatta. hogy :: Durbln ési Watson által megállapított felső korlátok jó megközelítései az általuk kiszámított.

viszonylag pontos szignifikamia-korlátoknak. A Theil- és Nagar-féle szlgnlflkancía—

pontokat a 3. táblában mutatjuk be., "

3. tábla

A Theil és Nagar által a Durbin—Watson-mutatóra készített szignilíkancia-tábla

A szlgnifikancia-szint, ha a változók száma

A megflgyelések k : 1 k : 2 k : 3 k : 4 k : 5

""m" 1 l 5 1 [ 5 1 ] 5 1 l 5 1 l 5

százalékos valószínűségi szlnten '*

15 ,, l,07 *1 ,36 1,24 1,53, 1.43 1.73 1.65 l,94 1.88 2,ló

. 1.08 1.37 1.24 l,53 1.42 1 ,71 1.62 1.90 1.83 2,'ll

17 . 1.10 138 1.25 1.53 1.41 1.69 1.59 1.87 1.79 2.06

18 . l ,12 1.39 1.25 1.53 1.40 1.68 1.57 1.85 1.75 2.02

19 . 1.13 1,4O 1.26 ,1.53 1.40 1.67 1.56 1.83 1.72 ! 1.99

20 . 1.15 1.41 1.26 1.53 1.40 1.67 1.54 1.81 1.70 1,_96

21 . 1.16 1.42 1.27 l,53 1.40 1.66 1.53 1.80 1.68 194

22 . 1 ,17 1,43 1.28 l,54 1.40 1.66 153 1.78 1.66 192

23 . 1.19 1.44 1.29 1.54 1,40 1,65 1,52 1.77 1.65 . ),90

24 . 1.20 l,45 1.29 1,54 1,40 1.65 1.5l l,77 — 1.64 1.89

25 ,. 1.21 1.45 1.30 'l,55 1.40 1.65 1.51 1.76 1.63 1.87

26 . 1.22 1.46 1.31 1.55 1.40 1.65 1.51 1.75 1.62 1.86

27 . 1.23 1,47 1.32 1.55 'l,41 1.65 1.51 1.75 l,61 1.85

28 . 1.24 1.48 1.32 l,56 1.41 1.65 1.51 1.74 — 1.60 1.84.

29 1.25 1,48 1.33 1515 1.414 1.65 1.50 1.74 1.60— 1,83

30 126 1.49 1.34 1.57 1.42 1.65 1.50 1.73 1.60 1.82

31 1.27 150 1.34 1,57 1,42 1.65 1.50 1.73 1.59 1.82

32 1.28 1.50 1.35 1.57 1.43 1.65 1.50 1.73 1.59 1,81

33 )1 .29 1.51 1.36 1.58 1.43 1.65 1.51 1.73 1.59, 1.84

34 1,30 1.51 1.36 1.58 1.43 1.65 1.51 1.72 1.58 1.80

35 1.31 1.52 'l,37 l,58 1,44 1.65 1.51 1.72 1.58 1.80

36 1.31 1.52 1.38 1.59 1.44 1.65 1.51 1.72 1.58 1.79

37 1.32 1555 1.38 1.59 1.44 1.65 1,51 1.72 1.58 1,79

38 1.33 1.53 1.39 1.59 1,45 1.65 1.51 1.72 1.58 1.79

39 1,34 1.54 1.39 l,60 1,45 1.66 1.51 1.72 1,58 1,79

40 1.34 154 1.41 1.61 1.46 1.66 1.52 1,72 l,58 1,78_.

45 l,37 1,56 1,42 . 1.61 1.47 1.67 1.53 1.72 1.58 1,78

50 1.40 * 1.58 1.44 1.63 1,49 1.67 1.54 1.72 ' 1.5? 4.7?

55 1.43 1.60 1.47 1.64 1,51 1,68 1.55 1.72 1.59 1,77

60 l,45 'l,62 1.48 1.65 1.52 1.69 1,56 1.73 1.60 1.77

65 1.47 'l,63 1.50 1.66 1.53 1.70 1.57 1.73 1.60 ' 1.77

70 1.49 1.64 1.51 1.67 1.55 1.70 1,58 1.73 1.61 1.77

75 1.50 1.65 1.53 1,68 1.56 1 ,71 1,59 1.711 1.72 1,77

80 1,52 1.66 1.54 1.69 1.57 l,72 1.60 1.74 1,62 1,77,

85 'l,53 1.67 1.55 1.70 1.58 1.72 1.60 1,75 _ 1.63 1.77

90 1.54 1.68 'l_,56 1,7O 1.59 1.73 1.61 1,75 1.64 1.78

95 1.55 1.69 1,57 1.71 1.60 1.73 1.62 1.75 1,64 1.78

100 1.56 1.69 1.58 1.72 1.60 1,74 1.63 1.76 1,65 1,78

(13)

AZ AUTOKORRELACIÓ VIZSGÁLATA 615

Ha a 3. tábla adatait összevetjük Durbin és Watson tábláinak adataival. akkor azt látjuk, hogy Nagar és Theil szignifikancia-pontjai majdnem megegyeznek a Dur-

bin—Watson—féle felső korlátokkal. Minél nagyobb a minta, és minél kisebb a válto—

zók száma, annál jobb lesz ez a megközelítés.

A két tábla nem azonos. mert Nagar és Theil különböző megközelítési módo- kat használt a szignifikancia-pontok kiszámításához.

Ha a Durbin—Watson-mutatót a Nagar—Theil-féle szignifikancia-táblával vet-

jük egybe. akkor ennek alapján d akkor szignifikáns, ha kisebb. mint a táblában szereplő érték. megfelelő mintanagyság és valószínűségi szint mellett és d akkor nem szignifikáns. ha nagyobb, minta táblában szereplő érték. Ilyen módon a bur—

gonya—, illetve a tojásfogyasztás regressziós függvényeire vonatkozó cl-értékeket (0.885, 0.1689) összevetve a 3. táblával T : 23 és k :: 2 esetében. 5, illetve 1 százalékos valószínűségi szinten azt láthatjuk, hogy a számított együttható mind a burgonyára, mind a tojásra vonatkozóan kisebb, mint a táblában szereplő küszöb-

érték (1,29, 1.54). Ebből következően a Nagar—Theil—próba szerint is pozitív auto- korreláció van a hibák között.

Geary-próba

1970—ben R. C. Geary a Neumann—, illetve a Durbin—Watson—próbától teljesen

eltérő módszert dolgozott ki az autokorreláció kimutatására (ó). Geary módszeré—

ről azt állítja, és sikeresen bizonyítja is. hogy gyakorlatilag csaknem ugyanolyan hatékonyan alkalmazható az autokorreláció kimutatására, mint akár a Neumann-, akár a Durbin—Watson—próba. Geary módszere rendkívül egyszerű, és nagy elő- nye, hogy nem igényel hosszadalmas számításokat. Lényege az. hogy egyszerűen összeszámoljuk a regressziós függvényből kiszámított rezíduumok előjelváltásait.

Ha csak néhány előjelváltozás van, akkor biztosak lehetünk abban, hogy a hibák autokorreláltak, a regresszió nem kielégítő, mert vagy a lényeges független változók nem szerepelnek, vagy mert a regressziós függvény formája nem helyes.

Jelölje T a megfigyelések számát és 1 az előjelváltozások számát. Ha az elő- jelek véletlen sorrendben követik egymást. akkor a ! előjelváltozások gyakoriságát a

(7-1)!

:! (1—1 _r)!

míg a teljes gyakoriságot a

27—1—1

képlet fejezi ki. (A teljes gyakoriság képletében azért szerepel —1. mert az egymást követő T értékek előjele nem lehet azonos. mivel a regressziós eltérések összegé-

nek nullának kell lennie.)

Az előbbiek alapján Geary kiszámította a 1 számú előjelváltozások valószínű—

ségét. amit a következőképpen írhatunk fel:

(I"n! /(27—1——1)

Pm ___ :!(7—1—1)!

Geary ezt a valószínűségi eloszlást továbbfejlesztette, kumulatív valószínűségekkel fejezte ki a r vagy ennél kevesebb számú előjelváltozások valószínűségeit:

pit § t) : goa—t, (ll—ffi)! / (zr—l—n

(14)

616 KOVÁCS iLONA

Ha a kiszámított valószínűség P §0.05, akkor a hibák véletlen eloszlására vo- natkozó nullhipotézisünket el kell vetnünk. vagyis ez esetben pozitív autokorreláció van a hibák között. Ha viszont P) 0.05, akkor nullhipotézisünket megtartjuk, tehát a hibákat függetlennek tekintjük. íly módon az előjelváltozások számának ismere- tében egyszerű módszer áll rendelkezésünkre a hibák autokorrelációjának kimu- tatására. H. Habibagahí és ]. Pratschke közös cikkükben (7) 5, illetve 1 százalékos

valószínűségi szinten kiszámították az előjelváltozásoknak azt a kritikus minimális

és maximális határát (bármely T—re. ahol 3_§ T § 55), amely konzisztens a null- hipotézíssel. (Lásd a 4. táblát.) így például T : 25 megfigyelés esetén 5 százalékos valószínűségi szinten bármely számú előjelváltás 9 és 15 között konzisztens a null hipotézissel. tehát a hibák függetleneknek tekinthetők. máskülönben a nullhipoté- zist el kell vetnünk. Burgonyafogyasztósí példánkban az előjelváltozások száma 7.

a tojás esetében 2. A megfigyelések száma mindkét esetben 23. Behelyettesítve ezeket a kumulatív valószínűségi képletbe. a burgonyára a következőt nyerjük:

7 22!

"* § " : gum—?)"! lm; 1) :: 0,0674

A definíció értelmében, ha a kiszámított valószínűség, P § 0.05. akkor a hibák véletlen eloszlására vonatkozó hipotézisünket el kell vetnünk. Esetünkben ez a valószínűség O,.Oó7 azaz nagyobb, mint O.,05 tehát e próba szerint nincs autokor- reláció a hibák között. A tojás esetében nyilvánvalóan autokorrelációról van szó.

hiszen csupán 2 előjelváltást figyelhetünk meg, így ott feleslegesnek tartom a mu—

tató kiszámítását. Ez esetben nem alkalmazható a klasszikus legkisebb négyzetek módszere a regressziós függvény paramétereinek becslésére. mert olyan paramé- tereket nyernénk. amelyek rendelkeznének mindazokkal o hátrányos tulajdonsá—

gokkal. amelyekről a korábbiakban már szó volt.

AZ ISMERTETETT PRÓBÁK HATÉKONYSÁGÁNAK ÖSSZEHASONLlTÁSA

Áttekintettük azokat a fontosabb módszereket, amelyek eléggé elterjedtek a módszerek jellemző tulajdonságaira, álkalmazhatóságí feltételeire. Felhívtuk a ti- gyelmet egyes módszerek előnyeire és másokvhátrányaíra. Habibagahi és Protschke (7) hasonlította össze a különböző. itt ismertetett autokorrelációs próbák hatékony- ságát. A vizsgálathoz véletlenül generált, normális eloszlású (O-átlogú, egységnyi szórású). 16, 18, 50. 52 megfigyelésből álló száz mintát tekintettek alapul. A szerzők minden mintára alkalmazták a Neumann-módszert. a Durbín—Watson—mód—

szert és a Geary—próbát. majd összehasonlították a Neumann— és a Geary-próba.

valamint a Durbin—Watson-módszer és a Geary-próba eredményeit.

A szerzők a két próba hatékonyságának megvizsgálásához, vagyis, hogy mi- lyen mértékben alkalmasak az autokorrelácíó kimutatásához, a következő autoreg—

resszív sémát használták fel. kiindulva abból, hogy (: rezíduumok egymástól füg—

genek (a t-edík időpontra számított hiba függ a t—1—edik időponti hibától):

Ut : gut—1 4—8!

ahol

04941, t:1,2,....T, :;

t

normális eloszlású (O—átlog, egységnyi szórás) és az őt-k egymástól függetlenek.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

leíró regresszió elvégzésére is, amely a lehető legkevesebb független változóval becsüli a függő változót úgy, hogy a regressziós és teljes négyzetösszegek

Ennek egyszerő következménye, hogy ha egy adott hálózatban találunk egy folyamot és egy vágást, amiknek az értéke egyenlı, akkor biztosak lehetünk abban, hogy egy

A multikollinearitás jelenlétére gondolhatunk akkor is, amikor a két tényezővál- tozó közötti parciális korrelációs együttható értéke jelentősen eltér a két változó

Sorban, egymás után olvasva a verseket feltűnik, hogy a fentebb már bővebben is értékelt önálló újrafordítások ugyanabba a mederbe torkollnak, amelyben elődei ha- ladtak:

Ahogy a fürdőszobaszekrényt kinyitottam most az előbb, láttam, ott a pohár – ilyesképp jöttem rá, hogy álmom, gyötört kis mozzanat, becsapott, a' vagy épp boldogított

Ez a továbbképzés any- nyiban más, mint a többi, hogy az együttműködő osztrák kollégák a szaktudásukon túl technikai, anyagi segítséggel is hozzájárulnak.

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

kiszélesítése és hosszú távú szakmai fenntarthatóságának megalapozása a kiváló tudományos utánpótlás biztosításával”.!. A