ÖKONOMETRIA
ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet,
és a Balassi Kiadó közreműködésével.
ÖKONOMETRIA
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
ELTE TáTK Közgazdaságtudományi Tanszék
ÖKONOMETRIA
8. hét
Heteroszkedaszticitás, multikollinearitás
Elek Péter, Bíró Anikó
Heteroszkedaszticitás fogalma Próbák
Következmények Megoldások
Multikollinearitás – definíció, következmények
Röviden az endogenitásról
Heteroszkedaszticitás fogalma
Alapmodell feltevése
Var(ui) = σ2 minden i-re – homoszkedaszticitás
Hibatagok varianciája nem állandó
Var(ui) = σi2 minden i-re – heteroszkedaszticitás
Példa heteroszkedaszticitásra
Fogyasztás modell (adatok: SHARE, 2004, Németország – élelmiszer kiadások)
Reziduálisok eloszlása jövedelem függvényében
i i
i
i i
i i
Wealth Th
Inc C
u Wealth
Th Inc
C
_ 007
. 0 02
. 0 6 . ˆ 379
2 _
1 0
-1,000 -500 0 500 1,000 1,500 2,000
0 10,000 20,000 30,000 40,000
INC
RESID01
Példa, folyt.
Alternatív modell
Reziduálisok eloszlása jövedelem függvényében
i i
i
i i
i i
Wealth Th
Inc C
u Wealth
Th Inc
C
_ 05
. 0 log
15 . 0 63 . ˆ 4
log
_ log
log
log 0 1 2
-2.0 -1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6
0 10,000 20,000 30,000 40,000
INC
RESID02
Próbák 1.
White-próba
Kérdés: Van-e szisztematikus tényező maradéktag varianciájában?
White-próba: regressziója magyarázó változókon, azok négyzetein és
keresztszorzatain
→ F- vagy khi-négyzet próba együtthatók szignifikanciájára
ˆi2
u
Próbák 2.
Breusch-Pagan próba
Segédregresszió: regressziója z1,..., zk magyarázó változókon (amikről azt gondoljuk, hogy a varianciát befolyásolják)
S0 segédregresszió négyzetösszege (ESS) R2 segédregresszió det. együtthatója
(eredeti!) hibatagok becsült varianciája
LM-teszt a segédregresszió használhatóságára, ami u normális eloszlása esetén kifejezhető másképpen is:
ˆ
2
ˆi2
u
normális) u
ˆ ha (és 2
~ 2 04
2
nR k (és S ha u normális)
Következmény 1.
Szokásos standard hiba becslés nem jó
Egyváltozós modell
yi = α + βxi + ui, Var(ui) = σi2 →
Torzítatlan (E(ui) = 0; xi, ui függetlenek)
Homoszkedaszticitás esetén:
Torzított varianciabecslést ad heteroszkedaszticitás esetén!
– Szokásos tesztek nem használhatók.
ˆ 2 2
x x
u x x x
x
y y x x
i
i i
i i
i
2
22 2
) 2
( ˆ
x x
x x
x x
u x Var x
Var
i
i i
i
i
i
2
2
ˆ)
( x x
Var
i
Következmény 2.
OLS nem hatásos
Példa: σi2 = σ2zi2
Súlyozott (homoszkedasztikus) modell:
Cauchy–Schwarz:
i i
i i
i v
z x z
y
) 1 / ( ˆ)
( ) (
ˆ) ( : OLS modell
Eredeti
) / ) (
( )
/ (
) / : (
(WLS) OLS
modell Új
2 2 2
2 2
*
2 2 2 2 2
2 2 2 2
2 2
* 2
*
i i i
i
i
i i i i
i i
i i i
i
i i i
z x z
x
x V
V
x z x x
V x
z V x
z x
v z x
(aibi)2
ai2 bi2Új modell OLS (WLS):
Eredeti modell OLS:
Megoldás 1. – White SE
Heteroszkedaszticitás robusztus becslés becsült együttható varianciájára
Kétváltozós modell:
Többváltozós modell:
t-teszt:
Aszimptotikusan t-eloszlású: nagy mintára használható csak
2
2 2 1
) ˆ ) (
( ˆ
xx
i i
S
u x Var
x ból regresszió a
ugyanebbőg zeg
négyzetöss reziduális
:
változón magyarázó
többi jából
regresszió reziduális
:
ˆ , ) ˆ
( ˆ
2 2
j
j ij
j ij ij j
RSS
x r
RSS u Var
rSE robosztus
ˆ 0
t
reziduális xj regressziójából többi magyarázó változón reziduális négyzetösszeg ugyanebből a regresszióból
Megoldás 2 – WLS
Súlyozott legkisebb négyzetek (WLS)
Ez utóbbi egyenletet becsüljük OLS-sel, ami súlyozott összeg minimalizálásának felel meg
Ha a variancia jól specifikált, akkor
– hatásosabb, mint a sima OLS (sőt BLUE), – és kismintában is t- és F-eloszlású tesztek.
2 2 2
) ( 1 ,
) ( ,
i i
i i i
i i
i i
i i
i
v V z v
x z
z y
z u
V u
x y
n
i
i i
i
x z y
1
2
2 ˆ ˆ
min 1
Példák: WLS
yi = α + βxi + ui
1. gyakori eset: Var(ui) = σ2xi2
yi/xi = α/xi + β + ui/xi OLS-sel becsülendő 2. gyakori eset: Var(ui) = σ2xi
yi/(xi1/2) = α/(xi1/2) + βxi1/2 + ui/(xi1/2) OLS-sel becsülendő
Sokszor a magyarázó változó transzformálása (pl. logaritmizálása) megoldja
a heteroszkedaszticitási problémát.
Megoldás 3.: TWLS, FGLS
TWLS: two-step weighted least squares
FGLS: feasible generalalised least squares Lépések:
súlyokkal a ˆ
sel, -
WLS becslése
egyenlet Eredeti
. 6
ˆ ) ˆ exp(
értékek, illesztett
ˆ az 5.
n változóko ...,
, konstans,
ása regresszál ˆ
log . 4
...) exp(
pl.
iója, specifikác
variancia 3.
képzése hibatagok
becsült ˆ
2.
sel - OLS becslése
...
. 1
1 2
1 1 0
2
1 1
h g
h g
x x
) u ( σ x
u
u x
x y
i i
i i
ki i
i
i i
i
i ki
k i
i
FGLS tulajdonságai
Mivel a súlyokat becsültük, a
becslőfüggvény nem torzítatlan.
De konzisztens és aszimptotikusan hatásosabb, mint az OLS.
Ha úgy gondoljuk, hogy nem specifikáltuk tökéletesen a varianciát, akkor
használhatjuk itt is a White-féle standard
hibákat.
Példa: dohányzást meghatározó tényezők vizsgálata
Adatok (forrás: Wooldridge)
CIGS: naponta elszívott cigaretták száma INCOME: éves jövedelem
CIGPRIC: egy doboz cigaretta ára (cent) EDUC: iskolai évek száma
AGE: életkor
RESTAURN: vannak-e az adott tagállamban éttermi dohányzást korlátozó rendelkezések
OLS szokásos és robusztus standard
hibákkal
Próbák
FGLS becslés
Eviews program
equation eq_ols equation eq_olsrob
eq_ols.ls cigs c lincome lcigpric educ age age^2 restaurn delete white
delete breuschpagan
freeze(white) eq_ols.hettest(type=white)
freeze(breuschpagan) eq_ols.hettest(BPG) @regs
eq_olsrob.ls(h) cigs c lincome lcigpric educ age age^2 restaurn forecast olsf
genr olsres=cigs-olsf equation eq_logu2
genr logu2=log(olsres^2)
eq_logu2.ls logu2 c lincome lcigpric educ age age^2 restaurn forecast logu2f
genr h=exp(logu2f) genr sqrth=h^(1/2) equation eq_fgls equation eq_fgls2
eq_fgls.ls(w=1/(h)^(1/2)) cigs c lincome lcigpric educ age age^2 restaurn
eq_fgls2.ls cigs/sqrth 1/sqrth lincome/sqrth lcigpric/sqrth educ/sqrth age/sqrth age^2/sqrth restaurn/sqrth
Multikollinearitás
Magas korreláció magyarázó változók között:
Egyedi hatás nehezen kiszűrhető
Alapmodell feltevéseinek nem mond ellent
Tökéletes kollinearitás: függvényszerű kapcsolat
Pl.: y = β1x1 + β2x2 + u, x2 = ax1
y = (β1 + aβ2) x1 + u
Következmények, megoldások
Becsült együttható érzékeny változók hozzáadására, kihagyására
Becsült együttható varianciája nőhet
Magas, ha hibatag varianciája nagy vagy Sii alacsony vagy Ri2 magas (multikoll.: sem szükséges, sem
elégséges)
Lehetséges megoldások
Változó kihagyása: variancia csökken, de torzítás!
Adatgyűjtés (nagyobb variancia x-ben) Változók „összevonása” (pl. hányados)
) 1
) (
( ˆ 2
2 2
i ii
i
i RSS S R
Var
Endogenitás
Endogenitás: az eltérésváltozó korrelált a magyarázó változóval
Y
i= α + βX
i+ u
iE(u
i|x
i) ≠ 0
Következmény: β OLS becslése torz és
inkonzisztens
Endogenitás néhány lehetséges oka
Kihagyott változó (u tartalmaz valamit, ami korrelált X-szel)
Szimultaneitás (nemcsak X hat Y-ra, hanem Y is X-re: u miatt változik Y, és ez hat X-re)
Pl. kereslet–kínálati modellek
Önszelekció hatásvizsgálatokban: „kezelés”
(pl. programba való beválogatás) nem független a hibatagtól
Vállalatoknak nyújtott támogatás hatása az eredményességre
Stb.
Összefoglalás
Házi feladatok
Példatípusok a zárthelyin
Regressziós outputok értelmezése Elméleti, kifejtősebb kérdések
Hogyan ismerhetők fel a kiugró értékek, milyen teendők vannak outlierek esetén?
Gauss-Markov tétel kimondása
Előrejelzés standard hibája mitől függ az egyváltozós esetben
Rövid válaszos feladatok Igaz / hamis állítások
Gyakorlat
Heteroszkedaszticitás, multikollinearitás
Maddala: 5/7, 5/8, 7/1, 7/3
Wooldridge: 8.1, 8.2, 8.3, 8.7, 8.9, (3.7, 3.11)
Megbeszélendő
Heteroszkedaszticitás tesztelése, kezelése Multikollinearitás – valóban „probléma”?
Adatok
Egészségügyi kiadások modellje
(HRS vagy SHARE rész-adatbázis)
Heteroszkedaszticitás tesztelése
Multikollinearitás: különböző jövedelem vagy vagyon indikátorok együttes bevonása