ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet
és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
2
ÖKONOMETRIA 8. hét
Heteroszkedaszticitás, multikollinearitás
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Heteroszkedaszticitás fogalma Próbák
Következmények Megoldások
Multikollinearitás – definíció, következmények Röviden az endogenitásról
Heteroszkedaszticitás fogalma
Alapmodell feltevése
Var(ui) = σ2 minden i-re – homoszkedaszticitás Hibatagok varianciája nem állandó
Var(ui) = σi2 minden i-re – heteroszkedaszticitás
3
Példa heteroszkedaszticitásra
Fogyasztás modell (adatok: SHARE, 2004, Németország – élelmiszer kiadások)
Reziduálisok eloszlása jövedelem függvényében
Alternatív modell
Reziduálisok eloszlása jövedelem függvényében
Próbák 1.
White-próba
Kérdés: Van-e szisztematikus tényező maradéktag varianciájában?
White-próba: regressziója magyarázó változókon, azok négyzetein és keresztszorzatain
→ F- vagy khi-négyzet próba együtthatók szignifikanciájára
i i
i
i i i
i
Wealth Th
Inc C
u Wealth Th
Inc C
_ 007 . 0 02
. 0 6 . ˆ 379
2 _
1 0
-1,000 -500 0 500 1,000 1,500 2,000
0 10,000 20,000 30,000 40,000
INC
RESID01
i i
i
i i i
i
Wealth Th
Inc C
u Wealth Th
Inc C
_ 05 . 0 log
15 . 0 63 . ˆ 4 log
_ log log
log 0 1 2
-2.0 -1.6 -1.2 -0.8 -0.4 0.0 0.4 0.8 1.2 1.6
0 10,000 20,000 30,000 40,000
INC
RESID02
ˆi2
u
4
Próbák 2.
Breusch-Pagan próba
Segédregresszió: regressziója z1,..., zk magyarázó változókon (amikről azt gondoljuk, hogy a varianciát befolyásolják)
S0 segédregresszió négyzetösszege (ESS) R2 segédregresszió det. együtthatója σ2 (eredeti!) hibatagok becsült varianciája
LM-teszt a segédregresszió használhatóságára, ami u normális eloszlása esetén kifejezhető másképpen is:
Következmény 1.
Szokásos standard hiba becslés nem jó
Egyváltozós modell
yi = α + βxi + ui, Var(ui) = σi2 → Torzítatlan (E(ui) = 0; xi, ui függetlenek)
Homoszkedaszticitás esetén:
Torzított varianciabecslést ad heteroszkedaszticitás esetén!
– Szokásos tesztek nem használhatók.
ˆi2
u
normális) u
ˆ ha (és 2
~
2 042
nR
k (és S ha
ha uu normális)
normális)ˆ (és 2
~
2 042
nR
k (és S
ha unormális)
2 2
ˆ
x x
u x x x
x
y y x x
i i i i
i
i
2
22 2
) 2
(ˆ
x x
x x x
x u x Var x
Var
i i i
i i
i
2
2
ˆ)
( x x
Var
i
5
Következmény 2.
OLS nem hatásos
Példa: σi2
=σ2zi2
Súlyozott (homoszkedasztikus) modell:
Cauchy–Schwarz:
Megoldás 1. – White SE
Heteroszkedaszticitás robusztus becslés becsült együttható varianciájára Kétváltozós modell:
Többváltozós modell:
t-teszt:
Aszimptotikusan t-eloszlású: nagy mintára használható csak
i i i i
i v
z x z
y
) 1 / ( ˆ)
( ) (
ˆ) (
) / ) (
) ( / (
) / (
2 2 2
2 2
*
2 2 2 2 2 2 2
2 2
2 2
* 2
*
i i i i
i
i i i i
i i
i i i
i i i i
z x z x
x V
V
x z x x
V x
z V x
z x
v z x
: OLS modell Eredeti
:
(WLS) OLS
modell Új
(aibi)2
ai2 bi22 2 2 1
ˆ ) ) (
(ˆ
xx i i
S u x Var
x ból regresszió a
ugyanebbőg zeg
négyzetöss reziduális
:
változón magyarázó
többi jából regresszió reziduális
:
ˆ , ) ˆ
( ˆ
2 2
j
j ij
j ij ij j
RSS
x r
RSS u Var
rreziduálisxjregressziójából többi magyarázó változón reziduális négyzetösszeg ugyanebből a regresszióbólnégyzetösszegugyanebbőgaregresszióból reziduális
:
változón magyarázó
többi jából regresszió reziduális
:
ˆ , ) ˆ
( ˆ
2 2
j
j ij
j ij ij j
RSS
x r
RSS u Var
rreziduálisxjregressziójából többi magyarázó változón reziduális négyzetösszeg ugyanebből a regresszióból
SE robosztus
ˆ 0
t
6
Megoldás 2 – WLS
Súlyozott legkisebb négyzetek (WLS)
Ez utóbbi egyenletet becsüljük OLS-sel, ami súlyozott összeg minimalizálásának felel meg
Ha a variancia jól specifikált, akkor
– hatásosabb, mint a sima OLS (sőt BLUE), – és kismintában is t- és F-eloszlású tesztek.
Példák: WLS
yi = α + βxi + ui
1. gyakori eset: Var(ui) = σ2xi2
yi/xi = α/xi + β + ui/xi OLS-sel becsülendő 2. gyakori eset: Var(ui) = σ2xi
yi/(xi1/2) = α/(xi1/2) + βxi1/2
+ ui/(xi1/2
) OLS-sel becsülendő
Sokszor a magyarázó változó transzformálása (pl. logaritmizálása) megoldja a heteroszkedaszticitási problémát.
Megoldás 3.: TWLS, FGLS
TWLS: two-step weighted least squares FGLS: feasible generalalised least squares
2 2 2
) ( 1 ,
) ( ,
i i
i i i i i
i i
i i i
v V z v
x z z y
z u
V u x y
n
i
i i
i
x z y
1
2
2 ˆ ˆ
min 1
7
Lépések:
FGLS tulajdonságai
Mivel a súlyokat becsültük, a becslőfüggvény nem torzítatlan.
De konzisztens és aszimptotikusan hatásosabb, mint az OLS.
Ha úgy gondoljuk, hogy nem specifikáltuk tökéletesen a varianciát, akkor használhatjuk itt is a White-féle standard hibákat.
Példa: dohányzást meghatározó tényezők vizsgálata
Adatok (forrás: Wooldridge)
CIGS: naponta elszívott cigaretták száma INCOME: éves jövedelem
CIGPRIC: egy doboz cigaretta ára (cent) EDUC: iskolai évek száma
AGE: életkor
RESTAURN: vannak-e az adott tagállamban éttermi dohányzást korlátozó rendelkezések
súlyokkal a
sel, - WLS becslése egyenlet
Eredeti
értékek, illesztett
az 5.
változókon ...,
, konstans, ása
regresszál
pl.
iója, specifikác variancia
3.
képzése hibatagok
becsült 2.
sel - OLS becslése
h g
h g
x x )
u ( σ x
u
u x x
y
i i
i i
ki i i
i i
i
i ki k i i
. ˆ 6
ˆ ) ˆ exp(
ˆ ˆ log . 4
...) exp(
ˆ
...
. 1
1 2
1 1 0 2
1 1
8
OLS szokásos és robusztus standard hibákkal
Próbák
9
FGLS becslés
Eviews program
equation eq_ols equation eq_olsrob
eq_ols.ls cigs c lincome lcigpric educ age age^2 restaurn delete white
delete breuschpagan
freeze(white) eq_ols.hettest(type=white)
freeze(breuschpagan) eq_ols.hettest(BPG) @regs
eq_olsrob.ls(h) cigs c lincome lcigpric educ age age^2 restaurn forecast olsf
genr olsres=cigs-olsf equation eq_logu2 genr logu2=log(olsres^2)
eq_logu2.ls logu2 c lincome lcigpric educ age age^2 restaurn forecast logu2f
genr h=exp(logu2f) genr sqrth=h^(1/2) equation eq_fgls equation eq_fgls2
10
eq_fgls.ls(w=1/(h)^(1/2)) cigs c lincome lcigpric educ age age^2 restaurn eq_fgls2.ls cigs/sqrth 1/sqrth lincome/sqrth lcigpric/sqrth educ/sqrth age/sqrth age^2/sqrth restaurn/sqrth
Multikollinearitás
Magas korreláció magyarázó változók között:
Egyedi hatás nehezen kiszűrhető
Alapmodell feltevéseinek nem mond ellent Tökéletes kollinearitás: függvényszerű kapcsolat
Pl.: y = β1x1 + β2x2 + u, x2 = ax1 y = (β1 + aβ2)x1 + u
Következmények, megoldások
Becsült együttható érzékeny változók hozzáadására, kihagyására Becsült együttható varianciája nőhet
Magas, ha hibatag varianciája nagy vagy Sii alacsony vagy Ri2 magas (multikoll.: sem szükséges, sem elégséges)
Lehetséges megoldások
Változó kihagyása: variancia csökken, de torzítás!
Adatgyűjtés (nagyobb variancia x-ben) Változók „összevonása” (pl. hányados)
Endogenitás
Endogenitás: az eltérésváltozó korrelált a magyarázó változóval Yi= α + βXi + ui E(ui|xi) ≠ 0
Következmény: β OLS becslése torz és inkonzisztens )
1 ) (
(ˆ 2
2 2
i ii i
i RSS S R
Var
11
Endogenitás néhány lehetséges oka
Kihagyott változó (u tartalmaz valamit, ami korrelált X-szel)
Szimultaneitás (nemcsak X hat Y-ra, hanem Y is X-re: u miatt változik Y, és ez hat X-re)
Pl. kereslet–kínálati modellek
Önszelekció hatásvizsgálatokban: „kezelés” (pl. programba való beválogatás) nem független a hibatagtól
Vállalatoknak nyújtott támogatás hatása az eredményességre Stb.
Összefoglalás
Házi feladatok
Példatípusok a zárthelyin
Regressziós outputok értelmezése Elméleti, kifejtősebb kérdések
Hogyan ismerhetők fel a kiugró értékek, milyen teendők vannak outlierek esetén?
Gauss-Markov tétel kimondása
Előrejelzés standard hibája mitől függ az egyváltozós esetben Rövid válaszos feladatok
Igaz / hamis állítások
Gyakorlat
Heteroszkedaszticitás, multikollinearitás
Maddala: 5/7, 5/8, 7/1, 7/3
Wooldridge: 8.1, 8.2, 8.3, 8.7, 8.9, (3.7, 3.11)
12
Megbeszélendő
Heteroszkedaszticitás tesztelése, kezelése Multikollinearitás – valóban „probléma”?
Adatok
Egészségügyi kiadások modellje (HRS vagy SHARE rész-adatbázis) Heteroszkedaszticitás tesztelése
Multikollinearitás: különböző jövedelem vagy vagyon indikátorok együttes bevonása