ÖKONOMETRIA
ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet,
és a Balassi Kiadó közreműködésével.
ÖKONOMETRIA
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
ELTE TáTK Közgazdaságtudományi Tanszék
ÖKONOMETRIA
6. hét
Többváltozós regresszió III.
Elek Péter, Bíró Anikó
Tartalom
F-próba (folyt.), Stabilitási próbák
Korrigált R
2, modellszelekció,
Dummy változók
F-próba általánosabban
Több (r számú) korlátozás együttes tesztelése k magyarázó változós regresszióban
Egymásba ágyazott hipotézisek: a modell együtthatóinak halmaza az eredetinek
részhalmaza Példa
U: y = α + β1x1 + β2x2 + β3x3+ u H0: β2 = 0, β3 = 0
R: y = α + β1x1 + v
F-próba, tesztstatisztika
ez lényegében a Wald-teszt)
~ r2/ r, (nagymintában kb.
:
RRSS = Syy (1 – RR2) URSS = Syy (1 – RU2)
n – 1 = (k – r) + (n – k + r – 1) = (k – r) + r +(n – k – 1)
Szabadságfokok
TSS = RESS + RRSS = RESS + (RRSS – URSS) + URSS
Négyzetösszeg – felbontás
F = (RRSS – URSS) / r
~ F r,(n – k –1)
URSS /(n – k – 1)
F = (RU
2 – RR2) / r
~ F r,(n – k –1)
(1 – RU2) / (n – k – 1)
Együtthatók lineáris függvényének tesztelése
Példa: Cobb-Douglas termelési fv.
logX= α + β1logL + β2logK + u H0: β1 + β2 = 1
t-próba: θ = β1 + β2 β2 = θ – β1
logX = α + β1(logL – logK)+ θ logK + u H0: θ = 1
t-próba közvetlenül β1 + β2 -re, felhasználva, hogy az összeg varianciája kiszámolható
Var(β1^ + β2^) = Var(β1^) + Var(β2^)+ 2cov(β1^,β2^) F-próba: β2 = 1 – β1
R: logX – logK = α + β1 (logL – logK) + u
Stabilitási próba – 2 független adathalmaz (gyakran Chow-próbaként hivatkozva)
1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1 2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n2 H0: α1 = α2, β11 = β12, …, βk1 = βk2
RRSS:
összevont adatbázisból,RSS
1,RSS
2:
külön regressziókból F = (RRSS – RSS1 – RSS2) / (k + 1)~ F k + 1, n1 + n2 – 2k – 2
(RSS1 + RSS2) / (n1 + n2 – 2k – 2)
Stabilitási próba
– Chow-próba (prediktív)
1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1 2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n n – n1 < k + 1 lehetséges (ellentétben az előzővel) RSS1: rez. négyzetösszeg az első n1 megfigyelés alapján
RRSS: rez. négyzetösszeg az összes (n=n1+n2) megfigyelésből becsült modell szerint
F = (RRSS – RSS1) / (n – n1)
~ F (n – n1),(n1 – k – 1)
RSS1 / (n1 – k – 1)
Korrigált R 2
Újabb változó bevonása: RSS és szabadságfok is csökken (normálegyenletek száma nő)
Korrigált
R
2:
t < 1: változó kihagyása: nő F< 1: változók kihagyása: nő
Lehetséges: t, F alapján különböző következtetés (pl. multikollinearitás)
ok szabadságf ˆ 2 RSS
) 1
1 (
1
21 R
2k n
R n
R2
R2
Modellszelekció
Egymásba ágyazott hipotézisek: t- és F-próba
Nem egymásba ágyazott hip., függő változó azonos, pl.:
R&D = α + β log(bevétel) + u
R&D = α + β
1bevétel + β
2bevétel
2+ u
korrigált R2 vagy információs kritériumok (pl. AIC) alapján
AIC (Akaike információs kritérium):
RSS∙exp(2(k +1)/n)
Korrigált R 2 , példa
Bértarifa (2003): tapasztalat vagy életkor a jobb magyarázó változó béregyenletben?
Logaritmikus formák
Log-log (loglineáris) – rugalmasság
ln(y) = α + βln(x) + u
Félig logaritmikus alakok
e x x
y
ˆ 1 % ˆ %
%
ˆ
x y
u x
y
x y
u x
y
%
%
100 ˆ ) ˆ
ln(
100 ˆ ˆ
) ln(
Kvadratikus forma
Növekvő vagy csökkenő parciális hatás
Példa: Bértarifa (2003), tapasztalat négyzetes tag, becsült egyenletek
log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.0082 EXP
log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.022 EXP – 0.00029 EXP2 0.022/(2*0.00029) = 39 évig pozitív parciális hatás
(de végig csökkenő)
1 2 1
1
2 1 2 1
1
2 ˆ ˆ ˆ
x x y
u x
x y
Interakciók
Parciális hatás függ más magyarázó változótól is
Példa: Bér és iskolázottsági prémium, függhet a cég nyereségességétől
(nettó árbev. – anyagköltség)
Log(Ker) = 10.304 + 0.139 Iskveg9 + 0.092 Log(Cs_Arbev) Log(Ker) = 10.597 + 0.079 Iskveg9 + 0.043 Log(Cs_Arbev) + 0.010 (Iskveg9*Log(Cs_Arbev))
2 2 1
1
2 1 2 1
1
ˆ ˆ ˆ
x x y
u x
x x
y
Dummy változók a jobb oldalon
Eddig: főként folytonos változók
(kvantitatív információ) – pl. bér, fogyasztás, vagyon, végzettség (?)
Kétértékű változók
= dummy / binary / 0 – 1
Kvalitatív információ
Példák: nem, foglalkoztatott, képzett, ország dummy…
Különböző tengelymetszet – 2 csoport
Példa:
különben 1
budapesti, ha
, 0
, )
( )
log(
különben ,
budapesti ha
) , log(
1 2
1 2 1
i i
i i
i i
i i
i i
i
D D
u Isk
D Ker
u Isk
u Ker Isk
Különböző tengelymetszet, példa
2003-as bértarifa alapján
Log függő változó
Becsült egyenlet
Vidéki: ceteris paribus kb. 16%-kal kisebb kereset Pontos különbség (EViews „log” természetes
logaritmus)
i i
i Videk Isk
er
Kˆ ) 10.93 0.16 0.15
log(
1
100 14.79: külöbség kereset
os -
%
log 16
. 0 )
log(
) log(
16 . 0
0 1 0
1
e
Ker Ker Ker
Ker
Több csoport
N csoport (pl. Budapest/vidék helyett kistérség)
N csoport esetén N-1 dummy a regresszióban, N. csoport: viszonyítási/benchmark csoport!
különben) (0
csoportra N.
az 1
..., különben), (0
csoportra 2.
a 1
) (
...
) (
csoportban N.
az
csoportban 2.
a
csoportban 1.
az
2
1 2
1 2
1 2 1
N
i i
N N
i
i i
N
i i
i i
i
D D
u x
D D
y
u x
u x
u x
y
Interakciók kétértékű változók között
Példa: vidék/Bp és férfi/nő dummy + nemek közti kereseti különbség eltér vidéken és Bp-en
Négy kategória
Viszonyítási csoport: bp-i nők 2 ekvivalens modell
Budapest vidék
nő
férfi
i i
i i
i i
i
i i
i i
i i
u Isk
ffi Vidék
Vidék ffi
Ker
u Isk
ffi Vidék
ffi Bp
nő Vidék
Ker
3 2
1 0
3 2
1 0
) log(
_ _
_ )
log(
Bértarifa becslések (benchmark: bp-i nők)
–0,1026 = –0.1726 + 0.0540 + 0.016
Interakciók, példa
Nem állandó regressziós együtthatók
2 csoport esetén
→ Kétértékű változó és magyarázó változó interakciója
csoportra 2.
a 1 csoportra,
1.
az 0
) (
csoportra 2.
csoportra 1.
2 2 1
11 12
1 11
2 2 1
12
2 2 1
11
i i
i i
i i i
i
i i
i
i i
i i
D D
u x
x D x
y
u x
x
u x
y x
Példa
Végzettség hatása nemenként eltér, de feltesszük, hogy életkor hatása azonos
i i
i i
i
i
Isk Isk ffi Kor u
Ker )
0
1
2
3
log(
Együtthatók stabilitásának vizsgálata
Példa: férfiakra – nőkre azonos-e a kereseti modell?
Keresztmetszeti vizsgálat (idősor: együttható időbeli stabilitása)
F-próba (lehet nem mindhárom együtthatóra is) Probléma: ha
N
2< k
→ Chow-próba (prediktív) használható (ld. 5. hét)0 ,
0 ,
0 :
H
) log(
3 2
2 0
4 3
2 1
2 1
i i i i i i i i
i ffi Isk Isk ffi Kor Kor ffi u
Ker
Becslési eredmények és tesztstatisztika
Együtthatók stabilitásának vizsgálata, folyt.
Dummy függő változó
Példák
Munkapiac: foglalkoztatott-e
Fogyasztás: ingatlan tulajdonos-e Pénzügy: hitelfelvevő csődje
Kétértékű függő változó ↔ lineáris modell?
Lineáris valószínűségi modell I.
y kétértékű változó
Nemlineáris modell
ha F a normális eloszlásfv, akkor a probit,
ha F(z) = ez/(1 + ez), akkor a logit modellt kapjuk)
) (
)
| 1
( y x F x
P
lósz.
becsült va 1
ˆ :
: modell Becsült
)
| 1 (
)
| (
y
y
u x
y
x x
y P x
y E
i i
i
Lineáris valószínűségi modell II.
1. probléma: becsült valószínűség [0,1]
intervallumon kívül eshet
-0.2 0 0.2 0.4 0.6 0.8 1 1.2
Lineáris valószínűségi modell III.
2. probléma: heteroszkedaszticitás:
Megoldás
Robosztus SE használata Súlyozott LS:
ˆ ) 1 ˆ ( )
- (1 )
- 1 ( )
)(
- (1 )
Var(
valósz.
1
valósz.
) -
(1
0 )
( ,
2 2
i i
i i
i i
i i
i
i i
i i
i
i i
i i
y y
x x
x x
x x
u
x x
x u x
u E u
x y
ˆ ) 1
ˆi( i
i y y
w
Lineáris val. modell, példa
0 1,000 2,000 3,000 4,000 5,000 6,000
-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4
Frequency
INSF
Függő változó: magán egészségbiztosítással rendelkezik-e (SHARE adatbázis)
Magyarázó változók: vagyon, jöv., életkor, végzettség, ország dummyk
Előrejelzett val. hisztogramja
Szeminárium
Többváltozós regresszió III.
Feladat: béregyenlet becslése kis bértarifa részminta alapján
Változók
Iskev (iskolai évek száma) Exp (tapasztalat)
Ker (kereset)
Teltip (településtípus – kvalitatív változó) Bp (Budapest dummy)
Ffi (férfi dummy)
Béregyenlet becslése 1.
1. modell: log(ker) modellezése a versenyszférában iskev, exp, exp2, bp, ffi változókkal, továbbá az
iskev, exp változók ffi változóval való interakciójával
Különbözik-e szignifikánsan a férfiakra vonatkozó egyenlet a nőkétől?
Ffi, iskev*ffi és exp*ffi együtthatók együttes tesztelése
Tapasztalat-profil a bp-i, 12 iskolai évvel rendelkező férfiakra
Hol a maximum?
Tapasztalat-profil ábrázolása konfidencia-intervallummal
Béregyenlet becslése 2.
2. modell: előző modell kiegészítése a
megyeszékhely és egyéb város dummy változókkal
A megyeszékhely és egyéb város hatása
egyenlőségének tesztelése három módszerrel
Közvetlenül
Átalakítás után t-teszttel
A korlátozott és korlátozatlan modell R2-ének összehasonlításával
Heteroszkedaszticitás tesztelése White- és Breusch-Pagan próbákkal
Robusztus standard hibák számítása és
összehasonlítása a nem robusztus hibákkal