ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet
és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
2
ÖKONOMETRIA 6. hét
Többváltozós regresszió III.
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Tartalom
F-próba (folyt.), Stabilitási próbák
Korrigált R2, modellszelekció, Dummy változók
F-próba általánosabban
Több (r számú) korlátozás együttes tesztelése k magyarázó változós regresszióban Egymásba ágyazott hipotézisek: a modell együtthatóinak halmaza az eredetinek részhalmaza
Példa
U: y = α + β1x1 + β2x2 + β3x3+ u H0: β2 = 0, β3 = 0
R: y = α + β1x1 + v
3
F-próba, tesztstatisztika
Négyzetösszeg – felbontás
TSS = RESS + RRSS = RESS + (RRSS – URSS) + URSS Szabadságfokok
n – 1 = (k – r) + (n – k + r – 1) = (k – r) + r + (n – k – 1)
(nagymintában kb. ~ χr2/ r, ez lényegében a Wald-teszt) RRSS = Syy (1 – RR2
) URSS = Syy (1 – RU2
)
Együtthatók lineáris függvényének tesztelése
Példa: Cobb-Douglas termelési fv.
logX= α + β1logL+ β2logK + u H0: β1 + β2 = 1
t-próba: θ = β1 + β2 β2 = θ – β1
l ogX = α + β1(logL – logK)+ θlogK + u H0: θ = 1
t-próba közvetlenül β1 + β2 -re, felhasználva, hogy az összeg varianciája kiszámolható Var(β1^ + β2^) = Var(β1^) + Var(β2^)+ 2cov(β1^,β2^)
F-próba: β2 = 1 – β1
R: logX – logK = α + β1 (logL – logK) + u F = (RRSS – URSS) / r
~ F r,(n – k –1)
URSS /(n – k – 1) F = (RRSS – URSS) / r
~ F r,(n – k –1)
URSS /(n – k – 1)
F = (RU2– RR2) / r
~ F r,(n – k –1)
(1 – RU2) / (n – k – 1) F = (RU2– RR2) / r
~ F r,(n – k –1)
(1 – RU2) / (n – k – 1)
4
Stabilitási próba – 2 független adathalmaz (gyakran Chow-próbaként hivatkozva)
1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1
2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n2
H0: α1 = α2, β11 = β12, …, βk1 = βk2
RRSS: összevont adatbázisból, RSS1, RSS2: külön regressziókból
Stabilitási próba
– Chow-próba (prediktív)
1. yi = α1 + β11x1i + β21x2i +…+ βk1xki + ui, i = 1…n1
2. yi = α2 + β12x1i + β22x2i +…+ βk2xki + vi, i = 1…n n – n1 < k + 1 lehetséges (ellentétben az előzővel)
RSS1: rez. négyzetösszeg az első n1 megfigyelés alapján
RRSS: rez. négyzetösszeg az összes (n=n1+n2) megfigyelésből becsült modell szerint
Korrigált R 2
Újabb változó bevonása: RSS és szabadságfok is csökken (normálegyenletek száma nő)
F = (RRSS – RSS1– RSS2)/ (k + 1)
~Fk + 1, n1 + n2 – 2k – 2
(RSS1+ RSS2)/ (n1+ n2– 2k – 2) F = (RRSS – RSS1– RSS2)/ (k + 1)
~Fk + 1, n1 + n2 – 2k – 2
(RSS1+ RSS2)/ (n1+ n2– 2k – 2)
F =
(RRSS – RSS1) / (n – n1)~ F
(n – n1),(n1 – k – 1)RSS1/ (n1– k – 1)
F =
(RRSS – RSS1) / (n – n1)~ F
(n – n1),(n1 – k – 1)RSS1/ (n1– k – 1)
ok szabadságf
RSS ˆ2
5
Korrigált R2 :
t < 1: változó kihagyása: nő F< 1: változók kihagyása: nő
Lehetséges: t, F alapján különböző következtetés (pl. multikollinearitás)
Modellszelekció
Egymásba ágyazott hipotézisek: t- és F-próba
Nem egymásba ágyazott hip., függő változó azonos, pl.:
R&D = α + β log(bevétel) + u
R&D = α + β1 bevétel + β2 bevétel2 + u
korrigált R2 vagy információs kritériumok (pl. AIC) alapján AIC (Akaike információs kritérium):
RSS∙exp(2(k +1)/n)
Korrigált R 2 , példa
Bértarifa (2003): tapasztalat vagy életkor a jobb magyarázó változó béregyenletben?
) 1 1(
1 2 1 R2
k n
R n
R2
R2
6
Logaritmikus formák
Log-log (loglineáris) – rugalmasság ln(y) = α + βln(x) + u
Félig logaritmikus alakok
Kvadratikus forma
Növekvő vagy csökkenő parciális hatás
Példa: Bértarifa (2003), tapasztalat négyzetes tag, becsült egyenletek log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.0082 EXP
log(Ker) = 9.83 + 0.135 ISKVEG9 + 0.022 EXP – 0.00029 EXP2
0.022/(2*0.00029) = 39 évig pozitív parciális hatás (de végig csökkenő)
Interakciók
Parciális hatás függ más magyarázó változótól is
Példa: Bér és iskolázottsági prémium, függhet a cég nyereségességétől (nettó árbev. – anyagköltség)
Log(Ker) = 10.304 + 0.139 Iskveg9 + 0.092 Log(Cs_Arbev) Log(Ker) = 10.597 + 0.079 Iskveg9 + 0.043 Log(Cs_Arbev) + 0.010 (Iskveg9*Log(Cs_Arbev))
e
x xy
ˆ 1 % ˆ %
% ˆ
x y
u x y
x y
u x y
%
%
100 ˆ ˆ )
ln(
100 ˆ ˆ )
ln(
1 2 1 1
2 1 2 1 1
2ˆ ˆ ˆ
x x y
u x x y
2 2 1 1
2 1 2 1 1
ˆ ˆ ˆ
x x y
u x x x y
7
Dummy változók a jobb oldalon
Eddig: főként folytonos változók
(kvantitatív információ) – pl. bér, fogyasztás, vagyon, végzettség (?) Kétértékű változók
= dummy / binary / 0 – 1 Kvalitatív információ
Példák: nem, foglalkoztatott, képzett, ország dummy…
Különböző tengelymetszet – 2 csoport
Példa:
Különböző tengelymetszet, példa
2003-as bértarifa alapján
különben budapesti,
ha ,
log(
különben ,
budapesti ha
,
1 0
, )
( )
) log(
1 2 1 2 1
i i
i i i
i
i i
i i i
D D
u Isk D
Ker
u Isk
u Ker Isk
8
Log függő változó
Becsült egyenlet
Vidéki: ceteris paribus kb. 16%-kal kisebb kereset
Pontos különbség (EViews „log” természetes logaritmus)
Több csoport
N csoport (pl. Budapest/vidék helyett kistérség)
N csoport esetén N-1 dummy a regresszióban, N. csoport: viszonyítási/benchmark csoport!
Interakciók kétértékű változók között
Példa: vidék/Bp és férfi/nő dummy + nemek közti kereseti különbség eltér vidéken és Bp-en
Négy kategória
i i
i Videk Isk
er
Kˆ ) 10.93 0.16 0.15
log(
1
100 14.79log 16 . 0 ) log(
) log(
16 . 0
0 1 0
1
e
Ker Ker Ker
Ker
: külöbség kereset
os -
%
különben) (0
csoportra N.
az
..., különben), (0
csoportra 2.
a
csoportban N.
az
csoportban 2.
a
csoportban 1.
az
1 1
) (
...
) (
2
1 2
1 2 1 2 1
N
i i N N
i
i i N
i i
i i
i
D D
u x D D
y
u x
u x
u x y
Budapest vidék nő
férfi
Budapest vidék nő
férfi
9
Viszonyítási csoport: bp-i nők 2 ekvivalens modell
Interakciók, példa
Bértarifa becslések (benchmark: bp-i nők)
–0,1026 = –0.1726 + 0.0540 + 0.016
Nem állandó regressziós együtthatók
2 csoport esetén
→ Kétértékű változó és magyarázó változó interakciója
i i
i i i
i i
i i
i i
i i
u Isk
ffi Vidék Vidék
ffi Ker
u Isk
ffi Vidék ffi
Bp nő
Vidék Ker
3 2
1 0
3 2
1 0
) log(
_ _
_ )
log(
csoportra 2.
a csoportra,
1.
az
csoportra 2.
csoportra 1.
1 0
)
( 12 11 1 2 2
1 11
2 2 1 12
2 2 1 11
i i
i i i
i i
i
i i i
i i i
i
D D
u x x
D x
y
u x x
u x y x
10
Példa
Végzettség hatása nemenként eltér, de feltesszük, hogy életkor hatása azonos
Együtthatók stabilitásának vizsgálata
Példa: férfiakra – nőkre azonos-e a kereseti modell?
Keresztmetszeti vizsgálat (idősor: együttható időbeli stabilitása)
F-próba (lehet nem mindhárom együtthatóra is)
Probléma: ha N2 < k → Chow-próba (prediktív) használható (ld. 5. hét) Becslési eredmények és tesztstatisztika
i i i
i i
i Isk Isk ffi Kor u
Ker) 0 1 2 3
log(
0 , 0 , 0 :
) log(
3 2
2
4 3
2 1
2 1
H0
i i i i
i i i
i
i ffi Isk Isk ffi Kor Kor ffi u
Ker
11
Dummy függő változó
Példák
Munkapiac: foglalkoztatott-e Fogyasztás: ingatlan tulajdonos-e Pénzügy: hitelfelvevő csődje
Kétértékű függő változó ↔ lineáris modell?
Lineáris valószínűségi modell I.
y kétértékű változó
Nemlineáris modell
ha F a normális eloszlásfv, akkor a probit, ha F(z) = ez/(1 + ez), akkor a logit modellt kapjuk)
Lineáris valószínűségi modell II.
1. probléma: becsült valószínűség [0,1] intervallumon kívül eshet valósz.
becsült : modell Becsült
1 ˆ:
)
| 1 ( )
| (
y y
u x y
x x
y P x y E
i i
i
) ( )
| 1
(y x F x
P
-0.2 0 0.2 0.4 0.6 0.8 1 1.2
12
Lineáris valószínűségi modell III.
2. probléma: heteroszkedaszticitás:
Megoldás
Robosztus SE használata Súlyozott LS:
Lineáris val. modell, példa
Függő változó: magán egészségbiztosítással rendelkezik-e (SHARE adatbázis) Magyarázó változók: vagyon, jöv., életkor, végzettség, ország dummyk
ˆ ) 1 ˆ ( ) )
( )
)(
) Var(
1
) 0 ) ( ,
2 2
i i i i i
i i
i i
i i
i i
i
i i i i
y y x x x
x x
x u
x x
x u x
u E u x y
(1- 1-
(1-
valósz.
valósz.
(1-
ˆ ) 1 ˆi( i
i y y
w
0 1,000 2,000 3,000 4,000 5,000 6,000
-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4
Frequency
INSF
Előrejelzett val. hisztogramja
0 1,000 2,000 3,000 4,000 5,000 6,000
-0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4
Frequency
INSF
Előrejelzett val. hisztogramja
13
Szeminárium
Többváltozós regresszió III.
Feladat: béregyenlet becslése kis bértarifa részminta alapján
Változók
Iskev (iskolai évek száma) Exp (tapasztalat)
Ker (kereset)
Teltip (településtípus – kvalitatív változó) Bp (Budapest dummy)
Ffi (férfi dummy)
Béregyenlet becslése 1.
1. modell: log(ker) modellezése a versenyszférában iskev, exp, exp2, bp, ffi változókkal, továbbá az iskev, exp változók ffi változóval való interakciójával Különbözik-e szignifikánsan a férfiakra vonatkozó egyenlet a nőkétől?
Ffi, iskev*ffi és exp*ffi együtthatók együttes tesztelése Tapasztalat-profil a bp-i, 12 iskolai évvel rendelkező férfiakra
Hol a maximum?
Tapasztalat-profil ábrázolása konfidencia-intervallummal
Béregyenlet becslése 2.
2. modell: előző modell kiegészítése a megyeszékhely és egyéb város dummy változókkal
A megyeszékhely és egyéb város hatása egyenlőségének tesztelése három módszerrel
14
Közvetlenül
Átalakítás után t-teszttel
A korlátozott és korlátozatlan modell R2-ének összehasonlításával Heteroszkedaszticitás tesztelése White- és Breusch-Pagan próbákkal
Robusztus standard hibák számítása és összehasonlítása a nem robusztus hibákkal Feladat: munkapiaci részvétel becslése lineáris valószínűségi modellel