ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet
és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
2
ÖKONOMETRIA 7. hét
Becslések összefoglalása és nagymintás elmélet
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Regressziós modell
yi= α + β1x1i + β2x2i +…+ βkxki + ui, i=1…n Feltevések:
1. E(ui) = 0
2. ui, uj függetlenek minden i≠j-re
3. xi, uj függetlenek minden i, j-re (exogenitás) 4. nincs tökéletes kollinearitás
5. Var(ui) = 2 minden i-re 6. ui normális eloszlású
1–5.: Gauss–Markov-feltételek
1–6.: klasszikus lineáris modell feltételei
3
Feltételek máshogyan (nagymintás elmélethez
– sztochasztikus magyarázó változók)
1. A populációs modell: y = α + β1x1 + β2x2 +…+ βkxk + u.
2. {(x1i,x2i,…,xki,yi), i = 1,…,n} független véletlen minta a modellből
3. Egyik magyarázó változó sem konstans, és a magyarázó változók között nincs tökéletes multikollinearitás
4. Exogenitás: E(u|x1,…,xk) = 0
5. Homoszkedaszticitás: Var(u|x1,…,xk) = σ2
6. u független a magyarázó változóktól, és eloszlása normális 1–5.: Gauss–Markov feltételek
1–6.: klasszikus lineáris modell feltételei
Többváltozós regresszió becslés
Becslés: momentumok módszere vagy legkisebb négyzetösszeg alapján (de normális hibatag esetén ML-becslés is)
Mátrix
Egyváltozós eset
2 2
2 1 ˆ 1
ˆ, ( ˆ ˆ ˆ ... ˆ )
minQ i yi xi x i kxki
k
) ' ( ) '
ˆ (XX -1 Xy β
u Xβ
y
2 2 22 2 2
y n y y
y S
y x n y x y
y x x S
x n x x
x S
i i
yy
i i i
i xy
i i
xx
i i
i i i
i i
xx xy
x y
y y u
x y
x y S S
ˆ ˆ ˆ
ˆ ˆ ˆ ˆ
ˆ ˆ ˆ
4
Többváltozós regresszió értelmezés
Együtthatók értelmezése
Parciális hatás („ceteris paribus”): adott magyarázó változó hatása függő változóra, többi magyarázó változó fixen tartása mellett
Többszörös determinációs együttható: R2 RSS = Syy(1 – R2)
Becslés kismintás tulajdonságai
Az 1–4. feltételek teljesülése esetén az OLS-becslés torzítatlan.
Az 1–5. (Gauss–Markov) feltételek teljesülése esetén a becslés BLUE, és a paraméterbecslések szokásos varianciája helyes
Az 1–6. (klasszikus lineáris modell) feltételek esetén a t-, F-statisztika t-, ill.
F-eloszlású (minden mintaelemszám esetén).
Többváltozós regresszió, t-próba
Kétoldali próba: pl. H0: βi = 0, H1: βi ≠ 0 Egyoldali próba: pl. H0: βi = 0, H1: βi > 0 Normális hibatagok esetén:
i
i RSS
Var
2
ˆ ) (
~ 1
ˆ) ( ˆ
k n i
i
i t
SE
i
i RSS
Var
2
ˆ ) (
ˆ2 1
k n
RSS
5
Egyváltozós eset
Többváltozós regresszió, F-próba
Egymásba ágyazott hipotézisek tesztelése Több korlátozás együttes tesztelése
Varianciaanalízis
2
22
2 2
~ / /
ˆ 1 ˆ
~ ˆ /
ˆ
n xx
n xx
t S x n
t S
) 1 ( , 2
2 2
2 1
2 2
) 1 ( 2 ,
2 2
)~ 1 /(
) 1 (
/ 0
0 ...
:
) 1 ( )
1 (
)~ 1 /(
) 1 (
/ ) (
) 1 /(
/ ) (
k n k U
U R
k
U yy R
yy
k n r U
R U
k F n R
k F R
R
R S URSS R
S RRSS
k F n R
r R R k
n URSS
r URSS F RRSS
H
: atlansága használhat
Regresszió
0
Regresszió használhatatlansága
) 1 ( , 2
2 2
2 1
2 2
) 1 ( 2 ,
2 2
)~ 1 /(
) 1 (
/ 0
0 ...
:
) 1 ( )
1 (
)~ 1 /(
) 1 (
/ ) (
) 1 /(
/ ) (
k n k U
U R
k
U yy R
yy
k n r U
R U
k F n R
k F R
R
R S URSS R
S RRSS
k F n R
r R R k
n URSS
r URSS F RRSS
H
: atlansága használhat
Regresszió
0
Regresszió használhatatlansága
Szórás forrása
Négyzet- összeg
Szabads.- fok
Átl.
négyzetö. F
Regr. R
2S
yyk R
2S
yy/k = MS
1 F == MS1/MS2
Maradék (1 – R
2)S
yyn – k – 1 (1 – R
2)S
yy/(n – k – 1) =
= MS
2Teljes S
yyn – 1 Szórás
forrása
Négyzet- összeg
Szabads.- fok
Átl.
négyzetö. F
Regr. R
2S
yyk R
2S
yy/k = MS
1 F == MS1/MS2
Maradék (1 – R
2)S
yyn – k – 1 (1 – R
2)S
yy/(n – k – 1) =
= MS
2Teljes S
yyn – 1
6
Nagymintás eredmények 1.
Konzisztencia
Az 1–4. feltételek teljesülésekor az OLS becslés konzisztens. Egyváltozós esetre a bizonyítás
Nagymintás eredmények 2.
Aszimptotikus normalitás
Az 1–5. (Gauss–Markov) feltételek teljesülése esetén az OLS becslés aszimptotikusan normális
Tehát a szórás n1/2 nagyságrendben tart nullához.
A σ2 szokásos becslése konzisztens, így a szokásos t-teszt aszimptotikusan érvényes (még a 6. – normalitási – feltétel nélkül is)!
Nagymintás eredmények 3.
F-teszt és hasonlók
Az 1–5. feltételek esetén (tehát nem kell a 6. (normalitási) feltétel) az F-teszt aszimptotikusan érvényes.
) (
) , (
) (
) ,
ˆ ( ˆ
x Var
u x Cov
x Var
u x x
Cov Var(x)
Cov(x,y) S
S
xx xy
plim
) 1 ( ) 1 ) (
( ˆ
, 0 ˆ ~
2 2
2 2
2
i x i i i
aszimpt i
i
R R
n TSS Var
n c
c N n
i
7
További nagymintás tesztek (csak aszimptotikusan érvényesek):
Wald-teszt: n(RRSS – URSS)/URSS ~ χr2
a regresszió használhatatlanságára: nR2/(1 – R2)~ χk2
Lagrange-multiplikátor (LM) teszt: n(RRSS – URSS)/RRSS ~ χr2
a regresszió használhatatlanságára: nR2 ~ χk2
Modellszelekció
Korrigált R2
Egymásba ágyazott hipotézisek: t- és F-próba
Nem egymásba ágyazott hipotézis, függő változó azonos: korrigált R2, információs kritériumok (AIC, BIC – log-likelihood alapján)
Lényeges változók kihagyása
Kihagyott változó korrelál bennhagyott változókkal: torzított becslés (endogenitás) Kétváltozós regresszió
Tényleges modell: y = β1x1 + β2x2 + u Becsült modell: y = γ1x1 + u
Torzítás: Corr(x1,x2)>0 Corr(x1,x2)<0
β2 >0 + –
β2 <0 – +
) 1 1(
1 2 1 R2
k n
R n
8
Lényegtelen változó bevonása
Tényleges modell: y = β1x1 + β2x2 + u
Becsült modell: y = β1x1 + β2x2 + β3x3 + u, β3 = 0 Torzítatlanságot nem befolyásolja (nincs endogenitás) Variancia nő:
Egyéb témák
Előrejelzés Outlierek
Alternatív függvényformák Stabilitási tesztek
Dummy változók
Négyzetes tagok, interakciók Heteroszkedaszticitás stb.
Gyakorlat
Zárthelyi dolgozat
i
i RSS
2
) Var(