ÖKONOMETRIA
ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet,
és a Balassi Kiadó közreműködésével.
ÖKONOMETRIA
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
ELTE TáTK Közgazdaságtudományi Tanszék
ÖKONOMETRIA
2. hét
Egyváltozós regresszió 1.
Elek Péter, Bíró Anikó
Alapok, példák
A regressziós modell alapfeltevései A paraméterek értelmezése
Becslési módszerek
Legkisebb négyzetek (OLS) Momentumok módszere
(Maximum likelihood módszer)
A becslés tulajdonságai, mintavételi eloszlása
Tartalom
Bevezetés
Egyváltozós regresszió:
y = árbevétel
x = reklámra fordított kiadások
Többváltozós regresszió:
y = munkavállaló bére x1 = képzettség
x2 = munkatapasztalat x3 = lakóhely stb.
Célok:
olyan döntések y-ra való hatását vizsgálni, amelyek az x-eket megváltoztatják
y változót előrejelezni x-ek segítségével
eldönteni, van-e bármelyik x-nek szignifikáns hatása y-ra
Egyváltozós (lineáris) regresszió: alapok 1.
yi = α + βxi + ui (sztochasztikus kapcsolat)
y x
előrejelzett változó előrejelző változó magyarázott változó magyarázó változó függő változó független változó Eredményváltozó okváltozó
u hibatag:
véletlenszerű emberi reakciók előrejelezhetetlensége nagyszámú kihagyott véletlen változó hatása
az y mérési hibája
Egyváltozós regresszió: alapok 2.
Regressziós paraméterek:
tengelymetszet meredekség
A regresszió eredete: Francis Galton
gyermekek (y) és szüleik (x) testmagassága közötti összefüggés
y = m + x
<1 adódott: „regression to the mean”
(átlaghoz való visszatérés)
Alapfeltevések
1. E(u
i) = 0
2. u
i, u
jfüggetlenek minden i≠j-re 3. x
i, u
jfüggetlenek minden i, j-re
biztosan teljesül, ha xi-k nem véletlen változók
4. Var(u
i) = σ
2minden i-re (homoszkedaszticitás)
5. u
inormális eloszlású minden i-re: N(0, σ
2)
Értelmezés
(1) és (3) következménye: exogenitás, azaz E(ui| xk) = 0 minden i,k-ra
Tehát E(yi|xi) = α + βxi
Ezért β értelmezése parciális hatásként:
α értelmezése: α = E(yi|xi = 0)
i i
x x y
E
|
Becslés 1.
Legkisebb négyzetek (OLS)
Két normálegyenlet:
i
i
i x
y
Q 2
, ˆ
ˆ ( ˆ ˆ )
min
0 ) (
ˆ ) ˆ
( 2 ˆ 0
0 ) 1 ( ˆ ) ˆ
( 2 ˆ 0
i i
i i
i
i i
x x
Q y
x Q y
Becslés 2.
Momentumok módszere (MM)
Momentumok módszere: elméleti momentumokat egyenlővé tesszük a tapasztalati momentumokkal
(pl. várható értéket mintaátlaggal, varianciát mintabeli varianciával)
Normálegyenletek (ugyanaz, mint előbb):
E(u) = 0 cov(u,x) = 0
ahol
Egyenletrendszer:
ˆ 0
xiuiuˆi 0
i i
i y x
uˆ ˆ ˆ
0 ˆ )
( ˆ
0 ˆ )
( ˆ
i i
i i
i
i i
x x y
x y
Becslés 3.
Maximum likelihood (ML) módszer
Emlékeztető: adott mintaelemek (yi) alapján keressük azt a
paramétert, aminél a minta „előfordulásivalószínűsége” a lehető legnagyobb:
0
max )
( log )
( log )
(
max )
( )
(
1 1
l
y f
L l
y f
L
i n
i n
i
i
Eredmény: OLS-nél már látott egyenletek (ha a hibák normális eloszlásúak)
2 0 2
2 0 2
log 2 )
, , ( log )
, , (
exp 2 2
) 1 , , (
2 1
2 1
2 1
2 1
2
2
n
i
i i i
n
i
i i
n
i
i i
n
i
i i
x x l y
x l y
x y
n C L
l
x L y
Becslőfüggvény
i i
i i
i
i i
xx xy
x y
y y
u
x y
x y
S S
ˆ ˆ ˆ
ˆ
ˆ ˆ ˆ
ˆ ˆ ˆ
ˆ 2
ˆ ˆ ˆ
i i
i i
i i
x x
y x
x n
y
ˆ 2
ˆ ) (
ˆ ˆ
i i
iy nx y x x
x
x y
2 2 22 2 2
y n y
y y
S
y x n y
x y
y x x
S
x n x
x x
S
i i
yy
i i i
i xy
i i
xx
„Merőlegességi” összefüggések
A normálegyenletek más formában:
Ezért:
i i i
u x u 0 ˆ
0 ˆ
ˆ
0ˆ
ˆ 0 ˆ ˆ
ˆ ˆ ˆ 0
y y
u
x u
y u
y u
i i
i i
i i i
Teljes négyzetösszeg felbontása
Total
Explained Residual
Más könyvek fordítva használják („regression” ill. „error”)
ESS RSS
TSS
y y
y y
y
y
i i i i
( )
2( ˆ )
2( ˆ )
2
i i
yy xyxy xx
i i
yy i
S S
ESS TSS
y y
RSS
S S
x x
y y
ESS
S y
y TSS
ˆ ˆ
ˆ ˆ
ˆ ˆ ˆ ˆ
ˆ
2
2 2 2
2
Korreláció, determinációs együttható
r
xy: x
iés y
itapasztalati korrelációs együtthatója
r
xy2: determinációs együttható
TSS ESS S
S S
S S r S
yy xx xy
yy xx
xy
xy 2 /
A becslőfüggvény torzítatlansága
Itt úgy vezettük le, hogy xi-k rögzítettek, de akkor is érvényes, ha véletlen változók
(könnyen belátható)
Nem kell hozzá a hibatagok normalitása, sőt a homoszkedaszticitása sem
x E
y E x
y E E
x x
x x
x x
x x
y y
E x E x
i
i i
i
i i
ˆ) ( )
( ˆ )
( ˆ)
(
) (
) (
) (
) (
) (
) ) (
( ˆ 2 2
A becslőfüggvény optimalitási tulajdonsága
BLUE (best linear unbiased estimator):
a homoszkedaszticitás feltételezése mellett a becslésünk a torzítatlan lineáris becslések között a legkisebb varianciájú
(részletesebben ld. a többváltozós esetben)
Ha ráadásul normális eloszlású is a hiba, akkor az összes torzítatlan becslés között a legjobb
Példa
2003-as bértarifa, egyváltozós regresszió:
log(Keri)=α +β1Iski +ui
Értelmezés
Eggyel több iskolai év 0,12 egységgel növeli log(bér) változót
Azaz 12%-kal növeli a bért Előrejelzésre jó lehet
De: ok-okozati összefüggés-e (exogenitás)?
Nem biztos, pl.
munkatapasztalat (mérhető)
tehetség (nehezebben mérhető)
Paraméterbecslések mintavételi eloszlása (x
i-k rögzített értéke esetén)
kell....
becsülni is
t - de
ˆ Var , ˆ ~
Var ˆ , ˆ ~
: is normálisak hibák
a Ha
ˆ / ˆ, cov
/ /
ˆ 1 Var
/ /
/ Var
) /
ˆ Var(
Var
: mellett szticitás
Homoszkeda
2
2 2
2 2 2
2
N N
S x
S x n
S S
x x
S y x x S
S
xx
xx
xx xx
i
xx i
i xx
xy
Homoszkedaszticitás mellett
Ha a hibák normálisak is
de σ-t is becsülni kell…
2. gyakorlat
EViews használata, egyváltozós regresszió
Az EViews-ról
Statisztikai – ökonometriai szoftver
Felhasználóbarát, idősoros elemzésre nagyon jó Help fájlok (User’s guide)
Stata:
több beépített eljárása van, és jobban programozható keresztmetszeti és panel elemzésre jobban használható
Gretl:
ingyenesen letölthető, BA szinten megfelelő
panel- és többváltozós idősor-modellekre hiányos
Statisztikai szoftverek: SPSS, R
Adatok betöltése 1.
File/new/workfile – undated
Objects/new object/series – edit Copy – paste
Name
Adatok betöltése 2.
File/new/workfile – undated
Procs/Import/Read text-lotus-excel
Forrásfájl legyen bezárva!
Excel sheet name…
Names for series: pl. hours tax – mindkét adatsort beolvassa
Változók kezelése
Megnyitás, deskriptív statisztikák, grafikonok
View/Descriptive statistics View/Graph
Több adatsor együttesen is kijelölhető (open as group)
Változó generálás (genr) Minta: smpl
smpl 1 20 smpl @all
Vagy: quick/sample
Regresszió
Quick/estimate equation …
Konstanst feltüntetni! (c)
Method: OLS az alapbeállítás
Vagy:
equation name.ls …
1. példa – állami kiadások, GDP
Eurostat adatok
Miért függhet össze? Okság iránya?
Grafikon (scatterplot) Regresszió becslése
Együttható értelmezése
Szignifikancia – t-teszt, F-teszt (Wald)
Reziduumok: View/Resid.tests/histogram
Problémák?
2. példa – ledolgozott munkaórák, határadókulcs
OECD adatok
Miért függhet össze? Okság iránya?
Együttható várható előjele?
Grafikon (scatterplot) Regresszió becslése
Együttható értelmezése Szignifikancia – t-teszt R-négyzet értelmezése
Becsült érték: forecast