ÖKONOMETRIA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék az MTA Közgazdaságtudományi Intézet
és a Balassi Kiadó közreműködésével
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
2010. június
2
ÖKONOMETRIA 2. hét
Egyváltozós regresszió 1.
Készítette: Elek Péter, Bíró Anikó Szakmai felelős: Elek Péter
Tartalom
Alapok, példák
A regressziós modell alapfeltevései A paraméterek értelmezése
Becslési módszerek
Legkisebb négyzetek (OLS) Momentumok módszere
(Maximum likelihood módszer)
A becslés tulajdonságai, mintavételi eloszlása
Bevezetés
Egyváltozós regresszió:
y = árbevétel
x = reklámra fordított kiadások Többváltozós regresszió:
y = munkavállaló bére x1 = képzettség
x2 = munkatapasztalat x3 = lakóhely stb.
3
Célok:
olyan döntések y-ra való hatását vizsgálni, amelyek az x-eket megváltoztatják y változót előrejelezni x-ek segítségével
eldönteni, van-e bármelyik x-nek szignifikáns hatása y-ra
Egyváltozós (lineáris) regresszió: alapok 1.
yi = α + βxi + ui (sztochasztikus kapcsolat)
y x
előrejelzett változó előrejelző változó
magyarázott változó magyarázó változó
függő változó független változó
Eredményváltozó okváltozó
u hibatag:
véletlenszerű emberi reakciók előrejelezhetetlensége nagyszámú kihagyott véletlen változó hatása
az y mérési hibája
Egyváltozós regresszió: alapok 2.
Regressziós paraméterek:
tengelymetszet meredekség
A regresszió eredete: Francis Galton
gyermekek (y) és szüleik (x) testmagassága közötti összefüggés y = m + x
<1 adódott: „regression to the mean”
(átlaghoz való visszatérés)
4
Alapfeltevések
1. E(ui) = 0
2. ui, uj függetlenek minden i≠j-re 3. xi, uj függetlenek minden i, j-re
biztosan teljesül, ha xi-k nem véletlen változók 4. Var(ui) = σ2 minden i-re (homoszkedaszticitás) 5. ui normális eloszlású minden i-re: N(0, σ2)
Értelmezés
(1) és (3) következménye: exogenitás, azaz E(ui| xk) = 0 minden i,k-ra
Tehát E(yi|xi) = α + βxi
Ezért β értelmezése parciális hatásként:
α értelmezése: α = E(yi|xi = 0)
Becslés 1.
Legkisebb négyzetek (OLS)
Két normálegyenlet:
i i
x x y E
|
i
i
i x
y
Q 2
,ˆ
ˆ ( ˆ ˆ )
min
0 ) ( ˆ ) ˆ ( 2 ˆ 0
0 ) 1 ( ˆ ) ˆ ( 2 ˆ 0
i i
i i
i
i i
x x Q y
x Q y
5
Becslés 2.
Momentumok módszere (MM)
Momentumok módszere: elméleti momentumokat egyenlővé tesszük a tapasztalati momentumokkal
(pl. várható értéket mintaátlaggal, varianciát mintabeli varianciával) Normálegyenletek (ugyanaz, mint előbb):
E(u) = 0
cov(u,x) = 0
ahol
Egyenletrendszer:
Becslés 3.
Maximum likelihood (ML) módszer
Emlékeztető: adott mintaelemek (yi) alapján keressük azt a paramétert, aminél a minta
„előfordulási valószínűsége” a lehető legnagyobb:
uˆi 0ˆ 0
xiuii i
i y x
uˆ ˆˆ
0 ˆ )
ˆ (
0 ˆ ) ˆ (
i i
i i
i
i i
x x y
x y
0
max )
( log )
( log ) (
max )
( )
(
1 1
l
y f L
l
y f L
i n
i n
i
i
6
Eredmény: OLS-nél már látott egyenletek (ha a hibák normális eloszlásúak)
Becslőfüggvény
2 0 2
2 0 2
log 2 )
, , ( log ) , , (
exp 2 2
) 1 , , (
2 1
2 1
2 1
2 1
2 2
n
i
i i i
n
i
i i
n
i
i i
n
i
i i
x x l y
x l y
x y
n C L
l
x L y
ˆ 2
ˆ ˆ ˆ
i i
i i
i i
x x
y x
x n
y
ˆ 2
ˆ ) ( ˆ ˆ
i i
iy nx y x x
x
x y
2 2 22 2 2
y n y y
y S
y x n y x y
y x x S
x n x x
x S
i i
yy
i i i
i xy
i i
xx
i i
i i i
i i
xx xy
x y
y y u
x y
x y S S
ˆ ˆ ˆ
ˆ ˆ ˆ ˆ ˆ ˆ ˆ
7
„Merőlegességi” összefüggések
A normálegyenletek más formában:
Ezért:
Teljes négyzetösszeg felbontása
Total Explained Residual
Más könyvek fordítva használják („regression” ill. „error”)
Korreláció, determinációs együttható
rxy: xi és yi tapasztalati korrelációs együtthatója rxy2: determinációs együttható
i i i
u x u
ˆ 0
ˆ 0
ˆ
0ˆ
ˆ 0 ˆ ˆ
ˆ ˆ ˆ 0
y y u
x u
y u
y u
i i
i i
i i i
ESS RSS
TSS
y y y
y y
yi i i i
( )2 ( ˆ )2 (ˆ )2
i i
yy xyxy xx
i i
yy i
S S
ESS TSS y
y RSS
S S
x x
y y ESS
S y y TSS
ˆ ˆ
ˆ ˆ
ˆ ˆ ˆ ˆ
ˆ
2
2 2 2
2
TSS ESS S
S S S
S r S
yy xx xy yy
xx xy
xy 2 /
8
A becslőfüggvény torzítatlansága
Itt úgy vezettük le, hogy xi-k rögzítettek, de akkor is érvényes, ha véletlen változók (könnyen belátható)
Nem kell hozzá a hibatagok normalitása, sőt a homoszkedaszticitása sem
A becslőfüggvény optimalitási tulajdonsága
BLUE (best linear unbiased estimator):
a homoszkedaszticitás feltételezése mellett a becslésünk a torzítatlan lineáris becslések között a legkisebb varianciájú
(részletesebben ld. a többváltozós esetben)
Ha ráadásul normális eloszlású is a hiba, akkor az összes torzítatlan becslés között a legjobb
Példa
2003-as bértarifa, egyváltozós regresszió:
log(Keri)=α +β1Iski +ui
x E y E x y E E
x x
x x x x x
x
y y E x E x
i i i
i i i
ˆ) ( ) ( ˆ )
( ˆ) (
) (
) ( ) ( )
(
) ( ) ) (
( ˆ 2 2
9
Értelmezés
Eggyel több iskolai év 0,12 egységgel növeli log(bér) változót Azaz 12%-kal növeli a bért
Előrejelzésre jó lehet
De: ok-okozati összefüggés-e (exogenitás)?
Nem biztos, pl.
munkatapasztalat (mérhető) tehetség (nehezebben mérhető)
Paraméterbecslések mintavételi eloszlása (xi-k rögzített értéke esetén)
kell....
becsülni is
t - de : is normálisak hibák
a Ha
: mellett szticitás
Homoszkeda
ˆ Var , ˆ ~
Var ˆ , ˆ~
ˆ / ˆ, cov
/ /
ˆ 1 Var
/ /
/ Var
) / ˆ Var(
Var
2
2 2
2 2 2
2
N N
S x
S x n
S S
x x
S y x x S
S
xx xx
xx xx
i
xx i i xx
xy
10
2. gyakorlat
EViews használata, egyváltozós regresszió Az EViews-ról
Statisztikai – ökonometriai szoftver
Felhasználóbarát, idősoros elemzésre nagyon jó Help fájlok (User’s guide)
Stata:
több beépített eljárása van, és jobban programozható keresztmetszeti és panel elemzésre jobban használható Gretl:
ingyenesen letölthető, BA szinten megfelelő panel- és többváltozós idősor-modellekre hiányos Statisztikai szoftverek: SPSS, R
Adatok betöltése 1.
File/new/workfile – undated Objects/new object/series – edit Copy – paste
Name
11
Adatok betöltése 2.
File/new/workfile – undated
Procs/Import/Read text-lotus-excel Forrásfájl legyen bezárva!
Excel sheet name…
Names for series: pl. hours tax – mindkét adatsort beolvassa
Változók kezelése
Megnyitás, deskriptív statisztikák, grafikonok View/Descriptive statistics
View/Graph
Több adatsor együttesen is kijelölhető (open as group) Változó generálás (genr)
Minta: smpl smpl 1 20 smpl @all
Vagy: quick/sample
Regresszió
Quick/estimate equation … Konstanst feltüntetni! (c) Method: OLS az alapbeállítás Vagy:
equation name.ls …
12
1. példa – állami kiadások, GDP
Eurostat adatok
Miért függhet össze? Okság iránya?
Grafikon (scatterplot) Regresszió becslése
Együttható értelmezése
Szignifikancia – t-teszt, F-teszt (Wald) Reziduumok: View/Resid.tests/histogram Problémák?
2. példa – ledolgozott munkaórák, határadókulcs
OECD adatok
Miért függhet össze? Okság iránya?
Együttható várható előjele?
Grafikon (scatterplot) Regresszió becslése
Együttható értelmezése Szignifikancia – t-teszt R-négyzet értelmezése Becsült érték: forecast