GAZDASÁGSTATISZTIKA
GAZDASÁGSTATISZTIKA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén
az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet,
és a Balassi Kiadó közreműködésével.
GAZDASÁGSTATISZTIKA
Készítette: Bíró Anikó
Szakmai felelős: Bíró Anikó 2010. június
ELTE TáTK Közgazdaságtudományi Tanszék
GAZDASÁGSTATISZTIKA
6. hét
Többváltozós regresszió
Bíró Anikó
Zárthelyi dolgozat megbeszélése
Több magyarázó változó – példák
Munkanélküliség megyénként: gazdasági szervezetek száma, földrajzi elhelyezkedés, átlagos végzettség, …
Értékesítés: hirdetési kiadás, ledolgozott munkaórák, termék minősége, …
Ingatlanárak: telekméret, szobák száma, elhelyezkedés, …
Becslés, értelmezés
k-változós regresszió
OLS: maradéktagok négyzetösszegét minimalizálja Együtthatók értelmezése:
Marginális hatás
Többi magyarázó változó értéke rögzített
„Ceteris paribus”
2 2
2 1
1 1
2 1 2
1
ˆ ) ˆ ...
ˆ ˆ (
...
ik k
i i
N
i
i
i ik
k i
i i
X X
X Y
SSR
e X
X X
Y
Hipotézisvizsgálat
Konfidenciaintervallum: mint egyváltozósnál Együttható szignifikanciája: t-próba, p-érték R2 = 1–SSR/TSS
Illeszkedés mérőszáma
Magyarázó változók hány %-át magyarázzák függő változó szóródásának
R2 = 0 tesztelése: F-próba
2
2
1
) 1 (
R
R k
F N
1. példa: keresetek
Bértarifa részminta, 2003 (havi br. ker. – életkor – iskolaévek)
Együtthatók értelmezése: marginális hatás!
Téves: „idősebbek általában többet keresnek”!
Regressziós statisztika
r-négyzet 0.46
VARIANCIAANALÍZIS
df SS MS F F szign.
Regresszió 2 2.87E+13 1.44E+13 2170.7 0
Maradék 4997 3.30E+13 6.61E+09
Összesen 4999 6.18E+13
Koeff. Standard hiba t érték p-érték Alsó 95% Felső 95%
Tengelym. -328321.34 8040.13 -40.84 0.00 -344083.52 -312559.16
Iskév 27250.22 452.97 60.16 0.00 26362.20 28138.24
Kor 3171.29 109.05 29.08 0.00 2957.52 3385.07
2. példa: házárak
Házár (CAD) – telekméret (négyzetláb) – háló, fürdő, szint száma (forrás: Koop)
Regressziós statisztika
r-négyzet 0.54
VARIANCIAANALÍZIS
df SS MS F F szign.
Regresszió 4 2.08E+11 5.2E+10 155.95 0.00
Maradék 541 1.80E+11 3.34E+08
Összesen 545 3.89E+11
Koeff. Standard hiba t érték p-érték Alsó 95% Felső 95%
Tengelym. -4009.55 3603.11 -1.11 0.27 -11087.35 3068.25
Telekméret 5.43 0.37 14.70 0.00 4.70 6.15
#hálószoba 2824.61 1214.81 2.33 0.02 438.30 5210.93
#fürdőszoba 17105.17 1734.43 9.86 0.00 13698.12 20512.22
#szint 7634.90 1007.97 7.57 0.00 5654.87 9614.92
Gyakorlat
Többváltozós regresszió
OLS becslés
k-változós regresszió
OLS: SSR → min
2 2
2 1
1 1
2 2
1 1
ˆ ) ˆ ...
ˆ ˆ (
...
ik k
i i
N
i
i
i ik
k i
i i
X X
X Y
SSR
e X
X X
Y
1. példa
105 országra: 1960-85 átlag GDP növekedés,
átlag beruházás/GDP, átlag népesség növekedés Adatok %-ban
Együtthatók értelmezése? (százalékpont)
2. példa
Villamosenergiai cégek (Koop, electric.xls) Függő változó: termelési költség
Magyarázó változó: kibocsátás,
egységköltségek: munkaerő, tőke, fűtőanyag Logaritmikus formában becslés
Együtthatók: rugalmasság
Szimuláció Excelben
Y=a+bX
Regresszió: becsült = tényleges
Véletlenszám-generálás: e~N(0,1) Y=a+bX+e
Regresszió: becsült ≠ tényleges
Minta elemszámának növelése?
Hibatag szórásának növelése?