GAZDASÁGSTATISZTIKA
Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén,
az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi Intézet
és a Balassi Kiadó közreműködésével.
Készítette: Bíró Anikó Szakmai felelős: Bíró Anikó
2010. június
2
GAZDASÁGSTATISZTIKA 6. hét
Többváltozós regresszió Bíró Anikó
Zárthelyi dolgozat megbeszélése Több magyarázó változó – példák
Munkanélküliség megyénként: gazdasági szervezetek száma, földrajzi elhelyezkedés, átlagos végzettség, …
Értékesítés: hirdetési kiadás, ledolgozott munkaórák, termék minősége, … Ingatlanárak: telekméret, szobák száma, elhelyezkedés, …
Becslés, értelmezés
k-változós regresszió
OLS: maradéktagok négyzetösszegét minimalizálja Együtthatók értelmezése:
Marginális hatás
Többi magyarázó változó értéke rögzített
„Ceteris paribus”
2 2
2 1 1 1
2 1 2
1
ˆ ) ˆ ...
ˆ ˆ (
...
ik k i
i N
i i
i ik k i
i i
X X
X Y
SSR
e X X
X Y
3
Hipotézisvizsgálat
Konfidenciaintervallum: mint egyváltozósnál Együttható szignifikanciája: t-próba, p-érték R2 = 1–SSR/TSS
Illeszkedés mérőszáma
Magyarázó változók hány %-át magyarázzák függő változó szóródásának R2 = 0 tesztelése: F-próba
1. példa: keresetek
Bértarifa részminta, 2003 (havi br. ker. – életkor – iskolaévek)
Együtthatók értelmezése: marginális hatás!
Téves: „idősebbek általában többet keresnek”!
2 2
1 ) 1 (
R R k F N
3385.07 2957.52
0.00 29.08
109.05 3171.29
Kor
28138.24 26362.20
0.00 60.16
452.97 27250.22
Iskév
-312559.16 -344083.52
0.00 -40.84
8040.13 -328321.34
Tengelym.
Felső 95%
Alsó 95%
p-érték t érték
Standard hiba Koeff.
6.18E+13 4999
Összesen
6.61E+09 3.30E+13
4997 Maradék
0 2170.7
1.44E+13 2.87E+13
2 Regresszió
F szign.
F MS
SS df
VARIANCIAANALÍZIS 0.46 r-négyzet
Regressziós statisztika
3385.07 2957.52
0.00 29.08
109.05 3171.29
Kor
28138.24 26362.20
0.00 60.16
452.97 27250.22
Iskév
-312559.16 -344083.52
0.00 -40.84
8040.13 -328321.34
Tengelym.
Felső 95%
Alsó 95%
p-érték t érték
Standard hiba Koeff.
6.18E+13 4999
Összesen
6.61E+09 3.30E+13
4997 Maradék
0 2170.7
1.44E+13 2.87E+13
2 Regresszió
F szign.
F MS
SS df
VARIANCIAANALÍZIS 0.46 r-négyzet
Regressziós statisztika
4
2. példa: házárak
Házár (CAD) – telekméret (négyzetláb) – háló, fürdő, szint száma (forrás: Koop)
Gyakorlat
Többváltozós regresszió
OLS becslés
k-változós regresszió
OLS: SSR → min
9614.92 5654.87
0.00 7.57
1007.97 7634.90
#szint
20512.22 13698.12
0.00 9.86
1734.43 17105.17
#fürdőszoba
5210.93 438.30
0.02 2.33
1214.81 2824.61
#hálószoba
6.15 4.70
0.00 14.70
0.37 5.43
Telekméret
3068.25 -11087.35
0.27 -1.11
3603.11 -4009.55
Tengelym.
Felső 95%
Alsó 95%
p-érték t érték
Standard hiba Koeff.
3.89E+11 545
Összesen
3.34E+08 1.80E+11
541 Maradék
0.00 155.95
5.2E+10 2.08E+11
4 Regresszió
F szign.
F MS
SS df
VARIANCIAANALÍZIS
0.54 r-négyzet
Regressziós statisztika
9614.92 5654.87
0.00 7.57
1007.97 7634.90
#szint
20512.22 13698.12
0.00 9.86
1734.43 17105.17
#fürdőszoba
5210.93 438.30
0.02 2.33
1214.81 2824.61
#hálószoba
6.15 4.70
0.00 14.70
0.37 5.43
Telekméret
3068.25 -11087.35
0.27 -1.11
3603.11 -4009.55
Tengelym.
Felső 95%
Alsó 95%
p-érték t érték
Standard hiba Koeff.
3.89E+11 545
Összesen
3.34E+08 1.80E+11
541 Maradék
0.00 155.95
5.2E+10 2.08E+11
4 Regresszió
F szign.
F MS
SS df
VARIANCIAANALÍZIS
0.54 r-négyzet
Regressziós statisztika
2 2
2 1 1 1
2 2 1 1
ˆ ) ˆ ...
ˆ ˆ (
...
ik k i
i N
i i
i ik k i
i i
X X
X Y
SSR
e X X
X Y
5
1. példa
105 országra: 1960-85 átlag GDP növekedés, átlag beruházás/GDP, átlag népesség növekedés
Adatok %-ban
Együtthatók értelmezése? (százalékpont)
2. példa
Villamosenergiai cégek (Koop, electric.xls) Függő változó: termelési költség
Magyarázó változó: kibocsátás, egységköltségek: munkaerő, tőke, fűtőanyag Logaritmikus formában becslés
Együtthatók: rugalmasság
Szimuláció Excelben
Y=a+bX
Regresszió: becsült = tényleges Véletlenszám-generálás: e~N(0,1) Y=a+bX+e
Regresszió: becsült ≠ tényleges Minta elemszámának növelése?
Hibatag szórásának növelése?