Hajdu Ottó
8.3. A relatív deprivációs küszöb kvantilis-regressziós modelljei
A szegények körét elhatároló küszöb rögzítésének egyféle relatív, objektív jellegű mód-szere a medián adott százalékát adni meg küszöbként, mivel a medián robusztus az ext-rém, outlier esetek (háztartások) torzító hatására. Mint érintettük a bevezetésben, a rela-tív depriváció elve szerint bármely társadalmi, gazdasági réteghez tartozó individuum, háztartás érezheti magát feltételesen depriváltnak, ha szeretne olyan jószágot birtokolni, amivel nem rendelkezik, de reálisnak tartja a birtoklását, és lát másokat a környezetében, akik ennek a birtokában vannak. Ebben az értelemben a relatív deprivációs küszöb relatív szegénységi küszöbként értelmezhető, ahol a depriváció érzete olyan nem birtokolt javak-kal szemben jelentkezik, mint a jövedelem, fogyasztás, kiadás, vagyon, településtípus, sza-badidő, közlekedés, szabadság, hatalom.14 E dimenziók szóródása – ha a célváltozó például
14 A kapcsolatszegénységről például Vastagh – Huszár 2008 ír.
a háztartás éves kiadása és a rétegképző ismérv a háztartás éves jövedelmi szintje – jöve-delmi rétegről rétegre haladva nem egy szűk homogén párhuzamos sávon belül, hanem táguló-szűkülő egyenesek, parabolák vagy egyéb tendenciák mentén alakul. Erre példa a 4. ábra, amely a hazai háztartások évi összes élelmiszer kiadásait (ezer Ft) ábrázolja az éves összes jövedelmeik (ezer Ft), mint rétegképző feltétel mellett.15
A pontfelhő jellegzetességei, hogy outlierek jelennek meg mind a jövedelem, mind a kiadás tekintetében, és a kiadás terjedelme a jövedelmi szint emelkedésével tágul. Lát-ható, hogy egyetlen regressziós egyenessel nem lehet leírni a pontfelhőt, és ha éppen a „centrális tendenciát” modellezzük, akkor az OLS (Ordinary Least Squares) egyenes alkalmazása nem megfelelő, mert az átlag érzékeny az outlierek hatására, és a jelen adat-felhő outlierekkel terhelt mind X, mind Y tekintetében. Az egyre szélesedő pontfelhőt érdemes tehát kvantilis rendenként külön-külön regresszálni, megőrizve így az eloszlás 15 Értelemszerűen a rétegképzés kombinálható más ismérvekkel, mint életkor, nem, iskolai végzettség,
stb. (HKF 2003).
3. ábra. A cenzorált egyenlőtlenségi dimenziók rétegzett szegénységi vetületei (Forrás: HKF 2003 adatai alapján, saját szerkesztés)
extrém szegmenseinek az információit is. A 4. ábra négy regressziós egyenest ábrázol, rögzített X jövedelmi szintek függvényében, ahol a becsült egyenesek koefficiensei rendre:
1. OLS: A várható, átlagos kiadást becsli: 204 + 0,116X,
2. LAD: Tau(0,5): A várható medián kiadást becsli: 151 + 0,133X, 3. Tau(0,1): A várható alsó decilis kiadást becsli: 89 + 0,071X, 4. Tau(0,9): A várható felső decilis kiadást becsli: 267 + 0,205X.
Mikor a függő Y változó empirikus értékei a LAD (Least Absolute Deviation) regresszióval nem párhuzamosan, hanem az X prediktor függvényében szétnyílnak, zárulnak, kvadra-tikusak, akkor maga a centrális modell önmagában nem adekvát, és fölmerül a módszer-tani igény a függő változót valamely Tau-rendű kvantilis várható értékeként definiálni, és ezt egy alkalmas regressziós modell magyarázó változóinak ismeretében prediktálni.
Míg a centrális kiadás leírására a mediánközeli, addig az alacsony kiadások leírására az alsó, a magas kiadások esetén pedig a felső decilishez közeli kvantilisek a függő cél-változók. A különböző rendű kvantilisek egy szegénységi/gazdagsági függőleges, Y skálát szegmentálnak. A „rétegzés” arra utal, hogy az adott rendű kvantilist a regressziós pre-diktorváltozók X szintjei által „kihasított” rétegében modellezzük: például a felső
deci-4. ábra. Élelmiszerkiadás vs. Jövedelem kapcsolatú Engel-görbék (Forrás: HKF 2003 adatai alapján Gretl for Windows programmal saját szerkesztés)
lis előrejelzett értéke, ha a prediktor (regresszor) kovariáns a háztartásfő neme, iskolai végzettsége, a háztartás tagszáma. A „feltételes” terminológia arra utal, hogy a regresz-sziós modell a kvantilisek előrejelzése során is a várható értéket, most a várható kvantilist becsli, rétegenként külön-külön.16
Az alábbiakban magyar háztartások éves összes élelmiszer kiadásait (Y: ezer Ft) tekint-jük adott évben, az éves összesen jövedelmeik (X: ezer Ft) függvényében. Jelölje diff a reg-resszió eltérését az empirikus Y-értéktől, ahol a rega reg-resszió fölötti megfigyelés pozitív, reg-resszió alatti pedig negatív diff értéket eredményez. Ebben a regreg-resszióban a diff távolságok abszolút összegét minimáljuk, ahol egy pozitív diff értéknek nagyobb, mint 0,5 súlyt adva a kvantilis regressziós egyenest a medián regresszió fölé, míg kisebb, mint 0,5 súlyt adva a regressziós egyenest a medián regresszió alá húzzuk le. A Tau = 0,1 és a Tau = 0,9 eset az alsó és a felső decilis modelljét adja.
A magyarázó változók körét a specifikációs torzítás csökkentése érdekében bővítettük az 1. táblázat szerint.17 A kiadási határhajlandóságot vizsgálva a LAD medián becslése:
0,073, azaz 73 Ft.18 A csak Jövedelem modellel összevetve, a specifikációs torzítás jelentős, LAD-esetben: 0,06 (0,133–0,073), azaz 60 Ft.
A becsült koefficiensek alkalmazásával bármely réteg deprivációs küszöbértéke X fel-tétele melletti behelyettesítéssel kalkulálható, ahol a vizsgált X faktorok rendre (zárójelben a változónevek szerepelnek):
1. Településtípus (DBpNvTvKo_#): Budapest (# = 1), Nagyváros (# = 2), Többi város (# = 3);
2. A háztartás tagszáma (TLetszam, fő);
3. A lakás értéke (LakasMFt, millió Ft);
4. A gépkocsik éves futása (GepKoEKm, ezer km);
4. Üdülő: Van/Nincs (UduloVan: 1 ha van, 0 egyébként);
5. Foglalkoztatottság: Vállalkozók (Vallalk), Aktív keresők (AKeres), Munkanélküliek (Mnelkuli), Eltartottak (Eltartott) száma;
6. Demográfiai jellemzők: A háztartásfő neme (HFneme; 1 ha férfi, 0 egyébként), isko-lai végzettsége (HFiskv; 1,2, …,13 (PhD)), életkora (HFkora, év);
7. A háztartás évi összes jövedelme ezer forintban (JovEFt).
Az 1. táblázat a kvantilis regressziók eredményeit tartalmazza. A táblázat megállapításai a következők. A Tau = 0,5 LAD-medián és az OLS-átlag marginális hatások (koefficien-sek) jelentősen eltérnek egymástól, a vállalkozók száma prediktornál pedig az előjelben is különböznek. A const tengelymetszet a Tau növelésével növekszik, és negatív előjelről 16 A magyarázó változók tekintetében megfelelően specifikált regressziós koefficiensek és
a deprivá-ciós küszöb együttes birtokában a küszöb alá kerülés, azaz a „lemorzsolódás” valószínűsége számít-ható. A küszöbalattisági valószínűségszámítására a logisztikus regresszió, kismintás esetben pedig kifejezetten az egzakt logisztikus regresszió módszere kézenfekvően szolgál.
17 HKF 2003 adatok.
18 Most, lineáris esetben, a kiadási határhajlandóság a parciális jövedelem-koefficienssel egyezik meg.
indulva pozitív előjelűre vált át. A DBpNvTv_3 dummy-hatás Tau = 0,05 szinten markán-san pozitív, egyébként markánmarkán-san negatív! Az UduloVan prediktor marginális hatása egy viszonylag stabil negatív szintről a Tau = 0,9 és a Tau = 0,95 esetekre abszolút értékben erő-sen megemelkedik, először negatív, majd pozitív előjellel. A táblában szürke háttér emeli ki azon prediktorváltozókat, melyek valamennyi kvantilisre azonos előjelű koefficiensek-kel rendelkeznek.
Az Akaike-, Hannan–Quinn- és Schwarz-kritériumok egyaránt a Tau = 0,25 rendű kvantilis regressziót preferálják.
A kiadási határhajlandóság becsléseit, vagyis a jövedelem prediktor koefficienseit kiemelve, a nevezetes Tau-rendek mellett az egyes határhajlandóságok a következők: 35 Ft (Tau = 0,05), 38 Ft (Tau = 0,1), 50 Ft (Tau = 0,25), 73 Ft (Tau = 0,50), 90 Ft (Tau = 0,75), 119 Ft (Tau = 0,90), 137 Ft (Tau = 0,95). A parciális – azaz minden más környező változó hatásától tisztí-tott – kiadási határhajlandóság a Tau-rendjének növelésével tehát növekszik. A koefficien-sekhez p-értéket nem fűzünk, mert a küszöbértékek minél pontosabb, árnyaltabb becslése érdekében valamennyi magyarázó változó marginális hatásait (koefficienseit) szakmailag fontosnak tartjuk.
1. táblázat. A regressziós koefficiensek értékei különböző kvantilisek mellett
Példaként tekintsünk egy budapesti 3 fős háztartást 40 milliós lakással, 30 ezer km gépkocsifutással, üdülővel, vállalkozó nélkül, 1 fő munkanélkülivel, 1 főt eltartva, férfi háztartásfővel, akinek PhD-fokozata van, 40 éves, valamint 1,5 millió Ft éves háztartási jövedelemmel (1. táblázat utolsó oszlopa). A táblázat utolsó sora a Példa háztartás relatív deprivációs küszöbértékeit közli, a koefficiensek alkalmazásával számítva. E küszöbér-tékek értelmezése a következő. A Példa háztartáshoz hasonló arculatú háztartások egy alcsoportot, réteget képeznek a társadalomban. E rétegben a becsült, várható alsó decilis pl. 276,7 ezer Ft, a felső decilis pedig 703,6 ezer Ft. Az előbbi tekinthető rétegspecifikus sze-génységi, az utóbbi pedig jóléti küszöbnek. Ugyanakkor a Tau = 0,95 percentilis 842,3 ezer Ft értéke a „felső tízezret” elhatároló deprivációs küszöb becslése. Aki ez alatt van, hiába tartozik a felső decilishez, relatív értelemben depriváltnak érezheti magát.
Láthatóan, a vizsgált háztartástípusban a kiadás-tengelyt tetszőlegesen szegmentál-hatjuk, és az egyes szegmensekbe kerülés feltételes valószínűsége ordinális, logisztikus regressziós modellel számítható.19