3. KUTATÁS HIPOTÉZISEI, TARTALMA, MÓDSZEREI, INDOKLÁSA
3.3. A KUTATÁSBAN FELHASZNÁLT MÓDSZEREK
3.3.3. Heckit-modell
3.3.3.3. A Heckit-modell specifikálása
szelekciós korrekció az egyenletben benne foglaltatik (Greene, 2003).
3.3.3.3. A Heckit-modell specifikálása
A Heckit-modell használata során, az x1ij változók közül, melyek a szelekciós egyenletben szerepelnek, legalább egyet el kell hagyni a kvantitatív egyenlet becslésénél az
2
xij változók közül. (Sartori, 2003) Ugyanis amennyiben x1ij és x változók teljesen 2ij megegyeznek, akkor a becslés eredményei kizárólag a hibatagok eloszlására vonatkozó feltételezésen, nem pedig a magyarázó változók eltérésein alapulnak. Ugyanakkor nem lehet megoldás az, hogy a második lépésben használatos magyarázó változók közé olyan változót felvétele történik meg, amely nem szerepel a szelektivitási egyenlet magyarázó változói között, mivel ez inkonzisztens becsléshez vezetne. (Woolridge, 2002) Így a szelekciós egyenlet változói közül a második lépésben kihagyott változót úgy kell megválasztani, hogy az olyan legyen, ami feltehetőleg csak a kvalitatív döntésben játszik szerepet, ugyanakkor a kvantitatív döntésre nincsen hatással. A választás a korábbi szakirodalmak és a kutatói intuíció alapján lehetséges, mivel igazán egzakt módszerek nincsenek ennek a problémának a megoldására.
A magyar viszonyokra vonatkozóan sportkiadásokra vonatkozó részletes ökonometriai modell nem készült még, ezért kiindulási pontul a nemzetközi szakirodalomban fellelhető kutatások szolgáltak. Ugyanakkor ezek között is túlsúlyban vannak azok, amelyek a Heckit-modellt nem a sportkiadások becslésére, inkább a sporttal töltött idő mértékére alkalmazták. Joggal feltételezhető, hogy a sporttal töltött idő
86 mennyiségét és a sportkiadások nagyságát sok esetben ugyanazok a tényezők határozzák meg, éppen ezért feltétlenül szükséges ezen kutatások áttekintése is.
Humphrey és Ruseski (2006) empirikus elemzésükben Heckit-modell felhasználásával az Amerikai Egyesült Államok háztartásai esetében vizsgálták a sportaktivitásbeli részvétel mértékét, számszerűsítve több szocio-ökonómiai, szezonális, egészségügyi és demográfiai változó hatását. Kutatásukban a sportbeli részvételt és az azzal töltött idő mennyiségét vizsgálva a szelekciós egyenlet magyarázóváltozói közül a háztartásban eltartott gyermekek számát, a szubjektív egészségi állapot mutatóit és azokat a dummy változókat hagyták el, amelyek arra vonatkoztak, hogy a háztartás melyik államban található.
Pawlowski (2009) a német háztartásstatisztikák alapján szintén Heckit-modell által kapott eredmények segítségével azonosította a háztartások kiadási szerkezetében a sportkiadások jelenlétének valószínűségét, valamint azok megléte esetén azonosította a sportkiadások mértékét meghatározó gazdasági, szociológiai és demográfiai változókat.
Modelljei alapján háztartáscsoportonkénti specifikus kiadási különbözőségeket azonosított, valamint kiadási rugalmasságokat számszerűsített. Kutatásai során az egyes sportkiadás-típusoktól függően eltérő változókat hagyott ki a különböző modellekből. Így a sportszolgáltatási kiadások esetében a háztartásfő legmagasabb iskolai végzettségének, sporteseményekhez és a fitnesz-szolgáltatásokhoz kapcsolódó kiadások esetében a háztartás települési méretének, sí-kiadások esetében az adatfelvétel negyedévének, sportegyesületi tagsághoz kapcsolódó kiadások esetében a háztartásfő életkorának változóit hagyta ki a második lépésben.
Garcia et al. (2009) Spanyolországban végzett vizsgálataik során szintén két lépésben vizsgálták a sportolási szokásokat. Első lépésben probit-modellel a sportban történő részvétel valószínűségét, második lépésben pedig a látszólag nem összefüggő regressziós modellel (Seemingly Unrelated Regression – SUR) a sportra fordított idő mértékét. Bár nem Heckit-modellel dolgoztak, de hasonló metodikájuk miatt érdemes figyelembe venni, hogy vizsgálatukban a második lépésben az elsőhöz képest az urbanizáltság fokát, a régiókat és a képzettségi szintek magyarázó változóit hagyták ki.
Downward és Riordan (2007) kutatásukban a sportkeresletet a „személyes és szociális tőke” sportrészvételből származó hasznosságok akkumulációja felől közelítették meg. A sportaktivitásbeli részvételt gazdasági és szociális jellegű változókkal és a sportoláshoz kapcsolódó különböző változókkal magyarázták. Klaszteranalízisükkel a különböző szabadidő-eltöltési formákat kategorizálták aszerint, hogy melyek inkább szabadidős
87 tevékenységek, melyek rekreációs jellegű sporttevékenységek és melyek versenysport jellegűek. Ezen csoportokat a már említett változók alapján is jellemezték. Heckit-modellel tesztelték a különböző tevékenységekben való részvétel gyakoriságát ugyanezen változók alapján. Kutatásukban azzal a feltételezéssel éltek, hogy nincsen ok bármely szelekciós egyenletben szereplő magyarázó változó elhagyására, így ők a magyarázó változók azonos kombinációjával becsülték a második lépés egyenletét. Ennek helyessége megkérdőjelezhető, ezért e tanulmányban nem ez a módszer került alkalmazásra. (Sartori, 2003)
A szakirodalomban megtalált magyarázó változókat összefoglalóan a 11. táblázat tartalmazza.
11. táblázat: A Heckit-modellt alkalmazó, a sportolás gyakoriságát, sportkiadások mértékét kutató korábbi kutatások összefoglaló táblázata
Magyarázó változó
Humphreys –
Ruseski [2006] Garcia et al. [2009] Downward – Riordan [2007]
Pawlowski [2009]
Kvalit. Kvantit Kvalit. Kvantit. Kvalit. Kvantit. Kvalit. Kvantit.
Nem + + Külön
+ jel: azok a változók, amelyek szignifikánsnak bizonyultak az adott egyenletben
// jel: azok a változók, amelyek nem voltak szignifikánsak az adott egyenletben, vagy kihagyásra kerültek a kvantitatív egyenletből
Forrás: saját szerkesztés
88 A szakirodalomban többféle megoldás is található a függő változók specifikálására is.
Mivel az alább felsoroltak közül utóbbi kettő specifikáció nem általánosan elterjedt, tulajdonképpen egyedi esetek, ezért ezek használata elmaradt:
− Tekintettel arra, hogy a sportkiadási adatok nem normál eloszlást követnek, ezért a leggyakrabban alkalmazott megoldás azok természetes alapú logaritmizálása, és így történő szerepeltetése (Söderbom, 2009; Heckman, 1976; Wodjao, 2007; Baum, 2006; Mroz, 1987). A későbbiekben jelen tanulmányban is ez a fajta modellspecifikáció került alkalmazásra.
− Pawlowski (2009) modellezései során a sportkiadási adatok relatív nagyságát szerepeltette az összes háztartási kiadáshoz képest függő változóként.
− A harmadik fajta specifikációs megoldásként pedig a kiadási változó abszolút értékei is fellelhetőek. (Nicolau – Más, 2004).