• Nem Talált Eredményt

Analitikus trendszámítás

2.3 Trendelemzés

2.3.2 Analitikus trendszámítás

Az analitikus trendszámítás a leggyakrabban használatos görbeillesztési módszer, melyben valamilyen ismert, egyszerű matematikai függvénnyel írjuk le a vizsgált jelenség tartós tendenciáját. A feladatot úgy kell elképzelni, hogy kiindulva az idősor grafikus ábrájából, a vonaldiagramba (az alapirányzatot kimutatandó) egy kiegyenlítő vonalat kívánunk becslésszerűen berajzolni. Könnyen belátható, hogy az ábrába számos görbe rajzolható, melyek különbözőképpen illeszkednek a megfigyelt idősori ér-tékekhez, de mindegyikük tulajdonképpen egy grafikus becslésnek is tekinthető. A láthatóan szub-jektív és esetleges grafikus becslés helyett, az analitikus trendszámítás algebrai módon kezelhető megoldást nyújt az alapirányzat kimutatására.

Az analitikus trendszámítás első lépésében – előzetes információ (pl. az idősor ábrája) alapján – kiválasztjuk az illesztendő matematikai függvény típusát, például a lineáris függvényt9, ezt trendfügg-vénynek nevezzük; második lépésként a választott trendfüggvény együtthatóinak – más néven para-métereinek – konkrét értéket adunk. A trendfüggvény parapara-métereinek értékét a megfigyelt idősori adatokból közelítő számítással, azaz becsléssel állapítjuk meg. Görbeillesztési feladatok elvégzésére a leggyakrabban az ún. klasszikus legkisebb négyzetek módszerét szokás alkalmazni, mely közvetlenül a lineáris trendfüggvény illesztésére alkalmas.

A trendfüggvény becslése lineáris esetben nem más, mint az alábbi egyenes együtthatóinak megha-tározása:

0 1

ˆyt  b b t (2.24)

A klasszikus legkisebb négyzetek módszerének alapgondolata, hogy a

b b0, 1

paraméterpár értékeit változtatva végtelen számú trendfüggvényt előállíthatnánk, ám ezek közül legjobban illeszkedőnek azt tartjuk, mely esetében a

 

2

eltérés-négyzetösszeg a legkisebb. A fentiek alapján feladatunk a

0 1

2

többváltozós szélsőérték-számítási feladat megoldása. Az előbbi függvénynek csak akkor lehet szél-sőértéke, ha ott mindkét parciális derivált nulla.10 A b0 és b1 szerinti parciális deriváltak:

9 Melynek egyenlete, mint középiskola óta tudjuk: y a bx .

10 Esetünkben belátható, hogy a szélsőérték minimum, mivel a második deriváltak pozitívak.

31

Ha a fenti parciális deriváltakat egyenlővé tesszük nullával és célszerűen átalakítjuk, a paraméterek kiszámítására az alábbi, ún. normálegyenleteket nyerjük:

0 1

Mivel a t változó értékei és az yt idősor-adatok, ebből következően a szükséges összegek, kereszt-szorzatok és négyzetösszegek ismertek. A normálegyenletek kétismeretlenes elsőfokú egyenlet-rendszert alkotnak, ahol az ismeretlenek

b b0, 1

paraméterek. Az egyenletrendszert megoldva adó-dik a legjobban illeszkedő egyenes paramétereinek értéke:

 

A lineáris trendfüggvény paramétereinek értelmezése:

lineáris trend esetén a tengelymetszet (b0 paraméter) megadja a t 0, azaz az első megfigyelést ( t1) közvetlenül megelőző időpontra vonatkozó becsült alapirányzati értéket;

az iránytangens (b1 paraméter) megmutatja az időegységenkénti átlagos abszolút változás nagysá-gát. Abban az esetben, ha az iránytangens pozitív, növekvő; ha negatív, csökkenő trendről be-szélünk.

A lineáris trendet akkor alkalmazzuk, ha feltételezhető, hogy egységnyi időváltozás hatására a vizs-gált folyamat változása (növekedése vagy csökkenése) az elemzett időtávon belül abszolút értelem-ben megközelítően állandó.

Az alábbi grafikonon az NBA-ben szereplő Los Angeles Lakers hazai mérkőzéseinek átlagos jegyárai szerepelnek, az 1991/92-es szezontól a 2015/16-os szezonig (forrás:

https://umich.app.box.com/s/41707f0b2619c0107b8b/file/7964535440 ).

32 Az ábráról leolvasható, hogy a kezdeti, közel 50 $-os jegyár mintegy 25 év alatt több mint duplájára emelkedett, a 2015/16-os szezonban már meghaladta a 100 $-t. Lineáris trendet il-lesztve az adatsorra az alábbi egyenletet nyerjük:

ˆyt 31, 45 3, 23 t

Vagyis a modell által becsült éves jegyár növekedése 3,23$. Amennyiben ugyanazon az ábrán szerepeltetjük a tényleges és becsült adatokat is, jól látszik a lineáris trend „tévedése”:

Láthatjuk, hogy a kezdeti ingadozást kevéssé tudja leképezni az analitikus trend, ám az időszak második felében már viszonylag jól illeszkedik, ekkor a modell szinte „rásimul” a tényadatokra.

A lineáris mellett, a másik leggyakrabban alkalmazott trendfüggvény az exponenciális trend. Az emlí-tett két trendfüggvényben az a közös, hogy mindkettő egyenletes változást mutat. A lineáris trend esetén az abszolút változások (az elsőrendű differenciák), míg az exponenciális trendnél a relatív változások mutatnak viszonylagos állandóságot (stabilitást). Az exponenciális trendfüggvény általá-nos alakja:

30 40 50 60 70 80 90 100 110

1995 2000 2005 2010 2015

Átlagos jegyár ($)

30 40 50 60 70 80 90 100 110 120

1995 2000 2005 2010 2015

Átlagos jegyár ($)

tényleges becsült

33

ˆyt b b0 1t (2.25)

Paraméterének becslését könnyen megoldhatjuk az előbb bemutatott legkisebb négyzetek módsze-rével, ha az egyenletet logaritmálva lineáris alakra hozzuk, vagyis

0 1

ln ˆyt lnbt bln (2.26)

Az átalakított egyenlet paraméterei már becsülhetők a megismert normálegyenletek megoldásával.

Exponenciális trend esetén a paraméterek értelmezése:

 a b0 paraméter értelmezése megegyezik a lineáris esettel,

 a b1 megmutatja az időegységenkénti átlagos relatív változás nagyságát.

Az exponenciális trend általában a közép és hosszú távú gazdasági és társadalmi folyamatok jellem-zésének alapmodellje. Akkor alkalmazzuk, ha feltételezhető, hogy egységnyi időváltozás hatására a folyamat változása relatíve állandó, azaz a vizsgált időszakban a megfigyelések az előző értékhez képest rendre megközelítően azonos százalékos növekedést vagy csökkenést mutatnak.

Az analitikus trendszámítás számos további függvényformát alkalmaz, ezek közül talán a két leg-gyakoribb a

 polinomiális trend, ahol ˆy b 0 b t b t12 2 b tp p , illetve a

 logisztikus trend, ahol

1

Amennyiben az idősorban tendenciaváltás tapasztalható, vagyis növekedésből csökkenésbe (vagy fordítva) megy át – akár ismétlődően is – az idősor gyakran jól modellezhető p-ed fokú polinommal.

Értelemszerű, hogy a fokszám növelése egyre jobb illesztést ad, de megállapítható, hogy a p3

fokszám alkalmazása már igen nehezen indokolható.

A telítődési görbe (logisztikus trend) általában hosszabb távon vizsgált olyan folyamatok leírására alkal-mas, melyeknél a fejlődés három szakasza különíthető el. Például, egy új termék megjelenésekor a piaci bevezetés szakasza után a gyors felfutás, majd a piaci telítődés szakasza következik. Érdemes megjegyezni, hogy a függvény értéke nem haladhat meg egy „küszöbértéket”

2

valamint, hogy a növekedési ráta egyszerűen meghatározható:

1

azaz minél közelebb van az idősori érték a küszöbértékhez, annál kisebb a növekedés üteme.

34 A wimbledoni teniszbajnokság összdíjazása 1968 és 2004 között 26 ezer fontról közel 10 millió fontra emelkedett (forrás: https://umich.app.box.com/s/41707f0b2619c0107b8b/

file/23110069762 ). Határozzuk meg, hogy a bemutatott analitikus trendfüggvények közül me-lyik illeszkedik a legjobban a díjazás idősorára! A következő ábra az eredeti idősort (összes pénzdíj, ezer font), illetve a lineáris, exponenciális, másod- és harmadfokú polinom, valamint a logisztikus trend alapján becsült értékeket tartalmazza.

Látható, hogy a lineárison kívül mindegyik trendfüggvény viszonylag jól „leköveti” a pénzdíjak változását, de néhány esetben a modell és a valóság összevetése (a verifikáció) ellentmondást mutat, hiszen például a lineáris trend a negatív tartományból indul, ami nyilvánvalóan elkép-zelhetetlen.

Nézzük az állandó növekedési ütem feltételezésével készült exponenciális trendet! A becsült modell:

ˆyt 413,8 1,093 t

formájú. A paraméterbecslés (ezt az ábra is mutatja) kicsit felülbecsüli az induló értéket, hiszen az 1967-es (első évet megelőző időszak) pénzdíjat 413 ezer fontra teszi, ugyanakkor jól követi a díjazás alakulását, hogy modellünk szerint a vizsgált időszakban évről-évre átlagosan 9,3%-kal növekedett a kiosztott pénzösszeg.

A legkisebb négyzetek módszeréről tudjuk, hogy adott függvénytípuson belül a legjobban illeszkedő görbét szolgáltatja trendfüggvényként. Az alkalmazandó függvény típusának kiválasztása azonban az elemző feladata. Ehhez egyrészt - a vizsgált jelenség tulajdonságaira, az időbeli lefutás körülmé-nyeire vonatkozó – szakmai ismeretek, másrészt pedig előzetes statisztikai elemzések (például gra-fikus ábrázolás) szükségesek.

-4000 -2000 0 2000 4000 6000 8000 10000 12000

1970 1975 1980 1985 1990 1995 2000

OsszPenzdij Lin_ill Exp_ill Pol2_ill Pol3_ill Log_ill

35 2.4 Valószínűségelméleti alapok

A statisztikai módszertan annak alapján, hogy az eljárások kiinduló adatbázisa alapsokaság vagy minta, megkülönbözteti a

− leíró statisztikát (az alapsokaság legfontosabb jellemzőit bemutató, a teljes sokaság egé-szére állításokat, megállapításokat megfogalmazó módszerek); illetve

− a következtetéses statisztikát (alapgondolatában valamifajta bizonytalanságot tükröző, a részből az egészére utalás mikéntjét szabályozó eljárások).

Következtetéses (vagy következtető) statisztikának azon eljárásokat nevezzük, amelyek segítségével tö-megesen előforduló jelenségek esetén, a potenciálisan megfigyelhető egyedek csak egy részének felmérése alapján, az egész sokaságra (vagyis valamennyi egyedre) vonatkozó megállapításokat te-szünk. A sokaság azon részét, amelyre megfigyelésünk kiterjedt, mintának nevezzük. A következte-téses statisztikai módszerek célja, hogy az alapsokaságból megfelelően kiválasztott részsokaság (minta) alapján

− közelítő értéket nyerjünk az alapsokaság valamely jellemző paraméterére (pl. várható értékére, szórására, egy kitüntetett ismérvváltozat előfordulásának valószínűségére, két ismérv várható értékének különbségére vagy hányadosára); vagy

− döntsünk az alapsokaságra megfogalmazott valamilyen állítás (előfeltevés, prekoncep-ció) igazságtartalmáról; vagy

− meghatározzuk az alapsokaság jellemző összefüggéseit leíró oksági (kauzalitási) model-lek formáját.

A mintából való következtetés alapgondolata, hogy a statisztikai változók mintabeli értékeit meg-feleltetjük egy olyan véletlen változó reprezentációjának, amely leírható

− értékeinek felsorolásával és az egyes értékek bekövetkezési valószínűségének megadá-sával; vagy

− eloszlás-, illetve sűrűségfüggvényével.

2.4.1 Eloszlás- és sűrűségfüggvény

A valószínűségi változók legteljesebb mértékben eloszlásfüggvényükkel írhatók le. Ismeretes, hogy az eloszlásfüggvény azt a valószínűséget mutatja, hogy egy adott eloszlásból származó valószínűségi változó értéke nem halad meg egy kitüntetett x értéket, vagyis

   

Prx F x (2.27)

A definícióból következően az eloszlásfüggvény monoton nem csökkenő függvény, balról folyto-nos és értékeire igaz, hogy

 

36 A statisztikában tárgyalandó folytonos eloszlásfüggvényeknek van sűrűségfüggvényük, vagyis esetük-ben létezik olyan 0 f x

 

, hogy a valószínűségi változó bármely

x x intervallumba esésének 0, 1

valószínűsége kifejezhető az alábbi képlettel

      1  

ahol  jelöli az adott eloszlásból származó valószínűségi változót. Előzőekből következően az el-oszlásfüggvény a sűrűségfüggvény-értékek kumulálásával is előállítható11, tehát

  x  

F x f t dt



(2.29)

Könnyen belátható, hogy az eloszlásfüggvény-érték megadható egy alkalmasan választott sűrűség-függvény alatti területtel.

2.4.2 Várható érték, variancia

A változók eloszlásának megadása nem mindig egyszerű, pontosabban fogalmazva sokszor olyan képletet eredményez, melynek gyakorlati alkalmazása nem triviális. Éppen ezért terjedt el, hogy a valószínűségi változót eloszlásának legfontosabb paramétereivel jellemezzük, ezen paraméterek kü-lönösen

− a várható érték és

− a variancia.

A várható érték az ún. elsőrendű momentum12, meghatározása általános esetben

   

E xf x dx



 

(2.30)

képlettel történik. Jegyezzük meg, hogy a várható érték helyzet-paraméter; vagyis alapvetően egy sű-rűségfüggvénynek az abszcisszán való elhelyezkedését határozza meg. A várható érték végtelen számú megfigyelés, illetve elméleti valószínűség-eloszlások esetén releváns kategória; a gyakorlati alkalmazásokban elégséges megfelelője a leíró statisztikai alapokban említett számtani átlag.

Centrális momentumoknak nevezzük a E  változó momentumait, melyekről a legfontosabb tudnivalók az alábbiak:

− az elsőrendű centrális momentum definíció szerint 0;

− a másodrendű centrális momentum a variancia, vagyis

11 Az angol szóhasználat explicit utal erre: a sűrűségfüggvény angolul probability density function, az eloszlásfüggvény pedig cumulative distribution function.

12 Ismeretes, hogy r-ed rendű momentumnak nevezzük (diszkrét esetben) az  

1

37

A variancia leíró statisztikai (empirikus) megfelelője a szórásnégyzet, melynek tárgyi értelmet nem tulajdonítunk; annál inkább pozitív gyökének, vagyis a szórásnak, amely a legfontosabb szóródási mérőszám. A szórás – mint ismeretes – az átlagtól mért (négyzetes) átlagos eltérést mutatja, és természetéből adódóan nagyon fontos alak-paraméter.

2.4.3 Nevezetes statisztikai eloszlások

A legismertebb és – éppen ebből adódóan – leggyakrabban alkalmazott folytonos valószínűség-eloszlás a normális, vagy Gauss-valószínűség-eloszlás. Az valószínűség-eloszlást sűrűségfüggvényével definiáljuk, vagyis az x véletlen változó  várható értékű és 2 varianciájú normális eloszlást követ, ha sűrűségfüggvénye

 

alakú. A normális eloszlás sűrűségfüggvénye a jól ismert „harang alakú” görbe:

2-1. ábra: A normális eloszlás sűrűségfüggvénye (az ábrán 100 várható értékű, 225 varianciájú normális eloszlás)

A normális eloszlások között kitüntetett helyet foglal el a standard normális eloszlás, amely 0 várható értékű és 1 varianciájú (ebből következően 1 szórású) normális eloszlás. Bármely normális elosz-lásból előállítható ilyen (tehát standard normális) eloszlás a leíró statisztikáknál már említett stan-dardizálás műveletével. Tehát, ha x normális eloszlású valószínűségi változó  várható értékkel és

2 varianciával, akkor a

38 valószínűségi változó standard normális eloszlású. A standard normális eloszlás sűrűségfüggvénye alakját tekintve szintén harang-görbe, a transzformáció miatt a görbe maximuma az x tengely 0 pontjánál van. A standard normális eloszlás néhány fontosabb, a későbbiekben gyakran használatos tulajdonsága:

F 0 0,5

F   z 1 F z .

A normális, illetve a standard normális eloszlás alapján további nevezetes, a statisztikában gyakran használatos valószínűségi eloszlások is definiálhatók.

Belátható, hogy r darab standard normális eloszlású valószínűségi változó négyzetösszege ún. r- szabadságfokú 2-eloszlást követ, vagyis

2 2

A valószínűségelméleti tanulmányokból ismert szabadságfokról jelen tananyagban elég annyit meg-jegyeznünk, hogy az eloszlás egy paramétere.13

A standard normális és a 2-eloszlás egy speciális transzformációjával jön létre az ún. Studenféle t-eloszlás, meghatározása:

2 ~r

r

z t

(2.35)

Látható, hogy a t-eloszlás meghatározása során is szükség van a szabadságfokra, mint paraméterre.

Az utolsóként említendő speciális eloszlás, az ún. F-eloszlás; amely két 2-eloszlás hányadosaként keletkezik, így definiálásához szabadságfok-párra van szükség:

1

A nevezetes statisztikai eloszlásokat a későbbiekben gyakran fogjuk használni bizonyos speciális ökonometriai problémák tesztelése során.

13 Általánosságban a szabadságfok: egy adott döntési szituációban egymástól függetlenül, szabadon meghozható dön-tések száma. Pl. amennyiben egy l hosszúságú rudat három részre kívánunk szétvágni, akkor bizonyos határok között (l1; l2 <l ) csak az első kettő darabnak határozhatjuk meg a hosszát, a harmadiké már előzőekből adódik; vagyis ez egy 2 szabadságfokú probléma.

39 2.5 Becsléselméleti alapfogalmak

A következtetéses statisztika egyik nagy módszercsaládja a statisztikai becslés, melynek célja, hogy minta alapján közelítő értéket határozzunk meg az alapsokaság valamelyik, számunkra ismeretlen jellemzőjére. A becslés vonatkozhat

 az alapsokaság eloszlásának valamely fontos paraméterére (várható érték, variancia, kvanti-lis stb.), vagy

 egy, az alapsokaság összefüggéseit leíró modell paramétereire.

Bármilyen céllal végezzük is a statisztikai becslést, sohasem feledkezhetünk meg arról, hogy a min-tából nyert eredmények nem teljesen pontosak és nem tökéletesen megbízhatóak, ezért a statisztikai becslések két fontos jellemzője a standard hiba és a konfidencia-szint.

A becsléselmélet kulcsfogalma a mintabeli statisztika. A mintabeli statisztika, mint neve is mutatja egy adott mintára vonatkozó jellemző, és mivel a mintaelemekből (amik maguk is valószínűségi változók) számítottuk ki, ezért maga is valószínűségi változó. Általános14 formája:

1 2

ˆ f x x; ; ;xn

 (2.37)

Az alapsokaság fontos jellemzőinek közelítő meghatározására alkalmas mintastatisztikákat becslő-függvénynek nevezzük. A becslőfüggvény tehát egy valószínűségi változó, melynek értéke mintáról mintára váltakozik, valószínűségelméleti tulajdonságai többé-kevésbé megismerhetők, ezért alkal-mas arra, hogy segítségével statisztikai következtetést hajtsunk végre.

2.5.1 Becslési módszerek

A becslési módszerek célja olyan becslőfüggvény előállítása, amely alkalmas az alapsokasági jellem-zők, illetve modell-paraméterek közelítő meghatározására. Amennyiben például az alapsokaság vár-ható értékének becslésére vállalkozunk, úgy – szimmetrikus alapsokasági eloszlás mellett – kézen-fekvőnek látszik valamely mintabeli középérték (számított átlagok valamelyike, módusz, medián) becslőfüggvényként történő alkalmazása. Ezen probléma tehát úgy tűnik, logikai úton (az analógia elvén) is megoldható; de mit tegyünk összetettebb esetekben? Az ilyenkor használandó becslőfügg-vények meghatározását célozzák a különböző becslési módszerek.

A módszerek az alábbi csoportokba oszthatók:

 M-típusú becslési módszerek, amelyek szélsőérték-hely keresésen alapulnak;

 L-típusú becslési módszerek, melyek rendezett mintán alapulnak;

 R-típusú becslési módszerek, melyek a mintaelemeket azok rangszámaival helyettesítik, és ezen rangszámok függvényeként állítják elő a becslőfüggvényt;

14 A (2.37) képletben és a továbbiakban a statisztikát leíró szimbólum feletti „” jelzéssel utalunk arra, hogy mintából származó valószínűségi változóról van szó.

40

 momentumok módszere, amely az alapsokaság nevezetes momentumainak és a mintabeli momentumoknak az egyezőségére alapozva felállít egy többegyenletes, többismeretlenes egyetlenrendszert, melynek elvi megoldása eredményezi a becslőfüggvényt.

A becslési módszer alkalmazásának a célja egy alkalmas, általános becslőfüggvény (esztimátor) meg-határozása, amellyel az alapsokasági jellemzőre bármilyen összetételű minta alapján közelítő értéket tudunk adni. Előbbi kijelentés tehát úgy értelmezendő, hogy a becslési módszer „végeredménye”

egy képlet (a becslőfüggvény), amelybe bármilyen minta elemeit behelyettesítve elvégezhető a konk-rét becslés.

A két leggyakrabban alkalmazott M-típusú becslési módszer a

 legkisebb négyzetek módszere (LNM); és a

 maximum likelihood (ML) módszer.

A legkisebb négyzetek módszere15 (LNM, vagy az angol Ordinary Least Squares megnevezés alapján OLS), mint neve is mutatja, egy alkalmasan választott kifejezés minimalizálására törekszik, ezért tartozik a szélsőértékhely-kereső eljárások közé. A módszer alapgondolata rendkívül kézenfekvő:

keressük azt a paraméter-kombinációt, amelyre egy elméleti és a becsült modell közötti négyzetes eltérés minimális. Általánosságban mindez az alábbi kifejezésbe16 rendezhető:

   

2

A későbbiekben bemutatandó regressziós modellek esetén az LNM lesz az általánosan használt becslési módszer, ezért ezzel majd ott foglalkozunk részletesen.

A másik gyakran alkalmazott technika a maximum likelihood (ML ~ legnagyobb esélyesség) módszer, melynek lényege, hogy a becslőfüggvény készítője ismerettel rendelkezik az alapsokaság eloszlására vonatkozóan; pontosabban ismeri az alapsokasági eloszlás típusát, de nem ismeri a konkrét eloszlási paraméterek értékét. Ismert alapsokasági eloszlás esetén felírható valamennyi, az alapsokaságból származó, aktuálisan mintába került egyedhez tartozó sűrűségfüggvény érték. Az

 1 Pr1

f x x fenti sűrűségfüggvény azt reprezentálja, hogy mennyire esélyes (valószínű), hogy az alapsokaságból származó valószínűségi változó x1 értéket, vagyis az első mintaelem értékét veszi fel. Annak a valószínűsége, hogy a másodjára mintába került érték pontosan x2 lesz, az előző analógiájára f x 2 Prx2. Mivel az első két elem egymástól függetlenül került a mintába, ezért annak a valószínűsége, hogy az első két mintaelem pontosan x1 és x2, egyenlő az

 1  2

f x f x értékkel. A sort tovább folytatva, annak a valószínűsége, hogy n elemű mintánk pon-tosan x x1, , ,2 xn értékeket tartalmazza az

15 A módszerre már hivatkoztunk az analitikus trendfüggvény paramétereinek meghatározása során, gyakorlatilag azo-nos – de általáazo-nosabb – gondolatmenetet követünk a továbbiakban is!

16 Több paraméter esetén θ értelemszerűen egy vektor.

41

   

1 2 ...

 

n

 

i

Lf xf x   f x

f x

likelihood-függvény értékkel (konkrét valószínűséggel) egyenlő. A likelihood-függvény tehát a minta-elemek együttes sűrűségfüggvénye, ami megmutatja, hogy az adott minta mennyire jellemző a fel-tételezett eloszlásra.

A maximum likelihood módszer lényege, hogy az alapsokaság eloszlásának a típusa ugyan ismert, ám az eloszlás konkrét paraméterei nem. Ezért a likelihood-függvény konkrét minta esetén külön-böző értékeket is felvehet, annak függvényében, hogy milyen alapsokasági paramétereket helyette-sítünk be a sűrűségfüggvénybe. Ez azt jelenti, hogy L értéke függ a sűrűségfüggvény paramétereitől, tehát L a mintaelemek alapsokasági paraméter(ek)től függő, együttes, feltételes eloszlása. Azaz a függvény általános alakja:

A becslési módszer alkalmazása során a fenti függvény értékét kívánjuk a paraméter(ek) változtatá-sával maximalizálni. Az általános feladat tehát az alábbi:

( ) max

L

A maximum likelihood módszer alkalmazása során bevett szokás, hogy nem az „eredeti” likeli-hood-függvényből dolgozunk, mivel a szorzat-függvény használata nehézkes. Ugyanakkor, ha ki-használjuk azt a tényt, hogy egy függvény maximumhelye egybeesik logaritmusának maximumhe-lyével (a logaritmus alapszámától egyébiránt függetlenül), akkor használhatjuk a likelihood-függ-vény helyett, az ún. log-likelihood-ot, vagyis

 

log ( )L

log f xi (2.40)

Összefoglalásként tehát elmondható, hogy az M-típusú becslések a legfontosabb alapsokasági jel-lemzők tekintetében (arány, várható érték, variancia) a mintabeli tapasztalati megfelelőt, tehát a mintabeli relatív gyakoriságot, számtani átlagot, illetve tapasztalati varianciát határozták meg becs-lőfüggvényként.

2.5.2 A becslőfüggvény tulajdonságai

Az előző alpontban bemutatott becslési módszerek segítségével különböző becslőfüggvényeket nyerhetünk ugyanazon alapsokasági jellemző becslésére. Ahhoz, hogy választani tudjunk a külön-böző becslőfüggvények között, szükség van olyan kritériumok meghatározására, amelyek össze-mérhetővé teszik a becslőfüggvények jóságát. A matematikai statisztikai irodalom általában a becs-lőfüggvények alábbi tulajdonságait vizsgálja:

− torzítatlanság, illetve – általában végtelen sokaságra vonatkozó becslés esetén – aszimp-totikus torzítatlanság,

− hatásosság,

42

− konzisztencia,

− robusztusság,

− elégségesség.

A fenti tulajdonságok mintegy esszenciájaként kereshetjük az ún. BLUE (Best Linear Unbiased Estimator), vagyis a legjobb lineáris torzítatlan becslőfüggvényt is. A következőkben ezen tulajdonságokat mutatjuk be.

Torzítatlannak nevezzük a becslőfüggvényt, ha

 

ˆ

E  

vagyis, ha a becslőfüggvény várható értéke egyenlő a becsülni kívánt jellemzővel. Nagyon fontos, hogy megértsük a tulajdonságok ismertetésének szemléletét! A becslőfüggvények, mint korábban többször taglaltuk, maguk is valószínűségi változók, vagyis meghatározható a valószínűség-elosz-lásuk, ebből adódóan felírható várható értékük és varianciájuk. A becslőfüggvények tulajdonságai ezen elméleti eloszlás-tulajdonságokhoz köthetők.

Aszimptotikusan torzítatlannak nevezünk egy becslőfüggvényt, ha

 

ˆ

limn E

  

vagyis, amennyiben a becslőfüggvény várható értéke határértékében megegyezik a becsülni kívánt

vagyis, amennyiben a becslőfüggvény várható értéke határértékében megegyezik a becsülni kívánt