2.3 Trendelemzés
2.3.2 Analitikus trendszámítás
Az analitikus trendszámítás a leggyakrabban használatos görbeillesztési módszer, melyben valamilyen ismert, egyszerű matematikai függvénnyel írjuk le a vizsgált jelenség tartós tendenciáját. A feladatot úgy kell elképzelni, hogy kiindulva az idősor grafikus ábrájából, a vonaldiagramba (az alapirányzatot kimutatandó) egy kiegyenlítő vonalat kívánunk becslésszerűen berajzolni. Könnyen belátható, hogy az ábrába számos görbe rajzolható, melyek különbözőképpen illeszkednek a megfigyelt idősori ér-tékekhez, de mindegyikük tulajdonképpen egy grafikus becslésnek is tekinthető. A láthatóan szub-jektív és esetleges grafikus becslés helyett, az analitikus trendszámítás algebrai módon kezelhető megoldást nyújt az alapirányzat kimutatására.
Az analitikus trendszámítás első lépésében – előzetes információ (pl. az idősor ábrája) alapján – kiválasztjuk az illesztendő matematikai függvény típusát, például a lineáris függvényt9, ezt trendfügg-vénynek nevezzük; második lépésként a választott trendfüggvény együtthatóinak – más néven para-métereinek – konkrét értéket adunk. A trendfüggvény parapara-métereinek értékét a megfigyelt idősori adatokból közelítő számítással, azaz becsléssel állapítjuk meg. Görbeillesztési feladatok elvégzésére a leggyakrabban az ún. klasszikus legkisebb négyzetek módszerét szokás alkalmazni, mely közvetlenül a lineáris trendfüggvény illesztésére alkalmas.
A trendfüggvény becslése lineáris esetben nem más, mint az alábbi egyenes együtthatóinak megha-tározása:
0 1
ˆyt b b t (2.24)
A klasszikus legkisebb négyzetek módszerének alapgondolata, hogy a
b b0, 1
paraméterpár értékeit változtatva végtelen számú trendfüggvényt előállíthatnánk, ám ezek közül legjobban illeszkedőnek azt tartjuk, mely esetében a
2eltérés-négyzetösszeg a legkisebb. A fentiek alapján feladatunk a
0 1
2többváltozós szélsőérték-számítási feladat megoldása. Az előbbi függvénynek csak akkor lehet szél-sőértéke, ha ott mindkét parciális derivált nulla.10 A b0 és b1 szerinti parciális deriváltak:
9 Melynek egyenlete, mint középiskola óta tudjuk: y a bx .
10 Esetünkben belátható, hogy a szélsőérték minimum, mivel a második deriváltak pozitívak.
31
Ha a fenti parciális deriváltakat egyenlővé tesszük nullával és célszerűen átalakítjuk, a paraméterek kiszámítására az alábbi, ún. normálegyenleteket nyerjük:
0 1
Mivel a t változó értékei és az yt idősor-adatok, ebből következően a szükséges összegek, kereszt-szorzatok és négyzetösszegek ismertek. A normálegyenletek kétismeretlenes elsőfokú egyenlet-rendszert alkotnak, ahol az ismeretlenek
b b0, 1
paraméterek. Az egyenletrendszert megoldva adó-dik a legjobban illeszkedő egyenes paramétereinek értéke:
A lineáris trendfüggvény paramétereinek értelmezése:
lineáris trend esetén a tengelymetszet (b0 paraméter) megadja a t 0, azaz az első megfigyelést ( t1) közvetlenül megelőző időpontra vonatkozó becsült alapirányzati értéket;
az iránytangens (b1 paraméter) megmutatja az időegységenkénti átlagos abszolút változás nagysá-gát. Abban az esetben, ha az iránytangens pozitív, növekvő; ha negatív, csökkenő trendről be-szélünk.
A lineáris trendet akkor alkalmazzuk, ha feltételezhető, hogy egységnyi időváltozás hatására a vizs-gált folyamat változása (növekedése vagy csökkenése) az elemzett időtávon belül abszolút értelem-ben megközelítően állandó.
Az alábbi grafikonon az NBA-ben szereplő Los Angeles Lakers hazai mérkőzéseinek átlagos jegyárai szerepelnek, az 1991/92-es szezontól a 2015/16-os szezonig (forrás:
https://umich.app.box.com/s/41707f0b2619c0107b8b/file/7964535440 ).
32 Az ábráról leolvasható, hogy a kezdeti, közel 50 $-os jegyár mintegy 25 év alatt több mint duplájára emelkedett, a 2015/16-os szezonban már meghaladta a 100 $-t. Lineáris trendet il-lesztve az adatsorra az alábbi egyenletet nyerjük:
ˆyt 31, 45 3, 23 t
Vagyis a modell által becsült éves jegyár növekedése 3,23$. Amennyiben ugyanazon az ábrán szerepeltetjük a tényleges és becsült adatokat is, jól látszik a lineáris trend „tévedése”:
Láthatjuk, hogy a kezdeti ingadozást kevéssé tudja leképezni az analitikus trend, ám az időszak második felében már viszonylag jól illeszkedik, ekkor a modell szinte „rásimul” a tényadatokra.
A lineáris mellett, a másik leggyakrabban alkalmazott trendfüggvény az exponenciális trend. Az emlí-tett két trendfüggvényben az a közös, hogy mindkettő egyenletes változást mutat. A lineáris trend esetén az abszolút változások (az elsőrendű differenciák), míg az exponenciális trendnél a relatív változások mutatnak viszonylagos állandóságot (stabilitást). Az exponenciális trendfüggvény általá-nos alakja:
30 40 50 60 70 80 90 100 110
1995 2000 2005 2010 2015
Átlagos jegyár ($)
30 40 50 60 70 80 90 100 110 120
1995 2000 2005 2010 2015
Átlagos jegyár ($)
tényleges becsült
33
ˆyt b b0 1t (2.25)
Paraméterének becslését könnyen megoldhatjuk az előbb bemutatott legkisebb négyzetek módsze-rével, ha az egyenletet logaritmálva lineáris alakra hozzuk, vagyis
0 1
ln ˆyt lnb t bln (2.26)
Az átalakított egyenlet paraméterei már becsülhetők a megismert normálegyenletek megoldásával.
Exponenciális trend esetén a paraméterek értelmezése:
a b0 paraméter értelmezése megegyezik a lineáris esettel,
a b1 megmutatja az időegységenkénti átlagos relatív változás nagyságát.
Az exponenciális trend általában a közép és hosszú távú gazdasági és társadalmi folyamatok jellem-zésének alapmodellje. Akkor alkalmazzuk, ha feltételezhető, hogy egységnyi időváltozás hatására a folyamat változása relatíve állandó, azaz a vizsgált időszakban a megfigyelések az előző értékhez képest rendre megközelítően azonos százalékos növekedést vagy csökkenést mutatnak.
Az analitikus trendszámítás számos további függvényformát alkalmaz, ezek közül talán a két leg-gyakoribb a
polinomiális trend, ahol ˆy b 0 b t b t1 2 2 b tp p , illetve a
logisztikus trend, ahol
1
Amennyiben az idősorban tendenciaváltás tapasztalható, vagyis növekedésből csökkenésbe (vagy fordítva) megy át – akár ismétlődően is – az idősor gyakran jól modellezhető p-ed fokú polinommal.
Értelemszerű, hogy a fokszám növelése egyre jobb illesztést ad, de megállapítható, hogy a p3
fokszám alkalmazása már igen nehezen indokolható.
A telítődési görbe (logisztikus trend) általában hosszabb távon vizsgált olyan folyamatok leírására alkal-mas, melyeknél a fejlődés három szakasza különíthető el. Például, egy új termék megjelenésekor a piaci bevezetés szakasza után a gyors felfutás, majd a piaci telítődés szakasza következik. Érdemes megjegyezni, hogy a függvény értéke nem haladhat meg egy „küszöbértéket”
2
valamint, hogy a növekedési ráta egyszerűen meghatározható:
1
azaz minél közelebb van az idősori érték a küszöbértékhez, annál kisebb a növekedés üteme.
34 A wimbledoni teniszbajnokság összdíjazása 1968 és 2004 között 26 ezer fontról közel 10 millió fontra emelkedett (forrás: https://umich.app.box.com/s/41707f0b2619c0107b8b/
file/23110069762 ). Határozzuk meg, hogy a bemutatott analitikus trendfüggvények közül me-lyik illeszkedik a legjobban a díjazás idősorára! A következő ábra az eredeti idősort (összes pénzdíj, ezer font), illetve a lineáris, exponenciális, másod- és harmadfokú polinom, valamint a logisztikus trend alapján becsült értékeket tartalmazza.
Látható, hogy a lineárison kívül mindegyik trendfüggvény viszonylag jól „leköveti” a pénzdíjak változását, de néhány esetben a modell és a valóság összevetése (a verifikáció) ellentmondást mutat, hiszen például a lineáris trend a negatív tartományból indul, ami nyilvánvalóan elkép-zelhetetlen.
Nézzük az állandó növekedési ütem feltételezésével készült exponenciális trendet! A becsült modell:
ˆyt 413,8 1,093 t
formájú. A paraméterbecslés (ezt az ábra is mutatja) kicsit felülbecsüli az induló értéket, hiszen az 1967-es (első évet megelőző időszak) pénzdíjat 413 ezer fontra teszi, ugyanakkor jól követi a díjazás alakulását, hogy modellünk szerint a vizsgált időszakban évről-évre átlagosan 9,3%-kal növekedett a kiosztott pénzösszeg.
A legkisebb négyzetek módszeréről tudjuk, hogy adott függvénytípuson belül a legjobban illeszkedő görbét szolgáltatja trendfüggvényként. Az alkalmazandó függvény típusának kiválasztása azonban az elemző feladata. Ehhez egyrészt - a vizsgált jelenség tulajdonságaira, az időbeli lefutás körülmé-nyeire vonatkozó – szakmai ismeretek, másrészt pedig előzetes statisztikai elemzések (például gra-fikus ábrázolás) szükségesek.
-4000 -2000 0 2000 4000 6000 8000 10000 12000
1970 1975 1980 1985 1990 1995 2000
OsszPenzdij Lin_ill Exp_ill Pol2_ill Pol3_ill Log_ill
35 2.4 Valószínűségelméleti alapok
A statisztikai módszertan annak alapján, hogy az eljárások kiinduló adatbázisa alapsokaság vagy minta, megkülönbözteti a
− leíró statisztikát (az alapsokaság legfontosabb jellemzőit bemutató, a teljes sokaság egé-szére állításokat, megállapításokat megfogalmazó módszerek); illetve
− a következtetéses statisztikát (alapgondolatában valamifajta bizonytalanságot tükröző, a részből az egészére utalás mikéntjét szabályozó eljárások).
Következtetéses (vagy következtető) statisztikának azon eljárásokat nevezzük, amelyek segítségével tö-megesen előforduló jelenségek esetén, a potenciálisan megfigyelhető egyedek csak egy részének felmérése alapján, az egész sokaságra (vagyis valamennyi egyedre) vonatkozó megállapításokat te-szünk. A sokaság azon részét, amelyre megfigyelésünk kiterjedt, mintának nevezzük. A következte-téses statisztikai módszerek célja, hogy az alapsokaságból megfelelően kiválasztott részsokaság (minta) alapján
− közelítő értéket nyerjünk az alapsokaság valamely jellemző paraméterére (pl. várható értékére, szórására, egy kitüntetett ismérvváltozat előfordulásának valószínűségére, két ismérv várható értékének különbségére vagy hányadosára); vagy
− döntsünk az alapsokaságra megfogalmazott valamilyen állítás (előfeltevés, prekoncep-ció) igazságtartalmáról; vagy
− meghatározzuk az alapsokaság jellemző összefüggéseit leíró oksági (kauzalitási) model-lek formáját.
A mintából való következtetés alapgondolata, hogy a statisztikai változók mintabeli értékeit meg-feleltetjük egy olyan véletlen változó reprezentációjának, amely leírható
− értékeinek felsorolásával és az egyes értékek bekövetkezési valószínűségének megadá-sával; vagy
− eloszlás-, illetve sűrűségfüggvényével.
2.4.1 Eloszlás- és sűrűségfüggvény
A valószínűségi változók legteljesebb mértékben eloszlásfüggvényükkel írhatók le. Ismeretes, hogy az eloszlásfüggvény azt a valószínűséget mutatja, hogy egy adott eloszlásból származó valószínűségi változó értéke nem halad meg egy kitüntetett x értéket, vagyis
Pr x F x (2.27)
A definícióból következően az eloszlásfüggvény monoton nem csökkenő függvény, balról folyto-nos és értékeire igaz, hogy
36 A statisztikában tárgyalandó folytonos eloszlásfüggvényeknek van sűrűségfüggvényük, vagyis esetük-ben létezik olyan 0 f x
, hogy a valószínűségi változó bármely
x x intervallumba esésének 0, 1
valószínűsége kifejezhető az alábbi képlettel
1
ahol jelöli az adott eloszlásból származó valószínűségi változót. Előzőekből következően az el-oszlásfüggvény a sűrűségfüggvény-értékek kumulálásával is előállítható11, tehát
x
F x f t dt
(2.29)Könnyen belátható, hogy az eloszlásfüggvény-érték megadható egy alkalmasan választott sűrűség-függvény alatti területtel.
2.4.2 Várható érték, variancia
A változók eloszlásának megadása nem mindig egyszerű, pontosabban fogalmazva sokszor olyan képletet eredményez, melynek gyakorlati alkalmazása nem triviális. Éppen ezért terjedt el, hogy a valószínűségi változót eloszlásának legfontosabb paramétereivel jellemezzük, ezen paraméterek kü-lönösen
− a várható érték és
− a variancia.
A várható érték az ún. elsőrendű momentum12, meghatározása általános esetben
E xf x dx
(2.30)képlettel történik. Jegyezzük meg, hogy a várható érték helyzet-paraméter; vagyis alapvetően egy sű-rűségfüggvénynek az abszcisszán való elhelyezkedését határozza meg. A várható érték végtelen számú megfigyelés, illetve elméleti valószínűség-eloszlások esetén releváns kategória; a gyakorlati alkalmazásokban elégséges megfelelője a leíró statisztikai alapokban említett számtani átlag.
Centrális momentumoknak nevezzük a E változó momentumait, melyekről a legfontosabb tudnivalók az alábbiak:
− az elsőrendű centrális momentum definíció szerint 0;
− a másodrendű centrális momentum a variancia, vagyis
11 Az angol szóhasználat explicit utal erre: a sűrűségfüggvény angolul probability density function, az eloszlásfüggvény pedig cumulative distribution function.
12 Ismeretes, hogy r-ed rendű momentumnak nevezzük (diszkrét esetben) az
1
37
A variancia leíró statisztikai (empirikus) megfelelője a szórásnégyzet, melynek tárgyi értelmet nem tulajdonítunk; annál inkább pozitív gyökének, vagyis a szórásnak, amely a legfontosabb szóródási mérőszám. A szórás – mint ismeretes – az átlagtól mért (négyzetes) átlagos eltérést mutatja, és természetéből adódóan nagyon fontos alak-paraméter.
2.4.3 Nevezetes statisztikai eloszlások
A legismertebb és – éppen ebből adódóan – leggyakrabban alkalmazott folytonos valószínűség-eloszlás a normális, vagy Gauss-valószínűség-eloszlás. Az valószínűség-eloszlást sűrűségfüggvényével definiáljuk, vagyis az x véletlen változó várható értékű és 2 varianciájú normális eloszlást követ, ha sűrűségfüggvénye
alakú. A normális eloszlás sűrűségfüggvénye a jól ismert „harang alakú” görbe:
2-1. ábra: A normális eloszlás sűrűségfüggvénye (az ábrán 100 várható értékű, 225 varianciájú normális eloszlás)
A normális eloszlások között kitüntetett helyet foglal el a standard normális eloszlás, amely 0 várható értékű és 1 varianciájú (ebből következően 1 szórású) normális eloszlás. Bármely normális elosz-lásból előállítható ilyen (tehát standard normális) eloszlás a leíró statisztikáknál már említett stan-dardizálás műveletével. Tehát, ha x normális eloszlású valószínűségi változó várható értékkel és
2 varianciával, akkor a
38 valószínűségi változó standard normális eloszlású. A standard normális eloszlás sűrűségfüggvénye alakját tekintve szintén harang-görbe, a transzformáció miatt a görbe maximuma az x tengely 0 pontjánál van. A standard normális eloszlás néhány fontosabb, a későbbiekben gyakran használatos tulajdonsága:
− F 0 0,5
− F z 1 F z .
A normális, illetve a standard normális eloszlás alapján további nevezetes, a statisztikában gyakran használatos valószínűségi eloszlások is definiálhatók.
Belátható, hogy r darab standard normális eloszlású valószínűségi változó négyzetösszege ún. r- szabadságfokú 2-eloszlást követ, vagyis
2 2
A valószínűségelméleti tanulmányokból ismert szabadságfokról jelen tananyagban elég annyit meg-jegyeznünk, hogy az eloszlás egy paramétere.13
A standard normális és a 2-eloszlás egy speciális transzformációjával jön létre az ún. Studenféle t-eloszlás, meghatározása:
2 ~r
r
z t
(2.35)
Látható, hogy a t-eloszlás meghatározása során is szükség van a szabadságfokra, mint paraméterre.
Az utolsóként említendő speciális eloszlás, az ún. F-eloszlás; amely két 2-eloszlás hányadosaként keletkezik, így definiálásához szabadságfok-párra van szükség:
1
A nevezetes statisztikai eloszlásokat a későbbiekben gyakran fogjuk használni bizonyos speciális ökonometriai problémák tesztelése során.
13 Általánosságban a szabadságfok: egy adott döntési szituációban egymástól függetlenül, szabadon meghozható dön-tések száma. Pl. amennyiben egy l hosszúságú rudat három részre kívánunk szétvágni, akkor bizonyos határok között (l1; l2 <l ) csak az első kettő darabnak határozhatjuk meg a hosszát, a harmadiké már előzőekből adódik; vagyis ez egy 2 szabadságfokú probléma.
39 2.5 Becsléselméleti alapfogalmak
A következtetéses statisztika egyik nagy módszercsaládja a statisztikai becslés, melynek célja, hogy minta alapján közelítő értéket határozzunk meg az alapsokaság valamelyik, számunkra ismeretlen jellemzőjére. A becslés vonatkozhat
az alapsokaság eloszlásának valamely fontos paraméterére (várható érték, variancia, kvanti-lis stb.), vagy
egy, az alapsokaság összefüggéseit leíró modell paramétereire.
Bármilyen céllal végezzük is a statisztikai becslést, sohasem feledkezhetünk meg arról, hogy a min-tából nyert eredmények nem teljesen pontosak és nem tökéletesen megbízhatóak, ezért a statisztikai becslések két fontos jellemzője a standard hiba és a konfidencia-szint.
A becsléselmélet kulcsfogalma a mintabeli statisztika. A mintabeli statisztika, mint neve is mutatja egy adott mintára vonatkozó jellemző, és mivel a mintaelemekből (amik maguk is valószínűségi változók) számítottuk ki, ezért maga is valószínűségi változó. Általános14 formája:
1 2
ˆ f x x; ; ;xn
(2.37)
Az alapsokaság fontos jellemzőinek közelítő meghatározására alkalmas mintastatisztikákat becslő-függvénynek nevezzük. A becslőfüggvény tehát egy valószínűségi változó, melynek értéke mintáról mintára váltakozik, valószínűségelméleti tulajdonságai többé-kevésbé megismerhetők, ezért alkal-mas arra, hogy segítségével statisztikai következtetést hajtsunk végre.
2.5.1 Becslési módszerek
A becslési módszerek célja olyan becslőfüggvény előállítása, amely alkalmas az alapsokasági jellem-zők, illetve modell-paraméterek közelítő meghatározására. Amennyiben például az alapsokaság vár-ható értékének becslésére vállalkozunk, úgy – szimmetrikus alapsokasági eloszlás mellett – kézen-fekvőnek látszik valamely mintabeli középérték (számított átlagok valamelyike, módusz, medián) becslőfüggvényként történő alkalmazása. Ezen probléma tehát úgy tűnik, logikai úton (az analógia elvén) is megoldható; de mit tegyünk összetettebb esetekben? Az ilyenkor használandó becslőfügg-vények meghatározását célozzák a különböző becslési módszerek.
A módszerek az alábbi csoportokba oszthatók:
M-típusú becslési módszerek, amelyek szélsőérték-hely keresésen alapulnak;
L-típusú becslési módszerek, melyek rendezett mintán alapulnak;
R-típusú becslési módszerek, melyek a mintaelemeket azok rangszámaival helyettesítik, és ezen rangszámok függvényeként állítják elő a becslőfüggvényt;
14 A (2.37) képletben és a továbbiakban a statisztikát leíró szimbólum feletti „” jelzéssel utalunk arra, hogy mintából származó valószínűségi változóról van szó.
40
momentumok módszere, amely az alapsokaság nevezetes momentumainak és a mintabeli momentumoknak az egyezőségére alapozva felállít egy többegyenletes, többismeretlenes egyetlenrendszert, melynek elvi megoldása eredményezi a becslőfüggvényt.
A becslési módszer alkalmazásának a célja egy alkalmas, általános becslőfüggvény (esztimátor) meg-határozása, amellyel az alapsokasági jellemzőre bármilyen összetételű minta alapján közelítő értéket tudunk adni. Előbbi kijelentés tehát úgy értelmezendő, hogy a becslési módszer „végeredménye”
egy képlet (a becslőfüggvény), amelybe bármilyen minta elemeit behelyettesítve elvégezhető a konk-rét becslés.
A két leggyakrabban alkalmazott M-típusú becslési módszer a
legkisebb négyzetek módszere (LNM); és a
maximum likelihood (ML) módszer.
A legkisebb négyzetek módszere15 (LNM, vagy az angol Ordinary Least Squares megnevezés alapján OLS), mint neve is mutatja, egy alkalmasan választott kifejezés minimalizálására törekszik, ezért tartozik a szélsőértékhely-kereső eljárások közé. A módszer alapgondolata rendkívül kézenfekvő:
keressük azt a paraméter-kombinációt, amelyre egy elméleti és a becsült modell közötti négyzetes eltérés minimális. Általánosságban mindez az alábbi kifejezésbe16 rendezhető:
2A későbbiekben bemutatandó regressziós modellek esetén az LNM lesz az általánosan használt becslési módszer, ezért ezzel majd ott foglalkozunk részletesen.
A másik gyakran alkalmazott technika a maximum likelihood (ML ~ legnagyobb esélyesség) módszer, melynek lényege, hogy a becslőfüggvény készítője ismerettel rendelkezik az alapsokaság eloszlására vonatkozóan; pontosabban ismeri az alapsokasági eloszlás típusát, de nem ismeri a konkrét eloszlási paraméterek értékét. Ismert alapsokasági eloszlás esetén felírható valamennyi, az alapsokaságból származó, aktuálisan mintába került egyedhez tartozó sűrűségfüggvény érték. Az
1 Pr 1
f x x fenti sűrűségfüggvény azt reprezentálja, hogy mennyire esélyes (valószínű), hogy az alapsokaságból származó valószínűségi változó x1 értéket, vagyis az első mintaelem értékét veszi fel. Annak a valószínűsége, hogy a másodjára mintába került érték pontosan x2 lesz, az előző analógiájára f x 2 Prx2. Mivel az első két elem egymástól függetlenül került a mintába, ezért annak a valószínűsége, hogy az első két mintaelem pontosan x1 és x2, egyenlő az
1 2
f x f x értékkel. A sort tovább folytatva, annak a valószínűsége, hogy n elemű mintánk pon-tosan x x1, , ,2 xn értékeket tartalmazza az
15 A módszerre már hivatkoztunk az analitikus trendfüggvény paramétereinek meghatározása során, gyakorlatilag azo-nos – de általáazo-nosabb – gondolatmenetet követünk a továbbiakban is!
16 Több paraméter esetén θ értelemszerűen egy vektor.
41
1 2 ...
n
iL f x f x f x
f xlikelihood-függvény értékkel (konkrét valószínűséggel) egyenlő. A likelihood-függvény tehát a minta-elemek együttes sűrűségfüggvénye, ami megmutatja, hogy az adott minta mennyire jellemző a fel-tételezett eloszlásra.
A maximum likelihood módszer lényege, hogy az alapsokaság eloszlásának a típusa ugyan ismert, ám az eloszlás konkrét paraméterei nem. Ezért a likelihood-függvény konkrét minta esetén külön-böző értékeket is felvehet, annak függvényében, hogy milyen alapsokasági paramétereket helyette-sítünk be a sűrűségfüggvénybe. Ez azt jelenti, hogy L értéke függ a sűrűségfüggvény paramétereitől, tehát L a mintaelemek alapsokasági paraméter(ek)től függő, együttes, feltételes eloszlása. Azaz a függvény általános alakja:
A becslési módszer alkalmazása során a fenti függvény értékét kívánjuk a paraméter(ek) változtatá-sával maximalizálni. Az általános feladat tehát az alábbi:
( ) max
L
A maximum likelihood módszer alkalmazása során bevett szokás, hogy nem az „eredeti” likeli-hood-függvényből dolgozunk, mivel a szorzat-függvény használata nehézkes. Ugyanakkor, ha ki-használjuk azt a tényt, hogy egy függvény maximumhelye egybeesik logaritmusának maximumhe-lyével (a logaritmus alapszámától egyébiránt függetlenül), akkor használhatjuk a likelihood-függ-vény helyett, az ún. log-likelihood-ot, vagyis
log ( )L
log f xi (2.40)Összefoglalásként tehát elmondható, hogy az M-típusú becslések a legfontosabb alapsokasági jel-lemzők tekintetében (arány, várható érték, variancia) a mintabeli tapasztalati megfelelőt, tehát a mintabeli relatív gyakoriságot, számtani átlagot, illetve tapasztalati varianciát határozták meg becs-lőfüggvényként.
2.5.2 A becslőfüggvény tulajdonságai
Az előző alpontban bemutatott becslési módszerek segítségével különböző becslőfüggvényeket nyerhetünk ugyanazon alapsokasági jellemző becslésére. Ahhoz, hogy választani tudjunk a külön-böző becslőfüggvények között, szükség van olyan kritériumok meghatározására, amelyek össze-mérhetővé teszik a becslőfüggvények jóságát. A matematikai statisztikai irodalom általában a becs-lőfüggvények alábbi tulajdonságait vizsgálja:
− torzítatlanság, illetve – általában végtelen sokaságra vonatkozó becslés esetén – aszimp-totikus torzítatlanság,
− hatásosság,
42
− konzisztencia,
− robusztusság,
− elégségesség.
A fenti tulajdonságok mintegy esszenciájaként kereshetjük az ún. BLUE (Best Linear Unbiased Estimator), vagyis a legjobb lineáris torzítatlan becslőfüggvényt is. A következőkben ezen tulajdonságokat mutatjuk be.
Torzítatlannak nevezzük a becslőfüggvényt, ha
ˆE
vagyis, ha a becslőfüggvény várható értéke egyenlő a becsülni kívánt jellemzővel. Nagyon fontos, hogy megértsük a tulajdonságok ismertetésének szemléletét! A becslőfüggvények, mint korábban többször taglaltuk, maguk is valószínűségi változók, vagyis meghatározható a valószínűség-elosz-lásuk, ebből adódóan felírható várható értékük és varianciájuk. A becslőfüggvények tulajdonságai ezen elméleti eloszlás-tulajdonságokhoz köthetők.
Aszimptotikusan torzítatlannak nevezünk egy becslőfüggvényt, ha
ˆlimn E
vagyis, amennyiben a becslőfüggvény várható értéke határértékében megegyezik a becsülni kívánt
vagyis, amennyiben a becslőfüggvény várható értéke határértékében megegyezik a becsülni kívánt