Kühlmeyer, M.: A nem centrális t-eloszlás

(1)

A STATISZTIKA ÁLTALÁNOS ELMÉLETE ÉS MÓDSZERTANA MATEMATIKAI STATISZTIKA

KUHLMEYER. M.:

A NEM CENTRÁLIS t-ELOSZLÁS

(Die níchtzentrale t-Verteilung. Grundlagen und Anwendungen mit Beíspielen.) Lecture Notes in Operations Research and Mathematical Systems.

No. 31. Springer—Verlag. Berlin-Heidelberg—New York.

1970 106 p.

Monográflajaban a szerző a ma még szinte kizárólag csak az elméleti statisztiku- sok körében ismert nem centrális t—eloszlás gyakorlati szakemberek számára is hozzá- férhető, a megértést sok, a gyakorlatból vett példával megkönnyíteni igyekvő, átfogó ismertetését adja. A monográfia tizenegy fejezete közül tízben a Student-féle t-elosz- lás közvetlen általánosításaként adódó nem centrális t-eloszlás legfontosabb matemati—

kai tulajdonságait és alkalmazási lehetősé- geit tárgyalja, míg az elsőben a normális eloszlásból vett mintákkal kapcsolatos alap- vető tudnivalókat foglalja össze.

A második fejezetben a nem centrális t- eloszlás definícióját adja meg a szerző.

Eszerint a

T (f, ő) : X 4—6 /1/

r *

f

valószínűségi változó ö nem centralitási pa- raméterű. f szabadságfokú nem centrális t-eloszlást követ, ha

X — egy standard normális eloszlású (0 várható

értékű és 1 szórású) valószínűségi változó,

Y— egy XAtől független, f szabadságfokú ZZ

eloszlású valószínűségi változó,

§ — pedig egy konstans valós szám.

Az /1/ definíció alapján könnyen látható, hogy a ő : 0 speciális esetben a jól ismert f szabadságfokú Student—féle t-elosz—

lóshoz jutunk. A következő fejezetben a nem centrális t-eloszlás legfőbb matemati—

kai tulajdonságaí, eloszlásfüggvényének kü- lönböző alakjai, valamint első négy momen—

tumának képlete található meg.

Az ezután következő hat (4—10.) fejezetben a nem centrális t-eloszlás legfontosabb

alkalmazási területeit ismerteti a szerző.

Ezek közül az első öt elsősorban a kís mintákkal dolgozó minőségellenőrzés szem- pontjából alapvető fontosságú. míg az—utol—

só a hipotézisvizsgálat szempontjából bír nagy jelentőséggel. Az egyes alkalmazási területek a következők.

1. N (,a, 02) eloszlásból vett minta rela- tív szórásának vizsgálata. (N (M, a?) a u vár- ható értékű és 02 szórásnégyzetű normális eloszlást jelöli.) Tegyük fel, hogy rendelke- zésünkre áll az alapsokaság V : a:,u re- latív szórásának egy N—elemű mintából nyert v : 5 x becslése, ahol x a mintaát- lag. 5 pedig a a paraméter torzítatlan becs—

lése. Feltesszük még azt is, hogy annak va—

lószínűsége, hogy az általunk vizsgált való- színűségi változó negatív értékeket vegyen fel, elhanyagolhatóan kicsi. (Ellenkező esetben ugyanis v : 00 is előfordulhatna.) Ek—

kor könnyen belátható, hogy a VN—n; va- lószínűségi Változó

T(N_1,1/NJL)

(7

eloszlású, mely tulajdonságot kihasználva konfidencia-intervallumot adhatunk az alap—

sokaság ismeretlen V relatív szórására, s megvizsgálhatjuk a HO:V § Vo nullhípoté- zis helyességét is a H1:V ) Vo alternatívá- val szemben. ahol V0 a V egy feltételezett értéke. A nem centrális t—eloszlás alkalma- zása nélkül ez nem volna lehetséges.

2. Normális eloszlás kvantiliseinek becs- lése. Ebben az esetben az a célunk. hogy egy N (,a. 02) eloszlásból vett _N-elemű minta alapján olyan felső (alsó). x —I— k 5 alakú határt adjunk meg, hogy az alapso—

kaság elemeinek legalább (legfeljebb) 100 p százaléka előre megadott a valószínűség—

gel e határ alatt helyezkedjen el. Megmu—

tatható, hogy ez a probléma is csak a nem centrális t-eloszlás felhasználásával oldható meg teljes matematikai precizitással.

__ 3. Az előbbi probléma inverze. Most az x —lw k 5 alakú határ egyértelműen meg van

(2)

STATISZTIKAl lRODALMl FIGYELÖ

433

adva a Ep : ,a —l—— K a formában, ahol

K a k elméleti (pontos) értéke. 5 az ehhez tartozó 100 p százalék alsó és felső hatá- rát keressük. ami szintén csak a nem cent- rális t-eloszlás felhasználásával oldható meg.

4. SeIe/tarány megbízhatóságának vizs—

gálata. Ez az alkalmazás a minőségellenőr- zés elméletéből ismert mintavételi tervek ké- szítésével kapcsolatos. E fejezetben olyan selejtarány — a nem centrális t-eloszláson alapuló — meghatározását tárgyalja a szer- ző. mely mellett a vizsgált tétel előre meg—

adott a valószínűséggel még átvehető. Eb- ben a fejezetben kitér az ún. jelleggőrbe két adott pont alapján történő meghatáro- zására is.

5. Lineáris regresszió egyoldali határai—

nak meghatározása. E fejezetben a szerző egy a lineáris regressziós modell alapján meghatározott y, becslés olyan yi' :y'—l—

—j—k sR alakú felső határának meghatáro- zási módját tárgyalja. amely azzal a tulaj—

donsággal rendelkezik, hogy annak való- színűsége. hogy a függő változó összes

b0"l"'b1X1_l"---—'l"bl) XP /2/

átlagú értékének legalább 1000: százaléka y'f alatt van. egy előre megadott az érték.

Az y'; felső határban szereplő SR a modell maradék szórásának szokásos becslése, a /2/-ben szereplő bi együtthatók a modell paramétereinek legkisebb négyzetek mód- szere szerinti becslései az xi (i : 1. 2. ....

p) értékek pedig a modellben szereplő független változók rögzített értékei. E prob—

le'ma megoldása is a nem centrális t—elosz—

láshoz vezet.

6. Az egy- és kétmintás Student-féle !- próba erejének meghatározása. Mivel vé—

leményem szerint a statisztikai gyakorlat szempontjából ez az alkalmazási terület a legnagyobb jelentőségű, a t—próba erejé- nek meghatározási módját az előbbi al- kalmazási területeknél kissé részletesebben ismertetem. Az egymintás Student—féle t- próba lényege a következő. Adva van egy Nm, 02) eloszlásból vett N-elemű minta, 5 a normális alapeloszlás mindkét paramé- terét e mintából becsüljük. Vizsgálni kiván- juk a Hoz/Ag ,un hipotézis helyességét —- ahol .no a normális eloszlás várható érté—

kének egy feltételezett értéke —— a H1:M)MO alternativ hipotézissel szemben.

A fenti Ho hipotézis helyessége — mint is-

meretes — a

Wii : Ha) /3/

S

képlet segítségével vizsgálható. mely a HD

7 Statisztikai Szemle

hipotézis helyessége esetén N—l szabadság- fokú Student—féle t-eloszlást követ. Az is is—

meretes, hogy ebben az esetben döntésünk (a Ha elfogadása vagy elvetése) kétféle hi- bával járhat, s ezek közül az ún. elsőfajú hiba elkövetésének valószínűsége a hipoté—

zis-vizsgálat során közvetlenül adódik. Nem ilyen egyszerű azonban a másodfajú hiba elkövetési valószínűségének meghatározása.

A másodfajú hiba elkövetésének valószínű- sége azt mutatja, hogy milyen valószínű—

séggel fogadjuk el a Ha null-hipotézist abban az esetben, ha a valóságban Hn helyett ,u : M ) [40 érvényes. Az e valószí—

nűséget 1-re kiegészítő értéket a próba ere/ének, a próba erejét m függvényében ábrázolva pedig a próba erőfüggvényének

nevezzük.

Tegyük most fel, hogy a valóságban Ho helyett " : _u1 ) ,a.) teljesül. Ekkor elvé- gezhető a /3/ próbafüggvény

( : l/jy—Úfi'W) : s

: fől, __(7: "ELLl'm/fLI_FO)__ :

$

li (X— arab—_NÁHLJEL

— _ , 70 ,, W.,

, 5, , /4/

a

átalakítása, amiből látható, hogy próba- függvényünk

l(N—l; VLMÉÉ—Úü]

eloszlást követ. Ezt kihasználva a nem cent- rális t-eloszlás táblázatainak vagy nomog—

romjainak felhasználásával meghatározható a próba adott alternatívához tartozó ereje, illetve a másodfajú hiba elkövetésének való—

színűsége is.

A nem centralitási paraméter képletéből látható. hogy ehhez szükség lenne a szóban forgó normális eloszlás paraméterének is—

meretére. Mivel a gyakorlatban ez csak a legritkább esetben fordul elő, a nem cent—

ralitási paraméter képletében a helyére annak s becslését, vagy az arra vonatkozó konfidencia—intervallum valamelyik határát helyettesítjük. Ehhez hasonlóan használható fel a nem centrális t-eloszlás a kétmintás t—próba erejének meghatározására is.

Az utolsó két fejezetben a függelékben található táblázatok ..használati utasítása"

és a nem centrális t-eloszlás eloszlásfügg—

vényének különböző közelítő formulái talál—

hatók meg. A kötetet a nem centrális t-el-

(3)

434 STATlSZTlKAl lRODALMi FIGYELÖ-

oszlásra vonatkozó gazdag táblázat- és no—

mogram-anyagot tartalmazó függelék egé- szíti ki, melyben megtalálható a téma rész- letes irodalomjegyzéke és az egyes fejeze—

tek végén szereplő feladatok megoldása is.

A monográfia a szakemberek számára sokszor nehezen hozzáférhető szakfolyóira- tokban megjelent cikkek összefoglalása. Bár a szerző a tárgyalást a gyakorlatból vett példákkal illusztrálja, a könyv teljes meg- értése alapos matematikai statisztikai isme—

reteket igényel.

(lsm.: Vita László)

HEESTERMAN. A. R. G.:

AZ ALKALMAZOTT ÓKONOMETRIAI KUTATASOKRÓL

(On applied econometric research.) —-— Statistl'ca Neerlandica. 1970. 3. sz. 127—131. p.

A szerző bevezetésként összefoglalja a cikk alapvető célkitűzését, mely szerint tár- gyalni kívánja azokat a kritériumokat, ame—

lyek segítségével a sztochasztikus kapcsola- tok és modellek pontos meghatározása ta- nulmányozható. Ebben a vonatkozásban ve- tődik fel a szisztematikus egyezőség (syste- matic coincidence) koncepciója és a gyakorlati alkotómunka szempontjából nélkü- lözhetetlen idősoros elemzések jelentősége.

A probléma körvonalazását megelőzően szerző hangsúlyozza, hogy elsősorban a mo—

dellek specifikációja és eredményessége ér—

dekli. Gyakorlati tapasztalatait is a dina- mikus korrekció modelljének specifikációjá- ra. az idősoros elemzésekre (time-series analysis) és a keresztmetszeti elemzésekre (cross—section analysis) korlátozva ismerteti.

Statisztikai vizsgálatait mindenkor meg- előzi a modell specifikáclójóra vonatkozó elgondolások pontos meghatározása. A spe—

cifikáció helyes megközelítése - módszer- tanilag —- a közgazdasági elmélet, vagy a statisztikailag megfigyelt összefüggések, il—

letve statisztikai elemzések alapulvételével történhet. Mindkét esetben azonban fonto—

lóra kell venni azt a kérdést, hogy a taglalt összefüggés megegyezik-e mind az el- sődleges logikával (azaz a közgazdasági elmélettel), mind pedig a statisztikai ada- tokkal. Figyelmet érdemel, hogy egyes szer- zők a regresszió végeredményét csak akkor fogadják el. ha a feltárt összefüggések a közgazdasági elmélet és a gyakorlati érte—

lem oldaláról egyaránt olyan meggyőző ér—

vekkel bizonyíthatók. mintha a magyarázat önmagában a feltárás tényéből, illetve an—

nak eredményeként keletkeznék. Ezzel kap—

csolatban Prof. !. Sandee felveti azt a gon—

dolatot, hogy bizonyos újonnan felfedett összefüggések esetében -- biztonság céljá-

ból —- ésszerű megoldás a mintavételen 'kí— , vüli összefüggések érvényességének ellenőr—

zese.

A cikk a továbbiakban foglalkozik a becs——

lések és a tesztek problémájával. lsmerteti a teszt—statisztikák gyakorlati jelentőségét,"

a korrelációs együtthatókat, a regressziós koefficiensek standard eltéréseit stb. A teszt— ' statisztikák végrehajtását követő elemzések szükségessége két szempontból indokolható-' éspedig egyrészt a taglalt összefüggés köz-' gazdasági érvényessége. másrészt abban a vonatkozásban. hogy az összefüggés rendelkezik-e azokkal a tulajdonságokkal, ame—' lyeket a sztochasztikus összefüggések sta—

tisztikai meghatározásai feltételeztek. vagy- is az adott összefüggés elegendő—e a nor- mál regressziós modellhez.

A szisztematikus koincidenciák témakörét tárgyaló fejezet állásfoglalása szerint a*

módszeres összefüggés koncepcióját —— ke-' vésbé pontosan —- úgy lehet megfogalmazni, mint a regressziós analizis eszközével. egy- szerű módon nyerhető - de nem mindenre érvényes -— nyilvánvaló kapcsolatot. A mód- szeres összefüggés koncepciójával egy olyan specifikált kapcsolat paramétereinek érté- kelését nyerjük, mely létét teljes mértékben a feltételezett magyarázó változó (explana—

tory variables) és a függő változó közötti kapcsolatnak köszönheti.

A ,.tökéletes alkalmasság" (best fit) kri- tériumának ismertetése során a szerző ki- fejti. hogy a korrekt specifikáció kiválasztá—

sának tetszetős és legegyszerűbb módszere az lenne, ha a tűrésfak mértékéig történő korrekciót követően a legmagasabb korre- lációs koefficienssel való kapcsolatot vesz- szük figyelembe. Ez a megoldás helyes és célravezető, ha feltételezhetjük, hogy a vizs—

gált adatgyűjtésben korrektül specifikált összefüggés van. Más esetekben viszont csak az összes vizsgált specifikáció finomított módszerekkel történő elemzése révén jutha- tunk el a helyes kiválasztáshoz.

A specifikációs hiba egyébként olyan mó—

don isijelentkezhet, mint a maradékok so- rozatos korrelációja. A legtöbb közgazda- sági változó dinamikájának két fő jellem—

zője van:

a) egy pozitív trend, mely a gazdasági növeke- dést vagy az inflációt jelenti,

b) egy megtorpanó vagy gyorsuló irányzatú ciklikus komponens.

A különböző változók dinamikája három szempontból fog módszeresen különbözni egymástól, éspedig az átlagszintben, a trend erősségében és a ciklikus komponens üte- mében. Ha rendelkezünk egy olyan össze- függéssel, amelyből valamely lényeges ma- gyarázó változót kihagytak, ez a marad- ványnak olyan nem véletlenszerű kompo—