A STATISZTIKA ÁLTALÁNOS ELMÉLETE ÉS MÓDSZERTANA MATEMATIKAI STATISZTIKA
KUHLMEYER. M.:
A NEM CENTRÁLIS t-ELOSZLÁS
(Die níchtzentrale t-Verteilung. Grundlagen und Anwendungen mit Beíspielen.) Lecture Notes in Operations Research and Mathematical Systems.
No. 31. Springer—Verlag. Berlin-Heidelberg—New York.
1970 106 p.
Monográflajaban a szerző a ma még szinte kizárólag csak az elméleti statisztiku- sok körében ismert nem centrális t—eloszlás gyakorlati szakemberek számára is hozzá- férhető, a megértést sok, a gyakorlatból vett példával megkönnyíteni igyekvő, átfogó ismertetését adja. A monográfia tizenegy fejezete közül tízben a Student-féle t-elosz- lás közvetlen általánosításaként adódó nem centrális t-eloszlás legfontosabb matemati—
kai tulajdonságait és alkalmazási lehetősé- geit tárgyalja, míg az elsőben a normális eloszlásból vett mintákkal kapcsolatos alap- vető tudnivalókat foglalja össze.
A második fejezetben a nem centrális t- eloszlás definícióját adja meg a szerző.
Eszerint a
T (f, ő) : X 4—6 /1/
r *
fvalószínűségi változó ö nem centralitási pa- raméterű. f szabadságfokú nem centrális t-eloszlást követ, ha
X — egy standard normális eloszlású (0 várható
értékű és 1 szórású) valószínűségi változó,
Y— egy XAtől független, f szabadságfokú ZZ
eloszlású valószínűségi változó,
§ — pedig egy konstans valós szám.
Az /1/ definíció alapján könnyen látható, hogy a ő : 0 speciális esetben a jól is- mert f szabadságfokú Student—féle t-elosz—
lóshoz jutunk. A következő fejezetben a nem centrális t-eloszlás legfőbb matemati—
kai tulajdonságaí, eloszlásfüggvényének kü- lönböző alakjai, valamint első négy momen—
tumának képlete található meg.
Az ezután következő hat (4—10.) fejezet- ben a nem centrális t-eloszlás legfontosabb
alkalmazási területeit ismerteti a szerző.
Ezek közül az első öt elsősorban a kís mintákkal dolgozó minőségellenőrzés szem- pontjából alapvető fontosságú. míg az—utol—
só a hipotézisvizsgálat szempontjából bír nagy jelentőséggel. Az egyes alkalmazási területek a következők.
1. N (,a, 02) eloszlásból vett minta rela- tív szórásának vizsgálata. (N (M, a?) a u vár- ható értékű és 02 szórásnégyzetű normális eloszlást jelöli.) Tegyük fel, hogy rendelke- zésünkre áll az alapsokaság V : a:,u re- latív szórásának egy N—elemű mintából nyert v : 5 x becslése, ahol x a mintaát- lag. 5 pedig a a paraméter torzítatlan becs—
lése. Feltesszük még azt is, hogy annak va—
lószínűsége, hogy az általunk vizsgált való- színűségi változó negatív értékeket vegyen fel, elhanyagolhatóan kicsi. (Ellenkező eset- ben ugyanis v : 00 is előfordulhatna.) Ek—
kor könnyen belátható, hogy a VN—n; va- lószínűségi Változó
T(N_1,1/NJL)
(7
eloszlású, mely tulajdonságot kihasználva konfidencia-intervallumot adhatunk az alap—
sokaság ismeretlen V relatív szórására, s megvizsgálhatjuk a HO:V § Vo nullhípoté- zis helyességét is a H1:V ) Vo alternatívá- val szemben. ahol V0 a V egy feltételezett értéke. A nem centrális t—eloszlás alkalma- zása nélkül ez nem volna lehetséges.
2. Normális eloszlás kvantiliseinek becs- lése. Ebben az esetben az a célunk. hogy egy N (,a. 02) eloszlásból vett _N-elemű minta alapján olyan felső (alsó). x —I— k 5 alakú határt adjunk meg, hogy az alapso—
kaság elemeinek legalább (legfeljebb) 100 p százaléka előre megadott a valószínűség—
gel e határ alatt helyezkedjen el. Megmu—
tatható, hogy ez a probléma is csak a nem centrális t-eloszlás felhasználásával oldható meg teljes matematikai precizitással.
__ 3. Az előbbi probléma inverze. Most az x —lw k 5 alakú határ egyértelműen meg van
STATISZTIKAl lRODALMl FIGYELÖ
433
adva a Ep : ,a —l—— K a formában, ahol
K a k elméleti (pontos) értéke. 5 az ehhez tartozó 100 p százalék alsó és felső hatá- rát keressük. ami szintén csak a nem cent- rális t-eloszlás felhasználásával oldható meg.
4. SeIe/tarány megbízhatóságának vizs—
gálata. Ez az alkalmazás a minőségellenőr- zés elméletéből ismert mintavételi tervek ké- szítésével kapcsolatos. E fejezetben olyan selejtarány — a nem centrális t-eloszláson alapuló — meghatározását tárgyalja a szer- ző. mely mellett a vizsgált tétel előre meg—
adott a valószínűséggel még átvehető. Eb- ben a fejezetben kitér az ún. jelleggőrbe két adott pont alapján történő meghatáro- zására is.
5. Lineáris regresszió egyoldali határai—
nak meghatározása. E fejezetben a szerző egy a lineáris regressziós modell alapján meghatározott y, becslés olyan yi' :y'—l—
—j—k sR alakú felső határának meghatáro- zási módját tárgyalja. amely azzal a tulaj—
donsággal rendelkezik, hogy annak való- színűsége. hogy a függő változó összes
b0"l"'b1X1_l"---—'l"bl) XP /2/
átlagú értékének legalább 1000: százaléka y'f alatt van. egy előre megadott az érték.
Az y'; felső határban szereplő SR a modell maradék szórásának szokásos becslése, a /2/-ben szereplő bi együtthatók a modell paramétereinek legkisebb négyzetek mód- szere szerinti becslései az xi (i : 1. 2. ....
p) értékek pedig a modellben szereplő független változók rögzített értékei. E prob—
le'ma megoldása is a nem centrális t—elosz—
láshoz vezet.
6. Az egy- és kétmintás Student-féle !- próba erejének meghatározása. Mivel vé—
leményem szerint a statisztikai gyakorlat szempontjából ez az alkalmazási terület a legnagyobb jelentőségű, a t—próba erejé- nek meghatározási módját az előbbi al- kalmazási területeknél kissé részletesebben ismertetem. Az egymintás Student—féle t- próba lényege a következő. Adva van egy Nm, 02) eloszlásból vett N-elemű minta, 5 a normális alapeloszlás mindkét paramé- terét e mintából becsüljük. Vizsgálni kiván- juk a Hoz/Ag ,un hipotézis helyességét —- ahol .no a normális eloszlás várható érté—
kének egy feltételezett értéke —— a H1:M)MO alternativ hipotézissel szemben.
A fenti Ho hipotézis helyessége — mint is-
meretes — a
Wii : Ha) /3/
S
képlet segítségével vizsgálható. mely a HD
7 Statisztikai Szemle
hipotézis helyessége esetén N—l szabadság- fokú Student—féle t-eloszlást követ. Az is is—
meretes, hogy ebben az esetben döntésünk (a Ha elfogadása vagy elvetése) kétféle hi- bával járhat, s ezek közül az ún. elsőfajú hiba elkövetésének valószínűsége a hipoté—
zis-vizsgálat során közvetlenül adódik. Nem ilyen egyszerű azonban a másodfajú hiba elkövetési valószínűségének meghatározása.
A másodfajú hiba elkövetésének valószínű- sége azt mutatja, hogy milyen valószínű—
séggel fogadjuk el a Ha null-hipotézist ab- ban az esetben, ha a valóságban Hn he- lyett ,u : M ) [40 érvényes. Az e valószí—
nűséget 1-re kiegészítő értéket a próba ere/ének, a próba erejét m függvényében ábrázolva pedig a próba erőfüggvényének
nevezzük.
Tegyük most fel, hogy a valóságban Ho helyett " : _u1 ) ,a.) teljesül. Ekkor elvé- gezhető a /3/ próbafüggvény
( : l/jy—Úfi'W) : s
: fől, __(7: "ELLl'm/fLI_FO)__ :
$
li (X— arab—_NÁHLJEL
— _ , 70 ,, W.,
, 5, , /4/
a
átalakítása, amiből látható, hogy próba- függvényünk
l(N—l; VLMÉÉ—Úü]
eloszlást követ. Ezt kihasználva a nem cent- rális t-eloszlás táblázatainak vagy nomog—
romjainak felhasználásával meghatározható a próba adott alternatívához tartozó ereje, illetve a másodfajú hiba elkövetésének való—
színűsége is.
A nem centralitási paraméter képletéből látható. hogy ehhez szükség lenne a szóban forgó normális eloszlás paraméterének is—
meretére. Mivel a gyakorlatban ez csak a legritkább esetben fordul elő, a nem cent—
ralitási paraméter képletében a helyére an- nak s becslését, vagy az arra vonatkozó konfidencia—intervallum valamelyik határát helyettesítjük. Ehhez hasonlóan használható fel a nem centrális t-eloszlás a kétmintás t—próba erejének meghatározására is.
Az utolsó két fejezetben a függelékben található táblázatok ..használati utasítása"
és a nem centrális t-eloszlás eloszlásfügg—
vényének különböző közelítő formulái talál—
hatók meg. A kötetet a nem centrális t-el-
434 STATlSZTlKAl lRODALMi FIGYELÖ-
oszlásra vonatkozó gazdag táblázat- és no—
mogram-anyagot tartalmazó függelék egé- szíti ki, melyben megtalálható a téma rész- letes irodalomjegyzéke és az egyes fejeze—
tek végén szereplő feladatok megoldása is.
A monográfia a szakemberek számára sokszor nehezen hozzáférhető szakfolyóira- tokban megjelent cikkek összefoglalása. Bár a szerző a tárgyalást a gyakorlatból vett példákkal illusztrálja, a könyv teljes meg- értése alapos matematikai statisztikai isme—
reteket igényel.
(lsm.: Vita László)
HEESTERMAN. A. R. G.:
AZ ALKALMAZOTT ÓKONOMETRIAI KUTATASOKRÓL
(On applied econometric research.) —-— Statistl'ca Neerlandica. 1970. 3. sz. 127—131. p.
A szerző bevezetésként összefoglalja a cikk alapvető célkitűzését, mely szerint tár- gyalni kívánja azokat a kritériumokat, ame—
lyek segítségével a sztochasztikus kapcsola- tok és modellek pontos meghatározása ta- nulmányozható. Ebben a vonatkozásban ve- tődik fel a szisztematikus egyezőség (syste- matic coincidence) koncepciója és a gya- korlati alkotómunka szempontjából nélkü- lözhetetlen idősoros elemzések jelentősége.
A probléma körvonalazását megelőzően szerző hangsúlyozza, hogy elsősorban a mo—
dellek specifikációja és eredményessége ér—
dekli. Gyakorlati tapasztalatait is a dina- mikus korrekció modelljének specifikációjá- ra. az idősoros elemzésekre (time-series analysis) és a keresztmetszeti elemzésekre (cross—section analysis) korlátozva ismerteti.
Statisztikai vizsgálatait mindenkor meg- előzi a modell specifikáclójóra vonatkozó elgondolások pontos meghatározása. A spe—
cifikáció helyes megközelítése - módszer- tanilag —- a közgazdasági elmélet, vagy a statisztikailag megfigyelt összefüggések, il—
letve statisztikai elemzések alapulvételével történhet. Mindkét esetben azonban fonto—
lóra kell venni azt a kérdést, hogy a tag- lalt összefüggés megegyezik-e mind az el- sődleges logikával (azaz a közgazdasági elmélettel), mind pedig a statisztikai ada- tokkal. Figyelmet érdemel, hogy egyes szer- zők a regresszió végeredményét csak akkor fogadják el. ha a feltárt összefüggések a közgazdasági elmélet és a gyakorlati érte—
lem oldaláról egyaránt olyan meggyőző ér—
vekkel bizonyíthatók. mintha a magyarázat önmagában a feltárás tényéből, illetve an—
nak eredményeként keletkeznék. Ezzel kap—
csolatban Prof. !. Sandee felveti azt a gon—
dolatot, hogy bizonyos újonnan felfedett összefüggések esetében -- biztonság céljá-
ból —- ésszerű megoldás a mintavételen 'kí— , vüli összefüggések érvényességének ellenőr—
zese.
A cikk a továbbiakban foglalkozik a becs——
lések és a tesztek problémájával. lsmerteti a teszt—statisztikák gyakorlati jelentőségét,"
a korrelációs együtthatókat, a regressziós koefficiensek standard eltéréseit stb. A teszt— ' statisztikák végrehajtását követő elemzések szükségessége két szempontból indokolható-' éspedig egyrészt a taglalt összefüggés köz-' gazdasági érvényessége. másrészt abban a vonatkozásban. hogy az összefüggés ren- delkezik-e azokkal a tulajdonságokkal, ame—' lyeket a sztochasztikus összefüggések sta—
tisztikai meghatározásai feltételeztek. vagy- is az adott összefüggés elegendő—e a nor- mál regressziós modellhez.
A szisztematikus koincidenciák témakörét tárgyaló fejezet állásfoglalása szerint a*
módszeres összefüggés koncepcióját —— ke-' vésbé pontosan —- úgy lehet megfogalmazni, mint a regressziós analizis eszközével. egy- szerű módon nyerhető - de nem mindenre érvényes -— nyilvánvaló kapcsolatot. A mód- szeres összefüggés koncepciójával egy olyan specifikált kapcsolat paramétereinek érté- kelését nyerjük, mely létét teljes mértékben a feltételezett magyarázó változó (explana—
tory variables) és a függő változó közötti kapcsolatnak köszönheti.
A ,.tökéletes alkalmasság" (best fit) kri- tériumának ismertetése során a szerző ki- fejti. hogy a korrekt specifikáció kiválasztá—
sának tetszetős és legegyszerűbb módszere az lenne, ha a tűrésfak mértékéig történő korrekciót követően a legmagasabb korre- lációs koefficienssel való kapcsolatot vesz- szük figyelembe. Ez a megoldás helyes és célravezető, ha feltételezhetjük, hogy a vizs—
gált adatgyűjtésben korrektül specifikált összefüggés van. Más esetekben viszont csak az összes vizsgált specifikáció finomított módszerekkel történő elemzése révén jutha- tunk el a helyes kiválasztáshoz.
A specifikációs hiba egyébként olyan mó—
don isijelentkezhet, mint a maradékok so- rozatos korrelációja. A legtöbb közgazda- sági változó dinamikájának két fő jellem—
zője van:
a) egy pozitív trend, mely a gazdasági növeke- dést vagy az inflációt jelenti,
b) egy megtorpanó vagy gyorsuló irányzatú cik- likus komponens.
A különböző változók dinamikája három szempontból fog módszeresen különbözni egymástól, éspedig az átlagszintben, a trend erősségében és a ciklikus komponens üte- mében. Ha rendelkezünk egy olyan össze- függéssel, amelyből valamely lényeges ma- gyarázó változót kihagytak, ez a marad- ványnak olyan nem véletlenszerű kompo—