A t-eloszlás kritikus pontjainak egy új közelítő meghatározása

(1)

A T—ELOSZLÁS KRITIKUS PONTJAINAK EGY UJ KOZELlTÓ MEGHATÁROZÁSA"

K. K. SAXENA —— O. P. SRlVASTAVA

A tanulmányban egy új, a két normális eloszlás várható értékének összeha—

sonlitósc'ira szolgáló t-próbőval versenyző próbát mutatunk be, ami a közös saka—

sógi variancia ún. jackknife becslőfüggvénye'n alapszik. Meghatórozzuk az igy származtatott statisztika közelítő eloszlását, és a közelítő eloszlás kritikus pontjait

különböző ni és ng és a értékekre nézve, ahol ni és ha a mintaelemszómokot. a pedig (: szignifikancia-szintet jelöli. A hagyományos és a javasolt próba relativ

hatékonyságát Monte-Carla módszerrel hasonlítjuk össze. Arra a következtetésre

jutottunk, hogy a : 0.10 szinten és afölött a tanulmányban javasolt statisztika ereje megközelítően azonos a hagyományos t—próba erejével. A tanulmány lénye—

ges eredménye. hogy az így konstruált statisztika felhasználható az ún. Behrens—

Fisher-féle probléma alternatívájaként.

Számításainkban legyen xi, xa, ..., x,,1 és yi, yg, .... y,, két. ,ul, illetve [A várható értékű és 012, illetve Gá varianciójú normalis eloszlásból származó ru, illet—

ve ng elemű véletlen minta. Ha 012 : 02 :: 02, akkor -- mint az köztudott —— a H:

,u, : ,uz hipotézisnek a K: ,a, %f; [Az alternatívával szembeni tesztelésére szol—

gől a

t:— ——-————:_—_ m

statisztika. melyben s2 a a paraméter torzítatlan becslőfüggvénye, egyenletesen legerősebb torzítatlan próbót jelent.1 Bár e próbőról ismert. hogy minden szim- metrikus sokasőgi eloszlósra nézve robusztus. a 012 ?; U§ esetben messze nem ki- elégítő. és a t-próbónak a 012 : 0§ téves feltevésen alapuló használata alacsony erőt eredményez. Abból, hogy egy statisztika hatásos a becslés szempontjából.

még nem következik az. hogy nagyobb erejű próbához is vezet, mint egy kevésbé hatásos becslőfüggvényt tartalmazó statisztika (11). Ezért az [ll—ben szereplő 5- nek a 0'2 jacknife becslőfüggvényével való helyettesítését javasoljuk. amit a maxi- mum likelihood becslőfüggvénynek egy Saxena által javasolt módszerrel történő ja- vításával nyerhetünk (9). A második részben a a'2 paraméter jackknife becslő-

' A tanulmány K. K. Saxena doktori disszertáciőjőnak egy része. A szerzők ezúton mondanak köszö- netet ak cikk lektorúnak. Vito László kandidátusnak. (: Marx Károly Közgazdaságtudamónyi Egyetem adjunk- tusóna .

* Az ilyen próbákat UMPUB— (Uniiormly Most Pawerful Unblased) próbáknak is szokás nevezni.

(2)

SAXENA -— SRIVASTAVA! A 't-ELOSZLÁS 1239

függvényének a két mintán alapuló meghatározási módját mutatjuk be. A harmadik részben levezetjük az új statisztikát. és megadjuk annak közelítő eloszlását.

A negyedik részt a próba relatív hatékonyságát vizsgáló Monte-Carlo tanulmány

eredményei bemutatásának szenteljük.

A jackknife becslőfüggvény

A normális eloszlás helyzeti paramétereinek becslésére szolgáló becslőfügg-

vények egyesítési problémáival már sokan foglalkoztak (lásd (2). (3). (4). (6), (8),

(10)). A jackknife—technika kétmintás használatát illetően Arveson (i). Miller (7) és Farewell (5) javasoltak néhány módszert a két becslőfüggvény együttes fel—

használására. Az alábbiakban bemutatjuk a paraméter mindkét mintában szereplő összes információt hasznosító jackknife becslőfüggvényét.

Legyen 823 (!2 paraméternek az egyesített mintán alapuló jól ismert maxi- mum likelihood becslőfüggvénye. azaz

nl _ "2 _

21 (X.- — X)2 ** 211 (y; — y)2

,: ,:

Biz—M_— 2

"an //

Legyen őgy-_LDB a 0'2 paraméter olyan becslőfüggvénye, amit úgy nyerünk, hogy az első mintából elhagyjuk az i—edik megfigyelést, miközben a második minta elemeit érintetlenül hagyjuk (i : 1, 2. . . ., n,). Ehhez hasonlóan legyen ő,?ivjn2_1 a 02 olyan becslőfüggvénye. amit az első minta elemeinek érintetlenül hagyásával és a második minta i—edík (] : 1. 2, .. ., ng) elemének elhagyásával kapunk. Definiál—

juk ezután a

Ji(32):("1't"2)52 *("1 tüz—1) Gimme

A A B!

hüg):(mt"ÚUZ—Mrtm—1hűűr4

pszeudo—értékeket, majd ezek felhasználásával a 0'2 paraméter

152

( )

.:

"i'l'nz ( 1lil

n 82

)

—l— n

zlzl

;2

))

.

//

4

jackknife becslőfüggvényét. ahol:

A A (n14—n2—1) "2 A

hWÖzMWwH— m——k1%mm

és /5/

A A (n1—l—n2—1) "Z,. ,

lzlaz) : ("11L"'2)U2 — "mMM—— 2 03324

nz ;:1

jackknife becslőfüggvények.

Egyszerűsítés után azt kapjuk. hogy

JGH: [n1§ 151318 § ,,2 § M]

n1—l—n2 ':1 n,— ;:1 n2—1

(3)

1240 %; K. MMA ..: 0; F.? $RNWVA

"""

"en:: 'nznnuáhe:un%§1 f *—' ná

ahol Ma?), í—_—1,2

él:—1— " (ki—§)1'é's'* sz:—2 (y,— ,,z

"1i1m _ "2

jackknife becslőfüggvénye.

A fenti elemzés motiválta 'a u; : Ha vizsgálatára alkalmas olyan új próba kif—

dolgozását. ami a (71 s; 02 valószínű helyzetben is használható. anélkül, hogy feláldoznánk a jól ismert t—próba a, _ az eseiben érvényes tulajdonságait. Ez azért lehetséges. mert 2ló/ a 012 :: a§— a'2 paraméter torzítatlan becslőföggvénye.

de egyben ](8'12) és ](Er§) súlyozott átlaga is.

Az új próba

Ha az I1/-ben szereplő s—t ](32) négyzetgyökével helyettesítjük, a képlet a

következőképpen írható: .

a:;

1 1 1/2

0 ———-4————

t, l "1 "zl __ ! /7/

'— 1 n ' "2 _ 2 1 '—

l :

^{a (nrlnz)}

l

^::1

(x' *)

^1—1

Jrnzz

^;:1

(" ;)H/2

"2"1

: x'IV'í [8/

ahol:

x/Z—í;_x:v Zzamzlbhz

V 1 1

a N*—

"1 "2

_. "1 b __ ___—il.—

("1-H12) ("1—1) ' ("144110 ("z—1)

"1 (x-—§ 2 ng ( )2

x% ___ Z ( 2) , :Z1ÚYJJZY

!:1 0 I'—"1

1? és x% r : nl—l, illetve 3 : n2—1 szabadságfokú xx eloszlású, x' pe-

dig standard normális eloszlást követ. Megjegyezzük. hogy Z a x'—től mindig füg- getlen eloszlású. és az a :: b. vagy a :: 0, vagy b : 0 esetben Z egy ggg-elosz-

lás konstansszorosa. Az a % 0, b e; 0 értékekre Z már nem x2-eloszlású. s ezért

Z eloszlását az

HL 6 ,p) : %— sz exp (av/ó) on ö ) 0, ₁₉₁

sűrűségfüggvényű Weibull—eloszlással közelítjük.

(4)

A t-ELOSZLÁS 1241

A 6 és p paraméterek momentum-becsléseihez úgy jutunk, hogy egyenlővé tesszük egymással a kétféle eloszlás első két momentumát (9):

A

___1—p__1___ : azr—l— bzs—l—Oj

B (7 , mi?)

9 p /1m

A A 1 E

: (e); l p

A t' : x'h/Z változó eloszlását. ahol x' standard normális. Z pedig a l'lO/

alapján becsült p és 6 paraméterekkel rendelkező Weibull—eloszlású változó, a transzformáció szokásos módszerével kapjuk. A t' változó sűrűségfüggvénye:

hap)1

** til Zm4-1 )

47:— 2 1—1L£_L2Lm(5)$ 111( ij 1 ) ,

fm: 1 2 2 _m

?

/11/

MM (t' 4-- 7) v hal) :1

ő ő

A p és (3 paraméterek momentum-becsléseit /1 lI—be helyettesítve az f(t') sűrű- ségfüggvény az új próbafüggvényhez használható kritikus értékeket ad a hipoté—

zisvizsgálat céljaira. Tetszőleges p-érték esetén azonban igen bonyolult a t' vál-

tozó kritikus értékeinek számítása. lllusztrációs célokra a p : 1 esetet választjuk.

Ekkor a t' változó sűrűségfüggvénye

3 1 1 t'2 _3/2

f(t') :2- a—z— Te /12/

a a 2

alakú és

1/2

,. 2 ni ni

§ : ___—___ ___- M__,_ 13

[(m—PM? [n1—1 % n1—1 / ,

A [12/ összefüggés felhasználásával bármely szignifikancia-szintű próbához meghatározhatók a t'-re vonatkozó kritikus értékek. Ugyanis azt kapjuk. hogy

__C'

(hw—_ ff('*u)du 4— ff(u')du :

...C'

vagy

eo ——3/2

1 1 *2

] 2—3/2.5_ [75—4— u2 ] du' : a/2

—C'

amiből egyszerűsítés után adódik:

_sin tan—1(C' V—Sí) : 1—0 [14]

6 Statisztikai Szemle

(5)

1242 K. K. SAXENA _ a. F. SRNASTAVA

A [MI-ből különféle C' értékeket nyerhetünk 5 és a értékének ismereté—

ben. Az m és n; értékek különböző kombinációihoz tartozó 5 értékeket az 1. tábla tartalmazza.

1. tábla

A különböző n. és na mintaelemszómokhoz tartozó 3 értékek

"? 2 4 6 B 10 12 14 16 18 20

2 1.000 0.719 0.591 0.512 0.458 0.417 0.386 0.361 0.339 0.321 4 0.577 0.501 0.448 0.410 0.379 0.355 0.335 0.317 0.303

6 0.447 0.409 0.378 0.354 0.332 0.317 0.303 0.288

8 0.378 0.353 0.332 0.317 0.301 0.288 0.277

10 . . . 0.332 0.317 0.301 0.288 0.277 0.267

12 . . . 0.301 0.288 0.277 0.267 0.259

14 . . . 0.277 0.267 0.259 0.250

16 0.259 0.250 0.243

18 . ! 0.243 0.236

20 . l

0.229

A /14/—gyel difiniólt — különféle szignifikancia-szinthez tartozó — kritikus érté—

keket a 2. tábla tartalmazza az azonos szabadságfokú hagyományos t-re vonat—

kozó kritikus értékekkel együtt.

2. tábla

A Student—féle t—eloszlás és a levezetett eloszlás kritikus értékei

Szignifikancia-szint

Bzabadsógfok 0 50 0 10 0 05

!!!-lű); ' ' .

C ; C' C . C' C ; C'

4 . . . 0.82 0.816 292 2.919 4.30 4.300

6 . . . . . 0.74 0.963 2.113 3.443 278 5.073

8 . . . . . 0.72 1.068 1.94 3.821 2.45 5.629

10 . . . 0.71 1.147 1.86 4.103 2.31 6.045

12 . . . . . 0.70 1.213 1.81 4.348 223 6.406

14 . . . 0.70 1.272 1.78 4.549 2.18 6.703

1 6 . . . 0.69 1.324 1.76 4.735 2.15 6.970

— 18 . . . 0.69 1.369 1.75 4.896 2.12 * 7.213

20 . . . . . 0.69 1.413 1.73 5.053 2.10 7.429

22 . . . . . 0.69 1.450 1.73 5.186 2.0? 7.641

A 012 % 6§ esetre a t és t' próbák aszimptotikusan hasonlíthatók össze egy—

mással.

Nyilvánvaló. hogy az

m , rlz _ n1 ,_ ' ng __ ' 2

" 1 [2 (Xi — X)2—*' 21 (Yi ')')Z] és _1___ im Z Mlnz Z "(I'll

(ital-27121 ,: ("H-"Ú ;:1 "1—1 .:1 "2—1

kifejezések nagy més nz érték esetén ugyanahhoz a mennyiséghez kanvergőlnak.

s így az /1/ és l7/ statisztikák is ugyanahhoz (: mennyiséghez, mondjuk xo-hoz kon—

vergólnak. '

(6)

A r-ELOSZLAS . 1243

A 3. tábla az elutasítási valószínűségeket mutatja a kétféle eloszlás esetében.

különféle ní—l—ng értékekre.

3. tábla

Visszautasítási valószínűségek (: Student—féle t-eloszlósra és a t' eloszlásra

Xo értéke nI—l—n

, 0.70 l 0.71 ! 0.74 l me l 1,86 l 2.13 l 2,1a l 2.31 ; 2.78

6 P(ltlem) l 0.50 l 0.10 l l o,05

P(ít'l )xo) 0.59 0.21 0.14

10 P(*t')xo) 0.50 0.10 0.05

F( t'l )Xo) 0.66 0.32 0.24

14 P(ltiHo) 0.50 1 0.10 o,05

F( lt'l)xol 0.70 ! ! 0.37 ! 0.30 !

l

A 3. táblából látható, hogy minden 0.70-től 2.78—ig terjedő rögzített pont ese- tében nagyobb a visszautasítási valószínűség az általunk levezetett t'-eloszlás.

mint a Student-féle t-eloszlás esetében. A 3. táblában szereplő visszautasítási va-

lószínűségeket csak néhány önkényesen megválasztott xo értékre vonatkozóan ha-

tároztuk meg.

A Monte-Carlo vizsgálat eredményei

A harmadik részben levezetett próba relatív hatékonyságának meghatározása céljából Monte-Carlo mszimulációt hajtottunk végre. E célból ,u várható értékű és 02 szórásnégyzetű normális eloszlású sokaságokat generáltunk egy TDC—31ó típu- sú számítógép segítségével ,a és a'2 különböző kombinációira (,a értéke 1 és 5, a' pedig 0.5 és 2 között mozgott). Mindkét sokaságból ni :: 9, illetve ng : 7 elemű véletlen mintákat választottunk. és tíz pár mintát vettünk mindegyik sokaságból.

Az ily módon nyert tíz mintapár felhasználásával teszteltük a várható értékek azo- nosságát mind a hagyományos, mint a most javasolt t—próba segítségével. Mind- egyik esetben meghatároztuk. hogy a megfelelő t-, illetve t' -statisztiko értéke hány—

szor mutatkozott szignifikánsnak a különféle szignifikancía—szintek esetében. Azt találtuk, hogy az a : 0.10 szignifikancia-szinten és afölött az új statisztika kö- zel azonos erejű. mint a hagyományos t. így az új próba felhasználható két nor- mális eloszlás várható értékének összehasonlítására különböző varíanciák esetén a 2. tábla felhasználásával.

IRODALOM

(1)Arveson, !. N.: Jockknifing U-statistics. The Anno/s of Mathematical Storistics. 1969. évi 6. sz.

2076—2100. old.

(2) Brown, L. D. — Cohen. A.: Point ond confidence estimotion of a common mean and recovery of introblock information. The Annals of Statistícs. 1974. évi 5. sz. 963—976. old.

(3) Cohen, A. — Sockrowitz, H. B.: An estimating the common mean of two normal distributions.

The Annal: of Mathematical Statistics. 1974. évi 6. sz. 1274—1282. old.

(4) Cohen. A.: Combining estimates of location. Journal of the American Statish'col Association. 1976.

évi 353. sz. 172—175. old.

(5) Farewell. V. T.: Jockknife estimation with structured data. Biometrika. 1978. évi 2. sz. 444—447. old.

0 látó) Groybíll. F. A. — Deal, R. B.: Combining unbiased estimotors. Biometrics. 1959. évi 15. sz. 543—

55 . o .

(7) Miller, R. G.: The lockknife — (: review. Bíometrika. 1974. évi 1. sz. 145. old.

(a) Richter, D.: Two-stage experiments for estimoting a common mean. The Annals of Mathematical Statistr'cs. 1960. évi 4. sz. 1164—1173. old.

6.

(7)

1244 SAXENA -- SRlVASTAVA: A t—ELOSZLÁS

(9) Saxena, K. K.: Some contributions to jackknife methodology and its application. (Kézirott) (10) Seshadn', V.: Constructing unilormly better estimators. Journal of the American Statisticul As—

sociation. 1963. évi 301. sz. 172—175. old.

(11) Sundrum, R. M.: On the relation between estimating efficiency and the power of the tests. Bio- metn'ka. 1954. évi 1. sz. 542—544. old.

TÁRGYSZÓ: Matematikai statisztika.

PE3l—OME

ABTOpbi ,aeMOHctpnpyi—or ocuoabisawmymcn Ha T.M. cunanoü (jackknife) oueHoui—ioü (pynxuuu oőmeű MHomecvseHHoü BőpHaHTHOCTM HOBYIO npoőy p.ma cpaai—ienua omnnaemoü Bem—mmm Aayx HOpMaanle pacnpenenel—mü, copeBHyiomyioca t-npoőoi—i. Onpenenaro'r npuőnnmennoe pacnpeAenei—me nonyueHHoü TBKHM oőpaaom CTGTHCTHKH " oruocmenbuo paanuunbrx semmmi anmuecmx 'roueu ni, Hg u a npnőnnmem-ioro pacnpeAenei—ma,_me n, n ng oőoanauaioi- uncno aneMem-oa, a (: ypoaem, 3HauuM0c7u. Ori-iocmenbhym ad;-epen—

Tnauocn, rpannuuonnoü " npeAnaraeMoi—i npoő astopu conocraanm—o'r meroaom Mon-re- Kapno. l'lpnonn-r K BbIBOAY, tn'o Ha ypoaHe a:0,10 " Bume cuna npennaraemoü a one-pite cra'rucwm npuMepHo coananaer u cunov'i Tpaguuuonnoű t-npoőbl. CyuiecraeHHbiM peaynb- TaTOM ouepna nanaercn TO, uro nocrpoennax TaKHM oőpasoM cramcruna Monte-r Gun.

ncnonbzosana B Kauecvse anbrepuamahi T.H. npoőnthi Bepeuca—mumepa.

SUMMARY

in this paper a competitor test to the usual t-test for testing the eauality of two means of the normal populations have been constructed by using the jackkniie estimator of the common population variance. The distribution of the derived statistics is approximated and for different values of nl—l—ng. ni and "2 being the sample sizes, the critical points have been computed for various values of a. A Monte Carlo study has been made to find out the relative efficiency of the two tests. it is concluded that at the level of significance (Il—70.10 and above, the derived statistics is approximately as powerful as t. The saiient feature of this study is that the derived statistics can be used as an alternative to the Behrans—Fisher

problem.