A T—ELOSZLÁS KRITIKUS PONTJAINAK EGY UJ KOZELlTÓ MEGHATÁROZÁSA"
K. K. SAXENA —— O. P. SRlVASTAVA
A tanulmányban egy új, a két normális eloszlás várható értékének összeha—
sonlitósc'ira szolgáló t-próbőval versenyző próbát mutatunk be, ami a közös saka—
sógi variancia ún. jackknife becslőfüggvénye'n alapszik. Meghatórozzuk az igy származtatott statisztika közelítő eloszlását, és a közelítő eloszlás kritikus pontjait
különböző ni és ng és a értékekre nézve, ahol ni és ha a mintaelemszómokot. a pedig (: szignifikancia-szintet jelöli. A hagyományos és a javasolt próba relativ
hatékonyságát Monte-Carla módszerrel hasonlítjuk össze. Arra a következtetésre
jutottunk, hogy a : 0.10 szinten és afölött a tanulmányban javasolt statisztika ereje megközelítően azonos a hagyományos t—próba erejével. A tanulmány lénye—ges eredménye. hogy az így konstruált statisztika felhasználható az ún. Behrens—
Fisher-féle probléma alternatívájaként.
Számításainkban legyen xi, xa, ..., x,,1 és yi, yg, .... y,, két. ,ul, illetve [A várható értékű és 012, illetve Gá varianciójú normalis eloszlásból származó ru, illet—
ve ng elemű véletlen minta. Ha 012 : 02 :: 02, akkor -- mint az köztudott —— a H:
,u, : ,uz hipotézisnek a K: ,a, %f; [Az alternatívával szembeni tesztelésére szol—
gől a
t:— ——-————:_—_ m
statisztika. melyben s2 a a paraméter torzítatlan becslőfüggvénye, egyenletesen legerősebb torzítatlan próbót jelent.1 Bár e próbőról ismert. hogy minden szim- metrikus sokasőgi eloszlósra nézve robusztus. a 012 ?; U§ esetben messze nem ki- elégítő. és a t-próbónak a 012 : 0§ téves feltevésen alapuló használata alacsony erőt eredményez. Abból, hogy egy statisztika hatásos a becslés szempontjából.
még nem következik az. hogy nagyobb erejű próbához is vezet, mint egy kevésbé hatásos becslőfüggvényt tartalmazó statisztika (11). Ezért az [ll—ben szereplő 5- nek a 0'2 jacknife becslőfüggvényével való helyettesítését javasoljuk. amit a maxi- mum likelihood becslőfüggvénynek egy Saxena által javasolt módszerrel történő ja- vításával nyerhetünk (9). A második részben a a'2 paraméter jackknife becslő-
' A tanulmány K. K. Saxena doktori disszertáciőjőnak egy része. A szerzők ezúton mondanak köszö- netet ak cikk lektorúnak. Vito László kandidátusnak. (: Marx Károly Közgazdaságtudamónyi Egyetem adjunk- tusóna .
* Az ilyen próbákat UMPUB— (Uniiormly Most Pawerful Unblased) próbáknak is szokás nevezni.
SAXENA -— SRIVASTAVA! A 't-ELOSZLÁS 1239
függvényének a két mintán alapuló meghatározási módját mutatjuk be. A harma- dik részben levezetjük az új statisztikát. és megadjuk annak közelítő eloszlását.
A negyedik részt a próba relatív hatékonyságát vizsgáló Monte-Carlo tanulmány
eredményei bemutatásának szenteljük.
A jackknife becslőfüggvény
A normális eloszlás helyzeti paramétereinek becslésére szolgáló becslőfügg-
vények egyesítési problémáival már sokan foglalkoztak (lásd (2). (3). (4). (6), (8),
(10)). A jackknife—technika kétmintás használatát illetően Arveson (i). Miller (7) és Farewell (5) javasoltak néhány módszert a két becslőfüggvény együttes fel—használására. Az alábbiakban bemutatjuk a paraméter mindkét mintában szereplő összes információt hasznosító jackknife becslőfüggvényét.
Legyen 823 (!2 paraméternek az egyesített mintán alapuló jól ismert maxi- mum likelihood becslőfüggvénye. azaz
nl _ "2 _
21 (X.- — X)2 ** 211 (y; — y)2
,: ,:
Biz—M_— 2
"an //
Legyen őgy-_LDB a 0'2 paraméter olyan becslőfüggvénye, amit úgy nyerünk, hogy az első mintából elhagyjuk az i—edik megfigyelést, miközben a második minta elemeit érintetlenül hagyjuk (i : 1, 2. . . ., n,). Ehhez hasonlóan legyen ő,?ivjn2_1 a 02 olyan becslőfüggvénye. amit az első minta elemeinek érintetlenül hagyásával és a második minta i—edík (] : 1. 2, .. ., ng) elemének elhagyásával kapunk. Definiál—
juk ezután a
Ji(32):("1't"2)52 *("1 tüz—1) Gimme
A A B!
hüg):(mt"ÚUZ—Mrtm—1hűűr4
pszeudo—értékeket, majd ezek felhasználásával a 0'2 paraméter
152
( )
.:"i'l'nz ( 1lil
n 82)
—l— nzlzl
;2))
.//
4jackknife becslőfüggvényét. ahol:
A A (n14—n2—1) "2 A
hWÖzMWwH— m——k1%mm
és /5/
A A (n1—l—n2—1) "Z,. ,
lzlaz) : ("11L"'2)U2 — "mMM—— 2 03324
nz ;:1
jackknife becslőfüggvények.
Egyszerűsítés után azt kapjuk. hogy
JGH: [n1§ 151318 § ,,2 § M]
n1—l—n2 ':1 n,— ;:1 n2—1
1240 %; K. MMA ..: 0; F.? $RNWVA
"""
"en:: 'nznnuáhe:un%§1 f *—' ná
ahol Ma?), í—_—1,2
él:—1— " (ki—§)1'é's'* sz:—2 (y,— ,,z
"1i1m _ "2
jackknife becslőfüggvénye.
A fenti elemzés motiválta 'a u; : Ha vizsgálatára alkalmas olyan új próba kif—
dolgozását. ami a (71 s; 02 valószínű helyzetben is használható. anélkül, hogy feláldoznánk a jól ismert t—próba a, _ az eseiben érvényes tulajdonságait. Ez azért lehetséges. mert 2ló/ a 012 :: a§— a'2 paraméter torzítatlan becslőföggvénye.
de egyben ](8'12) és ](Er§) súlyozott átlaga is.
Az új próba
Ha az I1/-ben szereplő s—t ](32) négyzetgyökével helyettesítjük, a képlet a
következőképpen írható: .
a:;
1 1 1/2
0 ———-4————
t, l "1 "zl __ ! /7/
'— 1 n ' "2 _ 2 1 '—
l :
a (nrlnz)l
::1(x' *)
1—1Jrnzz
;:1(" ;)H/2
"2"1: x'IV'í [8/
ahol:
x/Z—í;_x:v Zzamzlbhz
V 1 1
a N*—
"1 "2
_. "1 b __ ___—il.—
("1-H12) ("1—1) ' ("144110 ("z—1)
"1 (x-—§ 2 ng ( )2
x% ___ Z ( 2) , :Z1ÚYJJZY
!:1 0 I'—"1
1? és x% r : nl—l, illetve 3 : n2—1 szabadságfokú xx eloszlású, x' pe-
dig standard normális eloszlást követ. Megjegyezzük. hogy Z a x'—től mindig füg- getlen eloszlású. és az a :: b. vagy a :: 0, vagy b : 0 esetben Z egy ggg-elosz-
lás konstansszorosa. Az a % 0, b e; 0 értékekre Z már nem x2-eloszlású. s ezért
Z eloszlását azHL 6 ,p) : %— sz exp (av/ó) on ö ) 0, 191
sűrűségfüggvényű Weibull—eloszlással közelítjük.
A t-ELOSZLÁS 1241
A 6 és p paraméterek momentum-becsléseihez úgy jutunk, hogy egyenlővé tesszük egymással a kétféle eloszlás első két momentumát (9):
A
___1—p__1___ : azr—l— bzs—l—Oj
B (7 , mi?)
9 p /1m
A A 1 E
: (e); l p
A t' : x'h/Z változó eloszlását. ahol x' standard normális. Z pedig a l'lO/
alapján becsült p és 6 paraméterekkel rendelkező Weibull—eloszlású változó, a transzformáció szokásos módszerével kapjuk. A t' változó sűrűségfüggvénye:
hap)1
** til Zm4-1 )
47:— 2 1—1L£_L2Lm(5)$ 111( ij 1 ) ,
fm: 1 2 2 _m
?/11/
MM (t' 4-- 7) v hal) :1
ő ő
A p és (3 paraméterek momentum-becsléseit /1 lI—be helyettesítve az f(t') sűrű- ségfüggvény az új próbafüggvényhez használható kritikus értékeket ad a hipoté—
zisvizsgálat céljaira. Tetszőleges p-érték esetén azonban igen bonyolult a t' vál-
tozó kritikus értékeinek számítása. lllusztrációs célokra a p : 1 esetet választjuk.
Ekkor a t' változó sűrűségfüggvénye
3 1 1 t'2 _3/2
f(t') :2- a—z— Te /12/
a a 2
alakú és
1/2
,. 2 ni ni
§ : ___—___ ___- M__,_ 13
[(m—PM? [n1—1 % n1—1 / ,
A [12/ összefüggés felhasználásával bármely szignifikancia-szintű próbához meghatározhatók a t'-re vonatkozó kritikus értékek. Ugyanis azt kapjuk. hogy
__C'
(hw—_ ff('*u)du 4— ff(u')du :
...C'
vagy
eo ——3/2
1 1 *2
] 2—3/2.5_ [75—4— u2 ] du' : a/2
—C'
amiből egyszerűsítés után adódik:
_sin tan—1(C' V—Sí) : 1—0 [14]
6 Statisztikai Szemle
1242 K. K. SAXENA _ a. F. SRNASTAVA
A [MI-ből különféle C' értékeket nyerhetünk 5 és a értékének ismereté—
ben. Az m és n; értékek különböző kombinációihoz tartozó 5 értékeket az 1. tábla tartalmazza.
1. tábla
A különböző n. és na mintaelemszómokhoz tartozó 3 értékek
"? 2 4 6 B 10 12 14 16 18 20
2 1.000 0.719 0.591 0.512 0.458 0.417 0.386 0.361 0.339 0.321 4 0.577 0.501 0.448 0.410 0.379 0.355 0.335 0.317 0.303
6 0.447 0.409 0.378 0.354 0.332 0.317 0.303 0.288
8 0.378 0.353 0.332 0.317 0.301 0.288 0.277
10 . . . 0.332 0.317 0.301 0.288 0.277 0.267
12 . . . 0.301 0.288 0.277 0.267 0.259
14 . . . 0.277 0.267 0.259 0.250
16 0.259 0.250 0.243
18 . ! 0.243 0.236
20 . l
0.229
A /14/—gyel difiniólt — különféle szignifikancia-szinthez tartozó — kritikus érté—
keket a 2. tábla tartalmazza az azonos szabadságfokú hagyományos t-re vonat—
kozó kritikus értékekkel együtt.
2. tábla
A Student—féle t—eloszlás és a levezetett eloszlás kritikus értékei
Szignifikancia-szint
Bzabadsógfok 0 50 0 10 0 05
!!!-lű); ' ' .
C ; C' C . C' C ; C'
4 . . . 0.82 0.816 292 2.919 4.30 4.300
6 . . . . . 0.74 0.963 2.113 3.443 278 5.073
8 . . . . . 0.72 1.068 1.94 3.821 2.45 5.629
10 . . . 0.71 1.147 1.86 4.103 2.31 6.045
12 . . . . . 0.70 1.213 1.81 4.348 223 6.406
14 . . . 0.70 1.272 1.78 4.549 2.18 6.703
1 6 . . . 0.69 1.324 1.76 4.735 2.15 6.970
— 18 . . . 0.69 1.369 1.75 4.896 2.12 * 7.213
20 . . . . . 0.69 1.413 1.73 5.053 2.10 7.429
22 . . . . . 0.69 1.450 1.73 5.186 2.0? 7.641
A 012 % 6§ esetre a t és t' próbák aszimptotikusan hasonlíthatók össze egy—
mással.
Nyilvánvaló. hogy az
m , rlz _ n1 ,_ ' ng __ ' 2
" 1 [2 (Xi — X)2—*' 21 (Yi ')')Z] és ___1_____ im Z Mlnz Z "(I'll
(ital-27121 ,: ("H-"Ú ;:1 "1—1 .:1 "2—1
kifejezések nagy més nz érték esetén ugyanahhoz a mennyiséghez kanvergőlnak.s így az /1/ és l7/ statisztikák is ugyanahhoz (: mennyiséghez, mondjuk xo-hoz kon—
vergólnak. '
A r-ELOSZLAS . 1243
A 3. tábla az elutasítási valószínűségeket mutatja a kétféle eloszlás esetében.
különféle ní—l—ng értékekre.
3. tábla
Visszautasítási valószínűségek (: Student—féle t-eloszlósra és a t' eloszlásra
Xo értéke nI—l—n
, 0.70 l 0.71 ! 0.74 l me l 1,86 l 2.13 l 2,1a l 2.31 ; 2.78
6 P(ltlem) l 0.50 l 0.10 l l o,05
P(ít'l )xo) 0.59 0.21 0.14
10 P(*t')xo) 0.50 0.10 0.05
F( t'l )Xo) 0.66 0.32 0.24
14 P(ltiHo) 0.50 1 0.10 o,05
F( lt'l)xol 0.70 ! ! 0.37 ! 0.30 !
l
A 3. táblából látható, hogy minden 0.70-től 2.78—ig terjedő rögzített pont ese- tében nagyobb a visszautasítási valószínűség az általunk levezetett t'-eloszlás.
mint a Student-féle t-eloszlás esetében. A 3. táblában szereplő visszautasítási va-
lószínűségeket csak néhány önkényesen megválasztott xo értékre vonatkozóan ha-
tároztuk meg.A Monte-Carlo vizsgálat eredményei
A harmadik részben levezetett próba relatív hatékonyságának meghatározása céljából Monte-Carlo mszimulációt hajtottunk végre. E célból ,u várható értékű és 02 szórásnégyzetű normális eloszlású sokaságokat generáltunk egy TDC—31ó típu- sú számítógép segítségével ,a és a'2 különböző kombinációira (,a értéke 1 és 5, a' pedig 0.5 és 2 között mozgott). Mindkét sokaságból ni :: 9, illetve ng : 7 elemű véletlen mintákat választottunk. és tíz pár mintát vettünk mindegyik sokaságból.
Az ily módon nyert tíz mintapár felhasználásával teszteltük a várható értékek azo- nosságát mind a hagyományos, mint a most javasolt t—próba segítségével. Mind- egyik esetben meghatároztuk. hogy a megfelelő t-, illetve t' -statisztiko értéke hány—
szor mutatkozott szignifikánsnak a különféle szignifikancía—szintek esetében. Azt találtuk, hogy az a : 0.10 szignifikancia-szinten és afölött az új statisztika kö- zel azonos erejű. mint a hagyományos t. így az új próba felhasználható két nor- mális eloszlás várható értékének összehasonlítására különböző varíanciák esetén a 2. tábla felhasználásával.
IRODALOM
(1)Arveson, !. N.: Jockknifing U-statistics. The Anno/s of Mathematical Storistics. 1969. évi 6. sz.
2076—2100. old.
(2) Brown, L. D. — Cohen. A.: Point ond confidence estimotion of a common mean and recovery of introblock information. The Annals of Statistícs. 1974. évi 5. sz. 963—976. old.
(3) Cohen, A. — Sockrowitz, H. B.: An estimating the common mean of two normal distributions.
The Annal: of Mathematical Statistics. 1974. évi 6. sz. 1274—1282. old.
(4) Cohen. A.: Combining estimates of location. Journal of the American Statish'col Association. 1976.
évi 353. sz. 172—175. old.
(5) Farewell. V. T.: Jockknife estimation with structured data. Biometrika. 1978. évi 2. sz. 444—447. old.
0 látó) Groybíll. F. A. — Deal, R. B.: Combining unbiased estimotors. Biometrics. 1959. évi 15. sz. 543—
55 . o .
(7) Miller, R. G.: The lockknife — (: review. Bíometrika. 1974. évi 1. sz. 145. old.
(a) Richter, D.: Two-stage experiments for estimoting a common mean. The Annals of Mathematical Statistr'cs. 1960. évi 4. sz. 1164—1173. old.
6.
1244 SAXENA -- SRlVASTAVA: A t—ELOSZLÁS
(9) Saxena, K. K.: Some contributions to jackknife methodology and its application. (Kézirott) (10) Seshadn', V.: Constructing unilormly better estimators. Journal of the American Statisticul As—
sociation. 1963. évi 301. sz. 172—175. old.
(11) Sundrum, R. M.: On the relation between estimating efficiency and the power of the tests. Bio- metn'ka. 1954. évi 1. sz. 542—544. old.
TÁRGYSZÓ: Matematikai statisztika.
PE3l—OME
ABTOpbi ,aeMOHctpnpyi—or ocuoabisawmymcn Ha T.M. cunanoü (jackknife) oueHoui—ioü (pynxuuu oőmeű MHomecvseHHoü BőpHaHTHOCTM HOBYIO npoőy p.ma cpaai—ienua omnnaemoü Bem—mmm Aayx HOpMaanle pacnpenenel—mü, copeBHyiomyioca t-npoőoi—i. Onpenenaro'r npuőnnmennoe pacnpeAenei—me nonyueHHoü TBKHM oőpaaom CTGTHCTHKH " oruocmenbuo paanuunbrx semmmi anmuecmx 'roueu ni, Hg u a npnőnnmem-ioro pacnpeAenei—ma,_me n, n ng oőoanauaioi- uncno aneMem-oa, a (: ypoaem, 3HauuM0c7u. Ori-iocmenbhym ad;-epen—
Tnauocn, rpannuuonnoü " npeAnaraeMoi—i npoő astopu conocraanm—o'r meroaom Mon-re- Kapno. l'lpnonn-r K BbIBOAY, tn'o Ha ypoaHe a:0,10 " Bume cuna npennaraemoü a one-pite cra'rucwm npuMepHo coananaer u cunov'i Tpaguuuonnoű t-npoőbl. CyuiecraeHHbiM peaynb- TaTOM ouepna nanaercn TO, uro nocrpoennax TaKHM oőpasoM cramcruna Monte-r Gun.
ncnonbzosana B Kauecvse anbrepuamahi T.H. npoőnthi Bepeuca—mumepa.
SUMMARY
in this paper a competitor test to the usual t-test for testing the eauality of two means of the normal populations have been constructed by using the jackkniie estimator of the common population variance. The distribution of the derived statistics is approximated and for different values of nl—l—ng. ni and "2 being the sample sizes, the critical points have been computed for various values of a. A Monte Carlo study has been made to find out the relative efficiency of the two tests. it is concluded that at the level of significance (Il—70.10 and above, the derived statistics is approximately as powerful as t. The saiient feature of this study is that the derived statistics can be used as an alternative to the Behrans—Fisher
problem.