NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK
A leggyakrabban használt próbák (pl. a t-próbák) feltételezik a normális eloszlást.
Sokszor ez nem teljesül.
Következmény: az első ill. másodfajú hiba-valószínűsége eltér a deklarálttól (Pl. azt hisszük, hogy p=0.01, tehát szignifikáns a különbség, pedig helyesen számolva p=0.2 lenne, tehát nem szignifikáns a különbség.
Sokszor az adatok természete már nyilvánvalóvá teszi:
• a selejtarány binomiális vagy Poisson-eloszlású,
• őrlésnél a szemcseméret lognormális eloszlású Máskor csak az eloszlás vizsgálatával derül ki
• hisztogram
• normalitásvizsgálat (pl. Shapiro-Wilk test)
A nem-paraméteres próbák nem tételezik föl a normális eloszlást.
rang-módszerek
kétmintás t-próbaWilcoxon-Mann-Whitney páros t -próba Wilcoxon signed rank
rang-korrreláció
egy faktor szerinti ANOVA Kruskal-Wallis véletlen blokk Friedman
kontingencia-táblázatok
két arány összehasonlítása homogenitás matched pairs függetlenség, McNemar Fisher egzakt próbája
Néhány figyelmeztető megjegyzés:
• ha az adatok ténylegesen normális eloszlásúak, a nem-
paraméteres próbák statisztikai ereje kisebb (könnyebben elfogadják a nullhipotézist, amikor pedig az nem igaz) ha lehet (normális eloszlású adatokra) a paraméteres
próbákat célszerű alkalmazni;
• a nemparaméteres próbák nem feltételezik a normális eloszlást, de más, elég szigorú feltételeket támasztanak (pl.
függetlenség, a két összehasonlítandó minta azonos alakú eloszlásból származzék), ha ezek nem teljesülnek, a nem-
Néhány figyelmeztető megjegyzés (folytatás):
• ha a próba eredménye szignifikáns (a nullhipotézist elutasítjuk), az is lehetséges, hogy a nullhipotézis
(pl. a várható értékek egyenlősége) igaz, de a feltételezések nem teljesülnek;
Legyen n1 és n2 két módszerre adott és mellett szükséges mintaelemszám (pl. 1 a paraméteres, 2 a nem-paraméteres).
A második módszernek az elsőre (a nem-paraméteresnek a paraméteresre) vonatkoztatott relatív hatásossága az n1 és n2 aránya. Ha n2>n1, az első módszer hatásosabb.
Asymptotic Relative Efficiency :
Asymptotic Relative Efficiency
Két független minta összehasonlítása: a Wilcoxon-Mann-Whitney próba
Két független minta összehasonlítása: a Wilcoxon-Mann-Whitney próba
1. példa
Conover, W.J.: Practical nonparametric statistics, J. Wiley, 3rd ed. 1999, p. 101 nyomán
Felmérést végeztek, hogy azok a gyerekek, akik óvodába jártak, eredményesebbek-e az iskolában. 12 gyerek eredményeit nézték, közülük 4 volt óvodás. ovoda.xls
Sorba rendezik a gyerekeket az átlageredmények szerint (1. a legalacsonyabb, 12. a legmagasabb)
a kétmintás t-próba nemparaméteres megfelelője
H0: a 4 óvodát járt rangszáma véletlen minta az 1-12 közül H1: a 4 óvodát járt rangszámai magasabbak (jobbak)
próbastatisztika: az óvodát jártak W rang-összege Wmin: 10 (1, 2, 3, 4)
Wmax: 42 (9, 10, 11, 12)
9 495 10
11 12 12
konfiguráció
4 495 3
2 1
9 10 11 12 4
12
Aktuálisan az óvodát jártak rangszámai:
4,7,8,11 W=30
W 37 H0
0.036P
W 36 H0
0.057P
kismintás eljárás döntés?
Statistics>Nonparametrics>Comparing two independent samples>
Mann-Whitney
n W n n
n
U
2
1 1
2 1 1
12 2 30
5 8 4
4
U
Mann-Whitney U Test (OVODA) By variable jarte
Marked tests are significant at p <.05000 variable
Rank Sum i
Rank Sum n
UZp-valueZ
adjusted
p-valueValid N i
Valid N n
2*1sided exact p
atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697
Közelítés normális eloszlással (nagymintás eljárás)
) (
) (
W Var
W E u W
2
) 1 ) (
( 0 1 1 2
n n n H
W E
12
) 1 ) (
( 0 n1 n1 n2 n2 H
W
Var
2 26
) 1 8 4 ( ) 4
H
( 0
W
E
67 . 12 34
8 ) 1 8 4 ( ) 4
H
( 0
W
Var
12
1 2
1
2 1
1
0
n n N N W n
u 0.6794
67 . 34
26 30
0
u
0.6794
0.248 P u p
ha W nagy (az óvodások jobbak), fölső határ
Mann-Whitney U Test (OVODA) By variable jarte
Marked tests are significant at p <.05000 variable
Rank Sum i
Rank Sum n
UZp-valueZ
adjusted
p-valueValid N i
Valid N n
2*1sided exact p
atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697
0.0 0.1 0.2 0.3
0 1 2 3 4 5 6 7 8 9 10
0.0 0.1 0.2 0.3
0 1 2 3 4 5 6 7 8 9 10
0.0 0.1 0.2 0.3
-2 0 2 4 6 8 10 12
x b 7 x < b 7
x=b=7
Folytonossági korrekció (Continuity correction)
u u0
P
p
0.0 0.1 0.2 0.3
-2 0 2 4 6 8 10 12
0.5944
0.2761 P u
p egyoldali
Mann-Whitney U Test (OVODA) By variable jarte
Marked tests are significant at p <.05000 variable
Rank Sum i
Rank Sum n
UZp-levelZ
adjusted
p-levelValid N i
Valid N n
2*1sided exact p
5944 .
67 0 . 34
5 . 0 26 6794 30
. 67 0
. 34
26 30
0
0
u
u
Kapcsolt rangok (ties)
2. példa
J. Krauth: Distribution-free statistics, An application-oriented approach, Elsevier, 1988, p. 50
Pszichiátriai betegeket lítium-készítménnyel való kezelésének hatásosságát vizsgálták. A függő változó a páciensek
önértékelése a depressziós skálán (VAS: Visual Analogue Score, nagy érték súlyosabb). litium.sta
Kismintás eljárás
A rangok és rangszám-összegek számítása a két csoportban:
6
Ha a rangszámokat véletlenszerűen osztanánk ki:
H0: a kezeltek eredményei nem jobbak a nem kezeltekénél H1: a kezeltek eredményei jobbak
15 . 20 0
3
p
Statistics>Nonparametrics>Comparing two independent samples>
Mann-Whitney
adjusted=adjusted for ties
Mann-Whitney U Test (LITIUM.STA) By variable treate
Marked tests are significant at p <.05000 variable
Rank Sum T
Rank Sum C
UZp-valueZ
adjusted
p-valueValid N T
Valid N C
2*1sided exact p
VAS7.50000013.500001.500000-1.091090.275234-1.107020.2682873 30.200000
Mann-Whitney U Test (litium) By variable treate
Marked tests are significant at p <.05000 variable
Rank Sum T
Rank Sum C
U Z p-levelZ
adjusted
p-levelValid N T
Valid N C
2*1sided exact p
VAS
vasm1 vasm2 vasm3
7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000
1
treate 2
VAS 3
vasm1 4
vasm2 5
vasm3 1
2 3 4 5 6
T 7 9 1 9
T 10 10 2 10 T 11 11 3 11 C 10 10 12 12 C 15 15 13 13 C 12 12 14 14
3. példa
Box-Hunter-Hunter: Statistics for Experimenters, J. Wiley, 1978, p. 97
Kétféle anyagból készült cipőtalp kopása (két független mintaként kezelve)
fiucipo.sta
Statistics>Nonparametrics>Comparing two independent samples>
>Mann-Whitney
Mann-Whitney U Test (Spreadsheet2) By variable Code
Marked tests are significant at p <.05000 variable
Rank Sum TALPA
Rank Sum TALPB
U Zp-levelZ
adjusted
p-levelValid N TALPA
Valid N TALPB
2*1sided exact p
Value97.50000112.500042.50000-0.5669470.570751-0.5671600.57060610100.578742
T-test for Independent Samples (Fiucipo)
Feltételek
1. A két minta véletlen minta a két sokaságból 2. A két minta független
3. Legalább sorrendi skálán mért változókról van szó
G
F
:
H0 P
x y
P
x y
G
F :
H1 P
x y
P
x y
x többnyire kisebb y-nál
G
F
:
H0 P
x y
P
x y
G
F :
H1 P
x y
P
x y
A hipotézisek természete
x
y
F ()
G ()
x többnyire kisebb y-nál
G
F
: H0
G
F :
H1
csak akkor, ha
4. A két minta mögött álló két sokaság eloszlása azonos alakú, vagyis amennyiben a két eloszlásfüggvény különböző, a
különbség helyzeti
x E
yE :
H0
x E
yE :
H1
A hipotézisek természete
- 5 0 5 1 0 1 5 2 0 2 5 0 .0 0
0 .0 2 0 .0 4 0 .0 6 0 .0 8 0 .1 0 0 .1 2 0 .1 4 0 .1 6 0 .1 8 0 .2 0 0 .2 2 0 .2 4
y x
3~ 2 x
36
~ 2 y
x E
y 3E
x y
P
x y
P
de
4. példa
R. Hoerl, R. Snee: Statistical thinking, Duxbury, 2002 nyomán
Vevői elégedettség összehasonlítása 2 szállodában 150 – 150 kérdőív alapján
Mann-Whitney U Test (Hotel) By variable Hotel
Marked tests are significant at p <.05000 variable
Rank Sum Hotel1
Rank Sum Hotel2
U Zp-levelZ
adjusted
p-levelValid N Hotel1
Valid N Hotel2 score19905.5025244.508580.500-3.553420.000380-3.791160.000150150150
Párokon belüli összehasonlítás: Wilcoxon előjeles rang próbája (signed rank test) Párokon belüli összehasonlítás: Wilcoxon
előjeles rang próbája (signed rank test)
a páros t–próba megfelelője 5. példa
wear
9 11 13 15
0 0 :
H e
0
i
i x
d
1 0 d i
Ri
W
Ri
) (
) (
W Var
W E z W
i i i
i
R R
z0 2
A nullhipotézis:
rangsoroljuk a különbségeket kis mintára a próbastatisztika
előjeles rang
feltételezi a d szimmetrikus eloszlását, legalább intervallum-skála (medián)
nagy mintára
i
Ri
W
boy material A material B B – A
difference d Ri Ri 1 13.2
(L) 14.0(R) 0.8 9 9 2 8.2(L) 8.8(R) 0.6 8 8 3 10.9(R) 11.2(L) 0.3 4 4 4 14.3(L) 14.2(R) -0.1 1 -1 5 10.7(R) 11.8(L) 1.1 10 10 6 6.6(L) 6.4(R) -0.2 2 -2 7 9.5(L) 9.8(R) 0.3 4 4 8 10.8(L) 11.3(R) 0.5 6.5 6.5 9 8.8(R) 9.3(L) 0.5 6.5 6.5 10 13.3(L) 13.6(R) 0.3 4 4
average difference 0.41
Rfiucipo.sta
Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test
Párokon belüli összehasonlítás: előjel- próba (sign test)
Párokon belüli összehasonlítás: előjel- próba (sign test)
Arbuthnott (1710)
82 év születési adatai: mind a 82 évben több fiú született, mint lány. Hihető-e ennek ellenére, hogy ugyanolyan
valószínűséggel születik fiú, mint lány?
H0: pfiú=0.5
82
Fiúcipő:
x=A-B +: 2 -: 8 H0: p+=0.5
0 0 10 1 9 0.520.58
2 5 10
. 0 5 . 1 0
5 10 . 0 5 . 0 0
H 10 2 k
P
p
0.0547
Páros t-próbánál P
t0 3.4
0.004 (erősebb)(egyoldali)
k 2 vagy k 8H0
20.0547 0.11P (kétoldali)
6. példa
Statistics>Nonparametrics>Comparing two dependent samples (variables)>Sign test
Összehasonlítás egy előírt értékkel:
Wilcoxon előjeles rang próbája (signed rank test)
Összehasonlítás egy előírt értékkel:
Wilcoxon előjeles rang próbája (signed rank test)
az egymintás t–próba megfelelője
7. példa H0 : E
x xrefxref=6.0 (standard) gagebias.xls
Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test
Rang-korreláció Rang-korreláció
x és y (kétváltozós minta), legalább intervallum-skálán A Pearson-féle korrelációs együttható
i i
i i
i
i i
x x
y y
x x
y y
r 2 2
Csak kétváltozós normális eloszlásra
„Közönséges korreláció”
i i
i i
i
i i
x R x
R y
R y
R
x R x
R y R y
R
2
2
x és y (kétváltozós minta), legalább sorrendi skálán
Spearman-féle rang-korrelációs együttható (Pearson rangokra)
Rang-korreláció
i i
i i
i
i i
x N N R
y R
x N N R
y R
2 2
2 1 2
1
2 1 2
1
i i
i i
i
i i
x x y
y
x x y y
r 2 2
8. példa
S. Siegel: Nonparametric statistics for the behavioral sciences, McGraw-Hill, 1956, p. 204
A vizsgált személyek autoritárius hajlamát és a társadalmi beilleszkedésre való törekvésük mértékét pontozták. A kérdés az, hogy van-e a két jellemző között összefüggés. Striving.sta
Correlation between autoritarianism and social status striving 1
AUTHORIT 2
STRIVING 1
2 3 4 5 6 7
82 42 98 46 87 39 40 37 116 65 113 88 111 86
Spearman Rank Order Correlations (Striving) MD pairwise deleted
Marked correlations are significant at p <.05000 VariableAUTHORITSTRIVING
AUTHORIT STRIVING
1.0000000.818182 0.8181821.000000