NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK

(1)

NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK

A leggyakrabban használt próbák (pl. a t-próbák) feltételezik a normális eloszlást.

Sokszor ez nem teljesül.

Következmény: az első ill. másodfajú hiba-valószínűsége eltér a deklarálttól (Pl. azt hisszük, hogy p=0.01, tehát szignifikáns a különbség, pedig helyesen számolva p=0.2 lenne, tehát nem szignifikáns a különbség.

(2)

Sokszor az adatok természete már nyilvánvalóvá teszi:

• a selejtarány binomiális vagy Poisson-eloszlású,

• őrlésnél a szemcseméret lognormális eloszlású Máskor csak az eloszlás vizsgálatával derül ki

• hisztogram

• normalitásvizsgálat (pl. Shapiro-Wilk test)

A nem-paraméteres próbák nem tételezik föl a normális eloszlást.

(3)

rang-módszerek

kétmintás t-próbaWilcoxon-Mann-Whitney páros t -próba Wilcoxon signed rank

rang-korrreláció

egy faktor szerinti ANOVA Kruskal-Wallis véletlen blokk Friedman

kontingencia-táblázatok

két arány összehasonlítása  homogenitás matched pairs függetlenség, McNemar Fisher egzakt próbája

(4)

Néhány figyelmeztető megjegyzés:

• ha az adatok ténylegesen normális eloszlásúak, a nem-

paraméteres próbák statisztikai ereje kisebb (könnyebben elfogadják a nullhipotézist, amikor pedig az nem igaz)  ha lehet (normális eloszlású adatokra) a paraméteres

próbákat célszerű alkalmazni;

• a nemparaméteres próbák nem feltételezik a normális eloszlást, de más, elég szigorú feltételeket támasztanak (pl.

függetlenség, a két összehasonlítandó minta azonos alakú eloszlásból származzék), ha ezek nem teljesülnek, a nem-

(5)

Néhány figyelmeztető megjegyzés (folytatás):

• ha a próba eredménye szignifikáns (a nullhipotézist elutasítjuk), az is lehetséges, hogy a nullhipotézis

(pl. a várható értékek egyenlősége) igaz, de a feltételezések nem teljesülnek;

(6)

Legyen n₁ és n₂ két módszerre adott  és  mellett szükséges mintaelemszám (pl. 1 a paraméteres, 2 a nem-paraméteres).

A második módszernek az elsőre (a nem-paraméteresnek a paraméteresre) vonatkoztatott relatív hatásossága az n₁ és n₂ aránya. Ha n₂>n₁, az első módszer hatásosabb.

Asymptotic Relative Efficiency :

Asymptotic Relative Efficiency

(7)

Két független minta összehasonlítása: a Wilcoxon-Mann-Whitney próba

1. példa

Conover, W.J.: Practical nonparametric statistics, J. Wiley, 3rd ed. 1999, p. 101 nyomán

Felmérést végeztek, hogy azok a gyerekek, akik óvodába jártak, eredményesebbek-e az iskolában. 12 gyerek eredményeit nézték, közülük 4 volt óvodás. ovoda.xls

Sorba rendezik a gyerekeket az átlageredmények szerint (1. a legalacsonyabb, 12. a legmagasabb)

a kétmintás t-próba nemparaméteres megfelelője

(8)

H₀: a 4 óvodát járt rangszáma véletlen minta az 1-12 közül H₁: a 4 óvodát járt rangszámai magasabbak (jobbak)

próbastatisztika: az óvodát jártak W rang-összege W_min: 10 (1, 2, 3, 4)

W_max: 42 (9, 10, 11, 12)

9 495 10

11 12 12

 



 





konfiguráció

(9)

4 495 3

2 1

9 10 11 12 4

12 



 



 





Aktuálisan az óvodát jártak rangszámai:

4,7,8,11 W=30



^W ^ ³⁷ ^H₀



^ ⁰^.⁰³⁶

P



^W ^ ³⁶ ^H₀



^ ⁰^.⁰⁵⁷

P

kismintás eljárás döntés?

(10)

Statistics>Nonparametrics>Comparing two independent samples>

Mann-Whitney

 

n W n n

n

U  



 2

1 1

2 1 1

12 2 30

5 8 4

4   





 U

Mann-Whitney U Test (OVODA) By variable jarte

Marked tests are significant at p <.05000 variable

Rank Sum i

Rank Sum n

UZp-valueZ

adjusted

p-valueValid N i

Valid N n

2*1sided exact p

atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697

(11)

Közelítés normális eloszlással (nagymintás eljárás)

) (

W Var

W E u W 

 2

) 1 ) (

( ₀ ¹  ¹  ² 

 n n n H

W E

12

) 1 ) (

( ₀ n¹ n¹ n² n² H

W

Var    



2 26

) 1 8 4 ( ) 4

H

( ₀    

 W

E

67 . 12 34

8 ) 1 8 4 ( ) 4

H

( ₀     

 W

Var

(12)

 

12

1 2

1

2 1

1

0 

 

 n n N N W n

u 0.6794

67 . 34

26 30

0  

 u



^ ⁰^.⁶⁷⁹⁴



^ ⁰^.²⁴⁸

 P u p

ha W nagy (az óvodások jobbak), fölső határ

Rank Sum i

Rank Sum n

UZp-valueZ

adjusted

p-valueValid N i

Valid N n

2*1sided exact p

atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697

(13)

0.0 0.1 0.2 0.3

0 1 2 3 4 5 6 7 8 9 10

0.0 0.1 0.2 0.3

0 1 2 3 4 5 6 7 8 9 10

0.0 0.1 0.2 0.3

-2 0 2 4 6 8 10 12

x  b  7 x < b  7

x=b=7

Folytonossági korrekció (Continuity correction)

(14)



^u ^u₀



P

p  

0.0 0.1 0.2 0.3

-2 0 2 4 6 8 10 12



^ ⁰^.⁵⁹⁴⁴



^ ⁰^.²⁷⁶¹

 P u

p egyoldali

Rank Sum i

Rank Sum n

UZp-levelZ

adjusted

p-levelValid N i

Valid N n

2*1sided exact p

5944 .

67 0 . 34

5 . 0 26 6794 30

. 67 0

. 34

26 30

0

0   





 

 u

u

(15)

Kapcsolt rangok (ties)

2. példa

J. Krauth: Distribution-free statistics, An application-oriented approach, Elsevier, 1988, p. 50

Pszichiátriai betegeket lítium-készítménnyel való kezelésének hatásosságát vizsgálták. A függő változó a páciensek

önértékelése a depressziós skálán (VAS: Visual Analogue Score, nagy érték súlyosabb). litium.sta

(16)

Kismintás eljárás

A rangok és rangszám-összegek számítása a két csoportban:

6



Ha a rangszámokat véletlenszerűen osztanánk ki:

H₀: a kezeltek eredményei nem jobbak a nem kezeltekénél H₁: a kezeltek eredményei jobbak

(17)

15 . 20 0

3 

 p

(18)

Mann-Whitney

adjusted=adjusted for ties

Mann-Whitney U Test (LITIUM.STA) By variable treate

Rank Sum T

Rank Sum C

UZp-valueZ

adjusted

p-valueValid N T

Valid N C

2*1sided exact p

VAS7.50000013.500001.500000-1.091090.275234-1.107020.2682873 30.200000

(19)

Mann-Whitney U Test (litium) By variable treate

Rank Sum T

Rank Sum C

U Z p-levelZ

adjusted

p-levelValid N T

Valid N C

2*1sided exact p

VAS

vasm1 vasm2 vasm3

7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000

1

treate 2

VAS 3

vasm1 4

vasm2 5

vasm3 1

2 3 4 5 6

T 7 9 1 9

T 10 10 2 10 T 11 11 3 11 C 10 10 12 12 C 15 15 13 13 C 12 12 14 14

(20)

3. példa

Box-Hunter-Hunter: Statistics for Experimenters, J. Wiley, 1978, p. 97

Kétféle anyagból készült cipőtalp kopása (két független mintaként kezelve)

fiucipo.sta

>Mann-Whitney

Mann-Whitney U Test (Spreadsheet2) By variable Code

Rank Sum TALPA

Rank Sum TALPB

U Zp-levelZ

adjusted

p-levelValid N TALPA

Valid N TALPB

2*1sided exact p

Value97.50000112.500042.50000-0.5669470.570751-0.5671600.57060610100.578742

T-test for Independent Samples (Fiucipo)

(21)

Feltételek

1. A két minta véletlen minta a két sokaságból 2. A két minta független

3. Legalább sorrendi skálán mért változókról van szó

 

 G

 



F 

:

H₀ ^P



^x ^ ^y



^ ^P



^x ^ ^y



 

^ ^G

 

^

F  :

H₁ ^P



^x ^ ^y



^ ^P



^x ^ ^y



x többnyire kisebb y-nál

(22)

 

 G

 



F 

:

H₀ ^P



^x ^ ^y



^ ^P



^x ^ ^y



 

^ ^G

 

^

F  :

H₁ ^P



^x ^ ^y



^ ^P



^x ^ ^y



A hipotézisek természete

x

y

F ()

G ()

   

x többnyire kisebb y-nál

(23)

 

 G

 



F 

: H₀

 

^ ^G

 

^

F  :

H₁

csak akkor, ha

4. A két minta mögött álló két sokaság eloszlása azonos alakú, vagyis amennyiben a két eloszlásfüggvény különböző, a

különbség helyzeti

 

^x ^E

 

^y

E  :

H₀

 

^x ^E

 

^y

E  :

H₁

A hipotézisek természete

(24)

- 5 0 5 1 0 1 5 2 0 2 5 0 .0 0

0 .0 2 0 .0 4 0 .0 6 0 .0 8 0 .1 0 0 .1 2 0 .1 4 0 .1 6 0 .1 8 0 .2 0 0 .2 2 0 .2 4

y x

 

³

~ ² x

 

³

6

~  ² y

 

^x ^ ^E

 

^y ^ ³

E



^x ^y



^P



^x ^y



P   

de

(25)

4. példa

R. Hoerl, R. Snee: Statistical thinking, Duxbury, 2002 nyomán

Vevői elégedettség összehasonlítása 2 szállodában 150 – 150 kérdőív alapján

Mann-Whitney U Test (Hotel) By variable Hotel

Rank Sum Hotel1

Rank Sum Hotel2

U Zp-levelZ

adjusted

p-levelValid N Hotel1

Valid N Hotel2 score19905.5025244.508580.500-3.553420.000380-3.791160.000150150150

(26)

Párokon belüli összehasonlítás: Wilcoxon előjeles rang próbája (signed rank test) Párokon belüli összehasonlítás: Wilcoxon

előjeles rang próbája (signed rank test)

a páros t–próba megfelelője 5. példa

wear

9 11 13 15

(27)

0 0 :

H _e  

0



 _i

i x

d







 



1 0 d i

Ri

W

Ri

) (

W Var

W E z W 









i i i

i

R R

z0 2

A nullhipotézis:

rangsoroljuk a különbségeket kis mintára a próbastatisztika

előjeles rang

feltételezi a d szimmetrikus eloszlását, legalább intervallum-skála (medián)

nagy mintára ^



^

i

Ri

W

(28)

boy material A material B B – A

difference d Ri R_i 1 13.2

(L) 14.0(R) 0.8 9 9 2 8.2(L) 8.8(R) 0.6 8 8 3 10.9(R) 11.2(L) 0.3 4 4 4 14.3(L) 14.2(R) -0.1 1 -1 5 10.7(R) 11.8(L) 1.1 10 10 6 6.6(L) 6.4(R) -0.2 2 -2 7 9.5(L) 9.8(R) 0.3 4 4 8 10.8(L) 11.3(R) 0.5 6.5 6.5 9 8.8(R) 9.3(L) 0.5 6.5 6.5 10 13.3(L) 13.6(R) 0.3 4 4

average difference 0.41



^R

(29)

fiucipo.sta

Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test

(30)

Párokon belüli összehasonlítás: előjel- próba (sign test)

Arbuthnott (1710)

82 év születési adatai: mind a 82 évben több fiú született, mint lány. Hihető-e ennek ellenére, hogy ugyanolyan

valószínűséggel születik fiú, mint lány?

H₀: p_fiú=0.5



82

(31)

Fiúcipő:

x=A-B +: 2 -: 8 H₀: p₊=0.5

 

_^ ^



 



 





 









 



 

 ₀ ⁰ ¹⁰ ¹ ⁹ 0.5²0.5⁸

2 5 10

. 0 5 . 1 0

5 10 . 0 5 . 0 0

H 10 2 k

P

 p

 0.0547

Páros t-próbánál ^P



^t₀ ^ ³^.⁴



^ ⁰^.⁰⁰⁴ _(erősebb)

(egyoldali)



^k ^ ² ^vagy ^k ^ ⁸^H₀



^ ²^⁰^.⁰⁵⁴⁷ ^ ⁰^.¹¹

P (kétoldali)

(32)

6. példa

Statistics>Nonparametrics>Comparing two dependent samples (variables)>Sign test

(33)

Összehasonlítás egy előírt értékkel:

Wilcoxon előjeles rang próbája (signed rank test)

Összehasonlítás egy előírt értékkel:

Wilcoxon előjeles rang próbája (signed rank test)

az egymintás t–próba megfelelője

7. példa ^H₀ ^: ^E

 

^x ^ ^x_ref

x_ref=6.0 (standard) gagebias.xls

Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test

(34)

Rang-korreláció Rang-korreláció

x és y (kétváltozós minta), legalább intervallum-skálán A Pearson-féle korrelációs együttható

  

   

 







i i

i

i i

x x

y y

x x

y y

r 2 2

Csak kétváltozós normális eloszlásra

„Közönséges korreláció”

(35)

   

   ^{   } 

   



^

  ^{   }

^



^





 



i i

i

i i

x R x

R y

R

x R x

R y R y

R

2

 2

x és y (kétváltozós minta), legalább sorrendi skálán

Spearman-féle rang-korrelációs együttható (Pearson rangokra)

Rang-korreláció

   

 





 



  



 

 

 

 





i i

i

i i

x N N R

y R

x N N R

y R

2 2

2 1 2

1

2 1 2

1

  

   

 







i i

i

i i

x x y

y

x x y y

r 2 2

(36)

8. példa

S. Siegel: Nonparametric statistics for the behavioral sciences, McGraw-Hill, 1956, p. 204

A vizsgált személyek autoritárius hajlamát és a társadalmi beilleszkedésre való törekvésük mértékét pontozták. A kérdés az, hogy van-e a két jellemző között összefüggés. Striving.sta

Correlation between autoritarianism and social status striving 1

AUTHORIT 2

STRIVING 1

2 3 4 5 6 7

82 42 98 46 87 39 40 37 116 65 113 88 111 86

Spearman Rank Order Correlations (Striving) MD pairwise deleted

Marked correlations are significant at p <.05000 VariableAUTHORITSTRIVING

AUTHORIT STRIVING

1.0000000.818182 0.8181821.000000