• Nem Talált Eredményt

NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK

N/A
N/A
Protected

Academic year: 2022

Ossza meg "NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK"

Copied!
36
0
0

Teljes szövegt

(1)

NEMPARAMÉTERES PRÓBÁK NEMPARAMÉTERES PRÓBÁK

A leggyakrabban használt próbák (pl. a t-próbák) feltételezik a normális eloszlást.

Sokszor ez nem teljesül.

Következmény: az első ill. másodfajú hiba-valószínűsége eltér a deklarálttól (Pl. azt hisszük, hogy p=0.01, tehát szignifikáns a különbség, pedig helyesen számolva p=0.2 lenne, tehát nem szignifikáns a különbség.

(2)

Sokszor az adatok természete már nyilvánvalóvá teszi:

• a selejtarány binomiális vagy Poisson-eloszlású,

• őrlésnél a szemcseméret lognormális eloszlású Máskor csak az eloszlás vizsgálatával derül ki

• hisztogram

• normalitásvizsgálat (pl. Shapiro-Wilk test)

A nem-paraméteres próbák nem tételezik föl a normális eloszlást.

(3)

rang-módszerek

kétmintás t-próbaWilcoxon-Mann-Whitney páros t -próba Wilcoxon signed rank

rang-korrreláció

egy faktor szerinti ANOVA Kruskal-Wallis véletlen blokk Friedman

kontingencia-táblázatok

két arány összehasonlítása  homogenitás matched pairs függetlenség, McNemar Fisher egzakt próbája

(4)

Néhány figyelmeztető megjegyzés:

• ha az adatok ténylegesen normális eloszlásúak, a nem-

paraméteres próbák statisztikai ereje kisebb (könnyebben elfogadják a nullhipotézist, amikor pedig az nem igaz)  ha lehet (normális eloszlású adatokra) a paraméteres

próbákat célszerű alkalmazni;

• a nemparaméteres próbák nem feltételezik a normális eloszlást, de más, elég szigorú feltételeket támasztanak (pl.

függetlenség, a két összehasonlítandó minta azonos alakú eloszlásból származzék), ha ezek nem teljesülnek, a nem-

(5)

Néhány figyelmeztető megjegyzés (folytatás):

• ha a próba eredménye szignifikáns (a nullhipotézist elutasítjuk), az is lehetséges, hogy a nullhipotézis

(pl. a várható értékek egyenlősége) igaz, de a feltételezések nem teljesülnek;

(6)

Legyen n1 és n2 két módszerre adott  és  mellett szükséges mintaelemszám (pl. 1 a paraméteres, 2 a nem-paraméteres).

A második módszernek az elsőre (a nem-paraméteresnek a paraméteresre) vonatkoztatott relatív hatásossága az n1 és n2 aránya. Ha n2>n1, az első módszer hatásosabb.

Asymptotic Relative Efficiency :

Asymptotic Relative Efficiency

(7)

Két független minta összehasonlítása: a Wilcoxon-Mann-Whitney próba

Két független minta összehasonlítása: a Wilcoxon-Mann-Whitney próba

1. példa

Conover, W.J.: Practical nonparametric statistics, J. Wiley, 3rd ed. 1999, p. 101 nyomán

Felmérést végeztek, hogy azok a gyerekek, akik óvodába jártak, eredményesebbek-e az iskolában. 12 gyerek eredményeit nézték, közülük 4 volt óvodás. ovoda.xls

Sorba rendezik a gyerekeket az átlageredmények szerint (1. a legalacsonyabb, 12. a legmagasabb)

a kétmintás t-próba nemparaméteres megfelelője

(8)

H0: a 4 óvodát járt rangszáma véletlen minta az 1-12 közül H1: a 4 óvodát járt rangszámai magasabbak (jobbak)

próbastatisztika: az óvodát jártak W rang-összege Wmin: 10 (1, 2, 3, 4)

Wmax: 42 (9, 10, 11, 12)

9 495 10

11 12 12

 

 





konfiguráció

(9)

4 495 3

2 1

9 10 11 12 4

12 

 



 

Aktuálisan az óvodát jártak rangszámai:

4,7,8,11 W=30

W 37 H0

0.036

P

W 36 H0

0.057

P

kismintás eljárás döntés?

(10)

Statistics>Nonparametrics>Comparing two independent samples>

Mann-Whitney

 

n W n n

n

U  

 2

1 1

2 1 1

12 2 30

5 8 4

4   

U

Mann-Whitney U Test (OVODA) By variable jarte

Marked tests are significant at p <.05000 variable

Rank Sum i

Rank Sum n

UZp-valueZ

adjusted

p-valueValid N i

Valid N n

2*1sided exact p

atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697

(11)

Közelítés normális eloszlással (nagymintás eljárás)

) (

) (

W Var

W E u W

 2

) 1 ) (

( 0 112

n n n H

W E

12

) 1 ) (

( 0 n1 n1 n2 n2 H

W

Var    

2 26

) 1 8 4 ( ) 4

H

( 0    

W

E

67 . 12 34

8 ) 1 8 4 ( ) 4

H

( 0     

W

Var

(12)

 

 

12

1 2

1

2 1

1

0

 

n n N N W n

u 0.6794

67 . 34

26 30

0  

u

0.6794

0.248

P u p

ha W nagy (az óvodások jobbak), fölső határ

Mann-Whitney U Test (OVODA) By variable jarte

Marked tests are significant at p <.05000 variable

Rank Sum i

Rank Sum n

UZp-valueZ

adjusted

p-valueValid N i

Valid N n

2*1sided exact p

atlag30.0000048.0000012.000000.5944450.5522150.5944450.5522154 80.569697

(13)

0.0 0.1 0.2 0.3

0 1 2 3 4 5 6 7 8 9 10

0.0 0.1 0.2 0.3

0 1 2 3 4 5 6 7 8 9 10

0.0 0.1 0.2 0.3

-2 0 2 4 6 8 10 12

x  b  7 x < b  7

x=b=7

Folytonossági korrekció (Continuity correction)

(14)

u u0

P

p  

0.0 0.1 0.2 0.3

-2 0 2 4 6 8 10 12

0.5944

0.2761

P u

p egyoldali

Mann-Whitney U Test (OVODA) By variable jarte

Marked tests are significant at p <.05000 variable

Rank Sum i

Rank Sum n

UZp-levelZ

adjusted

p-levelValid N i

Valid N n

2*1sided exact p

5944 .

67 0 . 34

5 . 0 26 6794 30

. 67 0

. 34

26 30

0

0   

 

u

u

(15)

Kapcsolt rangok (ties)

2. példa

J. Krauth: Distribution-free statistics, An application-oriented approach, Elsevier, 1988, p. 50

Pszichiátriai betegeket lítium-készítménnyel való kezelésének hatásosságát vizsgálták. A függő változó a páciensek

önértékelése a depressziós skálán (VAS: Visual Analogue Score, nagy érték súlyosabb). litium.sta

(16)

Kismintás eljárás

A rangok és rangszám-összegek számítása a két csoportban:

6

Ha a rangszámokat véletlenszerűen osztanánk ki:

H0: a kezeltek eredményei nem jobbak a nem kezeltekénél H1: a kezeltek eredményei jobbak

(17)

15 . 20 0

3 

p

(18)

Statistics>Nonparametrics>Comparing two independent samples>

Mann-Whitney

adjusted=adjusted for ties

Mann-Whitney U Test (LITIUM.STA) By variable treate

Marked tests are significant at p <.05000 variable

Rank Sum T

Rank Sum C

UZp-valueZ

adjusted

p-valueValid N T

Valid N C

2*1sided exact p

VAS7.50000013.500001.500000-1.091090.275234-1.107020.2682873 30.200000

(19)

Mann-Whitney U Test (litium) By variable treate

Marked tests are significant at p <.05000 variable

Rank Sum T

Rank Sum C

U Z p-levelZ

adjusted

p-levelValid N T

Valid N C

2*1sided exact p

VAS

vasm1 vasm2 vasm3

7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 7.50000013.500001.500000-1.309310.190431-1.328420.1840403 30.200000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000 6.00000015.000000.000000-1.963960.049535-1.963960.0495353 30.100000

1

treate 2

VAS 3

vasm1 4

vasm2 5

vasm3 1

2 3 4 5 6

T 7 9 1 9

T 10 10 2 10 T 11 11 3 11 C 10 10 12 12 C 15 15 13 13 C 12 12 14 14

(20)

3. példa

Box-Hunter-Hunter: Statistics for Experimenters, J. Wiley, 1978, p. 97

Kétféle anyagból készült cipőtalp kopása (két független mintaként kezelve)

fiucipo.sta

Statistics>Nonparametrics>Comparing two independent samples>

>Mann-Whitney

Mann-Whitney U Test (Spreadsheet2) By variable Code

Marked tests are significant at p <.05000 variable

Rank Sum TALPA

Rank Sum TALPB

U Zp-levelZ

adjusted

p-levelValid N TALPA

Valid N TALPB

2*1sided exact p

Value97.50000112.500042.50000-0.5669470.570751-0.5671600.57060610100.578742

T-test for Independent Samples (Fiucipo)

(21)

Feltételek

1. A két minta véletlen minta a két sokaságból 2. A két minta független

3. Legalább sorrendi skálán mért változókról van szó

 

G

 

F

:

H0 P

x y

P

x y

 

G

 

F  :

H1 P

x y

P

x y

x többnyire kisebb y-nál

(22)

 

G

 

F

:

H0 P

x y

P

x y

 

G

 

F  :

H1 P

x y

P

x y

A hipotézisek természete

x

y

F ()

G ()

   

x többnyire kisebb y-nál

(23)

 

G

 

F

: H0

 

G

 

F  :

H1

csak akkor, ha

4. A két minta mögött álló két sokaság eloszlása azonos alakú, vagyis amennyiben a két eloszlásfüggvény különböző, a

különbség helyzeti

 

x E

 

y

E  :

H0

 

x E

 

y

E  :

H1

A hipotézisek természete

(24)

- 5 0 5 1 0 1 5 2 0 2 5 0 .0 0

0 .0 2 0 .0 4 0 .0 6 0 .0 8 0 .1 0 0 .1 2 0 .1 4 0 .1 6 0 .1 8 0 .2 0 0 .2 2 0 .2 4

y x

 

3

~ 2 x

 

3

6

~  2 y

 

x E

 

y 3

E

x y

P

x y

P   

de

(25)

4. példa

R. Hoerl, R. Snee: Statistical thinking, Duxbury, 2002 nyomán

Vevői elégedettség összehasonlítása 2 szállodában 150 – 150 kérdőív alapján

Mann-Whitney U Test (Hotel) By variable Hotel

Marked tests are significant at p <.05000 variable

Rank Sum Hotel1

Rank Sum Hotel2

U Zp-levelZ

adjusted

p-levelValid N Hotel1

Valid N Hotel2 score19905.5025244.508580.500-3.553420.000380-3.791160.000150150150

(26)

Párokon belüli összehasonlítás: Wilcoxon előjeles rang próbája (signed rank test) Párokon belüli összehasonlítás: Wilcoxon

előjeles rang próbája (signed rank test)

a páros t–próba megfelelője 5. példa

wear

9 11 13 15

(27)

0 0 :

H e  

0

i

i x

d

 

1 0 d i

Ri

W

Ri

) (

) (

W Var

W E z W

i i i

i

R R

z0 2

A nullhipotézis:

rangsoroljuk a különbségeket kis mintára a próbastatisztika

előjeles rang

feltételezi a d szimmetrikus eloszlását, legalább intervallum-skála (medián)

nagy mintára

i

Ri

W

(28)

boy material A material B B A

difference d Ri Ri 1 13.2

(L) 14.0(R) 0.8 9 9 2 8.2(L) 8.8(R) 0.6 8 8 3 10.9(R) 11.2(L) 0.3 4 4 4 14.3(L) 14.2(R) -0.1 1 -1 5 10.7(R) 11.8(L) 1.1 10 10 6 6.6(L) 6.4(R) -0.2 2 -2 7 9.5(L) 9.8(R) 0.3 4 4 8 10.8(L) 11.3(R) 0.5 6.5 6.5 9 8.8(R) 9.3(L) 0.5 6.5 6.5 10 13.3(L) 13.6(R) 0.3 4 4

average difference 0.41

R

(29)

fiucipo.sta

Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test

(30)

Párokon belüli összehasonlítás: előjel- próba (sign test)

Párokon belüli összehasonlítás: előjel- próba (sign test)

Arbuthnott (1710)

82 év születési adatai: mind a 82 évben több fiú született, mint lány. Hihető-e ennek ellenére, hogy ugyanolyan

valószínűséggel születik fiú, mint lány?

H0: pfiú=0.5

82

(31)

Fiúcipő:

x=A-B +: 2 -: 8 H0: p+=0.5

 



 

 



 





 

 

0 0 10 1 9 0.520.58

2 5 10

. 0 5 . 1 0

5 10 . 0 5 . 0 0

H 10 2 k

P

p

 0.0547

Páros t-próbánál P

t0 3.4

0.004 (erősebb)

(egyoldali)

k 2 vagy k 8H0

20.0547 0.11

P (kétoldali)

(32)

6. példa

Statistics>Nonparametrics>Comparing two dependent samples (variables)>Sign test

(33)

Összehasonlítás egy előírt értékkel:

Wilcoxon előjeles rang próbája (signed rank test)

Összehasonlítás egy előírt értékkel:

Wilcoxon előjeles rang próbája (signed rank test)

az egymintás t–próba megfelelője

7. példa H0 : E

 

x xref

xref=6.0 (standard) gagebias.xls

Statistics>Nonparametrics>Comparing two dependent samples (variables)> Wilcoxon matched pairs test

(34)

Rang-korreláció Rang-korreláció

x és y (kétváltozós minta), legalább intervallum-skálán A Pearson-féle korrelációs együttható

  

   

 

i i

i i

i

i i

x x

y y

x x

y y

r 2 2

Csak kétváltozós normális eloszlásra

„Közönséges korreláció”

(35)

   

      

   

     

 

i i

i i

i

i i

x R x

R y

R y

R

x R x

R y R y

R

2

2

x és y (kétváltozós minta), legalább sorrendi skálán

Spearman-féle rang-korrelációs együttható (Pearson rangokra)

Rang-korreláció

   

   

 



 



  



 

 

 

 

i i

i i

i

i i

x N N R

y R

x N N R

y R

2 2

2 1 2

1

2 1 2

1

  

   

 

i i

i i

i

i i

x x y

y

x x y y

r 2 2

(36)

8. példa

S. Siegel: Nonparametric statistics for the behavioral sciences, McGraw-Hill, 1956, p. 204

A vizsgált személyek autoritárius hajlamát és a társadalmi beilleszkedésre való törekvésük mértékét pontozták. A kérdés az, hogy van-e a két jellemző között összefüggés. Striving.sta

Correlation between autoritarianism and social status striving 1

AUTHORIT 2

STRIVING 1

2 3 4 5 6 7

82 42 98 46 87 39 40 37 116 65 113 88 111 86

Spearman Rank Order Correlations (Striving) MD pairwise deleted

Marked correlations are significant at p <.05000 VariableAUTHORITSTRIVING

AUTHORIT STRIVING

1.0000000.818182 0.8181821.000000

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

For the comparison of ordinal data (LIPCOF degree, Oxford Scheme grade) and non-normally distrib- uted data (OSDI) the non-parametric Wilcoxon Signed Rank Test was used, meanwhile

Az igazságkeresés és igazságtevés egyéni szándéka és kollektív éthoszának ereje alighanem éppen az ember integratív, önazonosságra törekvő igényéből fakad, mely igény

repens infection blood samples were tested for circulating microfilariae by modified Knott’s method.. Mann-Whitney- Wilcoxon test and Fisher test were used for

H 4b Kísérlet utáni adatok t-próbája feladattípusok szerint felosztva *** Bizonyítást nyert H 5a Kísérlet előtti és utáni adatok közötti különbségek

Most importantly, Theorem 1 exposes a way to compute a signed distance func- tion of an offset surface defined by an SDF by merely subtracting the offset radius from the

statmin — a szűkebb értelemben vett statisztikai minőség, statöhg — a statisztikai összehasonlíthatósóg mértéke, strköhg — a strukturális összehasonlíthatósóg

A változók kiinduló halmazának megválasztása után arról is dönteni kell, hogy a többváltozós elemzési módszerek közül melyiket vagy melyeket célszerű felhasználni

Íráskészség különbözőségvizsgálat 2018: Wilcoxon-próba Az egyik legnagyobb különbség tehát a beszédkészség és az íráskészség feladatok értékelése között az,