ANOVA 11
Egy faktor szerinti ANOVA Egy faktor szerinti ANOVA
Több független mintánk van, elemszámuk
2 2 3 2 2 2 1 3
2
1, y ,y ,...,yr; s ,s ,s ,...,sr y
µr
µ µ
µ1= 2 = 3 =⋅ ⋅⋅=
0: H
pr
p p p1, 2, 3,..., Nevével ellentétben nem szórások, hanem átlagok összehasonlítására szolgál
1. példa
(Box-Hunter-Hunter: Statistics for Experimenters, J. Wiley, 1978, p.
165) Véralvadási idő(sec) négyféle diéta esetén
veralv.sta
Diéta
A B C D
62 63 68 56
60 67 66 62
63 71 71 60
59 64 67 61
65 68 63
66 68 64
63 59
4 3 2 1 0:
H µ =µ =µ =µ
ANOVA 33
Median 25%-75%
Non-Outlier Range Outliers Extremes
A B C D
DIET 54
56 58 60 62 64 66 68 70 72
CTIME
Ha nincs különbség a csoportok között, csak a véletlen ingadozás miatt térnek el egymástól az átlagok.
ˆ2y
σ kétféleképpen adható meg:
• ismétlések közötti eltérés
• átlagok közötti eltérés
2
sA és sR2 is σ2y körül ingadozik
ANOVA 55
Az i-edik csoporton belüli ingadozás varianciája
( )
s
y y
i p
ij i
j p
i
i
2
2 1
= 1
−
−
= ⋅
∑
( ) ( )
σ$y R
ij i
j i
i i
i i
i i i
s
y y
p r
s p p r
2 2
2
2 1
= =
−
− =
−
−
∑
⋅∑
∑
∑
∑
Az egyesített csoportokon belüli szórásnégyzet (ha σkonstans):
i p
j ij
i p
y y
∑
i⋅= =1
(a csoport-átlagtól való eltérések)
2 2 0
R A
s F = s
s F F s
R A >
= 22
0
( )
∑
∑∑
−
−
= ⋅
i i
i j
i ij
R p r
y y s
2 2
( )
1
1
2 2
−
−
=
∑
= ⋅ ⋅⋅
r y y p s
r
i
i i A
(within) (between)
ha a valóságban van különbség (H1)
f(F)
Fα F
α
ANOVA 77
ANOVA táblázat
Az eltérés forrása eltérés-négyzetösszeg szabadsági
fokszám szórás-négyzet F A hatása
(csoportok
közötti) SA p yi
(
i y)
i
=
∑
⋅ − ⋅⋅ 2 r-1 s SA r
A 2
= 1
− s s
A R 2 2
Ismétlések (csoportokon
belüli) SR
(
yij yi)
j i
=
∑ ∑
− ⋅ 2 pi ri
∑
− sR Sp rR i i
2 =
∑
−Teljes S
(
yij y)
j i 0
=
∑ ∑
− ⋅⋅ 2 pi i∑
−1S0ún. teljes négyzetösszeg. Az A faktor hatása jelentős (elutasítjuk a H0hipotézist), ha
sA2 / sR2 ≥ Fkrit
Az eltérés forrása
eltérés- -négyzetösszeg
szabadsági fok
szórásnégyzet F
A hatása (csoportok közötti)
( )
SA p yi y
i
=
∑
⋅ − ⋅⋅ 2 r-1 s SA r
2 A
= 1
− s s
A R 2 2
Ismétlések (csoportokon belüli)
( )
SR yij yi
j i
=
∑ ∑
− ⋅ 2 r(p-1)( )
s
SR
R r p
2
= 1
−
Teljes S
(
yij y)
j i 0
=
∑ ∑
− ⋅⋅ 2 rp-1Kiegyensúlyozott terv: p
1=p
2=...=p
r=p
ANOVA 99 Univariate Tests of Significance for CTIME (Veralv)
Sigma-restricted parameterization Effective hypothesis decomposition Effect
SS Degr. of Freedom
MS F p
Intercept DIET Error
92521.41 1 92521.41 16521.68 0.000000 228.00 3 76.00 13.57 0.000047
112.00 20 5.60
4 3 2 1 0:
H µ =µ =µ =µ
Descriptive Statistics (Veralv) Effect
Level of Factor
N CTIME Mean
CTIME Std.Dev.
CTIME Std.Err Total
DIET DIET DIET DIET
24 64.00000 3.844816 0.784820 A 4 61.00000 1.825742 0.912871 B 6 66.00000 2.828427 1.154701 C 6 68.00000 1.673320 0.683130 D 8 61.00000 2.618615 0.925820
between
within
i y
y p
ij
i σ
σˆ = ˆ
( )
∑
∑
−
−
=
i i i
i i
R p r
p s s
2 1
2
( )
s
p y y
A r
i i
i r
2
2 1
= 1
−
−
⋅ ⋅⋅
=
∑
Summary fülön: Descriptive cell statistics
Summary fülön: Test all effects
Feltételezések:
· az εij„hibák” várható értéke zérus,
·
·
·
varianciájuk
σ
e2, konstans
az εij„hibák” csoportokon belül és csoportok között is függetlenek egymástól,
az εij„hibák” normális eloszlásúak (nem az yijadatok!).
ij i
yij =µ +ε
ANOVA 1111
Modell
ij i ij i
ij Y
y = +ε =µ +ε
igazi érték várható érték mért érték
a faktor i-edik szintje (i-edik diéta) az i-edik csoporton belüli j-edik ismétlés kísérleti (nemcsak mérési) hiba
ij i
yij =µ +ε H0: µ1=µ2 =µ3 =⋅ ⋅⋅=µr
i
i µ α
µ = +
ij i
yij =µ+α +ε
átlag-modell αia faktor i-edik szintjének (i-edik diéta) hatása
µ közös érték; r+1 paraméter
r
i 0, i 1,..., :
H0 α = =
hatás-modell i=1,…,r
=0
∑
ri i
piα sum to zero
=0
αr set to zero
ANOVA 1313
(
− ˆ− ˆ)
2 =min=
∑∑
ni p
j
i ij
i
y µ α
φ
( )
∑∑
− − =−
=
i j
i
yij ˆ ˆ 0
ˆ 2 µ α
µ
∂∂φ
Becslések Yˆi =µˆ+αˆi
∑∑
=∑
+∑
i j i i
i i i
ij p p
y µˆ αˆ
=0
..
.
ˆ y
p y p p
y
i i i
i i
i i
i j
ij
=
=
=
∑
∑
∑
∑∑
µ főátlag
⋅⋅
⋅−
= yi y αˆi
= ⋅
= i i
i y
Yˆ µˆ
hatás, csak r-1 független
az i-edik csoport átlaga
( )
∑
− − =−
=
j
i ij
i
y ˆ ˆ 0
ˆ 2 µ α
α
∂∂φ
∑
= +j
i i i
ij p p
y µˆ αˆ
ANOVA 1515
Konfidencia-intervallum az egyes csoportok várható értékére
Pont-becslés:
Intervallum-becslés:
⋅
= ⋅−
yi
i i
s
t y µ
i R
y p
s s
i
2
2⋅ = szab. fokszáma: p r
i i−
∑
Az i-edik csoport várható értékének konfidencia-intervalluma:
i R i
i i R
i t s p y t s p
y⋅− α2 <µ ≤ ⋅+ α2
= ⋅
= i i
i y
Yˆ µˆ
Parameter Estimates (Veralv) Sigma-restricted parameterization Effect
Level of Effect
Column CTIME Param.
CTIME Std.Err
CTIME t
CTIME p
-95.00%
Cnf.Lmt
+95.00%
Cnf.Lmt Intercept
DIET DIET DIET
1 64.00000 0.497912 128.5367 0.000000 62.96137 65.03863 A 2 -3.00000 0.973610 -3.0813 0.005889 -5.03092 -0.96908 B 3 2.00000 0.845330 2.3659 0.028195 0.23667 3.76333 C 4 4.00000 0.845330 4.7319 0.000128 2.23667 5.76333
Parameter Estimates (Veralv)
(*Zeroed predictors failed tolerance check) Over-parameterized model
Effect
Level of Effect
Column Comment (B/Z/P)
CTIME Param.
CTIME Std.Err
CTIME t
CTIME p
-95.00%
Cnf.Lmt
+95.00%
Cnf.Lmt Intercept
DIET DIET DIET DIET
1 61.00000 0.836660 72.90895 0.000000 59.25476 62.74524 A 2 Biased 0.00000 1.449138 0.00000 1.000000 -3.02285 3.02285 B 3 Biased 5.00000 1.278019 3.91230 0.000864 2.33410 7.66590 C 4 Biased 7.00000 1.278019 5.47723 0.000023 4.33410 9.66590
D 5 Zeroed* 0.00000
sigma-restricted Summary fülön: Coefficients
ANOVA 1717 4
3 2 1 0:
H µ =µ =µ =µ elutasítva
Mindegyik különböző?
4
1 µ
µ = µ2=µ3
2 2
3 2 4
1 µ µ µ
µ + = +
Összehasonlítások: tervezett, post hoc
3 2 0: H µ =µ
⋅
⋅−
⋅
⋅−
=
3 2
3 2 0
y
sy
y t y
( )
+
=
− ⋅
⋅
3 2 2 3 2
1 1
p y p
y
Var σe
+
⋅ =
⋅−
3 2 2
2 1 1
3
2 s p p
sy y
egyesítésével a szabadsági fok n2+n3-2=6+6-2=10 lenne,
2
s2 és s32
2
sR
∑
p −r=24−4=20i
szabadsági foka i
3 2
3 2
0 1 1
p s p
y t y
R +
= ⋅− ⋅ LSD-próba
(Least Significant Difference)
ANOVA 1919
Általánosítás:
(k-adik nullhipotézis)
∑
=i i ik
k: c 0
H0 µ
∑
=i
cik 0 cikkontraszt-együtthatók
∑
⋅=
i i ik
k c y
C kontraszt
0 :
H10 µ2−µ3= C1= y2⋅−y3⋅
c11=0, c21=1, c31=-1, c41=0
3 2 0: H µ =µ
0 :
H0 µ2−µ3=
( )
=∑
i i ik
k c
C
E µ
( )
=∑
i i
ik e
k p
C c Var
2
σ2
( )
0:
H0 =
∑
=i i ik k
k E C c µ
∑
∑
⋅=
i
i ik R
i i ik
p c s
y c
t0 2
ortogonálisak a kontrasztok, ha minden k≠l-re ekkor függetlenek az összehasonlítások
=0
∑
i il ikc c
ANOVA 2121 1
H 0 H 20 H 30
i µi ci1 ci2 ci3 ci1 ci2 ci1 ci3 ci2 ci3
1 µ1 0 1 1 0 0 1
2 µ2 1 0 –1 0 –1 0
3 µ3 –1 0 –1 0 1 0
4 µ4 0 –1 1 0 0 –1
Σ 0 0 0 0 0 0
0 :
H10 µ2−µ3 = 0 :
H20 µ1−µ4 =
0 :
H30 µ1−µ2−µ3+µ4=
=0
∑
i il ikc
c ?
4 3 2
1 µ µ µ
µ = = =
2 6 4=
összehasonlítás (1-2, 1-3, 1-4, 2-3, 2-4, 3-4)
egy összehasonlításra az elsőfajú hiba valószínűsége α* (pl. 0.05)
(individual error rate) hogy nem követünk el elsőfajú hibát: 1-α* hogy r független összehasonlítás egyikénél
sem követünk el elsőfajú hibát:
hogy r független összehasonlítás valamelyikénél elkövetünk elsőfajú hibát:
(
1−α*)
r(
1 *)
r1 α
α = − − (family error rate) pl. 1−
(
1−0.5)
6 =0.265ANOVA 2323
Nem független összehasonlítások esetén
α*
α ≤k Bonferroni-egyenlőtlenség
3 . 0 05 . 0
6⋅ =
pl. 6 nem független összehasonlításra
LSD test; variable CTIME (Veralv) Probabilities for Post Hoc Tests Error: Between MS = 5.6000, df = 20.000 Cell No.
DIET {1}
61.000 {2}
66.000 {3}
68.000 {4}
61.000 1
2 3 4
A 0.003803 0.0001811.000000 B 0.003803 0.1587760.000864 C 0.0001810.158776 0.000023 D 1.0000000.000864 0.000023
Bonferroni test; variable CTIME (Veralv) Probabilities for Post Hoc Tests Error: Between MS = 5.6000, df = 20.000 Cell No.
DIET {1}
61.000 {2}
66.000 {3}
68.000 {4}
61.000 1
2 3
A 0.022815 0.0010831.000000 B 0.022815 0.9526560.005182 C 0.0010830.952656 0.000139
Post hoc összehasonlítások Post-hoc fülön: LSD
Post-hoc fülön: Bonferroni
0.003803·6=0.022815
ANOVA 2525 Between Contrast Coefficients (Veralv)
Coefficients for each cell in the selected effect Cell No. DIET Cell N CNTRST1
1 2 3 4
A 4 1
B 6 0
C 6 0
D 8 -1
Univariate Test of Significance for Planned Comparison (Veralv) Dependent variable: CTIME
Source Sum of Squares
Degr. of Freedom
Mean Square
F p
Effect Error
0.0000 1 0.000000 0.000000 1.000000 112.0000 20 5.600000
4 0
1−µ = µ
Between Contrast Coefficients (Veralv) Coefficients for each cell in the selected effect Cell No. DIET Cell N CNTRST1
1 2 3 4
A 4 0
B 6 1
C 6 -1
D 8 0
Univariate Test of Significance for Planned Comparison (Veralv) Dependent variable: CTIME
Source Sum of Squares
Degr. of Freedom
Mean Square
F p
Effect Error
12.0000 1 12.00000 2.142857 0.158776 112.0000 20 5.60000
3 0
2−µ = µ
Tervezett összehasonlítások Planned comps fülön: Specify contrasts
2 2
3 2 4
1 µ µ µ
µ + = +
Between Contrast Coefficients (Veralv) Coefficients for each cell in the selected effect Cell No. DIET Cell N CNTRST1
1 2 3 4
A 4 1
B 6 -1
C 6 -1
D 8 1
Univariate Test of Significance for Planned Comparison (Veralv) Dependent variable: CTIME
Source Sum of Squares
Degr. of Freedom
Mean Square
F p
Effect Error
203.2941 1 203.2941 36.30252 0.000007
112.0000 20 5.6000
4 0
3 2
1−µ −µ +µ = µ
ANOVA 2727
1-Way ANOVA: Power Calculation 1-Way ANOVA (Fixed Effects) Power vs. RMSSE (Alpha = 0.05, Groups = 4, N = 6)
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2
Root Mean Square Standardized Effect (RMSSE) 0.0
.1 .2 .3 .4 .5 .6 .7 .8 .9 1.0
Power
( )
22
1 e
i i
RMSSE r
σ α
=
∑
− Mekkora különbséget tudnánk kimutatni?Statistics>Power Analysis>Several Means, ANOVA 1-Way
ij i
y
ij= µ + α + ε
Pl.haα1=-3, α2=3, α3= α4=0
( )
3( )
4 31 50.6 0 3185.6 1.0352 2 2 2
⋅ =
⋅ =
−
+ + +
= − RMSSE
ANOVA 2929 Tests of Homogeneity of Variances (Veralv)
Effect: DIET Hartley
F-max
Cochran C
Bartlett Chi-Sqr.
df p
CTIME 2.857143 0.381125 1.667956 3 0.644081
Homoszkedaszticitás
Levene's Test for Homogeneity of Variances (Veralv) Effect: DIET
Degrees of freedom for all F's: 3, 20 MS
Effect MS Error
F p
CTIME 1.444444 2.050000 0.704607 0.560414
érzékeny a normális eloszlás feltételezésére konst
2 = σe
Bartlett-próba
Levene-próba
?
More results>Assumptions fülön: Homogeneity of variances ...
A feltételezések ellenőrzése a reziduumok vizsgálatával
-6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Raw Residuals
-7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6
Residual -3.0
-2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0
Expected Normal Value
.01 .05 .15 .35 .55 .75 .95 .99
1 2 3 4 5
No. of obs.
Residuals 1 fülön
Normality Pred & resids Predicted results
(histogram)