I. STATISZTIKAI ALAPOK 1
STATISZTIKAI ALAPOK
x
rel. gyak
0.0 0.2 0.4
9.4 9.8 10.2 10.6
f(x)
a b x
(
< ≤)
=∫ ( )
b
a
dx x f b x a P sőrőségfüggvény
Folytonos valószín ő ségi változó
I. STATISZTIKAI ALAPOK 3
Folytonos valószín ő ségi változó
x
kum.rel.gyak
0.0 0.2 0.4 0.6 0.8 1.0
9.4 9.6 9.8 10.0 10.2 10.4 10.6
F(x)
xi x
F(x)
F(xi)
( ) ( ) ∫ ( )
∞
−
=
≤
= i
x i
i P x x f xdx
x F
eloszlásfüggvény
Paraméter és statisztika
• várható érték: • számtani átlag:
• variancia • szórásnégyzet (korrigált)
( )
x =µ
E
∑
=
= N
i
xi
x N
1
1
( )
x x2Var =σ
∑ ( )
=
− −
= N
i
i x
N x s
1 2 2
1 1
sokaság minta
I. STATISZTIKAI ALAPOK 5
A legfontosabb folytonos eloszlás:
normális eloszlás
( )
−
−
=
2
2 exp 1 2
1
σµ σ
π x x
f
Két paramétere van:
µ
ésσ
2x
µ
különbözıx
f(x)
σ
különbözıI. STATISZTIKAI ALAPOK 7
Várható értéke és varianciája:
( )
x =µ
E Var
( )
x =σ
2Rövid jelölése:
( µ
,σ
2)
N pl. N
( )
0,1Célszerőtranszformációt keresnünk ,
Normalizált (standardizált) normális eloszlás
u x µ σ
= −
( )
0E u = Var u
( )
=1( )
1 exp 22 2 f u u
π
= −
I. STATISZTIKAI ALAPOK 9
1. példa
Határozzuk meg annak valószínőségét, hogy az x normális eloszlású valószínőségi változó a (
µ
-σ,µ
+σ) intervallumba esı értéket vesz fel!( µ
−σ
< x≤µ
+σ )
= F( µ
+σ ) (
−Fµ
−σ )
P
(Pl. azt kérdezzük, hogy milyen valószínőséggel esik a 10±0.5 intervallumba, ha
µ
=10,σ
=0.5)µ
x-1 0 1
µ
+σ µ
−σ
P(x ≤
µ − σ
)P(x≤
µ
+σ
)u
I. STATISZTIKAI ALAPOK 11
intervallum
szélessége
± σ ± 2 σ ± 3 σ
P
fölsı 1
u µ σ µ
σ
= + − =
alsó 1
u µ σ µ
σ
= − − = − x
u
µ
σ
= −
2. Példa
Határozzuk meg, hogy egy N(µ,σ2) normális eloszlású valószínőségi változó értékei milyen szimmetrikus
intervallumban vannak 95 %-os, ill. 99 %-os valószínőséggel!
(Pl. µ=10, σ=0.5)
α 0.05 0.01
1-α 0.95 0.99
1-α/2 0.975 0.995 u
α 0.05 0.01
xalsó
xfölsı
u x
µ σ −
=
x=
uσ µ +
I. STATISZTIKAI ALAPOK 13
xalsó µ xfölsõ
0
u
uα/2 -uα/2
α
/2α
/2x
fölsıx
alsó u xµ
σ
= −
A számtani középérték
(
+ + +)
=∑
= n xi
x n ...
x n x
x 1 1
2 1
( )
=[
nE( )
x]
=E( )
x =µ x nE 1
( ) ( )
n n
x x Var
Var x
x
2
2
σ
σ
= = =I. STATISZTIKAI ALAPOK 15
Centrális határeloszlási tétel
Bármilyen eloszlású sokaságból vett minták számtani középértéke közelítıleg normális eloszlást követ az eredeti eloszlás várható értéke körül, varianciájuk pedig
σ
2/n; tehát N(µ
,σ
2/n) eloszlású.3. példa
Ha egy µ=10 várható értékőés σ2=0.25 varianciájú sokaságból n = 5 elemőmintát veszünk, milyen intervallumban lesz a mintaelemek átlaga 95% valószínőséggel?
(
/ 2 / 2)
1P
µ
−uασ
n < ≤ +xµ
uασ
n = −α
I. STATISZTIKAI ALAPOK 17
uα/ 2 =
σ
n =
u / 2 α
σ
nµ
+ =u / 2 α
σ
nµ
− =x
f(x)
0.0 0.4 0.8 1.2 1.6 2.0
8 9 10 11 12
egyedi ( x)
xalsó xfölsõ
x
f(x)
0.0 0.4 0.8 1.2 1.6 2.0
8 9 10 11 12
átlag
átlagalsó átlagfölsõ
(
)
0.95P < ≤x =
(
)
0.95P < ≤x =
I. STATISZTIKAI ALAPOK 19
x
f( x )
0.0 0.4 0.8 1.2 1.6 2.0
8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0
átlag
egyedi
x
alsóx
fölsõátlagalsó átlagfölsõ
2 2 1
a a
P -u x u
n
µ α
σ
< − ≤ = −
u x
n
µ σ
= − u x µ
σ
= −
(az átlag is normális eloszlású valószínőségi változó)
I. STATISZTIKAI ALAPOK 21
χ
2- (khi-négyzet-) eloszlás
2 2
1 n
i i
χ u
=
=
∑
( ) χ
2 =ν
E
0.00 0.05 0.10 0.15 0.20
0 5 10 15 20 25
χ2 f(χ2) ν=4
ν=7
ν=10
f(χ2)
χ2 α
χ2α
I. STATISZTIKAI ALAPOK 23
A normális eloszlású sokaságból vett minta tapasztalati szórásnégyzetének eloszlása
( )
∑
=− −
= n
i
i x
n x s
1 2 2
1 1
(
xi x)
ni n
− = = −
=
∑
21
2 2
χ σ , ν 1
s2
2 2
=
χ σ
ν χ ν
2
σ
2
= s 2
4. példa
Egy σ2= 0.08 varianciájú normális eloszlású sokaságból 8 elemő mintát veszünk.
a) Határozzuk meg azt a szimmetrikus valószínőségő intervallumot, amelyben az eredmények s2korrigált tapasztalati szórásnégyzete
95%-os valószínőséggel megtalálható!
(
alsó2 2 2fölsı)
0.95P s < s ≤ s =
( )
2 2
2 2 2 2
2 fölsı2 0.95
alsó
alsó fölsı
s s
P
ν χ ν
Pχ χ χ
σ σ
< ≤ = < ≤ =
I. STATISZTIKAI ALAPOK 25
A χ
2-eloszlás kritikus értékei
χ2 f(χ2)
χ2alsó χ2fölsõ
0.025
0.025
2 fölsı
χ
2
χ
alsó2
χ
alsó=
2 fölsı
χ =
ν = 7
(
alsó2 2 2fölsı)
alsó2 2 2 2fölsı 2P χ χ χ P χ σ s χ σ
ν ν
< ≤ = < ≤ =
b) Határozzuk meg azt az értéket, amelyet s2 95%-os valószínőséggel nem halad meg!
(
2 2fölsı)
0.95P s ≤s =
I. STATISZTIKAI ALAPOK 27
f(χ2)
χ2 α
χ2α
A χ
2eloszlás föls ı kritikus értéke: χ
2fölsı =14.1(
2 0.161)
0.952 2
2 = ≤ =
s ≤ P s
P fölsı
ν σ χ
t-eloszlás (Student-eloszlás)
t
f(t)
0.0 0.1 0.2 0.3 0.4
-3 -2 -1 0 1 2 3
ν =4
ν =20
ν =1
t u E
( )
= = −s
χν
ξ ξ
2 ξ
( )
E t =0
n s t=x−µ pl.
n z= x
σ µ
−
I. STATISZTIKAI ALAPOK 29
5. példa
10 mérés eredménye:
24.46; 23.93; 25.79; 25.17; 23.82; 25.39; 26.54; 23.85; 24.19; 25.50.
Kérdés: a valódi érték 95%-os valószínőséggel milyen intervallumban van? (Adjunk 95%-os konfidencia-intervallumot a várható értékre!)
24, 9
x = s2 =0, 894 s=
ν= tα 2 =
α/2 α/2
-tα/2 0 tα/2
f(t)
α
=ν
= − =n 1 9tα2 = konfidencia-intervallum:
(
2 2)
1P x−tα s n < ≤ +µ x tα s n = −α
I. STATISZTIKAI ALAPOK 31
F-eloszlás
Legyen és két, egymástól független,
χ
2-eloszlású valószínőségi változóν
1, ill.ν
2szabadsági fokkal. A következıkifejezés F-eloszlású, a számláló szabadsági fokainak számaν
1, a nevezıéν
2:χ
12
χ
22
F = χ
ν χ
1 ν
2
1 2
2
2 F s
= s12 12
2 2
2 2
/ /
σ
, σ ,
σ1 σ
2 2
= 2
ha
F =s1 s
2 2 2
Az F-eloszlás kritikus értékei
f(F)
Fα F
α
( )
1(
2 1)
2
1 ,
, 1
ν ν ν
ν
α α
−
= F F
I. STATISZTIKAI ALAPOK 33
6. példa
Azonos analitikai módszerrel két méréssorozatot kaptunk, amelyek 4 ill. 7 mérésbıl állnak. Milyen intervallumban lehet 90 % valószínőséggel a két minta szórásnégyzetének aránya?
Minthogy azonos módszerrıl van szó, a variancia változatlan:
2 2 2
1 σ
σ =
fölsı
F =
alsó = F
(
alsó 12/ 22 fölsı)
=0.90P F <s s ≤F