BÁNHALMI ÁRPÁD

(1)

BÁNHALMI ÁRPÁD

^*

Statisztikai mutatók elemi úton

Statistical Indicators in Elementary Way

From the academic year 2004/2005 statistics is a part of the high-school graduation, so that's why it's important that the primary methods of statistics can be demonstrated by elementary means. First we are going into the Jensen's inequality, the special case of which can be shown by comparing of convex ranges very well. The examination is based on the simple statement that a convex polygon bounded by chords of a convex function is a subset of the convex range „over” the graph of the function. At the statistical examinations the „notable” means: the Harmonic, the Geometric, the Arithmetic and the Quadratic mean get an important rule. It can be stated about each of them that they are special cases of the so- called Generalized mean. To summarize the relations among the „notable” means the examination of the Generalized mean is very convenient. With the help of the Generalized mean such functions can be defined, the examination of which makes elementary properties of more statistical indicators outcrop and makes their relations to each other clear. The examination of two functions – that are interesting because of their geometric properties – the δ(x) and the σ(x) gives help for analyzing the median, the population variance and Gini’s Coefficient.

A 2004/2005-ös tanévtől kezdve a statisztika az érettségi anyag része, ezért fontos, hogy elemi eszközökkel – kapcsolva a középiskolás matematika anyag- hoz – szemléltethetőek legyenek a statisztika főbb módszerei.

Először a JENSEN-egyenlőtlenségre térünk ki, aminek a speciális esete igen jól szemléltethető konvex tartományok összehasonlításával. A vizsgálat azon az egyszerű megállapításon alapul, hogy egy konvex függvény húrjai által határolt konvex sokszöglap részhalmaza a függvény grafikonja „feletti” konvex tarto- mánynak.

Definíció: Legyen adva f : R → R konvex függvény.











  ≤



 



=  f(x) y

y

H_f x .

A Hf ponthalmaz épp az f : R → R függvény grafikonja „feletti” tartományt jelenti. Ismeretes, ha f : R → R konvex, akkor a hozzá tartozó Hf tartomány konvex. Tehát a Hf tartomány tetszőleges két pontját összekötő szakaszt is tartal- mazza, ami az jelenti, hogy az f : R → R függvény grafikonjának tetszőleges húrjai által határolt sokszöglap is részhalmaza.

Definíció: Legyenek adva a 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk valós számok. Legyen adva f : R → R, konvex függvény. Jelölje x = [x1, x2, x3, ..., xk]^*! Ekkor az



 



 ) f(x

x

i i

pontok által kifeszített tartomány:

* BGF Külkereskedelmi Főiskolai Kar, Matematika–Statisztika Tanszék, főiskolai tanár-

(2)

BUDAPESTI GAZDASÁGI FŐISKOLA – MAGYAR TUDOMÁNY NAPJA, 2004











  ≤ =



 



⋅

=



 







 



= 

∑ ∑

=

k

1

i i

i k

1

i i

i i f

,

x ,0 λ , λ 1

) f(x λ x y x y

T x .

A most definiált tartomány konvex sokszög, hisz k darab vektor konvex line- áris kombinációja. Mivel az



 



 ) f(x

x

i i

pontok éppen az f : R → R függvény grafikonjának pontjai, az is elmondható, hogy a szóban forgó sokszög minden oldala a grafikon egy húrja, tehát a fent elmondottak alapján Tx,f ⊂ Hf. Legyen a szokásos jelöléssel

∑

=

⋅

= ^k

1 i gi xi

x ,

illetve adott 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk értékek, és g1, g2, g3, ..., gk nem negatív, 1

k g

1

i i =

∑

=

súlyok esetén

∑

=

⋅

= ^k

1

i gi f(xi)

f ! Figyelembe véve, hogy a

( )

^^







 x f

x az

f : R → R függvény grafikonjának egy pontja, az











 f

x pedig a Tx,f tartomány egy

pontja, az ^f

( )

^x ^≤^f egyenlőtlenség áll fenn.

1. ábra

(3)

BÁNHALMI Á.: STATISZTIKAI MUTATÓK ELEMI ÚTON Ennek alapján kimondható a JENSEN-egyenlőtlenség: Legyenek adva a 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk valós számok, és a g1, g2, g3, ..., gk nem negatív súlyok, amikre ^k g 1 teljesül, továbbá f : R → R, konvex függvény. Ekkor

1

i i =

∑

=

∑

= =

⋅

≤



 



 ⋅ ^k

1

i i i

k

1

i gi xi g f(x )

f .

Speciális függvényekre érdemes kipróbálni, hogy a JENSEN-egyenlőtlenség konkrétan milyen összefüggésre vezet. Ha f(x) = ax + b, akkor a függvényre telje- sül a megkövetelt feltétel: a konvexitás. Erre a függvényre az egyenlőség teljesül,

hiszen az

∑

=

+

⋅

= +

⋅ ^k

1

i gi (axi b) b

x

a összefüggés tetszőleges a-ra és b-re teljesül (ez a számtani átlag ismert tulajdonsága). Ha f(x) = x², akkor a konvexitás feltétele szintén teljesül. Erre a függvényre alkalmazva az egyenlőtlenséget a

∑

= =

⋅

 ≤



 



 ⋅ ^k

1 i

2 i i k 2

1

i gi xi g x

összefüggést kapjuk. Gyökvonás után nyilvánvalóvá válik, hogy a számtani és négyzetes közepek közti összefüggéshez jutottunk:

∑

= =

⋅

≤

⋅ ^k

1 i

2 i i k

1

i gi xi g x .

A statisztikai vizsgálatoknál fontos szerepet kapnak a nevezetes közepek, a harmonikus, mértani, számtani és négyzetes közepek. Mindegyikről állítható, hogy az úgynevezett hatványközepek speciális esetei. A nevezetes közepek közti relációk összefoglalására meglehetősen alkalmas a hatványközepek vizsgálata.

Definíció: Legyenek adva a 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk nem mind egyenlő valós számok, és a g1, g2, g3, ..., gk pozitív súlyok, amikre ^k g 1 teljesül. Jelölje

1 i

i =

∑

=

[

x₁,x₂,x₃,...,x_k

]

^*

x= és g=

[

g₁,g₂,g₃,...,g_k

]

^*. Ekkor tetszőleges valós x-re

az 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk értékeknek, a g1, g2, g3, ..., gk súlyokhoz tartozó x-edik hatványközepe.

Ha az 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk értékek és a g1, g2, g3, ..., gk súlyok adottak, akkor egyszerűen K(x)-szel jelöljük a függvényt.

(4)

A K(x) függvény meghatározásából nem látszik azonnal, hogy a függvény meg- lehetősen „szépen” viselkedik.

I. A K(x) függvény folytonos

Az x ≠ 0 esetben ez magától értetődő állítás, hiszen a

x 1 k

1 i

i x

i g

x 

 





∑

⋅

=

függvényt ekvivalensen átalakítva ^^

 

 ∑ ⋅

⋅

=

= =









∑

⋅ ^x ^x¹^ln ⁱ^k¹^xⁱ^x^gⁱ

1 k

1 i

i x

i g e

 x

összetett függvényhez jutunk, ami folytonos. Az x = 0 eset okoz némi gondot. Azt kell csak belátni, hogy a K(x) függvény 0-ban vett határértéke létezik, és ez megegyezik a függvény helyettesítési értékével. Ez pedig a következő határérték ki- számításával beláthatóvá válik: =

→ K(x)

limx 0 a függvény fenti átalakítását figye-

lembe véve = =



 

 ∑ ⋅

→

=

x g x ln

0 x

k 1

i x i

i

e

lim a határátmenet elvét alkalmazva = =



 

 ∑ ⋅

=

→ x

g x ln lim

k 1

i x i

i 0

ex a

kitevő egy „ 0

0” típusú kritikus határérték, amire a L’HOSPITAL-szabályt alkal-

mazzuk = ^∑ ^⋅ =

∑ ⋅ ⋅

=

→ k

1

i x i

i k

1

i x i i

i 0

x x g

g lnx x lim

e felhasználjuk, hogy x_i^x →1 = ^∑ =

∑ ⋅

=

= k

1

i i

k 1

i i i

g g lnx

e a logaritmus azonosságai alapján

∏

.

=

= ^k

1 i

g i ⁱ

x

II. A K(x) függvény szigorúan monoton nő Először: n1 > n2 > 0 esetén az ²

1

n n

x

f(x)= függvény konvex a pozitív valós számok

halmazán, hiszen 1 x 0

n n n (x) n

f ⁿ ²

n

2 1 2

// 1 2

1

>

⋅



 



 −

⋅

= ⁻ . Az ²

1

n n

x

f(x)= függvényre és értékekre alkalmazva a JENSEN-egyenlőtlenséget kapjuk, hogy

2 2

2

2 n

k n

3 n 2 n

1 x x ... x

x

0< ≤ ≤ ≤ ≤

∑ ( )

∑

= =

⋅

 ≤



 



 ⋅ ^k

1 i

n n n i i n

k n

1 i

n i

i ²

1 2 2

1

2 g x

x

g .

Mindkét oldalt n1

1 -edik hatványra emelve

(5)

BÁNHALMI Á.: STATISZTIKAI MUTATÓK ELEMI ÚTON

1 1

2 2 n

k 1

1 i

n i i n

k 1

1 i

n i

i x g x

g 



 



 ⋅

 ≤



 





∑

⋅

∑

=

adódik, ami a K(x) függvény szigorú monoton nö- vekedését fejezi ki pozitív kitevők esetén.

Másodszor: 0 > n2 >n1 esetén az ²

1

n n

x

f(x)= függvény konvex a pozitív valós számok halmazán, hiszen

0 x

n 1 n n (x) n

f ⁿ ²

n

2 1 2

// 1 2

1

>

⋅



 



 −

⋅

= ⁻ .

Az ²

1

n n

x

f(x)= függvényre és értékekre alkalmaz-

va a JENSEN-egyenlőtlenséget kapjuk, hogy

2 2

2

2 n

k n

3 n 2 n

1 x x ... x

x

0< ≤ ≤ ≤ ≤

∑ ( )

∑

= =

⋅

 ≤



 



 ⋅ ^k

1 i

n n n i i n

k n

1 i

n i

i ²

1 2 2

1

2 g x

x

g .

Mindkét oldalt n1

1 -edik hatványra emelve ² ² ¹ ⁿ¹

1 k

1 i

n i i n

1 k

1 i

n i

i x g x

g 

 



 ⋅

 ≥



 





∑

⋅

∑

=

adó- dik, ami a K(x) függvény szigorú monoton növekedését fejezi ki negatív kitevők esetén. Mivel a K(x) függvény negatív és pozitív tartományon külön-külön szigo- rúan monoton nő, folytonos, tehát szigorúan monoton nő az egész értelmezési tartományán.

III. A K(x) függvény −∞-ben a legkisebb értékhez,

∞-ben pedig a legnagyobb értékhez tart.

1 x 1 k

2 i

x

1 i i 1 x 1

x x

x g x g x lim K(x)

lim  =













 



⋅ +

⋅

=

∑

−∞ =

→

−∞

→ , hasonlóan

k x 1 1

k

1 i

x

k i i k x k

x x

x g x g x lim K(x)

lim  =













 



⋅ +

⋅

=

∑

⁻

∞ =

→

∞

→

A most bemutatott tulajdonságokból néhány egyszerű következményt szűrhe- tünk le. A K(x) függvény a legkisebb és a legnagyobb átlagolandó érték között minden értéket fölvesz – pontosan egyszer. A monoton növekedésből következik, hogy például x = –1,0,1,2 értékekre K(–1) ≤ K(0) ≤ K(1) ≤ K(2). Határozzuk meg ezeket a hatványközepeket!

(6)

∑ ∑

=

−

=

−  =



 



 ⋅

=

− _k

1

i i

i 1

k 1

1

i i

1 i

x g g 1

x 1)

K( harmonikus közép,

∏

=

= ^k

1 i

g i ⁱ

x

K(0) geometriai közép,

∑

= =

⋅

 =



 



 ⋅

= ^k

1

i i i

1 1 k

1

i i

1

i g x g

x

K(1) számtani közép,

∑

= =

⋅

 =



 



 ⋅

= ^k

1

i i

2 i 2

k 1

1

i i

2

i g x g

x

K(2) négyzetes közép.

A középiskolában tanult nevezetes közepek közti reláció egyszerű behelyettesí- téssel vezethető vissza a K(x) szigorú monoton növekedésére.

2. ábra

Az x1 = 0,5; x2 = 2; x3 = 3; x4 = 4, és g1 = g2 = g3 = g4 = ¼ esetén a K(x) grafikonja

A hatványközepek segítségével definiálhatóak olyan függvények, amiknek a vizsgálata több statisztikai mutató elemi tulajdonságainak a felszínre hozatalát, és az egymáshoz való viszonyát tisztázza. Egy geometriai tulajdonságai miatt érdekes függvény, a δ(x) vizsgálata a medián elemzéséhez nyújt segítséget.

(7)

BÁNHALMI Á.: STATISZTIKAI MUTATÓK ELEMI ÚTON Definíció: Legyenek adva a 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk nem mind egyenlő valós számok, és a g1, g2, g3, ..., gk pozitív súlyok, amikre teljesül. Tetszőleges valós x-re

1

k g

1

i i =

∑

= i

k

1 i

i x x

g ⋅ −

=

∑

=

δ(x) .

A δ(x) függvény megmutatja az x valós szám 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk értékektől vett átlagos eltérését. Meghatározzuk a függvény kifejtett alakját, és megvizsgál- juk a tulajdonságait.

Ha ^k _i

1 i

i x x

g

δ(x) =

∑

⋅ −

=

alakjában felbontjuk az abszolútérték-jeleket, a követ- kezőt kapjuk:

( ) ( ) ( )















<

−

≤

<

−

≤ +

−

= ₊

x x ha , x x

x x x ha , x 1 2z x 1 2g

x x ha , x x

δ x

k

1 i i

/ i /

i

1

M M

A függvény, mivel folytonos függvények összege, folytonos. A fenti felírásból kitűnik, hogy szakaszonként lineáris, esetleg konstans – amennyiben valamilyen i-re a 2gi’–1 = 0. Mivel 2gi’–1 < 2gi+1’–1, a függvény szakaszonkénti meredeksége szigorúan monoton nő, a függvény konvex. A konvexitás miatt a szélső értéke minimum lehet. A minimum helyét a 2gi’–1 meredekségek előjelváltásából álla- píthatjuk meg: ahol 2gi’–1 = 0 teljesül, vagy előjelet vált. Ez 2gi’–1 ≤ 0 < 2gi+1’–1 megoldásához vezet. Az egyenlőtlenségrendszert átrendezve kapjuk, hogy

/ 1 i /

i g

2

g ≤1 < ₊ . Az xi elem, amelyik a _i^/ g_i ₁^/ 2

g ≤1 < ₊ tulajdonsággal rendelkezik, a medián.

(8)

Előfordulhat viszont, hogy a δ(x) a minimumát nem egy helyen veszi föl, hanem esetén egy egész szakaszon. Ilyenkor a szakasz összes pontja teljesíti a mediánnal szemben támasztható követelményeket – beleértve a végpontokat is.

0 1 2g_i^/− =

4. ábra

A δ(x) függvény tehát az ismérvértékek szóródásáról ad információt: ha az adatok x értéktől vett abszolút eltérését számtani középpel átlagoljuk, az a medián esetén a minimális.

A δ(x) függvény egy másik érdekes tulajdonsága, hogy a szórásról – pontosab- ban a szórásnégyzetről – is szemléletes képet ad. A beszínezett terület éppen a szórásnégyzettel egyenlő (5. ábra).

5. ábra

Ha a grafikon pontjai az y=−x+x és y=x−x egyenesekhez esnek közel, akkor kisebb a szórás, ha pedig távolabb esnek, a szórás növekszik.

A δ(x) definíciójából egyszerűen adódik, hogy , ahol a G a GINI- féle együtthatót jelöli. Figyelembe véve, hogy a δ(x)

∑

=

⋅

= ^k

1 i

i i δ(x ) g G

konvex, a JENSEN-egyenlőt- lenséget alkalmazva kapjuk, hogy

(9)

BÁNHALMI Á.: STATISZTIKAI MUTATÓK ELEMI ÚTON

( ) _∑ _∑

=

⋅

=

≤



 



 ⋅

= ^k

1

i i i

k

1

i gi xi G g δ(x )

x δ

δ .

Definíció: Legyenek adva a 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk nem mind egyenlő valós számok, és a g1, g2, g3, ..., gk pozitív súlyok, amikre teljesül. Tetszőleges

valós x-re

1

k g

1 i

i =

∑

=

( ) ∑ ( )

=

−

= ^k

1 i

2 i

i x x

g

σ x .

A σ(x) függvény megmutatja az x valós szám 0 < x1 ≤ x2 ≤ x3 ≤ ... ≤ xk értékek- től vett átlagos eltérését, ha négyzetes középpel átlagolunk. Meghatározzuk a függvény kifejtett alakját, és megvizsgáljuk a tulajdonságait.

Ha

( ) ∑ ( )

=

−

= ^k

1 i

2 i

i x x

g x

σ alakjában felbontjuk zárójeleket, a következőt kapjuk:

( )

^x

( )

^x ^x² ^σ²

σ = − +

A függvény folytonos. A fenti felírásból kitűnik, hogy nem érzékeny az xi érté- kekre, egyedül az átlagtól és a szórástól függ. A függvény képe az elemi geomet- riából jól ismert hiperbola, mint ilyen, a függvény konvex. A konvexitás miatt a szélső értéke minimum lehet. A minimum helyét a ^σ

( )

^x ⁼

( )

^x⁻^x²⁺^σ² alakjából következően, az átlagnál veszi fel (a δ(x)-szel szemben mindig egyértelműen). A minimum értéke megegyezik a szórással.

6. ábra

A hiperbola aszimptótái az y=−x+x és y=x−x egyenesek.

(10)

A σ(x) definíciójából kiolvasható, hogy

∑

= k ⋅

1

i 2 i

i σ (x )

g az xi adatok egymástól vett eltérésének négyzetes átlaga. Ez a G GINI-féle együtthatóhoz hasonlít, ami hasonlóan definiálható, az alapadatok egymástól vett abszolút eltérésének szám- tani átlaga. Kimutatható, hogy ^k g σ (x ) 2 σ

1

i 2 i

i⋅ = ⋅

∑

=

. Ez arra világít rá, hogy a szórás nem csak mint átlagtól vett átlagos eltérés értelmezhető, hanem mint az alapadatok egymástól vett eltérésének az átlaga is.

Irodalomjegyzék

HAJDÚ – PINTÉR – RAPPAI – RÉDEY: Statisztika I-II. JPTE, Pécs, 1994.

HUNYADI – VITA: Statisztika I. Aula Kiadó, Budapest, 1991.

KERÉKGYÁRTÓ – MUNDRUCZÓ: Statisztikai módszerek a gazdasági elemzésben.

Aula Kiadó, Budapest, 1995.

KORPÁS – MOLNÁR – SZŰTS: Általános statisztika I. rész. Tankönyvkiadó, Buda- pest, 1992.

KÖVES – PÁRNICZKY: Általános statisztika I-II. Közgazdasági és Jogi Könyvkiadó, Budapest, 1981.

BÁNHALMI ÁRPÁD