• Nem Talált Eredményt

4. lecke: A szóródás vizsgálata Híradásokban gyakran szerepel, hogy a havi nettó átlagkereset a versenyszférában 119

N/A
N/A
Protected

Academic year: 2022

Ossza meg "4. lecke: A szóródás vizsgálata Híradásokban gyakran szerepel, hogy a havi nettó átlagkereset a versenyszférában 119"

Copied!
16
0
0

Teljes szövegt

(1)

1

4. lecke: A szóródás vizsgálata

Híradásokban gyakran szerepel, hogy a havi nettó átlagkereset a versenyszférában 119 480 forint. Ennek hallatán sokan felkapják a fejüket, hogy nekik nincs ekkora havi nettó fizetésük. Hogyan lehetséges ez a statisztika szempontjából? A középértékek ugyan egyetlen, tömör, számszerű értékkel jellemzik a sokaságot, de sokszor kevés információt nyújtanak.

Ugyanis, két személy havi nettó keresetének átlaga akkor is 130 ezer forint, ha például

 mindketten havi nettó 130 ezer forintot keresnek,

 egyikük havi nettó 100 ezer, a másik pedig havi 160 ezer forintot keres,

 egyikük havi nettó 60 ezer, a másik pedig havi 200 ezer forintot keres.

A három példában az átlag azonos volt, de más volt az elemek variabilitása, azaz szóródása (különbözősége). Az átlag csak akkor nyújt megfelelő képet a valóságról, ha kicsi a változó szóródása. Éppen ezért meg kell vizsgálnunk az ismérvértékek szóródását is. A szóródás az egyes ismérvértékeknek egymástól, illetve valamely nevezetes középértékétől való eltérése. A szóródásnak több mérőszáma is ismeretes. Ezek közül először részletesen a szóródási terjedelemmel, az interkvantilis terjedelemmel, a szórással, a relatív szórással és az átlagos abszolút különbséggel foglalkozunk, majd megvizsgáljuk azt, hogy részekre bontott sokaságok esetében milyen dimenziókban lehet a szórást vizsgálni.

1. A szóródás mérőszámai

A szóródás a mérőszámai több szempont szerint csoportosíthatóak.

1. Az egyik ilyen szempont az, hogy a mérőszám abszolút vagy relatív. Az abszolút mérőszámok mértékegysége megegyezik a vizsgált változó mértékegységével. A taglalt szóródási mérőszámok a relatív szórás kivételével mind ebbe a kategóriába tartoznak. A relatív mérőszámok mértékegység nélküliek, általában százalékban fejezzük ki őket (például relatív szórás).

2. A szóródás fogalma egy kettős viszonyrendszert takar. Egyrészt, vizsgálhatjuk az ismérvértékek xjxi különbségét, illetve vizsgálhatjuk az ismérvértékek átlagtól való dixix eltérését, devianciáját. Ez alapján a szóródás mérőszámait csoportosíthatjuk úgy is, hogy az ismérvértékek különbözőségét (szóródási terjedelem, interkvantilis terjedelem, átlagos abszolút különbség) vagy az átlagtól vett devianciáit jellemzi (szórás, relatív szórás).

Először áttekintjük a különbségeket vizsgáló nevezetesebb mérőszámokat.

A szóródás terjedelme (terjedelem, range) a legnagyobb és a legkisebb ismérvérték közötti különbség.

min

max x

x

R 

A terjedelem megmutatja, hogy az ismérvértékek milyen széles tartományon szóródnak. A mérőszám nagy előnye a könnyű kiszámítás, viszont hátránya az, hogy érzékeny a kiugró (outlier) értékekre.

A kiugró értékekre való érzékenység problémáját próbálja kezelni az interkvantilis terjedelem. Ezen mérőszámok alapja az, hogy a rangsor mindkét végéből levágunk egy-egy

(2)

2

azonos méretű szeletet, konkrétan csak az első és az utolsó kvantilis közötti részt vesszük figyelembe.

k k

k x

x

IR( 1)/1/

A kérdés csak az, hogy melyik kvantiliseket alkalmazzuk. Például, az

1 3Q

Q IQR

interkvartilis terjedelem megmutatja, hogy az ismérvértékek középső 50 százaléka milyen széles tartományon szóródik. A probléma csak az, hogy ez esetben az ismérvértékek szélső 25-25, azaz 50 százalékát nem vesszük figyelembe.

A terjedelem és az interkvantilis terjedelem nem veszi figyelembe az összes ismérvérték egymástól való eltérését. Ezt a szempontot érvényesíti az átlagos abszolút különbség, melyet rangsorból a

2

1 1

N x x G

N

i N

j

j



i

gyakorisági, relatív gyakorisági sorokból pedig a

 

 

k

i k

j

j i j i k

i k

j

j i j i

x x g N g

x x f f G

1 1

2

1 1

képlettel1 számíthatjuk ki. A képletekben az ismérvértékek különbségének abszolút értékét, azaz előjel nélküli értékét vesszük figyelembe, ugyanis e nélkül az előjeles különbségek összege nulla lenne.

A mérőszám megmutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól.

A devianciák vizsgálatakor az általunk tárgyalt mérőszámok, mind az ismérvértékek átlagtól való átlagos eltérését mutatják meg. A mérőszámok felírásához az átlagtól vett előjeles eltéréseket nem vizsgálhatjuk, hiszen a számtani átlag tulajdonságainál láthattuk, hogy

N

i

i x

x

1

0 )

( . Ezért, az átlagtól való eltérésekből is ki kell szűrnünk az előjelet. Ezt úgy tehetjük meg, hogy a devianciáknak az abszolút értékét2 vagy pedig a négyzetét használjuk.

1 Mintavétel esetén a képlet nevezőjében N helyet N(N-1) kifejezést használjuk.

2 Az erre épülő mutató az átlagos abszolút eltérés, mely a devianciák abszolút értékeinek számtani átlaga.

Rangsor esetében:

N d N

x x

N

j i N

j

i

1 1

(3)

3 átlagtól vett különbségeinek négyzetes átlaga.

A szórás kiszámítása rangsor esetében az alábbi képletek valamelyikével lehetséges.

         

2 2 2

1 2 2

2 2

2 2 1

1 2 1

2 2

2 2 2 1

x x N x

x N x

x x

x

N d N

x x N

x x x

x x x

q N

i i N

N

i i N

i i N

 

 

 

 

A szórás kiszámítása gyakorisági, illetve relatív gyakorisági sorok esetében az alábbi képletek valamelyikével lehetséges.

       

2 2

2 1

2 2

1 1

2 2

2 2

2 2 2 1 1

1 2

1 1

2

1 1

2 2

2 2 2 2 1 1

x x

x x g x

f x f N x

x f x

f x f

d g f

d f

f x x f N

x x f x

x f x x f

q

k

i i k i

i i k

i i i N

N

k

i i k i

i i k

i i i

k

i i k

i i i N

N

 

 

 

 

 

 

A szórás azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlaguktól.

A szórás számlálójában szereplő

  

N

i

i x

x

1

2 ,

  

k

i i

i x x

f

1

2 mennyiséget teljes eltérés-négyzetösszegnek, a szórás négyzetét pedig varianciának nevezzük.

Ha azt mondjuk, hogy a havi nettó keresetek szórása 70 ezer forint, akkor ez az adat önmagában értékelhetetlen, mivel mást mond akkor, ha a havi nettó keresetek átlaga 100, illetve ha 200 ezer forint. Ezért használjuk a relatív szórást, ami a szórás és a számtani átlag hányadosa.

Gyakorisági, relatív gyakorisági sor esetén:

  

 

N

j i i N

j i i N

j i i

d N g

d f N

x x f

1 1

1

(4)

4 x

 v

A relatív szórás azt fejezi ki, hogy az egyes ismérvértékek átlagosan hány százalékkal térnek el az átlaguktól.

A szóródási mérőszámok tulajdonságai

1. A szóródási mérőszámok értéke nem negatív.

2. A szóródási mérőszámok értéke pontosan akkor nulla, ha mindegyik ismérvérték megegyezik.

3. Ha mindenegyes ismérvértéket ugyanazzal az A számmal növelünk vagy egy nullától különböző A számmal megszorzunk, akkor a szóródási mérőszámok értékéről az alábbiakat állíthatjuk.

Mérőszám Mindegyes ismérvértéket A- val növelünk

Mindegyes ismérvértéket A(<>0)-val szorozzuk Range, Interkvantilis

terjedelem Értéke NEM változik Értéke A-szorosára nő Gini-mutató Értéke NEM változik Értéke A-szorosára nő Átlagos abszolút eltérés Értéke NEM változik Értéke A-szorosára nő

Szórás Értéke NEM változik Értéke A-szorosára nő

Relatív szórás Értéke

A x

 

v lesz Értéke NEM változik

2. Mintafeladatok 1. feladat

Ismertek egy település lakóira vonatkozó adatok.

A családok megoszlása gyermekszám szerint Gyerekszám

(fő)

Családok száma (fő)

0 890

1 950

2 650

3 140

4 40

5 15

(5)

5

Összesen 2 686

Forrás: fiktív

A közölt adatok alapján számítsa ki és értelmezze a szóródási mérőszámokat!

) 0 Q

; 2 (Q31

A range vagy szóródási terjedelem azt fejezi ki, hogy az ismérvértékek milyen hosszú tartományon szóródnak, más szóval, hogy a legnagyobb ismérvérték mennyivel nagyobb a legkisebbhez viszonyítva.

min

max x

x

R  = 6 – 0 = 6,

tehát a vizsgált településen a gyermekek száma családonként 0 és 6 közé esik.

Az interkvartilis terjedelem megmutatja, hogy az ismérvértékek középső 50 százaléka milyen széles tartományon szóródik.

2 0 2 Q1

3    

Q

IQR ,

tehát a vizsgált településen a gyermekek száma családonként 0 és 2 közé esik a családok felében.

A szórás azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlaguktól. Kiszámítására 2 képletet javaslok.

A feladat megoldásához az adatokból egy munkatáblát készítünk.

xi fi xi fi fi(xix)2 fixi2 0 890 0 1 045,352 0

1 950 950 6,666 950

2 650 1 300 545,663 2 600

3 140 420 514,073 1260

4 40 160 340,176 640

5 15 75 230,053 375

6 1 6 24,169 36

Összesen 2 686 2 911 2 706,152 5 861

1 004 , 2686 1

152 , ) 2706

(

7

1

2

N x x f

i i

i

1 004 , 1 0838 , 2686 1

5861 2

2 7

1 2

x

N x f

i i

i

(6)

6

A relatív szórás azt fejezi ki, hogy az egyes ismérvértékek átlagosan hány százalékkal térnek el az átlaguktól.

% 6 , 92 926 , 08 0 , 1

v  1  

x

Tehát a vizsgált településen az egyes családokban a gyermekek száma átlagosan 1 fővel, azaz 92,6%-kal tér el a településre jellemző családonkénti átlagos gyermekszámtól.

A Gini-együttható azt fejezi ki, hogy az egyes ismérvértékek átlagosan mennyivel térnek el egymástól. Ekkor meg kell határoznunk minden elempár esetében az ismérvértékek eltéréseinek abszolút értékét, tehát, mind a 2686 elemet külön-külön kell viszonyítanunk a többi elemhez. A számítást nagyban könnyíti, ha az alábbi mátrixformát alkalmazzuk.

A mátrix belsejében szereplő számokat az alábbi logika szerint kapjuk meg. Például, amikor az 1 és a 4 ismérvértékeket hasonlítjuk össze, akkor ezek különbsége 3. Ekkor 1 darab 4 elemet 950 db 1 elemhez kell viszonyítanunk. Mivel mind a 950 darab 1 értéket viszonyítjuk az összes (40 db) 4 elemhez, ezért ez összességében 40*950 darab összehasonlítást jelent.

Tehát az 1 és 4 elemek 3 különbségét 40*950-szer kell tekintenünk. Ez összességében 3*40*950=114000 eltérést jelent.

fi 890 950 650 140 40 15 1

xi 0 1 2 3 4 5 6

890 0 0 845500 1157000 373800 142400 66750 5340 950 1 845500 0 617500 266000 114000 57000 4750

650 2 1157000 617500 0 91000 52000 29250 2600

140 3 373800 266000 91000 0 5600 4200 420

40 4 142400 114000 52000 5600 0 600 80

15 5 66750 57000 29250 4200 600 0 15

1 6 5340 4750 2600 420 80 15 0

Vegyük észre, hogy a mátrix szimmetrikus és a főátlójában végig 0 elemek állnak.

Mire jó ez a mátrix elrendezés? Megvizsgálva a Gini-együttható

2

1 1

N

x x f f G

k

i k

j

j i j



i

képletét, megállapíthatjuk, hogy a képlet számlálója pontosan a mátrix elemeinek összege lesz. Ezért

(7)

7

06 , 2686 1 2686

7671610

2

1 1

 



N

x x f f G

k

i k

j

j i j i

Tehát a vizsgált településen az egyes családokban a gyermekek számai átlagosan 1 fővel térnek el egymástól.

2. feladat

Egy utazási iroda által szervezett külföldi kirándulások (ezer forintban adott) árait vizsgáltuk.

A rendelkezésre álló adatokat az alábbi táblázatban közöltük.

A kirándulás ára (ezer Ft)

A kirándulások száma

– 40 5

41 – 60 15

61 – 80 50

81 – 100 250

101 – 150 350

151 – 200 100

201 – 30

Összesen 800

Számítsa ki és értelmezze a szóródási mérőszámokat!

A szóródási terjedelmet nem tudjuk kiszámítani, hiszen nem ismerjük a legnagyobb és a legkisebb ismérvértéket.

A szórás és a relatív szórás kiszámításához szükségünk van a számtani átlagra is.

A kirándulás ára

(ezer Ft) fi xi fixi fixi2

21 – 40 5 30 150 4 500

41 – 60 15 50 750 37 500

61 – 80 50 70 3 500 245 000

81 – 100 250 90 22 500 2 025 000

101 – 150 350 125 43 750 5 468 750

151 – 200 100 175 17 500 3 062 500

201 – 30 225 6 750 1 518 750

Összesen 800 94 900 12 362 000

(8)

8

625 , 800 118

94900

7

1 7

1  

i i i

i i a

f x f x

16 , 37 625 , 800 118

12362000 2

2 7

1 2

x

N x f

i i

i

% 33 , 31 3133 , 625 0 , 118

16 ,

v  37  

x

Ezek szerint az egyes külföldi kirándulások árai átlagosan 37,16 ezer forinttal, azaz 31,33 százalékkal térnek el a külföldi kirándulások átlagárától.

A Gini-együttható kiszámításához a megismert mátrixformulát használhatjuk.

fi 5 15 50 250 350 100 30

xi 30 50 70 90 125 175 225

5 30 0 1500 10000 75000 166250 72500 29250

15 50 1500 0 15000 150000 393750 187500 78750 50 70 10000 15000 0 250000 962500 525000 232500 250 90 75000 150000 250000 0 3062500 2125000 1012500 350 125 166250 393750 962500 3062500 0 1750000 1050000 100 175 72500 187500 525000 2125000 1750000 0 150000 30 225 29250 78750 232500 1012500 1050000 150000 0

Összesen 24599000

44 , 800 38 800 24599000

2

1 1

 



N

x x f f G

k

i k

j

j i j i

Ezek szerint az egyes külföldi kirándulások árai átlagosan 38,44 ezer forinttal térnek el egymástól.

3. Ellenőrző kérdések 1. Mi a szóródás?

2. Milyen szóródási mutatókat ismer? Csoportosítsa e mutatókat!

3. Mi a különbség?

4. Mi az eltérés (deviancia)?

5. Mi a range? Hogyan értelmezhető (mit fejez ki)?

6. Mi az interkvartilis terjedelem? Hogyan értelmezhető (mit fejez ki)?

7. Mi az átlagos abszolút különbség? Hogyan értelmezhető (mit fejez ki)?

8. Miben különbözik a szórás és a szóródás?

9. Mi a szórás? Hogyan értelmezhető (mit fejez ki)?

10. Mi a variancia?

(9)

9

12. Az egyes szóródási mérőszámok alkalmazásának mi az előnye? Mi a hátránya?

13. Különbség és eltérés vizsgálatakor miért kell az előjelet kiküszöbölni?

14. Milyen tulajdonságokkal rendelkeznek a szóródási mérőszámok?

Kiegészítő olvasnivaló (nem képezi részét a számonkérésnek!)

1. Szórás és variancia részekre bontott sokaság esetén

Abban az esetben, ha a vizsgált mennyiségi változó (amelynek a szóródását vizsgáljuk) mellett egy másik változó alapján részekre bontunk egy sokaságot, kérdéses, hogy a szórást (az ismérvértékek átlagtól való átlagos eltérése) hogyan vizsgálhatjuk. Például, egy vállalatnál az alkalmazottak fizetéseit vizsgáljuk. Az egyszerűség kedvéért tételezzük fel, hogy három foglalkozási csoport van: beosztott, középvezető, felsővezető. Ekkor a szórás azt jelentené, hogy az emberek fizetései átlagosan mennyivel különböznek az átlagostól. Ezt milyen dimenziók mentén lehet vizsgálni?

 Egyrészt megvizsgálhatjuk, hogy az emberek fizetései átlagosan mennyivel térnek el a vállalati átlagfizetéstől, azaz a főátlagtól. Ez a viszonyítás a (teljes) szórásnak felel meg. Ebben a viszonyításban a foglalkozási csoport nem kap szerepet. Az ismérvértékeknek a főátlagtól vett eltérés-négyzetösszegét, azaz a szórás számlálóját teljes eltérés-négyzetösszegnek nevezzük, és SST kifejezéssel rövidítjük.

 

N SST N

x x

k

j f

i ij

j



1 1

2

 Minden részcsoportban külön-külön megvizsgálhatjuk, hogy az emberek fizetései átlagosan mennyivel térnek el a saját foglalkozási csoportjuk átlagfizetéstől, azaz a saját részátlaguktól. Ez a viszonyítás a rétegenkénti (csoport) szórás. Példánkban tehát van egy rétegenkénti szórása a beosztottaknak, egy a középvezetőknek és egy a felsővezetőknek. Egy adott csoporton belül az ismérvértékeknek a saját részátlaguktól vett eltérés- négyzetösszegét, azaz a rétegenkénti szórás számlálóját az adott csoport (réteg) eltérés-négyzetösszegének nevezzük és SSj kifejezéssel rövidítjük.

 

j j j

f

i ij

j f

i

j ij

j f

SS f

d f

x x

j j

 

1

2 1

2

 Megvizsgálhatjuk, hogy az emberek fizetései átlagosan mennyivel térnek el a saját foglalkozási csoportjuk átlagfizetéstől, azaz a saját részátlaguktól. Ez a viszonyítás a belső szórás. A belső szórás nagyon hasonlít a rétegenkénti szóráshoz. A különbség az, hogy rétegenkénti szórás mindig egy adott réteget jellemez és annyi van belőle, ahány réteg van, míg a belső szórás az egész sokaságról állít valamit, és egy részekre bontás esetében csak egy belső szórás van. Az ismérvértékeknek a saját részátlaguktól vett eltérés-négyzetösszegét,

(10)

10

azaz a belső szórás számlálóját belső eltérés-négyzetösszegnek nevezzük, és SSB kifejezéssel rövidítjük. Be lehet bizonyítani, hogy a belső szórás kiszámítható a rétegenkénti szórások súlyozott négyzetes átlagaként is.

 

 





   

k

j j j k

j j j k

j f

i ij k

j f

i

j ij

B g

N f N

SSB N

d N

x x

j j

1 1 2

2

1 1

2 1 1

2

 Megvizsgálhatjuk, hogy a foglalkozási csoportok átlagfizetései, azaz a részátlagok átlagosan mennyivel térnek el a vállalati átlagfizetéstől, azaz a főátlagtól. Ez a viszonyítás a külső szórás. A részátlagoknak a főátlagtól – a csoport elemszámával súlyozott – vett eltérés-négyzetösszegét, azaz a külső szórás számlálóját külső eltérés-négyzetösszegnek nevezzük, és SSK kifejezéssel rövidítjük.

 

 

N x SSK x

N g x x

f k

j

j j k

j

j j

K   

 

1

2 1

2

Ezen dimenziók mentén az alábbi összefüggést lehet felírni az eltérés- négyzetösszegekre:

SSK SSB

SST   .

Továbbá alábbi összefüggést lehet felírni a szórásnégyzetekre, azaz a varianciákra:

2 2 2

K

B

   .

Ezt az összefüggést variancia-dekompozíciónak is nevezzük. Gyakorlatilag a kifejezést arra is lehet használni, hogy a sokaság részekre bontása mennyire homogén a vizsgált mennyiségi változó mentén, például ez egyes foglalkozási csoportok homogénnek tekinthetőek-e a fizetések szempontjából. Minél nagyobb hányadát teszi ki a külső szórásnégyzet a teljes szórásnégyzetnek, annál homogénebbnek tekintjük a csoportokat.

2. Mintafeladatok 1. feladat

Az iskolai büfében három diák havi összes költését (ezer Ft) az alábbi táblázat tartalmazza.

1. diák 2,0 1,5 1,8 1,7 1,6 – 2. diák 1,5 1,5 1,5 1,6 1,6 1,5 3. diák 1,0 1,1 1,2 1,3 – –

Ha a költéseket nem különítjük el diákonként, azaz N=15, akkor beszélünk teljes megfigyelésről. Amint a költéseket a diákokhoz rendeljük, és így 3 csoportot képzünk belőlük, akkor a 15 adatból álló adathalmazt részekre bontottuk.

(11)

11 Ekkor három részátlagot kell kiszámítanunk.

72 , 5 1

6 , 1 7 , 1 8 , 1 5 , 1 0 , 2

1     

x

5333 , 6 1

5 , 1 6 , 1 6 , 1 5 , 1 5 , 1 5 , 1

2      

x

15 , 4 1

3 , 1 2 , 1 1 , 1 0 , 1

3     

x

Ezek szerint az első diák havi átlagos költése 1,72 ezer forint, a második diáké 1,53333 ezer forint, míg a harmadiké 1,15 ezer forint.

B) Számítsa ki és értelmezze külön-külön a diákok havi költésének szórását!

Ekkor három, csoporton belüli szórást kell kiszámítanunk. A szórás bármely képletével dolgozhatunk.

172 , 5 0

) 72 , 1 6 , 1 ( ) 72 , 1 7 , 1 ( ) 72 , 1 8 , 1 ( ) 72 , 1 5 , 1 ( ) 72 , 1 0 , 2

( 2 2 2 2 2

1           

047 , 0 53333 , 6 1

5 , 1 6 , 1 6 , 1 5 , 1 5 , 1 5 ,

1 2

2 2 2 2 2 2

2        

112 , 4 0

) 15 , 1 3 , 1 ( ) 15 , 1 2 , 1 ( ) 15 , 1 1 , 1 ( ) 15 , 1 0 , 1

( 2 2 2 2

3        

 

Ezek szerint az 1. diák havi költései átlagosan 0,172 ezer forinttal térnek el a költéseinek 1,72 ezer forintos átlagától.

Ezek szerint a 2. diák havi költései átlagosan 0,047 ezer forinttal térnek el a költéseinek 1,53333 ezer forintos átlagától.

Ezek szerint a 3. diák havi költései átlagosan 0,112 ezer forinttal térnek el a költéseinek 1,15 ezer forintos átlagától.

C) Számítsa ki és értelmezze külön-külön a diákok havi költésének relatív szórását!

% 10 1 , 72 0 , 1

172 , v 0

1 1

1    

x

(12)

12

% 07 , 3 0307 , 53333 0 , 1

047 , v 0

2 2

2    

x

% 7 , 9 097 , 15 0 , 1

112 , v 0

3 3

3    

x

Ezek szerint az 1. diák havi költései átlagosan 10 százalékkal térnek el a költéseinek 1,72 ezer forintos átlagától.

Ezek szerint a 2. diák havi költései átlagosan 3,07 százalékkal térnek el a költéseinek 1,53333 ezer forintos átlagától.

Ezek szerint a 3. diák havi költései átlagosan 9,7 százalékkal térnek el a költéseinek 1,15 ezer forintos átlagától.

D) Számítsa ki és értelmezze a belső szórást!

A belső szórás a csoporton belüli szórások súlyozott négyzetes átlaga.

12 , 15 0

112 , 0 4 047 , 0 6 0,172 5 15

2 2

2 3

1

2

 

 

j

j j B

f

Ezek szerint az egyes diákok havi kiadásai átlagosan 0,12 ezer forinttal térnek el a saját átlagos kiadásaiktól.

E) Számítsa ki a diákok havi átlagos költését!

Ekkor a főátlagot kell kiszámítanunk, azaz nem diákonként érdekel minket az átlagos költés, hanem együtt az összes diáké.

49333 , 15 1

3

1

j

j

j x

f x

Ezek szerint az összes diák havi átlagos kiadása 1,49333 ezer forint.

F) Számítsa ki és értelmezze a külső szórást!

A külső szórás nem más, mint a részátlagoknak a főátlagtól vett eltéréseinek súlyozott négyzetes átlaga.

(13)

13

15 ) (

1

2 j

j j K

x x f

22 , 15 0

1,49333) -

(1,15 4 1,49333) -

(1,53333 6

1,49333) -

(1,72

5 2 2 2

 

 

Ezek szerint az egyes diákok havi átlagos kiadása átlagosan 0,22 ezer forinttal tér el az összes diák havi átlagos 1,49333 ezer forintos kiadásától.

G) Számítsa ki és értelmezze a szórást!

Két lehetőség áll előttünk. Az egyik szerint mind a 15 elemet figyelembe véve kiszámítjuk a főátlagtól való eltérésük négyzetes átlagát. Ez a gyakorlatban – a megfigyelések nagy elemszáma miatt – egyrészt túlságosan számításigényes, másrészt túl sok odafigyelést igényel.

Ezért inkább azt a lehetőséget, illetve összefüggést használjuk, miszerint a külső és a belső szórás négyzetösszege megegyezik a teljes szórás négyzetével, azaz

25 , 0 0628 , 0 0628

, 0 22 , 0 12 ,

0 2 2

2 2

2        

B K .

Ezek szerint az egyes diákok havi kiadásai átlagosan 0,25 ezer forinttal térnek el az összes diák havi átlagos kiadásától.

2. feladat

Egy adott évben az épített lakások átlagos alapterületére vonatkozó néhány adat:

Az épített lakásokra vonatkozó adatok Területi egység

Épített lakások száma

(db)

Épített lakások átlagos alapterülete

(m2)

Dél-Alföld 3146 98,2

Dél-Dunántúl 2092 103,9

Észak-Alföld 4824 94,0

Észak-Magyarország 2263 106,2

Közép-Dunántúl 2360 103,5

Közép-Magyarország 7447 98,5

Nyugat-Dunántúl 2586 102,6

forrás: fiktív adatok

Tételezzük fel, hogy az összes épített lakás alapterületének szórása az összes lakás átlagos alapterületének 20%-a.

Számítsa ki és értelmezze a külső szórást, a belső szórást és a teljes szórást!

Először nézzük meg, milyen adatok szerepelnek a táblázatban. Láthatjuk, minden részcsoport esetében a csoport elemszámát, illetve a részátlagot (átlagos alapterület). Ezekből a

(14)

14

mennyiségekből a külső szórásnégyzetet tudjuk kiszámítani. Ehhez azonban meg kell határoznunk a főátlagot.

Területi egység fj xj fjxj fj (xjx)2

Dél-Alföld 3146 98,2 308937,2 6631,824

Dél-Dunántúl 2092 103,9 217358,8 37752,95

Észak-Alföld 4824 94 453456 154097,8

Észak-Magyarország 2263 106,2 240330,6 97032

Közép-Dunántúl 2360 103,5 244260 34946,56

Közép-Magyarország 7447 98,5 733529,5 9881,253 Nyugat-Dunántúl 2586 102,6 265323,6 22475,66

Összesen 24718 – 2463196 362818

652 , 24718 99

2463196

7

1  

N x f

x j

j j

 

83 , 3 6783 , 24718 14

362818

1

2

N x x f

k

j

j j

K m2

Tehát az adott évben az épített lakások régiós átlagos alapterülete átlagosan 3,83 m2-rel tér el az országos átlagtól.

A feladat szövegezésében szereplő „összes épített lakás alapterületének szórása az összes lakás átlagos alapterületének 20%-a”adat gyakorlatilag a relatív szórás. Ebből és a főátlagból ki tudjuk számítani a teljes szórást.

93 , 19 652 , 99 2 , 0 v

v   x   

x

 m2

Tehát az adott évben az épített lakások alapterületei átlagosan 19,93 m2-rel térnek el az országos átlagtól.

A belső szórás pedig az alábbi összefüggésből adódik.

56 , 19 83 , 3 93 ,

19 2 2

2 2

2 B K B   

m2

Tehát az adott évben az épített lakások alapterületei átlagosan 19,56 m2-rel térnek el a saját régiójuk átlagától.

3. feladat

Egy vállalat dolgozóinak keresetére vonatkozó néhány adat:

A vizsgált keresetek szóródási mutatói

(15)

15 Állomány-

csoport szórása (ezer Ft)

relatív szórása (%)

Szellemi 7,2 9,0

Fizikai 8,4 12,0

A dolgozók hatvan százaléka szellemi foglalkozású.

Számítsa ki és értelmezze a külső szórást, a belső szórást és a teljes szórást, valamint a relatív szórást!

Mivel mindkét részcsoport esetében a szórás és a relatív szórás adott, így a részátlagokat könnyen ki tudjuk számítani. Ismerjük, hogy az alkalmazottak hatvan százaléka szellemi foglalkozású, így gyakorlatilag a relatív gyakoriságok adottak.

Ekkor a főátlag, azaz az összes foglalkoztatott átlagkeresete:

. 76 70 4 , 0 80 6 , 0

2

1

i

i ix g x

A megoldáshoz szükséges részeredmények Állománycsoport

Havi nettó átlagkeresetek

) (xj

Relatív gyakoriság

) (gj

Szellemi 80

09 , 0

2 ,

7  0,6

Fizikai 70

12 , 0

4 ,

8  0,4

Miután kiszámítottuk a főátlagot is, meg tudjuk határozni a külső szórás értékét.

 

0,6 (80 76)2 0,4 (70 76)2 24 4,9.

1

2        

k

j

j j

K g x x

Tehát az állománycsoportok havi nettó átlagkeresetei átlagosan 4,9 ezer forinttal térnek el a vállalati havi nettó átlagkeresettől.

A részcsoportok relatív gyakoriságából és csoport szórásából kiszámítható a belső szórás:

. 7 , 7 3280 , 59 4

, 8 4 , 0 2 , 7 6 ,

0 2 2

1

2      

k

j j j

B g

Tehát az alkalmazottak havi nettó keresetei átlagosan 7,7 ezer forinttal térnek el a saját állománycsoportjuk havi nettó átlagkeresetétől.

A teljes szórásnégyzetet, a külső és a belső szórásnégyzet összegeként kapjuk:

. 1 , 9 3280 , 83 3280

, 59

2 24

2     

 BK

(16)

16 A relatív szórás pedig

% 01 , 12 1201 , 76 0

3280 ,

v  83  

x

Tehát, az alkalmazottak havi nettó keresetei átlagosan 9,1 ezer forinttal, azaz 12,01 százalékkal térnek el a vállalati havi nettó átlagkeresettől.

3. Ellenőrző kérdések

1. Részekre bontott sokaság esetén milyen szórásokat vizsgálhatunk?

2. Mit fejez ki a rétegenkénti szórás?

3. Mit fejez ki a belső szórás?

4. Mit fejez ki a külső szórás?

5. Hogyan nevezzük a szórások számlálóit?

6. Milyen összefüggés van az eltérés-négyzetösszegek között?

7. Milyen összefüggés van a külső a belső és a teljes szórás között?

8. Mi a variancia-dekompozíció tartalma?

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A vállalkozás dolgozóinak havi bruttó keresete átlagosan 104,4 ezer Ft, amelytől az egyes dolgozók havi bruttó keresetei átlagosan 18,173 ezer Ft-tal, azaz 17,41%-kal térnek

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

„Itt van egy gyakori példa arra, amikor az egyéniség felbukkan, utat akar törni: a gyerekek kikéretőznek valami- lyen ürüggyel (wc-re kell menniük, vagy inniuk kell), hogy

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A CLIL programban résztvevő pedagógusok szerepe és felelőssége azért is kiemelkedő, mert az egész oktatási-nevelési folyamatra kell koncentrálniuk, nem csupán az idegen

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a

„Én is annak idején, mikor pályakezdő korszakomban ide érkeztem az iskolába, úgy gondoltam, hogy nekem itten azzal kell foglalkoznom, hogy hogyan lehet egy jó disztichont