• Nem Talált Eredményt

II. rész - LEÍRÓ STATISZTIKA

3. fejezet - A hisztogram

... a fölnőttek (...) szeretik a számokat. Ha egy új barátunkról beszélünk nekik, sosem a lényeges dolgok felől kérdezősködnek. Sosem azt kérdezik: „Milyen a hangja?” „Mik a kedves játékai?”„Szokott-e lepkét gyűjteni?” Ehelyett azt tudakolják: „Hány éves?” „Hány testvére van?” „Hány kiló?” „Mennyi jövedelme van a papájának?” És csak ezek után vélik úgy, hogy ismerik. 1

—A kis herceg

1. 1. Bevezetés

Hogyan oszlanak el a jövedelmek az országban? Mennyire megy rosszabbul a kisebbségekhez tartozók sora?

Némi információval szolgálnak erről számunkra a rendszeres kérdőíves népességfelmérésből (Current Population Survey) nyert hivatalos statisztikák. Az amerikai családok mintegy ötvenezer fős, reprezentatív mintáját kérdezik meg a kérdezőbiztosok minden egyes hónapban (részletesen lásd a VI. fejezetben).

Márciusban ezeket a családokat arra kérik, hogy számoljanak be az előző évi jövedelmeikről. Mi most az 1973-as adatokat fogjuk szemügyre venni. Természetesen előbb összesítenünk kell az adatokat, hiszen senki sem

Ebben a részben elmagyarázzuk, hogyan olvasandó a hisztogram. Mindenekelőtt, nincs függőleges tengely: a grafikus ábrázolások többségétől eltérően egy hisztogramhoz nincs feltétlenül szükség függőleges beosztásra.

Most nézzük a vízszintes tengelyt. Ez a jövedelmeket mutatja ezer dollárban. A grafikon maga egyszerűen csak téglalapok sorozata. Az első téglalap alsó éle 0-tól 1000 dollárig terjed, a másodiké 1000-től 2000 dollárig, és így tovább az utolsóig, amely a 25 000 és 50 000 dollár közötti szakaszon fekszik. Ezeket a tartományokat osztásközöknek nevezzük. Az ábra úgy készült, hogy a téglalapok területe arányos legyen azoknak a családoknak a számával, amelyeknek jövedelme a megfelelő osztásközbe esik.

Nézzük meg közelebbről is az 1. ábrát! A családok körülbelül hány százalékának volt 10 000 és 15 000 dollár közötti jövedelme? A teljes területnek nagyjából az egynegyedét teszi ki az erre az intervallumra emelt téglalap.

Tehát a családoknak körülbelül negyede, azaz 25 %-a rendelkezett ebbe a sávba eső jövedelemmel.

Vegyünk egy másik példát! Vajon az olyan családok voltak-e többen, ahol 10 000 és 15 000 dollár közötti jövedelmet értek el, vagy a 15 000 és 25 000 dollár között keresők? Az előbbi intervallumhoz tartozó téglalap magasabb, az utóbbihoz tartozó viszont szélesebb. A két téglalap területe körülbelül azonos, tehát a 10 000 és 15 000 dollár között kereső családok aránya nagyjából megegyezik a 15 000 és 25 000 között kereső családok arányával.

1Antoine de Saint-Exupéry, Rónay György fordítása. A kötetben a Harcourt Brace Jovanovich, Inc. kiadó engedélyével szerepel.

2Money Income in 1973 of Families and Persons in the United States, Current Population Reports, Series P-60, No. 97 (January, 1975). U.S.

Department of Commerce.

A hisztogram

33

Utolsó példaként nézzük a 7000 dollárnál alacsonyabb jövedelmű családok arányát! 10, 25 vagy 50%-hoz van közelebb a részarányuk? 0 és 7000 dollár között a hisztogram alatti terület szemmértékre a teljes területnek úgy az egynegyede, tehát 25%-hoz esik a legközelebb ez az arány.

A hisztogramon a téglalapok területe képviseli az arányokat.

A vízszintes tengely az 1. ábrán 50 000 dollárig tart. Mi van vajon az ennél többet kereső családokkal? A hisztogram őket egyszerűen figyelmen kívül hagyja. 1973-ban az amerikai családok mindössze 1%-a rendelkezett ennél magasabb jövedelemmel: a családok túlnyomó többsége tehát szerepel az ábrán.

Ezen a ponton érdemes elvégeznünk néhány gyakorlatot a hisztogram jobb megismeréséhez. A 2. ábrán is az 1.

ábra hisztogramja szerepel, csak függőleges tengellyel ellátva. A függőleges beosztás hasznunkra lesz az 1.

feladat megoldásánál. A 8. feladatban az 1973-as és az 1992-es jövedelmeket hasonlítjuk majd össze.

3.2. ábra - Az 1. ábrában szereplő hisztogram függőleges tengellyel ellátva

1.1. „A” feladatsor

1. A 2. ábrában szereplő családok körülbelül 1 %-ának esett 0 és 1000 dollár közé a jövedelme. Becsülje meg, hogy hány százalékuk jövedelme volt

a. 1000 és 2000 dollár között

b. 2000 és 3000 dollár között c. 3000 és 4000 dollár között d. 4000 és 5000 dollár között e. 4000 és 7000 dollár között f. 7000 és 10000 dollár között

2. A 10 000 és 11 000 dollár, vagy pedig a 15 000 és 16 000 dollár között kereső családok voltak-e többen a 2.

ábra szerint? Vagy nagyjából ugyanakkora volt a számuk? A lehető legjobb tippet válassza!

3. Az alábbi hisztogram a félév során elért pontszámokat ábrázolja az egyik tantárgyból.

a. Melyik téglalap jelenti azokat, akik 60 és 80 pont között teljesítettek?

b. 10 százalék teljesítménye volt 20 és 40 pont között. Körülbelül hány százalék ért el 40 és 60 pont közötti eredményt?

c. Körülbelül hány százalék ért el 60 pontnál többet?

A hisztogram

4. Három különböző tanulócsoport teszteredményeit vázoltuk fel az alábbi hisztogramokon. 0 és 100 közötti pontszámot lehetett elérni; 50 ponttal lehetett átmenni a vizsgán. A sikeresen vizsgázók aránya az egyes csoportokban 50% körül, jóval 50% fölött, vagy jóval 50% alatt alakult?

5. A 4. feladatban szereplő tanulócsoportok egyikében a hallgatók szétváltak két, egymástól erősen elütő csoportra. Az egyik csoport igencsak gyengén szerepelt a vizsgán, a másik viszont kiválóan. Melyik volt ez a tanulócsoport?

6. A 4. feladat (b) jelű csoportjában 40-50 vagy pedig 90-100 közötti pontszámot értek el többen?

7. Egy kutató három különböző munkáscsoport órabéreiről gyűjt adatokat. A B csoportban körülbelül a kétszeresét keresik az A csoportbeli béreknek; a C csoportba tartozók mintegy 10 dollárral keresnek többet az A csoportbelieknél. Melyik hisztogram tartozik az egyes csoportokhoz?

8. Az alábbi ábra az 1973-as és 1992-es családi jövedelmeket hasonlítja össze az Egyesült Államokban. Úgy tűnik, mintha 20 év alatt háromszorosára nőttek volna a jövedelmek. Vagy mégsem? Röviden válaszoljon!

Forrás: Current Population Survey.3

3Az 1973-as adatok forrását lásd a 2. jegyzetben. Az 1992-es adatok a Bureau of the Census CD-ROM-járól származnak, melyet a U.C.

Survey Research Center bocsátott a rendelkezésünkre. Lásd még: Money Income of Households, Families and Persons in the United States:

A hisztogram

35

2. 2. Hogyan rajzoljunk hisztogramot?

Ebben a szakaszben a hisztogram elkészítését magyarázzuk el. Nem bonyolult az eljárás, de akad benne pár elkerülendő buktató is. Kiindulópontunk egy gyakorisági táblázat, mely az egyes osztásközökbe eső jövedelemmel rendelkező családok arányát mutatja (1. táblázat). Ezeket az arányokat úgy tudjuk meg, ha visszamegyünk az eredeti adatokhoz – az 50 000 családhoz – és számlálunk. Manapság az ilyesfajta munkát számítógépek végzik, valójában az 1. táblázat is számítógép segítségével készült a Népszámlálási Hivatalban.

A számítógépnek meg kell mondanunk, mit tegyen az éppen két osztásköz határára eső családokkal. Ez a végpontokra vonatkozó konvenció. Az 1. táblázatnál követett szabályt a felirata jelzi: a baloldali végpont beletartozik az intervallumba, a jobboldali pedig nem. A táblázat első soránál például a 0 beletartozik az intervallumba, az 1000 viszont nem. Az intervallum azokat a családokat tartalmazza, akik 0 dollárt vagy annál többet, de 1000 dollárnál kevesebbet keresnek. A pontosan 1000 dollár jövedelmű családok már a következő intervallumba kerülnek.

3.1. táblázat - A családok jövedelem szerinti megoszlása az USA-ban, 1973. Az osztásközök a baloldali végpontot tartalmazzák, a jobboldalit nem.

Jövedelemkategória Százalék

Megjegyzés: A százalékarányok összege a kerekítés miatt nem pontosan 100%.

Forrás: Current Population Survey4

A hisztogram elkészítéséhez az első lépés egy vízszintes tengely felvétele. Egyesek a következőképpen látnak hozzá:

1992, Current Population Reports, Series P-60, No. 184, U.S. Department of Commerce (September, 1993). Sok esetben a kérdőívben szereplő kérdés megfogalmazása miatt kell eltérő hosszúságú osztásközökkel dolgoznunk. A megkérdezettektől például csak azt kérdezték meg, hogy a felsoroltak közül melyik sávba esik a jövedelmük; ezek a sávok – osztásközök – jellemzően különböző hosszúságúak.

4Lásd a 2. jegyzetet

A hisztogram

Ez hiba. A 7000 dollártól 10 000 dollárig terjedő intervallum háromszor akkora, mint a 6000$ és 7000$ közötti, a vízszintes tengelynek tehát a következőképpen kell kinéznie:

A következő lépés az oszlopok megrajzolása. Kísértésbe eshetünk, hogy olyan magasra rajzoljuk őket, amekkorák a táblázatban szereplő százalékok. A 3. ábrán megnézhetjük, mi is történik, ha elköveti valaki ezt a hibát. Ez az ábra igencsak rózsás képet fest a jövedelmek megoszlásról. Eszerint például sokkal több családnak lett volna 25 000 dollár fölötti jövedelme, mint 7000 dollár alatti. Gazdag ország volt az USA 1973-ban, de ennyire azért mégsem.

3.3. ábra - Ne a százalékokat mérjük fel függőlegesen!

A bonyodalom forrása az, hogy egyes osztásközök nagyobbak másoknál, így az 1. táblázatban szereplő százalékok mennyiségei nem egy az egyben felelnek meg egymásnak. A 25 000 és 50 000 dollár között kereső 8% például sokkal szélesebb jövedelemsáv mentén oszlik el, mint a 7000 és 10 000 dollár között kereső 15%.

Figyelmen kívül hagynánk ezt a tényt, ha direkt módon a százalékarányokat mérnénk fel, és túl nagyok lennének a hosszabb intervallumokon fekvő téglalapok.

Van egy egyszerű mód az osztásközök eltérő hosszának ellensúlyozására: használjunk egységként ezerdolláros intervallumokat. A tól 10 000$-ig terjedő osztásközben például háromszor van meg ez az egység: 7000$-tól 8000$-ig, 8000-től 9000-ig és 9000-től 10 000-ig. Az 1. táblázat szerint a családok 15%-ának esett a jövedelme a teljes intervallumba. Az egyes ezerdolláros részintervallumokba így nagyjából 5% esik. Ezt az ötöt, nem pedig a tizenötöt kell a 7000 és 10 000 dollár közötti szakaszra felmérnünk.

Második példának vegyük a 10 000$ és 15 000$ közötti intervallumot. Ez öt darab ezerdolláros intervallumból áll. Az 1. táblázat szerint a családok 26%-ának volt a jövedelme a teljes intervallumban. Az öt kisebb intervallum mindegyikébe nagyjából a 26 % ötöde: 26% / 5 = 5,2% esik. A 10 000 és 15 000$ közötti intervallumra felmérendő oszlop magassága tehát 5,2.

A hisztogram

37

Elkészültünk az 1. táblázat első két sorával. A teljes hisztogram elkészítéséhez ugyanezt kell tennünk a többi sorra is. Az eredmény a 4. ábrán látható.

Adott osztásköz fölé emelt oszlop magasságának kiszámításához osszuk el a százalékszámot az intervallum hosszával.

Ilyen módon a téglalap területe egyenlő lesz az adott osztásközbe eső családok részarányával. A hisztogram a megoszlást úgy ábrázolja, mintha az osztásköz mentén egyenletesen oszlana el ennyi százalék. Első közelítésnek ez azonban általában megfelel.

3.4. ábra - A családok jövedelem szerinti megoszlása az USA-ban, 1973.

Az eljárás egyszerű és világos, bár a függőleges tengely mértékegysége picit komplikáltabb. Vegyük, hogy hogyan kaptuk meg például a 7000 és 10 000 dollár közti intervallumon fekvő téglalap magasságát: a 15 százalékot elosztottuk 3 ezer dollárral. A kérdéses mértékegység tehát: százalék / ezer dollár. Gondoljunk a

„per‖ jelre egyszerűen úgy, mintha azt hallanánk, hogy Tokió népsűrűsége 20 000 fő per négyzetkilométer: a város minden egyes négyzetkilométerére körülbelül 20 ezer ember jut. Ugyanez a helyzet a hisztogramnál is. A 7000 és 10 000$ közti intervallumon fekvő téglalap magassága 5% per ezer dollár: 7000 és 10 000 dollár között minden ezerdollárnyi intervallumba a családoknak körülbelül 5%-a esik. A 4. ábrán láthatjuk a teljes hisztogramot, a függőleges tengelyen ezzel az egységgel.

2.1. „B” feladatsor

1. Az alábbi táblázat a 25 éven felüli amerikai népesség iskolázottsági szint szerinti megoszlását adja meg 1960-ban, 1970-ben és 1991-ben. (Az „iskolázottsági szint‖ az elvégzett iskolaévek számát jelenti.) Az osztásközökbe a baloldali végpont beletartozik, a jobboldali nem: a táblázat második sora szerint tehát 1960-ban az emberek mintegy 14%-a végzett 5-8 osztályt, amibe a 8 osztály elvégzése már nem tartozik bele; 1991-ben 4% esett ugyanebbe a kategóriába. Rajzolja meg az 1991-es adatok hisztogramját! A „16 és több‖ kategóriát 16-17 év tanulásként értelmezhetjük; nem sokan végeztek ugyanis 16 évnél többet, különösen nem 1960-ban és 1970-ben.

Miért csúcsosodik ki hisztogramunk a 8, 12 és 16 évnél?

A hisztogram

Iskolázottsági szint

(iskolaévek száma) 1960 1970 1991

0-5 8 6 2

5-8 14 10 4

8-9 18 13 4

9-12 19 19 11

12-13 25 31 39

13-16 9 11 18

16 és több 8 11 21

Forrás: Statistical Abstract, 1988, 202. táblázat; 1992, 220. táblázat

2. Rajzolja át az 1991-es adatok hisztogramját úgy, hogy az első két osztásközt egyesíti (0-8 év, az emberek 6%-a)! Nagyon megváltozott a hisztogram?

3. Készítse el az 1970-es adatok hisztogramját, és hasonlítsa össze az 1991-essel! Mi történt a népesség iskolázottsági szintjével 1970 és 1991 között – megnőtt, lecsökkent vagy nagyjából ugyanolyan maradt?

4. Milyen változás következett be az iskolázottságban 1960 és 1970 között?

3. A sűrűségskála

Kényelmes dolog a függőleges beosztás, amikor területeket olvasunk le a hisztogramról. A jövedelem-hisztogram elkészítésekor az előző szakaszban mi az ún. sűrűségskálával dolgoztunk.5 A vízszintes tengelyen 1000 dollárnyi családi jövedelem volt az egység, a függőleges tengely pedig az 1000 dollárnyi jövedelemre eső családok részarányát mutatta. Az 5. ábrán újabb példát láthatunk sűrűségskálával ellátott hisztogramra. Ez a 25 éven felüli amerikai népesség 1991-es iskolázottsági szintjét mutatja. Az „iskolázottsági szint‖ a befejezett iskolaévek számát jelenti; az óvoda nem számít bele.

3.5. ábra - A 25 éven felüli amerikai népesség eloszlása 1991-ben, iskolázottsági szint szerint.

5A 3. fejezet adathisztogramjai – többek közt – az elméleti hisztogramok tárgyalását készítik elő a 18. fejezet számára. Utóbbiakat sokszor sűrűségfüggvényekkel közelítjük; például gyakori, hogy egy hisztogram a „normálgörbét követi‖ abban az értelemben, hogy a görbe jól közelíti a hisztogramot. Ha az f görbe egy sűrűségfüggvényt ábrázol, az f alatti terület mutatja a valószínűséget; f –nek az x pontban felvett értéke az egységnyi hosszúságra eső valószínűséget jelenti, nem pedig x valószínűségét: x valószínűsége valójában 0, nem pedig f(x).

Általában a matematikusok nem törődnek a fizikai egységekkel, centiméterekkel, hüvelykekkel, kilogrammokkal, dollárokkal. A statisztikusoknak azonban számítanak. Ezért adjuk meg a jövedelem-hisztogram sűrűségskáláját „százalék per ezer dollárban‖ vagy a súlyhisztogramot „százalék per kilogrammban‖.

A hisztogram

39 Forrás: Statistical Abstract, 1992, 220. táblázat

Az intervallum végpontjaira vonatkozó megállapodás ennél az ábránál kicsit körülményes: a 8-9 év szakaszához tartozó oszlop például azokat jelenti, akik befejezték a 8-adik osztályt, de a 9-ediket már nem; a kilencedik osztályból évközben kimaradtak beletartoznak. A vízszintes tengelyen az iskolaév az egység, a függőleges tengelyen tehát százalék per év. Vegyük például a 13-16 év szakaszát: a hisztogram magassága itt 6% per év.

Másként fogalmazva, közelítőleg a népesség 6%-a fejezte be a főiskola első évét, másik 6% a másodikat, és újabb 6% a harmadik évet.

Az 1. szakaszban láttuk, hogyan ábrázolják a területek az arányokat: ha az egyik oszlop területe nagyobb, akkor az esetek nagyobb százalékát képviseli. Mit jelent vajon az oszlop magassága? Nézzük az 5. ábra vízszintes tengelyét! Képzeljük el, hogy az emberek felsorakoznak a tengely mentén, mindegyikük a saját iskolai végzettségének megfelelő helyre áll. A tengely – az iskolaévek – bizonyos részein nagyobb lesz a zsúfoltság. A hisztogram magassága ezt a zsúfoltságot mutatja.

A hisztogram a 12-13 év közötti intervallumon a legmagasabb, itt a legnagyobb tehát a sűrűsödés. Itt vannak mind a középfokú végzettségűek. (Az intervallumból egyesek esetleg beiratkoztak a főiskolára, de még az első évet sem fejezték be.) Két másik csúcsot is megfigyelhetünk: egy kisebbet 8-9 év között (a 8 általános végzettségűeket) és egy nagyobbat 16-17 évnél – a felsőfokú végzettségűeket. A csúcsok azt mutatják, hogy az emberek jellemzően a három lehetséges végzettségi fokozat valamelyikénél fejezik be a tanulmányaikat, és kevésbé maradnak ki menetközben.

Elsőre nem könnyű különválasztani a sűrűsödés fogalmát, melyet az oszlop magassága fejez ki, és az intervallumba esők számát, amit az oszlop területe mutat. Egy példa segíthet. Nézzük meg a 8-9 év és a 9-12 év közötti szakaszon álló oszlopot az 5. ábrán! Az első kicsivel magasabb, tehát ez az intervallum valamivel zsúfoltabb. A 9-12 év közötti intervallumban az oszlop területe azonban sokkal nagyobb, azaz jóval többen vannak itt. Persze a második szakaszon a hely is több--háromszor olyan hosszú. A két oszlop úgy viszonyul egymáshoz, mondjuk mint Hollandia és az Egyesült Államok. Hollandiában nagyobb a népsűrűség, viszont többen élnek az Egyesült Államokban.

A hisztogramon az oszlopok magassága a sűrűsödést mutatja: az egy vízszintes egységre eső százalékarányt.

Az oszlop területe ezzel szemben a megfelelő osztásközbe eső esetek számarányát fejezi ki (1. szakasz).

A sűrűségskála nagyon is hasznos, ha már elsajátítottuk a használatát. Vegyük például a 9-12 év közötti intervallumot az 5. ábráról! Itt azok az emberek találhatók, akik a középiskola első osztályát elvégezték, de nem érettségiztek le. Az intervallumhoz tartozó oszlop magassága közelítőleg 4% / év. Más szóval, a három egyéves intervallum (9-10, 10-11, 11-12) mindegyikébe az embereknek közel 4%-a tartozik. A teljes 3 év hosszúságú intervallumba így az emberek mintegy 3 · 4% = 12%-a esik. Tehát a 25 éven felüli népesség közel 12%-a elvégezte a középiskola első évét, de nem érettségizett le.

1. példa. Az alábbi rajz a jövedelem-hisztogram egyik oszlopát mutatja egy bizonyos városra vonatkozóan. A családok körülbelül hány százalékának volt 15 000 és 25 000 dollár közötti jövedelme a városban?

Megoldás: Az oszlop magassága 2% / ezer dollár; 15 000-25 000 dollár között minden egyes ezerdolláros intervallumba a város családjainak körülbelül 2%-a esik. 15.000 és 25.000 dollár között 10 darab ezerdolláros intervallum van. A válasz tehát 10 · 2%= 20%. A családok körülbelül 20%-ának volt 15 000 és 25 000 dollár közötti jövedelme.

A példából látható, hogy a sűrűségskálát használva százalékban jön ki az oszlop területe. A vízszintes tengely egysége – az ezer dollár – kiesik:

A hisztogram

2% / 1000 dollár ·10 000 dollár = 20%

2. példa. Az alábbi hisztogramon emberek egy csoportjának testsúlyát vázolta fel valaki sűrűségskála alkalmazásával. Mi nem stimmel?

Megoldás: A teljes terület 200%, holott 100%-nak kellene lennie. Következőképpen számolható ki a terület: a hisztogram közelítőleg háromszöget alkot, melynek magassága 4% /kg, alapja pedig 150 kg – 50 kg = 100 kg.

Területe így

½ · alap · magasság = ½ · 100 kg · 4% / kg = 200% .

Ha a függőleges tengelyen sűrűségskála szerepel, akkor az oszlopok területét százalékban kapjuk meg. A hisztogram alatti terület adott intervallumon egyenlő az intervallumba eső esetek százalékarányával.6 A hisztogram alatti teljes terület 100%.

6Ez az osztásközökre pontos érték, más intervallumokra közelítés.

3.1. „C” feladatsor

1. Részmunkaidőben foglalkoztatottak havi jövedelmének hisztogramját láthatjuk alább (a sűrűségeket zárójelben közöltük). Havi 1000 dollárnál többet senki sem keresett. Az ábráról hiányzik a 200$-tól 500$-ig terjedő intervallumhoz tartozó oszlop. Mekkora ennek magassága?

2. Egy vizsgálatban részt vevő személyek testsúlyáról hárman is hisztogramot készítettek sűrűségskálát használva. Közülük csak az egyik jó. Melyik ez és miért?

3. Egy kutató testmagasságokról készít hisztogramot a méter alapú mértékegységrendszerben. Centiméterekben dolgozik. A függőleges tengely a sűrűséget mutatja, a függőleges tengely legfelső pontja 10 százalék per centimétert jelent. Szeretné azonban milliméterbe konvertálni az ábrát. Egy centiméter az 10 milliméter. A vízszintes tengelyen 175 cm helyett ________ mm-t kell írnia, 200 cm helyett ________ mm-t. A függőleges tengelyen a 10 százalék per cm helyett ________ százalék per millimétert, az 5 százalék per cm helyett _________ százalék per millimétert.

4. Egy egészségügyi kutatásban hisztogramon ábrázolták, hogy mennyi cigarettát szívnak naponta az egyes alanyok (jelenleg is dohányzó férfiak). A hisztogram a feladat végén látható, a sűrűséget zárójelben tűntettük fel.7 Az osztásközök a jobboldali végpontot tartalmazzák, a baloldalit nem.

a. A napi 10 vagy annál kevesebb szálat szívók aránya

7Statistical Abstract, 1971, 118. táblázat

A hisztogram

41

1,5% 15% 30% 50% körül van.

b. Az egy doboznál többet, de legfeljebb két dobozt szívók aránya

1,5% 15% 30% 50% körül van.

c. A napi egy doboznál többet szívók aránya

1,5% 15% 30% 50% körül van.

(Egy dobozban 20 szál van.)

d. A napi három doboznál többet szívók aránya

0,25% 0,5% 10% körül van.

e. A napi 15 szálat szívók aránya

0,35% 0,5% 1,5% 3,5% körül van.

4. 4. Változók

A rendszeres kérdőíves népességfelmérésben a jövedelem mellett sok más változó is szerepel. A változó olyan jellemző vonás, amely emberenként különböző lehet. A felvételben közreműködő kérdezőbiztosok egy egész sor kérdést tesznek föl: Hány éves Ön? Hányan élnek együtt a családban? Mennyi az Önök összes jövedelme?

Házas-e Ön? Van Önnek munkája? A megfelelő változók: az életkor, a családnagyság, a családi jövedelem, a családi állapot és a foglalkoztatottság. Bizonyos kérdésekre egy szám a válasz. A megfelelő változó ekkor kvantitatív, azaz számszerű. Kvantitatív változóra példa az életkor, a családnagyság, a családi jövedelem. Egyes kérdésekre valamilyen leírással (szóval vagy kifejezéssel) válaszolunk. A megfelelő változó ekkor kvalitatív, mint például a családi állapot (egyedülálló, házas, özvegy, elvált, különélő) vagy a foglalkoztatottság (munkában álló, munkanélküli, eltartott vagy inaktív).

Egy kvantitatív változó lehet diszkrét vagy folytonos. A kettő megkülönböztetése nem szigorúan egyértelmű, ám hasznos.8 A diszkrét változó értékei csak meghatározott mennyiséggel különbözhetnek egymástól. Ilyen például a családlétszám. Két család létszáma között nulla, egy, kettő stb. lehet a különbség. Köztes érték nem fordulhat elő. Az életkor viszont folytonos változó. Ez nem folyamatos öregedésünkre utal; pusztán annyit jelent, hogy két ember kora között tetszőlegesen kicsi lehet a különbség – egy év, egy hónap, egy nap, egy óra.. Végezetül, a kvalitatív, kvantitatív, diszkrét, folytonos kifejezéseket az adatok leírására is használjuk – kvalitatív adatokat nyerünk egy kvalitatív változóval kapcsolatban, stb.

8Sok változó mindkettőbe besorolható, attól függően, hogyan nézzük. A jövedelmek például legfeljebb egy pennyvel (vagy forinttal) térhetnek el egymástól. Mindazonáltal célszerű a jövedelmet folytonos változóként kezelnünk, mivel terjedelme a minimális különbségnél jóval nagyobb.

A hisztogram

A 2. szakaszban láttuk, hogyan lehet felrajzolni egy hisztogramot a gyakorisági táblázatból kiindulva. Sokszor a nyers adatokból kell kiindulnunk, az esetek (egyének, családok, iskolák stb.) és a változó hozzájuk tartozó értékeinek felsorolásából. A hisztogram megrajzolásához előbb el kell készítenünk a gyakorisági táblázatot. Az

A 2. szakaszban láttuk, hogyan lehet felrajzolni egy hisztogramot a gyakorisági táblázatból kiindulva. Sokszor a nyers adatokból kell kiindulnunk, az esetek (egyének, családok, iskolák stb.) és a változó hozzájuk tartozó értékeinek felsorolásából. A hisztogram megrajzolásához előbb el kell készítenünk a gyakorisági táblázatot. Az