• Nem Talált Eredményt

fejezet - Adatok normális közelítése

II. rész - LEÍRÓ STATISZTIKA

5. fejezet - Adatok normális közelítése

1. 1. A normálgörbe

A normálgörbét Abraham de Moivre fedezte fel 1720 körül a valószínűségek matematikájának kidolgozásakor.

(Munkásságáról a IV. és V. részben lesz majd még szó.) 1870 körül egy belga matematikusnak, Adolph Queteletnek támadt az az ötlete, hogy a görbét érdemes egyfajta ideális hisztogramnak tekinteni, és az adatokból nyert hisztogramokat ehhez hasonlítani.

A normálgörbe egyenlete elég félelmetesen néz ki:

Ebben az egyenletben a matematikatörténet legnevezetesebb számai közül három is szerepel: a , a p és az e.

De igazából csak a hatás kedvéért mutattuk meg. Meglátja majd az Olvasó, hogy könnyű a normálgörbével dolgozni. Elég egy táblázatra és saját ábráinkra támaszkodunk, az egyenletet elő sem kell vennünk. A görbét az 1. ábrán láthatjuk.

5.1. ábra - A normálgörbe

Adatok normális közelítése

77

Ennek a görbének sok fontos tulajdonsága van a számunkra. Először is szimmetrikus a 0-ra nézve: a 0-tól jobbra eső rész tükörképe a 0-tól balra lévőnek. Azután a teljes görbe alatti terület 100%. (A terület százalékban jön ki, mivel a függőleges tengelyen sűrűségbeosztás szerepel.) Végezetül mindig pozitív, azaz a vízszintes tengely fölött van. Úgy tűnik, mintha valahol 3 és 4 között véget érne, de csak azért, mert ott már nagyon lapos.

Területének mindössze hat százezredrésze része esik a –4 és 4 közötti intervallumon kívül.

Érdemes megnéznünk a normálgörbe alatti területeket egyes speciális értékek között. Például

• -1 és 1 között 68% körül van a normálgörbe alatti terület;

• -2 és 2 között 95% körül van a normálgörbe alatti terület;

• -3 és 3 között 99,7% körül van a normálgörbe alatti terület.

A területeket kikereshetjük egy táblázatból vagy megkaphatjuk egy megfelelő zsebszámológép segítségével; a táblázatot a 2. szakaszban ismerjük majd meg részletesen.

Sok adathisztogram alakja hasonlít a normálgörbéhez, feltéve, hogy ugyanazt a beosztást alkalmazzuk a tengelyeken. Ahhoz, hogy a vízszintes tengelyek megfeleljenek egymásnak, standard egységre van szükségünk.1

Egy értéket úgy váltunk át standard egységbe, hogy megnézzük, hány szórásnyival van az átlag fölött, illetve alatt.

Az átlag fölötti értékek pozitív előjelet kapnak, az átlag alattiak negatívat. Az 1. ábra vízszintes tengelyét standard egységben mértük.

A példa kedvéért vegyük a HANES mintájában szereplő 18-74 éves nőket. Átlagos testmagasságuk 161 cm volt;

a szórás 6,3 cm. Az egyik nő 174 cm magas. Mennyi vajon a magassága standard egységben mérve? Alanyunk 13 cm-rel magasabb az átlagnál, ami nagyjából éppen két szórás. Standard egységben tehát +2 a magassága.

1. példa. A HANES mintájában szereplő 18-74 éves nők esetében a. váltsa át standard egységre a következő értékeket:

(i) 167,3 cm (ii) 148,4 cm (iii) 162,3 cm (iv) 161cm

b. Mekkora testmagasságot jelent a – 1,2 standard egység?

Megoldás:

a. (i) 167, 3 cm az átlag fölött van 6,3 cm-rel, azaz 1 szórásnyival. Standard egységben a 167,3 cm: +1. (ii) 148,4 cm az átlag alatt van 12, 6 cm-rel, azaz 2 szórásnyival. Standard egységben kifejezve 148,4 cm = -2.

1Standardizált értéknek, z-score-nak, szigmának is nevezik.

Adatok normális közelítése

(iii) 162,3 cm 1,3 cm-rel, azaz 0,2 szórásnyival van az átlag fölött; a válasz 0,2. (iv) 161 cm az átlag, tehát 0 szórásnyira van az átlagtól; a válasz 0.

b. A keresett magasság 1,2 szórásnyival, azaz 1,2 · 6,3 cm ≈ 7,5 cm-rel van az átlag alatt. A magasság tehát:

161 cm – 7,5 cm = 153,5 cm.

A 2. ábrán a standard egységek is szerepelnek. Ezen az ábrán a HANES-ben résztvevő 18-74 éves nők magassághisztogramját összevethetjük a normálgörbével. A hisztogram vízszintes tengelyét centiméterben mértüki; a normálgörbéhez tartozót standard egységben. A két tengely az 1. példa szerint feleltethető meg egymásnak. A 167 cm például a +1 fölött van, az 149 pedig a –2 fölött.

Függőleges tengelyből is kettő szerepel a 2. ábrán. A hisztogramhoz a belső tartozik, mértékegysége százalék per centiméter. A normálgörbéhez a külső tengely, százalék per standard egységben mérve. Úgy nézhetjük meg, hogyan passzolnak össze ezek a tengelyek, ha vesszük a tetejükön szereplő értékeket: 50% / standard egység felel meg 8% / cm-nek, hiszen a standard egység 6, 3 cm. 50%-ot egy szórásnyin szétteríteni ugyanazt jelenti, mint 50%-ot egy 6,3 cm-es intervallumon, ami centiméterenként 8%-ra jön ki :

50% / standard egység = 50% / 6,3 cm ≈ 8 % / cm.

Hasonlóképpen 25% per standard egység felel meg 4% / cm-nek. És bármely más értékpár esetén is ugyanígy járhatunk el.

Az előző fejezetben azt mondtuk, hogy sok olyan adatsor van, ahol a számok nagyjából 68%-a az átlagtól legfeljebb egy szórásnyira van, azaz

átlag – szórás és átlag + szórás között.

Hogy lássuk, honnan jön ez a 68%, nézzünk a 2. ábrára. Azoknak a nőknek az aránya, akiknek az átlagtól egy szóráson belül van a magassága, egyenlő a hisztogram alatti területtel az átlagtól egy szóráson belül. Ezt a területet a 2. ábrán besatíroztuk. Hisztogramunk egész jól követi a normálgörbét. Néhol magasabb, máshol alacsonyabb, de a pluszok és a mínuszok nagyjából kiegyenlítik egymást. A hisztogram alatti besatírozott terület nagyjából ugyanakkora, mint a normálgörbe alá eső. A normálgörbe alatti terület pedig –1 és +1 között közelítőleg 68%. Hát innen jön ez a százalékarány.

5.2. ábra - A nők magassághisztogramja a normálgörbével összevetve. A hisztogram alatti terület 155 és 167 cm között (a magasságukat tekintve az átlagtól egy szóráson belüli nők aránya) nagyjából megegyezik a görbe alatti területtel –1 és +1 között – azaz 68%-kal.

iAz eredeti mértékegységet hüvelykről átírtuk centiméterre. A szerk.

Adatok normális közelítése

79

(Megjegyzés: Az ábra eredeti adatait hüvelykről centiméterre váltottuk át. A szerk.) Sok adatsorra érvényes, hogy az adatok 95%-a az átlagtól két szórásnyin belül van. Ez az átlag – 2 szórástól az átlag + 2 szórásig

terjedő intervallum.

Az okoskodás az előzőhöz hasonló. Ha a hisztogram követi a normálgörbét, akkor a hisztogram alatti terület nagyjából megegyezik a görbe alatti területtel. –2 és +2 között pedig közelítőleg 95% a görbe alatti terület:

A normálgörbét használhatjuk arra, hogy megbecsüljük2, adataink hány százaléka esik egy adott intervallumba, mégpedig a következő módon: Először átszámoljuk az intervallumot standard egységbe; azután meghatározzuk, hogy mekkora a megfelelő területet a normálgörbe alatt. A 2. szakaszban elmagyarázzuk, hogyan lehet megkapni a görbe alatti területeket, a 3. szakaszban pedig együtt látjuk majd a két lépést. Az egész eljárást normális közelítésnek nevezzük. A közelítés abból áll, hogy a valódi hisztogramot a normálgörbével helyettesítjük, mielőtt kiszámolnánk a területet.

1.1. „A” feladatsor

1. Az egyik vizsgán az átlagpontszám 50, a szórás 10 volt.

a. Számítsa át standard egységbe a következő pontszámokat: 60, 45, 75.

b. Mekkorák voltak azok a pontszámok, amelyek értéke standard egységben: 0, +1,5, -2,8?

2.

2A „becslés‖, „megbecsülni‖ szavakat itt köznapi értelemben használjuk: „határozzuk meg közelítőleg‖. A „becslés‖ emellett szakkifejezés is a statisztikában, melyet a VI. részben tárgyalunk majd.

Adatok normális közelítése

a. Váltsa át a következő listán szereplő számokat standard egységbe (azaz a lista átlagával és szórásával kifejezve): 13, 9, 11, 7, 10.

b. Mennyi lesz az átváltott lista átlaga és szórása?

2. 2. A normálgörbe alatti területek meghatározása

A könyvünk végén található első táblázat megadja, hogy mekkorák bizonyos területek a normálgörbe alatt. Ha például a –1,20 és +1,20 közötti területre vagyunk kíváncsiak, menjünk a z-vel jelölt oszlop 1,20-as sorába, és olvassuk le a Terület feliratú oszlopban szereplő számot. Ez kerekítve 77%. –1,20 és 1,20 között tehát körülbelül 77% a normálgörbe alatti terület.

De másféle területekre is kíváncsiak lehetünk.:

Példákon mutatjuk be, hogyan lehet ilyen területek nagyságát is meghatározni.

2. példa. Mennyi a normálgörbe alatti terület 0 és 1 között?

Megoldás: Készítsünk először vázlatot a normálgörbéről, melyen vonalkázzuk be a keresett területet.

A táblázatban a –1 és +1 közé eső terület szerepel. Ez kerekítve 68%. A szimmetria miatt a 0 és 1 közötti terület a –1 és +1 közé eső terület fele, azaz

½ · 68% = 34%.

3.példa. Mennyi a normálgörbe alatti terület 0 és 2 között?

Megoldás: Ez nem a 0 és 1közötti terület kétszerese, hiszen a görbe nem téglalap alakú.

Az eljárás ugyanaz, mint a 2. példában. A –2 és +2 közötti terület kikereshető a táblázatból. Kerekítve 95%. A 0 és 2 közötti terület a szimmetria miatt ennek a fele:

½ · 95% ≈ 48%

4. példa. Mekkora a normálgörbe alatti terület -2 és 1 között?

Megoldás: A –2 és 1 közötti területet két részre bonthatjuk:

Adatok normális közelítése

81

A –2 és 0 közötti terület a szimmetria miatt ugyanakkora, mint a 0 és 2 közötti, mégpedig közelítőleg 48% (lásd 3. példa). A 0 és 1 közötti terület körülbelül 34% (lásd a 3. példát). A –2 és 1 közötti terület tehát

48% + 34% = 82%.

5. példa. Mekkora az 1-től jobbra eső terület a normálgörbe alatt?

Megoldás: A táblázat megadja a –1 és 1 közé eső területet: 68%. Az ezen intervallumon kívüli terület 32%.

A szimmetria miatt az 1-től jobbra eső terület ennek a fele, azaz 16%.

6. példa. Keressük meg a 2-től balra eső normálgörbe alatti területet!

Megoldás: A 2-től balra eső terület a 0-tól balra eső, és a 0 és 2 közötti területek összege.

A 0-tól balra eső terület a szimmetria miatt a teljes terület fele:

½ · 100% = 50%

A 0 és 2 közé eső terület 48% körül van. Összegük: 50% + 48% = 98%.

7. példa. Keressük meg a normálgörbe alatti területet 1 és 2 között!

Megoldás:

A –2 és 2 közötti terület kerekítve 95%, míg a –1 és 1 közötti 68%. Különbségük fele:

½ · (95% - 68%) = ½ · 27% ≈ 14%.

Az ilyenfajta feladatok megoldásához nincs mechanikusan végrehajtható eljárás. Az a lényeg, hogy megtaláljuk azokat az ábrákat, amelyek a kérdéses területet összefüggésbe hozzák a táblázatból kiolvasható területekkel.

2.1. „B” feladatsor

1. Határozzuk meg a normálgörbe alatti területet a. 1,25-től jobbra

b. –0,40-től balra c. 0,80-tól balra

Adatok normális közelítése

d. 0,40 és 1,30 között e. –0,30 és 0,90 között

f. a –1,5 és 1,5 közötti intervallumon kívül 2. Töltse ki az üresen hagyott helyeket!

a. A normálgörbe alatti terület ± __________ között 68%.

b. A normálgörbe alatti terület ± __________ között 75%.

3. Vázlatot készítettünk a normálgörbe alatti terület meghatározásához. Mennyi z értéke?

4. Felvázoltunk egy görbét (nem a normálgörbét). A görbe alatti teljes terület 100%, a 0 és 1 közé eső terület pedig 39%.

a. Határozza meg az 1-től jobbra eső terület nagyságát, ha ez lehetséges!

b. Határozza meg a 0 és 0,5 közé eső terület nagyságát, ha ez lehetséges!

5. Felvázoltunk egy görbét (nem a normálgörbét). Szimmetrikus a 0-ra nézve, és a görbe alatti teljes terület 100%. A –1 és 1 közé eső terület 58%.

a. Határozza meg a 0 és 1 közé eső terület nagyságát, ha ez lehetséges!

b. Határozza meg az 1-től jobbra eső terület nagyságát, ha ez lehetséges!

c. Határozza meg a 2-től jobbra eső terület nagyságát, ha ez lehetséges!

3. 3. A normális közelítés adatokon

A normális közelítés eljárását egy példán keresztül fogjuk világossá tenni. Az ábrák oly egyszerűnek tűnhetnek, hogy az Olvasó esetleg azt gondolja, nem is érdemes fáradni velük. De könnyű elveszíteni a fonalat, ezért kérünk mindenkit: készítsen magának vázlatot!

8. példa. A HANES felmérésében részt vevő 18-74 éves férfiak magasságátlaga 175,3 cm, a szórás 7,6 cmii. Becsüljük meg a normálgörbe segítségével, hogy hány százalékuk magassága volt 160 és 183 cm között!

Megoldás: A kérdezett arányt a magassághisztogram alatti terület adja meg 160 és 183 cm között.

1. lépés. Rajzoljunk egy számegyenest és vonalkázzuk be az intervallumot!

iiAz eredeti adatokat hüvelykben adták meg. A szerk.

Adatok normális közelítése

83

2. lépés. Jelöljük be a számegyenesen az átlagot, és számoljuk át a végpontokat standard egységbe!

3. lépés. Rajzoljuk be a normálgörbét, és határozzuk meg a 2. lépésben kapott standard egységekkel számolva a besatírozott intervallum fölötti területet. A keresett arány közelítőleg megegyezik a bevonalkázott területtel, ami körülbelül 82%.

A normálgörbe segítségével úgy becsülhetjük, hogy a magasságok körülbelül 82%-a esett 63 és 72 hüvelyk közé. Ez ugyan csak közelítés, ám meglehetősen pontos: a valóságban a férfiak 84%-a volt ekkora. A 3. ábrán látható ez a megközelítő hasonlóság.

5.3. ábra - Normális közelítéskor a normálgörbével helyettesítjük az eredeti hisztogramot a görbe alatti terület kiszámítása előtt

9. példa. A HANES felmérésében részt vevő 18-74 éves nők átlagos magassága 161 cm, a szórás 6,3 cm volt.

Adjunk becslést a 152 centiméternél magasabb nők arányára a normálgörbe segítségével!

Megoldás: 152 cm 1,4 szórással alacsonyabb az átlagnál:

(152 – 161) / 6,3 = -1,4.

A normálgörbe segítségével úgy becsülhetjük, hogy a nők mintegy 92%-a 152 cm-nél) magasabb volt. Ez a becslés nagyjából stimmel is.

Adatok normális közelítése

Figyelemre méltó tény, hogy sok hisztogram követi a normálgörbét. (Ezt a történetet az V. részben még folytatjuk!) Ilyen hisztogramok esetében az átlag és a szórás jó összegző statisztikák. Ha egy hisztogram a normálgörbét követi, akkor nagyjából hasonló a 4. ábrán szereplő rajzhoz. Az átlag kijelöli a középpontját, a szórás pedig megadja a szélességét. Lényegében csak ennyi a mondandónk a hisztogramról – amennyiben a normálgörbéhez hasonló az alakja. Sok más hisztogram azonban nem követi a normálgörbét. Ilyen esetekben eléggé szegényes összegző statisztika az átlag és a szórás. De erről majd a következő szakaszban szólunk bővebben.

5.4. ábra - Az átlag és a szórás. Az átlag és a szórás a középpont, illetve a középpont körüli szóródás mértékének megadásával összegzi a normálgörbét követő hisztogramot.

3.1. „C” feladatsor

1. A HANES-ben szereplő 18-24 éves nők átlagos magassága 163 cm, a szórás körülbelül 6,6 cm. A normálgörbe segítségével becsüljük meg azon nők arányát, akiknek testmagassága

a. 167 cm alatt volt,

b. 152 és 167 cm között volt,

c. 183 cm fölött volt.

2. Az egyik jogi egyetemen a frissen felvett hallgatók felvételi pontszámainak átlaga 160, a szórás 8 körül volt.

A pontszámok hisztogramja elég jól követi a normálgörbét.

a. Az évfolyamra járók körülbelül hány százalékának lehetett 166 alatti pontszáma?

b. Az egyik hallgató pontszáma 0,5 szórásnyival volt az átlag fölött. A teljes évfolyamnak körülbelül hány százaléka teljesített nála rosszabbul?

3. A 155 és 167cm közötti nők aránya pontosan megegyezik a _______, és közelítőleg megegyezik a _________ alatti területtel a 2. ábrán. Válaszlehetőségek: normálgörbe, hisztogram.

4. 4. Percentilisek

Az átlag és a szórás jól használhatók a normálgörbét követő adatok összegzésére. Másfajta adatok összesítésére már kevésbé felelnek meg. Vegyük például az amerikai családi jövedelmek megoszlását 1992-ből, melyet az 5.

ábrán láthatunk.

5.5. ábra - A családi jövedelmek megoszlása: USA, 1992.

Adatok normális közelítése

85

Forrás: A rendszeres népességfelmérés 1993. márciusi adatai; az adatokat CD-n a U. C. Survey Research Center közvetítésével a Bureau of the Census bocsátotta rendelkezésünkre.

A családok jövedelemátlaga az 5. ábra szerint 44 500$, a szórás 32 000$ körül van.3 Normális közelítéssel azt kapnánk, hogy a családok mintegy 8%-a negatív jövedelemmel rendelkezett:

5.6. ábra

-A baklövés oka: az 5. ábrán látható hisztogram cseppet sem követi jól a normálgörbét: jobbra hosszan elnyúló farka van. Ilyen hisztogramok összegzésére a statisztikusok általában percentiliseket használnak (1. táblázat).

5.1. táblázat - Az 1992-es amerikai családi jövedelmek egyes percentilisei.

1 1 300$

10 10 200$

25 20 100$

50 36 800$

75 58 100$

90 85 000$

99 151 800$

Forrás: A Rendszeres Népességfelmérés 1993. márciusi adatai; az adatokat CD-n a U. C. Survey Research Center közvetítésével a Bureau of the Census bocsátotta rendelkezésünkre.

A jövedelemmegoszlás első percentilise 1300$, ami azt jelenti, hogy a családok 1%-a keresett 1300$-t vagy annál is kevesebbet, 99%-uk többet. A tizedik percentilis 10 200$: a családok 10%-ának ez alatt a szint alatt volt a jövedelme, 90%-é fölötte. Az 50-edik percentilis épp a medián (lásd 4. fejezet).

3Lásd a 3. fejezet 3. jegyzetét. A családi jövedelmek átlagát az 1993-as felmérés 14. táblája közli. A hisztogramot, a szórást és a percentiliseket a CD-ROM-ról számoltuk ki. A közvetlen családokra (családegységekre) vonatkozó súlyozott adatokkal dolgoztunk; az átlag 43 400$, a szórás 32 500$ volt.

Adatok normális közelítése

Definíció szerint az interkvartilis terjedelem:

(a 75. percentilis) – (a 25. percentilis).

Sokszor ezt használjuk a szóródás jellemzésére, amikor az esetek egy kis százaléka – amiatt, hogy az eloszlás erősen elnyúló farkán található – erősen befolyásolná a szórást. Az 1. táblázat esetében 38 000$ az interkvartilis terjedelem.

A statisztikusok – erre megvan a maguk oka – a Moivre-féle görbét normálgörbének nevezik. Ettől az a benyomás támadhat, mintha a többi görbe „abnormális‖ volna. De ez nincs így. Sok hisztogram igen jól követi a normálgörbét, sok más hisztogram pedig – a jövedelemhisztogramhoz hasonlóan –nem. A későbbiekben megismerkedünk majd egy matematikai elmélettel, melynek alapján megmondhatjuk, hogy mikor kell egy hisztogramnak a normálgörbét követnie.

4.1. „D” feladatsor

1. A megadott válaszlehetőségek valamelyikével töltse ki az üresen hagyott helyeket!

a. Az 1. táblázatban szereplő családok mintegy _________ %-ának 58 100$ alatt volt a jövedelme.

b. Az 1. táblázatban szereplő családok 10%-ának volt __________$ alatti jövedelme.

c. Az 10 000 és 80 000$ közötti jövedelemmel rendelkező családok aránya az 1. táblázatban _________%.

5% 10% 25% 60% 75% 95% 10 200$ 36 800$

2. 1992-ben egy 6100$ jövedelemmel rendelkező család a jövedelemmegoszlás ______ percentilisébe, míg egy 104 200$-t kereső család a _________ percentilisbe tartozott. Válaszlehetőségek: 5, 95.

3. Ha az 1973-as családi jövedelemmegoszlást nézzük: a 25. percentilis vajon 7000$, 10 000$ vagy 25 000$

körül volt? (Lásd a 3. fejezet 1. táblázatát.)

4. A bőr alatti zsírpárna vastagságával szokás mérni a zsírfelesleget. Az alábbi hisztogramon láthatjuk a bőr alatti zsírpárna vastagságának megoszlását; a vízszintes tengelyen milliméterek (mm) szerepelnek. A zsírpárna vastagságának 25. percentilise ___________ 25 mm. Töltse ki az üresen hagyott helyet az alábbi kifejezések valamelyikével! Vagy ez már az ábrából is megmondható?

• jóval kisebb mint

• körülbelül

• jóval nagyobb mint

5. Felvázoltunk egy hisztogramot.

a. Mennyiben tér el a normálgörbétől?

b. Vajon 15, 25 vagy 50 százalék körül van az interkvartilis terjedelem?

Adatok normális közelítése

87

5. 5. Percentilisek és a normálgörbe

Ha egy hisztogram a normálgörbét követi, akkor táblázatunk alapján a percentiliseket is megbecsülhetjük. Az eljárást egy példán mutatjuk be.

10. példa. Valamelyik évben az egyik egyetemre jelentkezők matematika pontszámainak átlaga 535, szórása 100 volt, és a pontszámok a normálgörbét követték. Becsüljük meg, hogy mennyi volt a 95. percentilis!

Megoldás: A keresett pontszám az átlag fölött van a szórás valahányszorosával. Ezt a számot kell megtalálnunk, nevezzük z-nek. Ez az egyenlet teljesül z-re:

A normálgörbe táblázatát nem tudjuk közvetlenül felhasználni, hiszen az a –z és z közötti területet adja meg, nem pedig a z-től balra esőt.

Az általunk keresett, z-től jobbra eső terület 5%, tehát a –z-től balra eső terület is 5%. Ebből következően a –z és z közötti terület 100% – 5% – 5% = 90%.

A táblázat alapján z ≈ 1,65. Az átlagosnál 1,65 szórásnyival jobb eredménnyel lehetett bekerülni a matematikai teszt 95. percentilisébe. Pontszámokra visszafordítva ez 1,65 · 100 = 165 ponttal több az átlagnál. A pontszámok megoszlásának 95. percentilise 535 + 165 = 700.

A szóhasználat kissé összezavarja az embert. A percentilis egy pontszám: a 10. példában a 700-as pontszám a 95. percentilis. A percentilis besorolás viszont egy százalék: ha valaki 700 pontot elér, akkor teljesítményével a 95%-os percentilisbe sorolódik. Még egy harmadik módon is elmondhatjuk ugyanezt: 700 ponttal az ember a pontszámok megoszlásának 95. percentilisébe kerül.

5.1. „E” feladatsor

1. A 10. feladatban említett egyetemen az egyik jelentkező 750 pontot ért el matematikából. Ezzel ő a _________ percentilisbe került.

Adatok normális közelítése

a. Mennyi volt a matematika pontszámok 80. percentilise ugyanezen az egyetemen?

b. A Berkeley első éveseinek körében 3,0 körül volt a tanulmányi átlagok átlaga, a szórás körülbelül 0,5. A hisztogram a normálgörbét követi. Mennyi lehet a tanulmányi átlagok megoszlásának 30. percentilise?

6. 6. A skála megváltoztatása

Ha egy listán szereplő összes számhoz hozzáadjuk ugyanazt az értéket, akkor az átlag is ezzel az értékkel nő, a szórás pedig nem változik. (Az átlagtól való eltérések nem változnak, hiszen a konstans, amit minden számhoz hozzáadtunk, egyszerűen kiesik.) Továbbá ha ugyanazzal a számmal szorozzuk meg a lista összes számát, akkor az átlag és a szórás is ugyanennyiszeresére változik. Egy kivétel van ez alól: ha a szorzó negatív szám, attól a szórás előjele nem változik. A 4. fejezet "E" feladatsorában szereplő 5-8. feladatoknál láttuk ezeket az összefüggéseket.

11. példa.

a. Mennyi a következő számok átlaga és szórása? 1, 3, 4, 5, 7.

b. Az (a) pontban szereplő számokat szorozzuk meg 3-mal, majd adjunk mindegyikhez 7-et. Így a következő listát nyerjük: 10, 16, 19, 22, 28. Mennyi lesz az új lista átlaga és szórása?

Megoldás:

c. 4 az átlag. Az átlagtól való eltérések így –3, -1, 0, 1, 3. A szórás 2.

d. Az átlag 3 · 4 + 7 = 19, a szórás 3 · 2 = 6. (Természetesen direkt módon is kiszámolhatjuk ezeket.) 12. példa. Váltsuk át a következő listákon szereplő számokat standard egységbe!

a. 1, 3, 4, 5, 7

b. 10, 16, 19, 22, 28

(Ugyanezek a számok szerepeltek az előző feladatban is.) Megoldás:

a. 4 az átlag, az átlagtól való eltérések pedig –3, -1, 0, 1, 3. A szórás 2. Osszunk 2-vel, hogy standard egységben kapjuk meg a listát:

A (b) listát a skála megváltoztatásával kaptuk meg az (a) listából: szoroztunk 3-mal és 7-et hozzáadtunk. A 7 eltűnik, amikor az átlagtól való eltéréseket számoljuk. A 3 akkor tűnik el, amikor osztunk a szórással, hiszen a szórás is – az összes átlagtól való eltéréssel együtt – a 3-szorosára nőtt. Ezért van az, hogy a standard egységben vett listák megegyeznek. Összegezve:

i. Ha ugyanazt az értéket adjuk a listán szereplő összes számhoz, akkor az átlaghoz is ugyanez a konstans adódik; a szórás nem változik.

ii. Ha ugyanazzal a pozitív értékkel szorozzuk meg a listán szereplő összes számot, akkor az átlag és a szórás is ugyanezzel a konstanssal szorzódik.

Adatok normális közelítése

89

iii. A skála megváltozása a standard egységbe konvertált listán nem változtat.

Gyakorlati példa erre a hőmérséklet átszámítása Fahrenheit fokról Celsius fokra:

C° = 5/9 (F° - 32°)

A statisztikusok skálatranszformációnak nevezik ezt, mivel csak a mértékegység változik. Mi történik vajon akkor, ha a listán szereplő számokat negatív konstanssal szorozzuk meg? Standard egységben véve ilyenkor az előjelek egyszerűen megfordulnak.

6.1. „F” feladatsor

1. Emberek egy csoportjának 98,6 Fahrenheit-fok a testhőmérséklet-átlaga, 0,3 foknyi szórás mellett.

a. Váltsa át ezeket az eredményeket Celsius- fokra!

b. Az egyik ember hőmérséklete a Fahrenheit-skálán 1,5 szórással magasabb az átlagnál. Számítsa át ezt a hőmérsékletet olyan standard egységbe, amellyel a Celsius-skálát használó kutató is dolgozhat!

7. 7. Ismétlő feladatsor

Az ismétlő feladatok a korábbi fejezetek anyagait is felhasználhatják.

1. A következő listán szereplő tesztpontszámok átlaga 50, szórásuk 10:

39 41 47 58 65 37 37 49 56 59 62 36 48

52 64 29 44 47 49 52 53 54 72 50 50

a. Becsülje meg normális közelítéssel, hogy hány pontszám esik az átlagtól 1,25 szóráson belül!

b. Hány pontszám esett valójában az átlagtól 1,25 szóráson belül?

b. Hány pontszám esett valójában az átlagtól 1,25 szóráson belül?