• Nem Talált Eredményt

fejezet - A korreláció

III. rész - KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS

8. fejezet - A korreláció

Amilyen az apja, olyan a fia

1. 1. A pontdiagram

A II. részben tárgyalt eszközök jók akkor, amikor egyidejűleg csak egy változóval foglalkozunk. Más módszerekre van azonban szükségünk, ha két változó kapcsolatát szeretnénk vizsgálni.1 Sir Francis Galton (Anglia, 1822-1911) tett némi előrelépést ezen a fronton, miközben arról gondolkodott, hogy milyen mértékben hasonlítanak vajon a gyermekek szüleikre. A Viktória korabeli Anglia statisztikusait felvillanyozta az öröklődés számszerűsítésének gondolata, és hatalmas adattömeget gyűjtöttek össze ennek megvalósítása érdekében. Mi most egy olyan vizsgálat eredményeit fogjuk szemügyre venni, amelyet Galton egyik tanítványa, Karl Pearson (Anglia, 1857-1936) végzett a családtagok közötti hasonlóságról.2

A vizsgálat keretében Pearson megmérte többek közt 1078 apa, valamint annak felnőtt fia testmagasságát.

Aligha lehetne áttekinteni ezt az 1078 magasságpárt tartalmazó listát. Megjeleníthetjük azonban a két változó–

az apa magassága, illetve a fiú magassága--közötti összefüggést egy pontdiagram segítségével (lásd 1. ábra).

Minden pont egy-egy apa-fiú párnak felel meg. A pont x koordinátája, melyet a vízszintes tengelyre mértünk fel, az apa magasságát adja meg. A pont y koordinátája (a függőleges tengely mentén) a fiú magasságát jelenti.

8.1. ábra - 1078 apa és fiú testmagasságának pontdiagramja. A diagram pozitív összefüggést mutat az apák és fiaik magassága között. A 45 fokos, y = x egyenesre esnek azok a családok, ahol a fiú magassága megegyezik az apjáéval. A berajzolt függőleges sávban találhatók azok a családok, ahol az apa magassága kerekítve 72 hüvelyk, azaz 183 cm. (Az eredeti, hüvelykben megadott adatokat centiméterben tüntetjük fel. A szerk.)

1Kettőnél több változó kezelésére is vannak módszerek, csak kissé bonyolultabbak. Szükség van némi mátrixalgebrára tárgyalásuk követéséhez. Alapvető könyvek e tárgyban:

M. L. Eaton, Multivariate Statistics:A Vector Space Approach (John Wiley & Sons, 1983).

C. R. Rao, Linear Statistical Inference and Its Applications, 2nd ed. (John Wiley & Sons, 1973).

J. A. Rice, Mathematical Statistics and Data Analysis, 2nd ed. (Duxbury Press, 1955).

H. Scheffé, The Analysis of Variance (John Wiley & Sons, 1961).

G. A. F. Seber, Linear Regression Analysis (John Wiley & Sons, 1977).

A könyv 12. fejezetének 3. szakaszában röviden szót ejtünk majd a többváltozós regressziószámításról is.

2K. Pearson, A Lee, „On the laws of inheritance in man,‖ Biometrika vol. II. (1903) 357-462. o. Hüvelykre kerekítve közölték a testmagasságok együttes megoszlását. Hogy folytonos adatokat kapjunk, tizedes értékeket rendeltünk véletlenszerűen az adatokhoz. Az itt szereplő ábrák kis mértékben eltérnek a könyv első kiadásában megjelent változattól, minthogy a most használt adatok az előzőtől független randomizálással készültek.

A korreláció

A 2.a ábra mutatja, hogyan kell elkészíteni a pontdiagramot. (A 7. fejezetben részletesen is átvettük ezt.) Az eredmény az 1. ábrán látható pontfelhő: alakja olyan, mint egy rögbilabda, csak kósza pontokkal a széleken túl is. Amikor elnagyolt vázlatot készítünk egy ilyen pontdiagramról, elegendő feltüntetnünk a tojásdad fő részt a 2.b ábra szerint.

8.2. ábra - 2.a A pontdiagram egyik pontja; 2.b A pontdiagram elnagyolt vázlata

Az 1. ábrán látható pontraj rézsutosan jobbra felfelé tart: az x koordináta növekedésével a pontok y koordinátái is felfelé tendálnak. Egy statisztikus úgy mondaná, hogy pozitív összefüggés van az apák és a fiúk testmagassága között. Magasabb apáknak rendszerint a fiuk is magasabb. Ez megerősíti azt, amit nyilvánvalónak gondolunk.

A korreláció

119

Nézzük most az ábrán szereplő 45 fokos egyenest! Ez az egyenes felel meg azoknak a családoknak, ahol a fiú testmagassága megegyezik az apjáéval. Ezen egyenes mentén a – mondjuk – 183 cm magasságú apának a fia is 183 cm magas; ha az apa 163 cm magas, akkor a fia is ennyi; és így tovább. Hasonlóan, ha egy fiú testmagassága csak kevéssel tér el az apja magasságától, akkor az őket ábrázoló pont közel lesz ehhez az egyeneshez, mint a 3. ábránál.

8.3. ábra - A fiú magassága közel van az apa magasságához

A tényleges pontdiagramon a 3. ábrához képest sokkal jobban szóródnak a pontok a 45 fokos egyenestől jobbra-balra. Ez a szóródás az apa és a fiú magassága közötti kapcsolat gyengéit mutatja. Tegyük fel például, hogy ki kellene találnunk egy fiú testmagasságát: vajon mennyit segít ebben az apa magasságának ismerete? Az első ábrán bejelölt függőleges sávba eső pontok jelentik az összes olyan apa - fiú párt, ahol az apa magassága kerekítve 183 cm (az apa magassága 182 és 184 cm között van: ahol a szaggatott függőleges vonalak metszik a vízszintes tengelyt). A fiú magassága valójában még sokféle lehet, amint azt a sávba eső pontok függőleges szóródása mutatja. Ha ismerjük is az apa magasságát, a fiú testmagasságának megtippelésekor tág tere van a hibának.

Ha erős összefüggés van két változó között, akkor az egyik változó értékének ismerete nagy segítséget jelent a másik megtippelésénél. Gyenge összefüggés esetén az egyik változóra vonatkozó információ nem sokat segít a másik kitalálásában.

A korreláció

Sir Francis Galton (Anglia, 1822-1911) Forrás: Biometrika (1903).

Társadalomtudományi vizsgálódásoknál az egyik változót független, a másikat függő változónak szokás nevezni.

Rendszerint úgy gondoljuk el, hogy a független változó befolyásolja a függő változót, nem pedig fordítva. Az 1.

ábránál az apa magasságát tekintettük független változónak és ezt vettük fel az x tengelyre: az apa magassága befolyásolja a fia magasságát. Mindazonáltal semmi sem tartja vissza a kutatót attól, hogy a fiú magasságát vegye független változónak. Ez alkalmasint helyénvaló is lehet, például ha az a kérdés, hogy mennyire található ki az apa magassága a fiú magassága alapján.

Mielőtt tovább mennénk, érdemes lenne megoldani néhány, erre az anyagrészre vonatkozó feladatot. Könnyűek, és tényleg segítséget nyújtanak a fejezet további részeinek megértéséhez. Ha gondjai támadnának, nézze át a 7.

fejezetet!

A korreláció

121

1.1. „A” feladatsor

1. Az 1. ábra alapján válaszoljon a következő kérdésekre!

a. Mekkora a legalacsonyabb apa testmagassága? Milyen magas az ő fia?

b. Mekkora a legmagasabb apa testmagassága? És a fiáé?

c. Vegyük azokat a családokat, ahol az apa magassága kb. 183 cm. Milyen magas a legmagasabb fiú? És a legalacsonyabb?

d. Hány olyan család van, ahol a fiú 198 cm-nél magasabb? Milyen magasak itt az apák?

e. Az apák átlagos magassága vajon 163, 173 vagy 183 cm körül van?

f. Az apák magasságának szórása vajon 7,5 cm, 15cm vagy 22,5 cm körül van?

2. Egy adatsor pontdiagramját láthatjuk itt. Töltse ki az üresen hagyott helyeket!

Adatok

x y

1 4

2 3

3

-- 1

-

-Pontdiagram

3. Kitalált adatok pontdiagramja látható az alábbi ábrán.

a. Vajon az x értékek átlaga 1; 1,5 vagy 2 körül alakul?

b. Vajon az x értékek szórása 0,1; 0,5 vagy 1 körül alakul?

c. Vajon az y értékek átlaga 1; 1,5 vagy 2 körül alakul?

d. Vajon az y értékek szórása 0,5; 1,5 vagy 3 körül alakul?

A korreláció

4. Készítse el az alábbi, kitalált adatsorok pontdiagramjait! Az „x‖-szel jelzett változót vegye fel az x tengelyre, az „y‖ jelűt az y tengelyre! Lássa el a tengelyeket a szükséges jelzésekkel! Előfordul, hogy ugyanaz a pont többször is szerepel. Ezt jelölhetjük úgy, hogy a pont mellett feltüntetjük az előfordulások számát, amint az alábbi ábrán látható. Alkalmazza ezt a jelölést!

(a) (b)

x y x y

1 2 3 5

3 1 1 4

2 3 3 1

1 2 2 3

1 4

4 1

Pontdiagram

5. 10 diák, A, B, C, D, E, F, G, H, I és J a félév közepén zárthelyi dolgozatot, a félév végén pedig vizsgadolgozatot írtak az egyik tantárgyból. Elért pontszámaik pontdiagramja a feladat végén látható.

a. Ki(k) teljesítettek a vizsgán ugyanúgy, mint a ZH-n?

b. Ki(k) szerepeltek a legjobban a félév végén?

c. A vizsgaeredmények átlaga vajon 25, 50 vagy 75 körül alakult?

d. A vizsgaeredmények szórása vajon 10, 25, vagy 50 körül alakult?

e. Vajon 30, 50 vagy 70 körül volt a vizsgapontszámok átlaga azok körében, akik 50 pontnál többet értek el félév közben?

f. Igaz-e: „A félévközi zárthelyin jó eredményt elérők összességében a félév végén is jól szerepeltek.‖

g. Igaz-e: „Erős pozitív kapcsolat van a félévközi és a félévvégi pontszámok között.‖

A korreláció

123

6. A következő pontdiagram az egyik kurzuson elért félévközi zárthelyi és félévvégi vizsgapontszámokat mutatja.

a. A ZH pontszámok átlaga vajon 25, 50 vagy 75 pont körül volt?

b. A ZH pontszámok szórása vajon 5, 10 vagy 20 pont körül volt?

c. A félévvégi pontszámok szórása vajon 5, 10 vagy 20 pont körül volt?

d. Melyik volt a nehezebb: a zárthelyi vagy a vizsga?

e. A zárthelyi vagy a vizsgapontszámok szóródása nagyobb?

f. Igaz-e: „Erős pozitív kapcsolat van a félévközi és a félévvégi pontszámok között.‖

2. 2. A korrelációs együttható

Tegyük fel, hogy két változó összefüggését vizsgáljuk, és felrajzoltuk már a pontdiagramot is. Egy rögbilabda alakú pontfelhőt kaptunk. Hogyan foglalhatnánk össze ezt számszerűen is? Az első lépés az lehetne, hogy megjelöljük az x és y értékek átlagát mutató pontot (4.a ábra). Ez az átlagpont kijelöli a felhő középpontját.3 A következő lépésben számszerűsíthetnénk a felhő szóródását a különböző irányokban. Használhatjuk ehhez az x értékek szórását – a vízszintes irányú szórást. A pontok nagy többsége az átlagponttól jobbra-balra vett két vízszintes szórásnyin belül esik (4.b ábra). Ugyanígy használhatjuk az y értékek szórását – a függőleges szórást – annak számszerűsítésére, hogy mennyire szórt a felhő az aljától a tetejéig nézve. A pontok legtöbbje az átlagponttól fölfelé és lefelé vett két függőleges szórásnyin belül esik (4.c ábra).

8.4. ábra - A pontdiagram összegzése

3Az „átlagpont‖ nem bevett szakkifejezés.

A korreláció

Eddig tehát a következő összegző statisztikáink vannak:

• az x értékek átlaga, az x értékek szórása

• az y értékek átlaga, az y értékek szórása

Statisztikáink megmondják, hogy hol a pontfelhő középpontja, és hogy mennyire szórt vízszintes, illetve függőleges irányban. De valami még hiányzik: a két változó közötti összefüggés erőssége. Nézzük az 5. ábrán szereplő pontdiagramokat!

8.5. ábra - Pontdiagram összegzése. A korrelációs együttható azt méri, hogy mennyire szorosan csoportosulnak a pontok egy egyenes köré.

(a) 1-hez közeli korreláció azt jelenti, hogy a pontok szorosan tömörülnek egy egyenes körül.

(b) 0-hoz közeli korreláció laza csoportosulást jelent.

Mindkét pontfelhőnek ugyanaz a középpontja, és mind vízszintes, mind függőleges irányban ugyanannyira szóródnak. Az első felhő pontjai azonban szorosan tömörülnek egy egyenes körül: erős lineáris összefüggés van a két változó között. A második felhő sokkal lazább. A kapcsolat erőssége eltérő a két ábránál. Az összefüggés méréséhez tehát további összegző statisztikára van szükségünk. Ez lesz a korrelációs együttható, melyet r-relszokás jelölni (minden különösebb ok nélkül – bár valóban kér r betű is szerepel a szóban).

A korreláció

125

A korrelációs együtthatóval mérhetjük a lineáris összefüggést, azaz a pontok tömörülését egy egyenes körül.

Két változó közötti kapcsolat a következőkkel összesíthető:

• az x értékek átlaga, az x értékek szórása,

• az y értékek átlaga, az y értékek szórása,

• az r korrelációs együttható.

A korrelációs együttható kiszámítására szolgáló képletet megadjuk majd a 4. alfejezetben, most azonban a pontdiagramok grafikus értelmezésével szeretnénk még egy kicsit foglalkozni. A 6. ábrán hat pontdiagramot láthatunk, kitalált adatokkal, mindegyiken 50 pont szerepel. Számítógép generálta ezeket úgy, hogy az átlag mindig 3, a szórás pedig mind vízszintesen, mind függőlegesen 1 legyen. A számítógép kiírta a korrelációs együttható értékét is az egyes diagramok fölé. A bal felső ábránál 0 a korrelációs együttható, a felhő pedig teljességgel alaktalan. Nem vehető ki semmiféle tendencia, hogy x növekedésével az y nőne vagy csökkenne;

csupán kósza pontokat látunk.

A következő pontdiagramnál r = 0,40 : kezd előtűnni egy egyenesszerű alakzat. A következőnél r = 0,60 és a linearitás már erősebben érzékelhető. És így tovább, egészen az utolsó ábráig. Minél közelebb van 1-hez az r, annál erősebb a lineáris összefüggés a változók között, annál szorosabban csoportosulnak a pontok egy egyenes köré. Az 1-es korrelációt, amely nem szerepel az ábrák közt, tökéletes összefüggésnek is szokás nevezni: ekkor az összes pont egy egyenesre esik, azaz tisztán lineáris kapcsolat van a változók között. A korrelációs együttható értéke legfeljebb 1 lehet.

Az egypetéjű ikrek testmagassága közötti korreláció 0,95 körül alakul.4 0,95 a korrelációs együttható a 6. ábra jobb alsó pontdiagramjánál – ehhez hasonlóan nézhet ki az ikrek pontdiagramja is. Az egypetéjű ikrek úgy hasonlítanak egymásra, mint két tojás, és a magasságukat jelölő pontok valóban eléggé közel esnek az y = x egyeneshez. De azért nem hajszálpontosan ugyanakkorák: ezt mutatja a 45 fokos egyenes körüli szóródás.

Nézzünk egy másik példát: A jövedelem és az iskolázottság közötti korreláció az USA-ban 1993-ban a 18-24 éves férfiak körében 0,15, az 55-64 éves férfiak között 0,45 volt.5 Amint a 6. ábra pontdiagramjai is mutatják, erősebb az összefüggés az idősebb korosztályban, de itt is inkább csak elnagyolt. Társadalomtudományi kutatásoknál általában gyengébb kapcsolatokkal találkozunk, az r értéke 0,3 – 0,7 között szokott lenni a legtöbb területen.

Egy kis figyelmeztetés: r = 0,80 nem azt jelenti, hogy a pontok 80%-a csoportosulna szorosan egy egyenes körül, és azt sem, hogy kétszer annyira lenne lineáris a kapcsolat, mint r = 0,40 esetén. Jelenleg még nem tudjuk közvetlen módon interpretálni a korrelációs együttható értékét; ezt majd a 10. és 11. fejezetekben tesszük meg.

8.6. ábra - A korrelációs együttható (r) hat különböző pozitív értéke. Az ábrák úgy készültek, hogy az átlag 3, a szórás pedig 1 legyen mind vízszintesen, mind függőlegesen; 50 pont szerepel mindegyik ábrán. A korrelációs együtthatóval mértük, hogy mennyire tömörülnek a pontok.

4H. N. Newman, F. N. Freeman, K. J. Holzinger, Twins: A Study of Heredity and Environment (University of Chicago Press, 1937).

Ikervizsgálatoknál az ikerpárokat kétszer szokás feltüntetni; egyszer (x,y)-ként, egyszer pedig (y,x)-ként.

5A rendszeres népességfelmérés 1993 márciusi adatai; a korrelációkat a Bureau of the Census által, a U. C. Survey Research Center közvetítésével rendelkezésünkre bocsátott CD-ROM alapján számítottuk ki, a súlyozatlan adatok felhasználásával. Az adatok az 1992. évi jövedelemre vonatkoznak. A befejezett iskolaévek számát az iskolai végzettség csoportosított adataiból kaptuk. 1992-től kezdődően kategóriánként közlik az iskolai végzettséget, mint például „1-4 osztály‖, „befejezetlen főiskola‖. Lásd Monthly Labor Review, 1993.

szeptember, 34-38. o.

A korreláció

A korreláció

127

Eddig csak pozitív összefüggésekről esett szó. A negatív összefüggést a korrelációs együttható negatív előjele jelzi. A 7. ábrán hat újabb pontdiagramot láthatunk, ismét kitalált adatokkal, itt is mindegyiken 50 pont szerepel.

A 6. ábrához hasonlóan ezek is úgy készültek, hogy az átlag 3, és a szórás mindkét változónál 1 legyen.

Vegyük például a –0,90-es korrelációt! A tömörülés ugyanolyan szoros, mint a +0,90-es korrelációnál. Csak negatív előjel esetén egy jobbfelé lejtő egyenes köré tömörülnek a pontok; pozitív előjelnél pedig felfelé tart az egyenes. Az USA-ban 1993-ban –0,25 körül volt az iskolázottság és a gyerekszám közötti korreláció a 25-39 éves nők körében – ez gyenge negatív összefüggésnek minősíthető.6 Az r = –1-es, tökéletes negatív összefüggés azt jelenti, hogy az összes pont egy jobbra lejtő egyenesen fekszik.

A korrelációs együttható mindig –1 és 1 közé esik, a kettő között viszont bármilyen értéket felvehet. Pozitív korreláció azt jelenti, hogy a pontfelhő felfelé húzódik; az egyik változó növekedésével a másik is nő. Negatív korreláció azt jelenti, hogy a felhő lefelé húzódik; az egyik változó növekedésekor a másik csökken.

Valóságos adatoknál mindkét szórás pozitív szám. Abban az elvileg lehetséges esetben, ha valamelyik szórás 0, a korrelációs együtthatót nem tudjuk értelmezni.

8.7. ábra - A korrelációs együttható hat negatív értéke. Az ábrák úgy készültek, hogy az átlag 3, a szórás 1 legyen mind vízszintesen, mind függőlegesen; 50 pont szerepel az egyes ábrákban. A pontok tömörülését a korrelációs együtthatóval mértük.

2.1. „B” feladatsor

1.

a. Vajon pozitív vagy negatív a használt autók életkora és ára közötti korreláció? Miért? (A veterán autókat nem számítjuk.)

b. Milyen vajon a korreláció az autó súlya és a 10 liter üzemanyaggal megtett út között?

2. Az alábbi pontdiagramok esetében a. Mennyi lehet körülbelül az x átlaga?

1,0 1,5 2,0 2,5 3,0 3,5 4,0

b. Mennyi lehet az y átlaga ugyanezek közül?

c. Mennyi lehet körülbelül az x szórása?

0,25 0,5 1,0 1,5

d. Mennyi lehet az y szórása ugyanezek közül?

6Lásd az 5. jegyzetet. A „gyerekszám‖ a saját, 18 éven aluli nőtlen, illetve hajadon gyerekek számát jelenti. Az anya életkorával 0,05 körüli a korreláció. Az idősebb nők kevesebb osztályt végeztek; viszont a gyerekeik is idősebbek, tehát kevesebb 18 éven aluli gyermekük van. Ez pozitív összefüggést eredményez, mely ellensúlyozza a negatív kapcsolatot. (Az adatok a 25 éven felüli anyákra vonatkoznak; a korreláció bizonyos mértékig függ a választott életkori határoktól.)

A korreláció

e. Vajon pozitív, negatív vagy 0 a korreláció?

A korreláció

129

A korreláció

3. Az előző feladat két pontdiagramja közül melyiknél van közelebb a 0-hoz a korreláció? (Az előjel nem számít.)

4. Mennyi lehet vajon az apák és a fiúk testmagassága közötti korreláció az 1. ábránál?

-0,3 ; 0 ; 0,5 vagy 0,8?

5. Mekkora vajon a korreláció, ha csak azokat a családokat vesszük figyelembe az 1. ábráról, ahol az apa 183 cm-nél magasabb?

-0,3 ; 0 ; 0,5 vagy 0,8?

6.

a. Ha minden nő nála öt évvel idősebb férfival házasodna össze, akkor a férjek és feleségek életkora közötti korreláció ________ lenne. Válassza ki az ideillőt a válaszlehetőségek közül, és adjon indoklást is!

b. Amerikában a férjek és feleségek életkora közötti korreláció _________ . Válassza ki az ideillőt a válaszlehetőségek közül, és adjon indoklást is!

pontosan -1; -1-hez közeli; 0-hoz közeli; 1-hez közeli; pontosan 1

7. Felmérést végeztek a Kaliforniai Egyetemre beiratkozott hallgatók körében. A diákok által kitöltött kérdőíveken szerepelt a születési évük, az életkoruk (években), az anyjuk életkora, satöbbi. A megadott válaszlehetőségek segítségével töltse ki az üresen hagyott helyeket, és adjon rövid indoklást is!

a. A hallgatók életkora és születési éve közötti korreláció ___________.

b. A hallgatók és édesanyjuk életkora közötti korreláció ____________ .

-1; közel van -1-hez; kisebb negatív érték;

0; kisebb pozitív érték; közel van 1-hez; 1

8. Kutatók mintát vettek a gyermek nélküli kétkeresős családoki közül. A férj és a feleség jövedelméről is van adatuk. A definíció szerint

családi jövedelem = férj jövedelme + feleség jövedelme.

A családi jövedelem átlaga 50 000$ körül volt, és a családi jövedelem a párok 10%-ánál esett 45 000 és 55 000$

közé. Töltse ki az üresen hagyott helyeket a megadott válaszlehetőségek segítségével, és adjon rövid indoklást is!

a. A feleség jövedelme és a családi jövedelem közötti korreláció _______________ .

b. A 45 000 és 55 000$ közötti jövedelemsávba eső családoknál a férj és a feleség jövedelme közötti korreláció _______________ .

-1; közel van -1-hez; kisebb negatív érték;

0; kisebb pozitív érték; közel van 1-hez; 1

9. Igaz-e: „ha 0,90 a korrelációs együttható, akkor a pontok 90%-ánál erős a korreláció‖? Adjon indoklást is!

3. 3. A szórásegyenes

iAmerikában „becenevük‖ is van: DINKS (dual-income families and no kids).

A korreláció

131

A pontdiagram pontjai általában a szórásegyenes körül látszanak tömörülni. Ez az egyenes átmegy az átlagponton; valamint átmegy minden olyan ponton, amely ugyanannyi szórásnyira van az átlagtól a két változó szerint. Vegyük például a testmagasság és a testsúly pontdiagramját! Ha valaki 1 szórással magasabb az átlagnál, és történetesen a testsúlya is 1 szórással nagyobb az átlagosnál, akkor rajta lesz a szórásegyenesen; ha viszont 1 szórással magasabb az átlagnál, de csak 0,5 szórásnyival nehezebb, akkor nem lesz rajta. Ugyanígy, rajta lesz a szórásegyenesen az, aki 2 szórással alacsonyabb és úgyszintén 2 szórással könnyebb az átlagnál;

akinek viszont 2 szórással marad el a magassága az átlagtól, ám a testsúlya 2,5 szórással, az nem lesz rajta.

A 8. ábrán látható, hogyan kell berajzolni a szórásegyenest: átmegy az átlagponton, és egy vízszintes szórásnyi távolságon egy függőleges szórásnyit emelkedik. Rövidebben szólva, a meredeksége:

(y szórása) / (x szórása).

Ez érvényes pozitív összefüggés esetén. Ha a korrelációs együttható negatív, akkor az egyenes lefelé tart, a meredeksége tehát:7

- (y szórása) / (x szórása).

8.8. ábra - A szórásegyenes megrajzolása

Pozitív korreláció esetén; Negatív korreláció esetén

3.1. „C” feladatsor

1. Igaz-e?

a. A szórásegyenes mindig átmegy az átlagponton.

b. A szórásegyenes mindig átmegy a (0;0) ponton.

2. Vajon a folytonos vagy a szaggatott vonal jelöli a szórásegyenest az alábbi ábrán?

2. Egy főiskola férfi hallgatóiról készült felmérés adatai szerint az átlagos testmagasság 69 hüvelyk, a testmagasság szórása 3 hüvelyk. A hallgatók átlagos testsúlya 140 font, 20 font szórás mellett. A magasság és a testsúly közötti korreláció 0,60. Hány fontot kell nyomnia egy 72 hüvelyk magas hallgatónak ahhoz, hogy pontja a szórásegyenesre essen?

3. A szórásegyenesre esnek-e a következő diákok pontjai a 3. feladatban szereplő adatok szerint?

a. 75 hüvelyk magas, 180 font súlyú

7Ha a korreláció 0, bármelyik meredekség használható. A „szórásegyenes‖ nem bevett szakkifejezés.

A korreláció

b. 66 hüvelyk magas, 130 font súlyú c. 66 hüvelyk magas, 120 font súlyú

4. 4. A korrelációs együttható kiszámítása

Íme a korrelációs együttható kiszámítási eljárása:

Számítsuk át mindkét változót standard egységbe. A korrelációs együttható az így képzett szorzatok átlaga.

(A standard egységeket a {79-80.} oldalakon tárgyaltuk.) Az eljárást képletszerűen is leírhatjuk; x jelöli az első változót, y a másodikat, r a korrelációs együtthatót:

r = (standard x) · (standard y) átlaga.

1. példa. Számítsuk ki r –et az 1. táblázatban szereplő kitalált adatokra!

8.1. táblázat

-Adatok

x y

1 5

3 9

4 7

5 1

7 13

Megjegyzés: A táblázat első sora a vizsgálatban szereplő egyik személy kétféle adatát jelenti; a két szám a pontdiagram megfelelő pontjának x, illetve y koordinátája. Ugyanígy a többi sorra is. Fontos a párosítás: r-nek csak akkor van értelme, ha két változónk van, és az összes vizsgált személynél mértük mindkettőt.

Megjegyzés: A táblázat első sora a vizsgálatban szereplő egyik személy kétféle adatát jelenti; a két szám a pontdiagram megfelelő pontjának x, illetve y koordinátája. Ugyanígy a többi sorra is. Fontos a párosítás: r-nek csak akkor van értelme, ha két változónk van, és az összes vizsgált személynél mértük mindkettőt.