• Nem Talált Eredményt

A korrelációszámítás lényege és jelentősége

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A korrelációszámítás lényege és jelentősége"

Copied!
10
0
0

Teljes szövegt

(1)

562

;

SZEMLE

W .

Az egyes iparcsoportok indexeinekmkji-

lönbözőségéből eredő eltérések a könnyű-

ipar nettó indexétavállalati teljes terme—

lés indexéhez képest csökkentik mind az

1949—1954. évek között (—0,3%), mind

1954—1957. évek között (—2,1%).

Az újfajta _ a teljesített órákkal való

—- mérlegelés hatása a könnyűipar nettó termelési indexére azonbanakét időszak között már jelentősen eltérő. Míg az 1949—1954. évek között a nettó termelési

indexet a teljes termelési indexhez ké—

pest az eltérő mérlegelés —§—6,5 százalék—

kal növeli, addig az 1954—1957. évek kö—

zött —— bár jelentéktelen mértékben

—-— csökkentő (——0,1%) hatással van.,

Tehát —- most már a két időszakot ,

együtt vizsgálva -—- az egyes iparcsopor—

tok nettó és teljes termelési indexei kö—

zötti eltérés a könnyűipar összindexei kö-

zötti eltérésre csak kisebb mértékben hat (———2,4%) és a könnyűipar nettó termelési indexét lefelé húzza a teljes termelés in—

dexéhez képest. A teljesitett órákkal való mérlegelés miatti eltérés a két index kö—

zötti különbség nagyobb részét képezi

(—t—6,4%) és végeredményben okozója" an—

nak, hogy a nettó termelési index a tel- jes termelés indexénél nagyobb emelke— ' dést H— 40/0) jelez.

Nagy István

A korrelációszámítás lényege és jelentősége*

A statisztika nem tárja fel a jelenségek

közötti belső összefüggéseket. A statisz—

tika nem képes a kérdés Éényegét meg—

határozni, azt hogy miért változik vala- mely ismérv vagy jelenség értéke. Az egyetlen, amit a statisztika tehet az, hogy

minden egyes statisztikai megfigyelési

egységnél, illetve a megfigyelési egysé—

gek csoportjánál szembeállítja a két1

viZSgált ismérv értékét, és vizsgálja ——a

véletlen tömegjelenségek, illetve folyama—

tok elemzésének szabályai szerint —-—, hogy páros vagy csoportos változásaik-

ban meg van-e vagy hiányzik-e a kap—

csolat. A megfelelő terület elméleti tu—

dományainak feladata indokolni és ma—

gyarázni az összehasonlított ismérvek

változásainak kapcsolatát.

A JELENSÉGEK ÖSSZEFOGGÉS'ÉNEK JELLEMZÉSE

Azt az ismérvet, amely valamely módon

meghatározza egy másik jelenség érté—

keit, tényező ismérvnek (független válto-

zónak), azt az ismérvet pedig, amelynek

értékei a tényező ismérv változásaitól függően változnak, eredmény ismérvnek (függő változónak) nevezzük. A tényező ismérvek és az eredmény ismérvek kö—

zötti, statisztikailag megállapított össze-

* A cikket D. I. Oparin professzor a Slatísziikm Szemle részére irta,

líTermészetesen tőbb szimultán tényező ismérv, tehát több változós kapcsolat esetén is lehet korre—

lációs elemzést alkal-malmi. (Szerk.) *

függés a jelenségek különféle fajta belső kapcsolatának formális kifejezése.

Megmérjük a hal hosszát, és azt akar—

juk megtudni, hogyan változik a hal súlya hosszától függően. Ebben az esetben a

tényező ismérv a hal hossza, az eredmény ismérv pedig a hal súlya. Ha forditva

tesszük fel a kérdést, éspedig megmérjük

a hal súlyát és meg akarjuk határozni a hal hosszát súlyától függően, akkor a

statisztikai szembeállítás szempontjából

a hal súlya a tényező ismérv, és a hal

hossza az eredmény ismérv. Az ilyen

csere nem érinti a kérdés lényegét, mint—

hogy az adott esetben csupán a hal nö-

vekedésével kapcsolatosan változó két is-

mérv értékei közötti kapcsolat meghatá- .

rozásáról van szó. A szomszédos parcel—

lák területegységére eső terméshozam-

értékek közötti párhuzamos változások

hasonló meghatározása szintén csak az

ismérvek értékeinek statisztikai kapcso-

latát tárja fel, és semmit sem mond az

okozati összefüggésről. Ebben az esetben a tényező és az eredmény ismérvek szin-

* tén felcserélhetők.

Különösen gakran fordul elő a válto- zások párhuzamos kapcsolata a dinamikus sorokban. A különböző népgazdasági ka- tegóriák (népesség, lakóhelyiségek, vetés- területek, állatállomány, különböző ter—

mények, gabona összes termelése stb.) értékeinek növekedését nem e kategóriák—

közötti közvetlen okozati kapcsolat, ha-

nem a népgazdaságnak az emlitett kate—

(2)

SZEMLE

góriák közötti

mellett időben idézi elő.

meghatározott

bekövetkezett

arányok

Más anyagi jellege vana viz hőmér—

séklete és a halikra kikelésének időtar—

tama vagy a víz sótartalma és a külön- böző halfajták egészséges ikráinak kifej-

lődése között. Az adott esetben senkinek

sem jut az eszébe, hogy felcserélje a té—

nyező és az eredmény ismérvet, minthogy lényegében a víz hőmérséklete és sótar—

talma azok a tényezők, amelyek meg- határözzák az ikrák kikelésének időtar-

tamát és az egészséges ivadékok számát.

Hasonló következtetésre juthatunk az

éghajlati viszonyok egyes kerületek sze—

rinti ingadozása, illetve a földekre kihor—

dott trágya mennyisége és a területegy—

ségre eső terméshozam nagysága, a ka—

pott darabbér és a munkás munkájának

termelékenysége, a munkás szolgálati ideje és teljesítménye, a gép munkavégzési sebessége és termelési teljesítménye, a munkaigényess'ég változása és a ter—

mékegység önköltsége, a villamosáram—

fejlesztő—telep teljesítőképessége, illetőleg kihasználásának mértéke és az előállított energiaegység értéke, a megtett út

hossza és a szállítások önköltsége, az ál—

lőalapok nagysága és az azonos típusú

vállalatok által kibocsátott termelés mennyisége stb. közötti kapcsolat tekin- tetében. Mindezekben az esetekben azon—-

ban figyelemmel kell lenni arra, hogy a

szembeállított ismérvek közül kizár—

tuk azoknak az egyéb ismérveknek be-

folyását, amelyek a tényező ismérven

keresztül az eredmény ismérvre rendsze—

resen hatást gyakorolhatnak. Az ilyen

esetek különösen nagy számban fordul- nak elő a gazdasági rendszeren belül egy- mással kapcsolatban levő gazdasági je—

len égek vizsgálatánál, ahol a rendszer m ködése általában a népgazdasági mu- tatószámok megfelelő arányos növekedé-

sén és minőségi változásán keresztül nyil—

vánul meg.

Készítsünk egy táblát, és helyezzük el

ennek első rovatában a tényező ismérv (például a nyári csapadék kerületek sze- rinti) értékeit növekvő sorrendben, a

második rovatban pedig az eredmény ismérv (például ugyanezen kerületekben a területegységre eső terméshozam) érté-

keit.

fejlődése _

- szabály szerint,

563

Most könnyen megfigyelhetjük a két vizsgált ismérv változásai kapcsolatának

jellegét. Ha az eredmény ismérv értékea

táblában a tényező ismérv növekedésével

megegyezően növekszik, akkor követke—

zésképpen feltételezhetjük, hogy értékeik

között egyenes (direkt) kapcsolat van.

Ha megfordítva, a tényező ismérv érté—

kének növekedése mellett az eredmény

ismérv szisztematikusan csökken, akkor

a jelenségek között forditott (inverz) kap—

csolat áll fenn, azaz az egyik jelenség értékének növekedésével a másik értéke

csökken. Végül, ha az eredmény ismérv

értéke rendszertelenül hol emelkedik. hol csökken, akkor a jelenségek változásai—

ban nincs semmiféle meghatározott össze—

függés, azaz a jelenségek között a vizs—

gált ismérvek tekintetében ' semmiféle kapcsolatot nem lehet megállapítani.

Mégszemléletesebb az ilyen összeha—

sonlítás, ha grafikon segítségével végez—

zük. Ebben az esetben a tényező ismérv lehetséges értékeit az abszcissza tengely—

re, az eredmény ismérv értékeit pedig az ordinata tengelyre mérjük fel.

Az egyes (ac, y) értékeknek megfelelő pontok a koordináta rendszerben a kapcsolat fennforgását vagy hiányát mutatják. A pontok elhelyezkedése emelkedő görbe mentén azt mutatja, hogy a jelen- ségek között egyenes összefüggés (arány) van, a pontoknak elhelyezkedése süllyedő görbe mentén pedig forditott kapcsolatra mutat. Végül a pontok vizszintes irányú elhelyezkedése azt fejezi ki, hogy a jelenségek között nincs semmiféle kapcsolat, minthogy ebben az esetben a tényező ismérv érté- kének növekedésekor az eredmény ismérv értéke változatlan marad.

A nyári csaoadék és a terméshozam értékeinek kerületek szerinti szembeál- lításakor a tényező ismérv növekedésével, növekszik az eredmény ismérv értéke is. Ez a növekedés azonban nem jelentkezik minden egyes esetben, hanem csak mint általános tendencia az egész vizsgált sokaságra vonatkozóan állapítható meg. Következésképpen, a

tényező ismérv csupán bizonyos mérték—

ben, csupán részben határOZZa meg az

eredmény ismérv értékeit. Léteznek te- hát valamiféle egyéb (talán tisztán vélet—

len, talán szisztematikus) okok is, ame—

lyek befolyásolják az eredmény ismérv értékét. Ezért tehát egy és ugyanazon a:

értéknek több különböző 1; érték felelhet meg.

Ha az eredmény ismérv értékeit a té—

nyező ismérv értékei egyértelműen meg-

(3)

564

határozzák, akkor felállíthatjuk az érté—

kek közötti összefüggés képletét. A leg-

egyszerűbb esetben meghatározzuk az arányosságnak valamely együtthatóját,

amely az egyes 11 értékeknek az x érté-

keinek növekedésétől függő változását

jellemzi, Általánosítva az y-nak az az:—től

való teljes függését az 3; mi (ne) függ—

vénnyel fejezhetjük ki. Ezt az Összefüg—

gést függvény (funkcionális) kapcsolat- nak nevezzük. Ilyen összefüggés eseté—

ben az :c minden egyes értékének az y

szigorúan meghatározott értéke felelmeg.

Megfordítva, azokban az esetekben, amikor az eredmény ismérv értékét nem- csak a vizsgált tényező ismérv értéke határozza meg, hanem egyéb másodlagos, esetleg véletlen okok is, akkor az ismér- vek közötti összefüggést korrelációs kap—

csolatnak2 nevezzük. Korrelációs kapcso—

latnak fogjuk nevezni a tényező és az

eredmény ismérv között fennálló olyan összefüggést, amikoris az ac egy meghatá- rozott értékének, valamiféle egyéb is—

meretlen tényezőknek az egyes statiszti- kai megfigyelési egységekre gyakorolt

hatása következtében az y több értéke ' felel, illetve felelhet meg. Az ilyen kap—

csolatot így fejezzük ki:

?] : Ú'cs (T)

Tudjuk, hogy a valóságban a különféle jelenségek értékeiben, rejtett vagy nyílt

formában, a tényezők sokaságainak ha—

tása érvényesül. Következésképpen, igen

gyakran korrelációs kapcsolattal van, dol—

gunk,

Ha a jelenségek közötti kapcsolat függ—

vényszerű (funkcionális), azaz teljes, ak- kor a kérdés csupán a függvény formája,

azaz a jelenségek közötti kapcsolat for-

mája. (Hogyan változik az 1!) értéke az ne értékének változásától függően.) Ha a je- lenségek között korrelációs (stochasz- tikus), azaz nem teljes kapcsolat van, ak—

kor természetesen nemcsak a kapcsolat formája, hanem a kapcsolat teljességének,

illetve nem teljességének mértéke is kér-

déses. Az első kérdésre a kapcsolat egyen—

letének paraméterei, a második kérdésre a kapcsolat teljességének (szorosságának) együtthatói adnak választ.

*- Sztochasztikus kapcsolat.

szanta

A REGRESSZIÓ EMPIRIKUS VON—ALA ÉS A KORRELÁCIÓS HÁNYADOS

Ha korrelációs összefüggés esetén a

tényező ismérv és az eredmény ismérv

között a kapcsolat csupán az egész sta—

tisztikai sokaság tekintetében, csak átla-

gosan áll fenn, akkor az y értékeknek az x változásaitól függő változásaiban jelent- kező általános tendencia meghatározását valamiféle összesítő (általánosító) mutató—

számok összehasonlítása segítségével kell megkísérelnünk.

Nem lehetne—e erre a célra átlagokat

használni? Minthogy az a: egy értékének több y érték felelhet meg, igy átlagot

számíthatunk ezekből az y értékekből, és akkor minden egyes x—nek csupán egy 1;

átlagérték fog megfelelni. Ha ezeket a pontokkal jelzett és mint ordinátákat áb—

rázolt átlagokat összekötjük, akkor egy bizonyos görbét kapunk, amit a rearesz- sztó empirikus vonalának neveznek. Ez a regresszió vonal (regressziós egyenes), vagy görbe, bár igen tökéletlenül, de jel—

lemzi az y értékeknek " az a: értékek nö-

vekedésétől függő alakulását, azaz megha—

tározza a közöttük levő kapcsolat formá—

ját. Következésképpen az y átlagok szó—

ródása az eredmény ismérvnek a tényező ismérv változásaitól függő szóródását fe—

jezi ki. "

Az ún. tényező szóródás, illetve a té- nyező ismérv okozta szóródás (vőn) kiszá—

mítása céljából meg kell keresnünk az y—ra vonatkozó részátlagok eltéréseit az általános átlaguktól; ezeket az eltéréseket négyzetre emeljük az egyes csoportokba tartozó egységek számával (n) mérlegel—

jük, a szorzatokat összegezzük, és az ösz—

szeget osztjuk a statisztikai egységek ösz—

szes számával (N). Ha Mn—on az Összes

yyból számított általános átlagot, M '—ön pedig a meghatározott x—nek megfelelő y—okból számított részátlagokat értjük, akkor?

z (M'—Mmm

%: * T—*

'

3 A hazai irodalomban szokás—os írásmód szerint:

2 Sán—17): -n

Ur " '*'—7—

ahol hí" az eredmény ismérv értékeiből képezhető részátlagot, Y a lőátlagot és n az egyes részátla- gokhoz tartozó megfigyelési egységek számát jelenti.

(4)

SZEMLE

565

A a'fn értéke az ac változásai által ki—

váltott szóródás mértékét ("erősségét")

jellemzi. Tudjuk azonban, hogy korrelá—

ciós kapcsolat esetében a tényező (vagy

szisztematikus) szóródáson kívül, létezik

még egyéb, számunkra ismeretlen ténye—

zők hatása miatti szóródás is, az úgy—

nevezett maradék szóródás (ci-fm). Ez a

szóródás az eredmény ismérv egyes érté—

keinek (y) a saját részátlagok (M') körüli

ingadozásait mutatja:51

2 (y *M'V

(TZ :. —————_—_

("0 N

A kétféle szóródás együttes összege a szórásnégyzetek összekapcsolásának sza- bálya szerint; az általános szórásnégyze—

tet vagy ingadozást (ag) adja:5 (73 : 0-3" 4— 057")

Az ingadozásnak ezt az általános ösz—

szegét könnyen és közvetlenül is mérhet—

jük, ha kiszámítjuk az ismérv minden

egyes értékének (y), az általános átlagtól (Mu) való eltérését, ezeket az eltéréseket

négyzetre emeljük, összegezzük és az ösz—

szeget osztjuk a tagok összes számával:6

E' (il—Ma)a

N

Nyilvánvaló, hogy az eredmény ismérv—

nek tényező szóródása (Gin) ezen ismérv általános szóródásának (0-5) egy részét

jelenti, éspedig éppen azt a részét, amely a vizsgált tényező ismérv változásainak

hatására keletkezik. Minél nagyobb ez a

rész, annál nagyobb jelentősége van az eredmény ismérv változása szempontjá—

ból a tényező ismérv változásának. For—

dítva, minél kisebb ez a rész, annál ke—

vésbé okozzák az a: változásai az y vál—

0-3:

4 A hazai irodalomban:

,, ANY—img

o-d __—_ ___—__.

?! N

ahol Y az eredmény ismérv egyes értékeit jelenti.

5 A hazai irodalomban:

2 2 g_

a' cry % a'y, ' A hazai irodalomban:

z .§(Y'—í?i

;. N

tozásait, azaz annál kevésbé teljes kap—

csolat jellemzi a vizsgált ismérvek válto- zásait. Az említett hányadost empirikus

korrelációs hányaclosnak7 nevezzük, és az

2 0'm

In2—_

tr?)

képlet segítségével számítjuk ki. Ez a

hányados a szembeállított jelenségek kö- zötti kapcsolat teljességének (vagy mint mondják szorosságának) mértékét jellem—

zi. Például, ha a korrelációs hányados értéke a bemutatott képlet szerint 0,3, ez

azt jelenti, hogy az általános (teljes) szó-

ródás 30 százaléka az eredmény ismérv—

nek a tényező ismérv változásai által elő-

idézett tényezőszóródásra esik. A kor—

relációs hányadost rendszerint négyzetek nélkül adják meg:

C"m

7; : a.

0'0

Ebben az esetben , azonban nem állít—

hatjuk, hogy pontosan visszatükrözi az eredmény ismérv általános (teljes) szóró—

dásában a tényező ismérv szóródás há—

nyadát, minthogy

o'm %— 0'(m) sé 0-0

így tehát a részátlagokból és e részát—

lagok szóródásából levont következtetés

alapján megkaptuk mind a két ismérv

közötti kapcsolat formájának (empirikus

regresszió egyenes), mind a kapcsolat szo—

rossága együtthatójának (empirikus kor-

relációs hányados) empirikus jellemzését.

A REGRESSZIÓ ELMÉLETI! VONALA8 Ahol a részátlagokat nagy számú ér—

tékből számítjuk, ott feltételezhetjük, hogy ezek az átlagok kellő pontossággal adják meg a sokaság adott részére vonat—

kozóan az átlagos tendencia értékét. Igen

gyakran azonban az x valamely értéke

tekintetében a részátlagot két vagy há—

rom értékből kell kiszámítani, sőt néha

" A hazai irodalomban:

2 "f'

ne (,,

B A hazai irodalom—ban szokásos kifejezésmód még:

regressziós görbe analitikus meghatározása.

(5)

566 5213an

az empirikus y—nak csak egy értéke áll rendelkezésre. Természetes, hogy ilyen

esetekben a regresszió empirikus vonalá—

nak részátlagai véletlenül jelentősen ma—

gasabbak vagy fordítva alacsonyabbak

lehetnek az összegezett empirikus y—ok véletlen értékeitől függően, mint volná—

nak akkor, ha minden .va—hez sok y tar—

tozna. Innen származik a regresszió em—

pirikus vonalának a sokszor szabálytalan

görbéje, amely egyáltalán nem felel meg

annak a képnek, amelyet a jelenségek

közötti kapcsolat valódi formája szerint

kapnunk kellett volna, s amely rendsze- rint egyenes vonal lenne. Tehát a reg—

resszió empirikus vonala ,,törvényszerű—

ség ellenesen" (az adatok elégtelensége

miatt) magába gyűjtheti, illetve erősen ki—

fejezi azokat a szóródásokat, amelyek nem

tartoznak a tényező szóródáshoz, s inkább

a véletlen, a maradék szóródást tükrözi

vissza. Hogyan lehet ezt elkerülni?A

megfigyelések számának növelése nem

mindig lehetséges, helyesebben sok esetben lehetetlen. Ezenkívül a sta- tisztikai egységek számának növelése

sem védi a kutatót attól, hogy egy :r—nek,

különösen az x szélső értékeinek több

vagy egyetlen fu érték feleljen meg.

Nem lehet—e ilyen esetben a pontok ál—

talános elhelyezkedési tendenciájának meg—

őrzése mellett egyszerre az y valamennyi

empirikus értékére támaszkodni, azaz a

regresszió olyan egyenes vonalát alkal—

mazni, amely azokhoz a legközelebb Van.

Ezt megtehetjük a legkisebb négyzetek módszere segítségével, felhasználva az

alábbi egyenlőségeket, mint ún. normál-

egyenleteket?

): y : N a $ [3 L' a: ; ZmyzaZx—l—BZM,

ahol a a kezdő érték, a p pedig az iránytangens értéke (a. P ún. paraméte—

rek). A számítások egyszerűsítése céljá—

ból a koordinátatengelyék kezdőpontját áthelyezzük az összes empirikus a: kés !;

érték (M,; és My) számtani átlagának

megfelelő abszcissza és ordinata metszés- pontjába. Ekkor az x—eket és az y—okat

az általános átlaguktól való eltérésekkef

(dx és mi,) fogjuk helyettesíteni. Az első egyenlőség nyilván kiesik. A- második

egyenlőség formája az alábbi lesz:

9

dedy : (1de 4— BEdz.

A számtani átlag sajátossága szerint az

átlagtól való eltérések összege zérussal

egyenlő

2 dx : 0

Egyenlőségünk a következő [formát ölti:

;: dx dy a p 2: ág,

és ebből az egyenes iránytangensét a kö—

vetkező képlet segítségével határozzuk

meg:"

de d,,

Ed;

A B paraméter értéke a koo'rdinátaten—

gelyek áthelyezésével (párhuzamos elto-

lásánál) nem változik. Ami a kezdőpara—

métert, az az értékét illeti, annak meg—

9 A két normálegyenlet a következőképpen szár—

maztatható (hazai irodalomban szokásos írásmódot használva): Ha a szlohasvtikus kapcsolat olyan jel- legü, hogy lineáris elrendezést mutat, akkor az

összefüggést az _

Y"c:mX-H) egyenes ábrázolja

Ennek az egyenesnek azonban úgy kell az ered—

mény ismérv egyes értékeivel adott pontok között haladnia, hogy az eltérések négyzetössvege :; lehető legkisebb (minimum) legyen ("legkisebb négyzetek módszere"), vagyis

): (Y— roz

minimum legyen.

Lényegében kétváltozós függvény:—ől van szó, mely—

nek változói, m és b *

u(m,b)a ):(Y—mX—wa

A határérték megállapítása céljából az egyenletet előbb b, (majd m szerint parciálisan differenciálva

Bu Bu

811 öm

:()

8" arra ne

aba" ( """ "

Bu

————- :: ——ZZ(Y——b—mX)XaO öm

ahonnan

Erzzvrnu mzx EXYzbEXl—mixa

" A hazai irodalomban:

ahol

(6)

' SZEMLE 567

állapításához az első, teljes képletet kell és az exponenciális függvénynél

felhasználni:11 ' 2 d dlog y

_ . . lo : ————x————— ké lettel."

Ey—zva—l—BEX, 853. za; P

E'). E,;

N _— 5—3; : My—pr.

Abból a célból, hogy meghatározzuk az

az értékét xzo esetében, az M, átlag- ból ki kell vonni az m egységére eső nö—

vekedést (p), és ezt annyiszor kell ismé

telni, ahányszor ilyen növekedést az x

értékének a O—kezdőponttól az Mx átla-

gig való haladása Során (amelyet a koor—

dináta tengelyek áthelyezésekor a leol—

vasás kezdőpontjának elfogadtunk) meg—

figyelünk.

a:

Az x—ek és az y—ok közötti arányok- nak megfelelő, empirikus pontok alkotta vonal általános alakja a koordináta mezőben nem egyenes, hanem görbe vo—

nal, például másodfokú parabola vagy ex—

ponenciális függvény. Természetesen, a megfelelő paramétereket az egyenesek

,egyenleteihez hasonlóan kell kiszámítani.

A, legkisebb négyzetek módszere szerint (a koordinátatengelyeknek az átlagok met—- széspontjába való áthelyezése nélkül) a

másodfokú parabola számára kapjuk a következő egyenlőségeketzü

EycaNá—BEm—toyl'xi;

Ezym'an—l—BZwa-íe'yimi;

Zw2y: (123362 4—[323'913—1— y2x4;

és az exponenciális függvény esetében:13

Elog yleog a—lalongx;

Ea: log y: log aZm tiogpz'xs.

Természetesen a B paraméter megállapí-

tása céljából, minthogy E dx :: O, egy—

szerűsített képletekkel is dolgozhatunk,

éspedig a parabolánál a *

dedy Ed; '

11 ha?—mí

" EY2aNs—bÉAf—i- el:):2

Exrzazxibxxziczr EXzYaaixz-i—bZXS %cEX'

" ZlongNlogb—l—longX

EXIonglongX-i-logmísz

Az egyenes egyenletének, a másodfokú parabolának és az ac exponenciális függ—

vényének analitikus alakjai:15

yzaiöw vagy yza—thl—ywl

vagy

zal-%; (logyzlogai—xlogm

által, valamint az egyéb képletek segítsé—

gével meghatározott egyeneseket elméleti regressziós egyeneseknek, illetőleg a reg- resszió elméleti vonalainak nevezik.16

Milyen statisztikai elméleti. alapokon

nyugszik a regresszió elméleti viszonyá- nak, mint a tényező és az eredmény is-

mérvek közötti kapcsolat formájának megállapítása? A nagyszámok matemati—

kai törvényén, amely szerint a megfigye—

lések nagy száma esetén az általános ten—

denciától való véletlen eltérések kiegyen—

lítődnek és kifejezésre jut a jelenségek kö—

zötti kapcsolat formája. Másképpen mondva, amikor megkeressük az _egye—

nest, azt tartjuk, hogy a véletlen tényezők hatásai az egész statisztikai sokaság te—

kintetében ennek az egyenesnek értékei—

ben kiegyenlitődnek. Természetes, hogy ez az állítás csak igen nagyszámú egy—

nemű statisztikai egység esetében és

olyan feltevés. mellett helyes, hogy az

egyéb tényezők csupán véletlen hatást

gyakorolnak. Innen következik, hogy a regressziós egyenesek (a regresszió vona—

lainak) statisztikai megállapítása (mint-

hogy ez nem támaszkodik a jelenségek közötti kapcsolat formájának elméletileg levezetett anyagi törvényére) majdnem

* mindig magán viseli az adott statisztikai sokaság empirikus feltételeinek bélyegét.

A regresszió vonalai nem tekinthetők el-

méleti törvénynek a szó teljes értelmében,

Ewing?!

Ez?

" Yale—b

rzaibxa—cxt

Yabmx; (longlogb—l—Xlogm)

H log m :

" D. I. Oparin: Korrelációszámitások logaritmus- sal az ichtiológiai kutatásokban. Az S. !. Mikoxanj ról elnevezett moszkvai halipari és halgazdálkodásu műszaki intézet munkái. Moszkva, 1957. VII. old.

(7)

568

SZEMLE

m.

hanem csupán bizonyos mennyiségileg kifejezett megközelítésnek. Ezért az a kezdő paraméternek nincs önálló anyagi

tartalma, és csupán a vizsgált sokaság regresszió vonala számára kiszámított együttható. Ami a ,8 szögparamétert illeti, amely azt mutatja meg, hogy meny- nyire növekszik az eredmény ismérv ér—

téke a tényező ismérv értékének egy egy—

séggel történt növekedése esetében, ennek

értéke csupán megközelítő kifejezése a

jelenségek közötti mennyiségi összefüg—

gésnek.

AZ ELMÉLETI KORRELÁCIÓS HÁNYADOS,

A KORRELACIOS INDEX És A KORRELÁCIÓS EGYUTTHATÓ

MA regresszió elméleti vonala paraméte- reinek kiszámítása után sor kerülhet (a jelenségek közötti kapcsolatok teljessé—

gét —— szorosságát —— kifejező együttható megállapítása céljából) az elméleti kor—

relációs hányados kiszámításáraz"

Ir): Egg—, ahol a cm

0'0

jelenti a regressziós egyenes helyesen mérlegelt elméleti értékeinek általános átlagukhoz viszonyított szóródását. Más- képpen mondva, az elméleti korrelációs hányadosban a tényező szóródást a reg- resszió elméleti vonalának értékei és az

általános átlag közötti különbség hatá- rozza meg. Ezekben az esetekben rend—

szerint nem a korrelációs hányados kép- letét alkalmazzák, hanem a korrelációs index (9) képletét, amelyet az elméleti korrelációs hányadosból a szóródások összekapcsolásának törvénye alapján közvetlenül is levezethetünk:

2__ 2 2

a'() —a'm %d)-(m)

2 Um

Valóban, ha a kifejezésben a száma

mi

lálóba behelyettesitjük a a-ín :: (rá—aan)

A korrelációs index jelentése érthető. A

pontoknak az egész koordináta mezőben való szétszóródása esetén a maradék szó—

ródás —— (T(m) —-— egyenlő az általános

szigmával (0-0), azaz a regresszió víz-

szintes egyenesétől, az általános átlagtól való eltérésekből alakul ki. Ebben az eset-

ben a korrelációs index O-lesz, aminek a

jelenségek közötti kapcsolat híján lennie

kell. Ha megfordítva, a maradék szóró-

dás egyenlő zérussal, (azaz az empirikus pontok a regresszió görbéje szerint he- lyezkednek el, akkor 9 ::1; ebben az esetben a jelenségek között függvény—

szerű (funkcionális) kapcsolat van.

Ha a regresszió vonalát az egyenes egyenlete fejezi ki, akkor a kapcsolat tel—

jességének fent bemutatott képletei át—

alakulnak az úgynevezett korrelációs együttható (r) képletévé. Vegyük az el-

méleti korrelációs hányadost, értve rész-

átlagokon az elméleti regressziós egyenes

értékeit. Ekkor:

0-5" 2 (ay % By . x—Jily)2

O'á N-crg

ahol a számláló a regressziós egyenes ér—

tékeinek (ay —i— B),-ac) az y általános

átlagtól (My) való eltérései négyzeteinek

összegét jelenti. Ha a koordinátatenge—

lyek kezdőpontját áthelyezzük az MJc és M), megfelelő abszcisszájának és ordiná- tájának metszéspontjába, akkor aszy, ésxx : dx. Helyettesitsük be a 0-3 helyett

Ed;

a értékét, akkor ,

N

25542

fríz _ Easy—dem

::

03 Nna; Ed;

összefüggést kapjuk. A szög—paraméter

négyzetét (Bf/) kihozzuk a szumma jel elé, mint állandó értéket, és felcseréljük

kifejezést és négyzetgyököt vonunk,

kapjuk, hogy13 a

Ed d %

' 2 ? iii—).. kifejezéssel.

00 "(m) %n) (2: dna

g : vagv g: 1— %

03 03 Akkor kifejezésünk átalakult"

*—

2

19 ony—' Ezy

gr:

a. VEzz-Eyg

(8)

SZEMLE 569

s — a "2 megmutatja, hogy az egyenes vagy a

Um : (E dx dy) de .: (Elifdy)! , görbe egyenletével kell—e meghatározni a,

0—3 2 d; — Ed; - lid; 2 d; - Ed; regresszió vonalát és következésképpen

a kapcsolat teljességének együtthatóját.

a'm de-dy Hangsúlyozni kell, hogy a pontok

(fo "" T—T—m—2— — cs többé—kevésbé jelentős szóródása esetén Ed; ' Edy az egyenes igen gyakran kellőképpen

A kapott képlet megadja a- korrelációs

együtthatót (cs). A korrelációs együttha—

tót csak azokban az esetekben lehet és

célszerű alkalmazni, amikor az ismérvek

közötti kapcsolat formáját az egyenes fejezi ki. Ha a kapcsolat említett for—

mája görbevonal, akkor a jelenségek

közötti kapcsolat teljességének (szoros- ságának) meghatározása céljából a kor—

relációs indexet kell, használni. Amikor a

kapcsolat meghatározása végett a reg—

ressziónak a részátlagokból (az egyes

x—eknek megfelelően az y átlagokból)

képzett empirikus vonalát (görbe vonal) alkalmazzuk, ki kell számítani az em—

pirikus korrelációs hányadost.

A korrelációs hányados értéke szabály szerint magasabb, mint a korrelációs in-

dex értéke, amely Viszont magasabb, mint a korrelációs együttható értéke.

v))g)cs

A három említett együttható értéke

közötti fenti összefüggés onnan szárma—

zik, hogy a korrelációs indexet a tényező (szisztematikus) szóródásában az a gör—

bület ,,növeli", amely az egyenesnél nem áll fenn, a korrelációs hányadost pedig az, hogy ez a szisztematikus szóródásra (változékonyságra) vonatkozik, a regresz- szió empirikus vonalának azon görbüle-

teire, amelyeket a korrelációs index ki—

számításakor a maradék (véletlen) szóró—

dás elnyel.

A jelenségek közötti kapcsolat egyenes-

vonalú vagy görbevonalú formájának

meghatározása céljából a következő kép- letet használhatjuk:

Kzfrf—csz

::

' Ha az alakzat együtthatója (K) O,25—nél

kisebb, akkor az összehasonlított mutató—

számok között a különbség kevésbé lé-

nyeges. Ha a K ) (),25, akkor a feltárt különbségre különös figyelmet kell for- ditani. Legcélszerűbb mindenek előtt a tényleges adatokat koordináta rendszer-

ben ábrázolni. A kapott grafikon mindig

' mutatja az alapvető tendencia általános

tellegét, jóllehet az egyenes egyenlete lé-

nyegében nem adta meg elméletileg he—

lyesen a jelenségek közötti kapcsolat for—

máját. Ezért az empirikus anyag kutatói bár nem ismerik a jelenségek közötti

kapcsolat formájának jellegét, igen gyak—

ran a korrelációs együtthatóhoz és a reg—

ressziónak az egyenes egyenlete alapján való meghatározásához folyamodnak. Az ily módon nyert eredményeket úgy kell

tekinteni, mint első megközelítést, amely

a vizsgált anyagnak csupán empirikus jellemzését adja. Ez a jellemzés elméleti elemzés nélkül nem vonatkoztatható fenn—

tartás nélkül más anyagra.

A korrelációs elemzésben néha a való- színűségi koncepcióra támaszkodnak. Eb—

ben az esetben a regresszió vonalak para—

métereinek és a kapcsolat teljessége mu—

tatószámainak megbízhatóságát e mutató- számoknak, a megfelelő képletek alapján

kiszámított, átlagos hibája alapján érté-

kelik. A valószínűség elméletéből ismere- tes, hogy a megállapított korrelációs para—

méter átlagos hibája O,683, O,955, illetve

O,997 valószínűséggel az egyszeres, két- szeres vagy háromszoros szigma érté—

keket nem haladja meg. A korrelációs mutatószámok alkalmazásának valószínű- ségi koncepciója csak a nagyszámú, mi- nőségileg egynemű és független statiszti—

kai egységek elemzésénél ismerhető el

jogosnak.

KIEGÉSZI'DÖI MEGJEGYZÉSEK ÉS KÖVETKEZTETÉSEK

' Az elsődleges adatok nagy száma eseté—

ben azokat rendszerint előzetesen mind a tényező, mind az eredmény ismérv bi—

zonyos osztályközei szerint csoportosít—

ják. Ily módon úgynevezett korrelációs

rácsot (táblát) kapunk, amelyben az is—

mérvek osztályközei az oldal- és fejrovat—

ban függőlegesen és vízszintesen helyez-

kednek el, a tábla egyes kockái pedig a

statisztikai egységek számát tartalmaz-

zák (például a megfelelő súlyú és hosszú

(9)

570 szama

halak száma; vagy a különböző mérték—

ben" trágyázott és különböző terméshoza—

mú parcellák száma). A kapcsolat formá—

jának és teljességének fent bemutatott egyenletei érvényesek, ha a tényező és

az eredmény ismérv osztályközi átlagos értékeit a korrelációs rács statisztikai .

egységeinek számával mérlegeljük.

A számítások egyszerűsítése céljából, mind a páronkénti szembeállítás, mind pedig az adatoknak a korrelációs rácsban

való csoportosítása esetén (szabály sze—

rint) a momentumok módszerét alkalmaz—

zák, ami lehetővé teszi az eltérések ki—

számítását bármely feltételesen kiválasz—

tott értékből.

Ha az eredmény ismérvet két vagy több

szisztematikusan ható tényező befolyá—

solja, akkor minden egyes tényező hatása

kiszámítható az úgynevezett részleges

korreláció külön képleteinek segítségé—

vel. Ezek a képletek két ismérv szembe—

állítása esetén lehetőséget nyújtanak arra, hogy az egyéb tényezők hatását ——

változatlan színvonalon való tartásuk mellett —— elszigeteljü'k.

Az itt elmondottak nem változtatják, meg a korrelációs mutatók lényegét és jelentőségét, amelyeknek elméleti elem—

zése lehetőséget nyújt az alábbi következ—

tetések levonására:

l. A jelenségek közötti kapcsolatok meghatározására szolgáló korrelációszá—

mítási módszerek a táblázatos és tisztán

grafikus szembeállítások fejlődését jelen- tik.

2. Ezektől az elemi eljárásoktól eltérően a korrelációs elemzés lehetővé teszi, hogy

a szembeállított jelenségek kapcsolatának formáiát és teljességét mennyiségileg ki—

fejezzük.

3, A korrelációs-számításoknál a kap— ;

csolat formáját a regresszió vonala alap—

ján határozzuk meg, amely megmutatja

(mint átlag) az eredmény ismérv értékei-

ben a ténvező ismérv értékeinek változá- sától fiigeően kialakult változás általá—

nos tendenciáját.

4. A jelenségek közötti kapcsolat teljes—

ségének (szorossáe'ának) mutatószámai: a

korrelációs hányados, a korrelációs index és a korrelációs eeviittható. Meghatáro—

zott előfeltételek mellett az egvik mutató—

számról át lehet térni a másikra. Alkal—

mazásukat a megfelelő feltételek termé-

szete szabja meg.

5..A kapcsolat teljességének meghatá—

rozására szolgáló valamennyi korrelációs mutatószám lényege annak meghatáro-

zása, hogy az eredmény ismérv értékeinek a tényező ismérv változásainak befolyá—

sára létrejött változásai milyen hányadot képviselnek ezen ismérv általános szóró—

dásában.

6. Valamennyi korrelációs mutatószám

mind a jelenségek kapcsolatának formá—

ját; mind teljességét tekintve mindig ma—

gán viseli az idő, a tér és általában mind azon feltételek bélyegét, amelyek mellett kiszámításuk történt (az ideográfia bé—

lyege)?" —

7. A korrelációs mutatószámok mind megbízhatóbbá válnak a megfigyelési

egységek számának növelése ezek minő—

ségi egyneműsége és egymástól való füg—

getlensége esetében. Ezekben az eSetek—

ben a megállapított törvényszerűségek bizonyos mértékben megszabadulnak az ideográfikus (empirikus) bélyegtől és 'át—

alakulnak viszonylag állandó (nomográ—

fikus) törvényekké.

8. A reális valóság feltételei között (a vizsgált sokaság statisztikai egységei tel-

jes minőségi. egyneműségének és függet- lenségének hiányában) a viszonylag állandó törvények és törvényszerűségek feltárásakor, az ideografikus megnyilvá-

nulásokban a nomografikus'lényeg meg—

állapítására törekvő megfelelő tudomány—

ágak elméleti hipo'téziseire kell támasz—

kodnunk.

9. A korrelációs mutatószámok kiszámí—

tásakor különös óvatoSságot kell tanusí—

tania gazdasági jelenségek elemzésénél."

A népgazdaság a meghatározott társadal-

mi formáció alapvető és egyéb törvényei-

nek hatására megfelelően arányosan vál—

tozó, egymással kapcsolatban levő nép-

gazdasági kategóriák rendszerét jelenti.

" A. A. Csuprov: Statisztikai elméleti vázlatok.

Szentpétervár. 1910. I. Vázlat. Nomográfiai tudomá-' nyok és ideográfiavi tudományok. Sti—128. old. Bár A_ A. Csubi-ov terminológiáját alkalmazzuk de nem érthetünk egyet az ldeográl'iának a nomográfiáiól való azzal :; kategórikus elkülönítéséveíl, amelyet ez a neves tudós elméletileg alkalmaz

" A különböző (kategória jellegű kategória jel—

legü-variációs és tisztán variációs) statisztikai soka- s—áizok elemzésének sajátosságait lásd D. I. Oparin:

Elméleti statisztikai módszertani seeédkönyv (a mérnök-kóznamdász erzvetemi hallgatók számára) MRP. II. kötet. Moszkva 1956. V. téma. Az anyag csoportosítása és a táblák olvasása (l)—32. old ), és D ) Oparin: A statisztikai számok jellege és elemzése. Sztatisztilca Szófia. 1956. évi 4. szám.

(10)

SZEMLE

Az említett törvények és összefüggések

hatása megmutatkozik az egyes vállala—

tok és gazdaságok mutatószámainak mi- nőségi változásaiban és kapcsolatában,

ami megnehezíti a korrelációszámítások

szokásos alkalmazását.

10. Az ismérvek közötti kapcsolat for-

máját és teljességét kifejező korrelációs

mutatószámok valószínűségi megalapo—

zása, amely a nagyszámok matematikai

törvényért nyugszik, elveszti jelentőségét

a gazdasági jelenségek és folyamatok

571

kutatásának területén. Ezen a területen a korrelációs mutatószámok megbízható—

sága nem alapszik olyan együtthatókon, mint például a mutatószámok határait a

különböző valószínűséggel meghatározó

átlagos hibák. Ily módon a gazdasági élet- ben empirikusan szükségszerű összefüg—

gések csak a politikai gazdaságtan elmé—

leti törvényeinek fényében, annak értel-

mében válnak nomografikus jellegűvé, hogy a népgazdaság a bővített újrateme-

lés alapján fejlődik. D. [_ Oparin

Tanulmányút a Jugoszláv Szövetségi Népköztársaság Statisztikai

A különböző népi demokratikus orszá—

gok statisztikai hivatalainál tett tanul-

mányi látogatások után ez évben került

sor első ízben a Jugoszláv Szövetségi

Népköztársaság Statisztikai

tett látogatásra. A tanulmányúton a Köz—

ponti Statisztikai Hivatalból hárman:

Hajdu Györgyné, a Tájékoztatási főosz- tály főelőadója, Lukács Ottó, az Ipari, építőipari és beruházási statisztikai fő—

osztály vezetője és Mód Aladárné, a Köz- gazdasági főosztály vezetője vettek részt.

A delegáció a Jugoszláv Szövetségi Sta—

tisztikai Hivatalban részletesebben három

területtel, illetve témakörrel: az ipari

termelés volumene és általában az ipar-

statisztika, a különböző háztartásstatisz—

tikák és végül a dokumentáció, a tájékoz—

tatás kérdéseivel foglalkozott. Ezenkívül

kevésbé behatóan tapasztalatcsere folyt

az ár-, a munkaügyi, valamint anyag—

statisztika, továbbá a beruházási és építő-

ipari statisztika, végül az input-output számítások kérdéseiről is. A tanulmányút

során szerzett, közérdeklődésre számot—

tartó tapasztalatok a következőkben fog—

lalhatók össze.

I:

Jugoszláviában az iparstatisztika né—

hány kérdésében azonos, más kérdések-

ben eltérő módszereket alkalmaznak,

mint a magyar iparstatisztikában. A kő—

vetkezőkben nagyrészt azokkal a mód—' szerekkel foglalkozunk,

térések mutatkoznak. '

amelyeknél el- Hivatalában '

Hivatalában

A Jugoszláv Szövetségi Statisztikai Hi-

vatal Ipari osztálya csak a gyáripar sta- tisztikájával foglalkozik. A gyáripar kü- lön népgazdasági ágat alkot, a kisipart a

gyáriparral tehát általában nem össze-

sítik, hanem külön népgazdasági ágként mutatják ki.

A jugoszláv iparági rendszer 20 ágaza—

tot ölel fel, ezt a 20 ágazatot vállalatok

csoportosításával képezik. Ennél részlete—

sebb csoportosításokat is nyilvántarta-

nak (kb. 40—50 csoportot), amelyeknél azonban az iparágakat nem mint a vál- lalatok összeSSégét, hanem mint termé—

kek összességét fogják fel, azaz az egyes népgazdasági ágakat tevékenységek ösz—

szességének és nem szervezetek összes-' ségének tekintik. Ennek a felfogásnak

természetes következménye, hogy nem- csak a termelést, hanem a létszámot, költ—' ségeket stb. is fel kívánják osztani ezekre

a termékekből képzett iparágakra. Az ilyen felosztást lehetővé tevő adatszol—

gáltatás megszervezése kétségkívül na—

gyon bonyolult feladat és különös gon- dosságot és eljárást igényel. Ennek az új

elgondolásnak megfelelő részletmunká—

kat a jugoszláv statisztikusok most dol-

gozzák ki.

Ez a kísérlet, hogy az egyes iparágakat

mint tevékenységek összességét fogják

fel, kétségtelenül figyelmet érdemel mind

az ipari termelési index kiszámítása,

mind az input—output táblázatok összeál-

lítása szempontjából.

Az iparstatisztikában havi és éves be—

számolójelentést rendszeresitettek. A havi

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

145 Ezen alaphelyzet lényege, miszerint a vizsgált, korábbi tényező (magatartás) mint potenciális ok hatását az eredmény előidé- zésében megakadályozza az, hogy

— máskor az adott tevékenységet jellemző ismérvek között kell kapcsolatot létesítenünk a tevékenységet jellemző harmadik ismérv kiszámításához (például létszám-

A beosztás feltétele mellett vizsgálva a két ismérv függetlenségének hipotézi- sét azonban már erősen szignifikáns összefüggést kapunk az iskolai végzettség és a

parciális asszociációs együtthatók, segítségükkel feltárhatók az olyan látszólagos asszociációs kapcsolatok, amikor például az A és a B ismérv közötti asszociáció

Az egyik ilyen kérdésnek a lényege annyiban összegezhető, hogy azokban az esetekben, amikor a rendőrség nem mint nyomozó hatóság jár el (például eltűnt

Hogy eljussunk az adatok feléig, az i-edik osztályköz adataiból még kell vennünk további adatokat, azaz annak valamekkora hányadát.. Az i-edik osztályközb ő l még (n/2 - f’

Ez utóbbit elvileg tulajdonképpen az határozná meg, hogy nagyobb mintavételi egységek között milyen a Vizsgálat tárgyát képező ismérv(ek) szóródása. Tekintve azonban,

" — A dinamikus viszonyszámok számítása az időbeli ismérvek szerinti elemzés (idősorok elemzésének) eszköze. Ha egy ———_mondjuk —-_—- minőségi, ismérv