A STATISZTIKA ÁLTALÁNOS ELMÉLETE ÉS MÓDSZERTANA MATEMATIKAI STATISZTIKA
JEZSOV. A. l.:
ELOSZLÁSI SOROKKAL KAPCSOLATOS SZAMITÁSOK
(Vücsiszlenie rjadov 1973. Sztatisztika. 158 p.
rauszpredelenij.) Moszkva.
A bevezető az adathalmazban végzett cso—
portosítások és az így kialakított eloszlási so—
rok jelentőségét hangsúlyozza a statisztikai adatfeldolgozás szempontjából.
Az első két rövid fejezet azeloszlási sav rokka! kapcsolatos számítások általános kér- déseivel (kiegyenlítés. az eloszlástípus meg- választása, a kezdő és a végső értékek meg- , határozása. az értékek jelölése) és a lineáris függvények eloszlásszámításával foglalkozik külön tárgyalva a diszkrét és a folyamatos változók eloszlási sorait.
A harmadik fejezet a másodfokú parabola szerinti eloszlásszámításokat tárgyalja. A diszkrét jellegekkel kapcsolatos általános ke'r- dések érintése után a szimmetrikus és az aszimmetrikus eloszások ao. ai és az paramé—
tereinek számítását részletezi. (A másodfokú parabola leírására a szerző az yzaO—I—
—l— 01 x —l— 02 x2 egyenletet használja a nálunk ismertebb y: axz—l— bx—l— c helyett.) Szim—
metrikus eloszlás esetén a háromtagú para- bola egyenlet elsőfokú, szorzat alakú for- mára hozható:
ao*31x*""2 *2z32(i_*1)(x'*2)
ahol xi és xz másodfokútegyenlet gyökei. A másodfokú parabolával kifejezett szimmetri—
kus eloszlás meghatározásához végülis há- rom feltételezést használ fel a szerző.
A valóságban a társadalmi—gazdasági fo—
lyamatok adatai ritkán mutatnak szimmetri—
kus képet. Az esetek többségében magas ér- tékről indulnak, és fokozatosan csökkennek közelítve a nulla felé. Ennek ellenére ilyen esetekben is sikeresen használhatjuk a má- sodfokú parabolát az eloszlás vizsgálatához.
Ez azzal magyarázható, hogy a vizsgálat 50- rán a parabolának csak egy szakaszát hasz-
náljuk fel, azt a szakaszt. amely az adott
konkrét gyakorisági sornak megfelel. és meg—
közelítően tükrözi a kérdéses eloszlást. Ilyen- kor olyan ao, ai és az paramétereket kell meg- határoznunk. amelyek megfelelnek az aszim- metrikus eloszlásnak. A szerző megfelelő fel—
tételek bevezetésével megadja ezek kiszórni-' tási lehetőségét. A végső képletek:
__ san) — Z'RBZy
"70 _ ZS(S*2)
31 :ÉÉX—
s(s —1)
' a szam
5(5*2)(52—1)
ahol 5 a sor tagjainak száma. Ahol 5 értéke 100 alatt van, egyszerűsített számítási képlet is alkalmazható. Az ehhez szükséges koeffi- cienseket táblázat tartalmazza. A számítások gyakorlati végrehajtását több példa illuszt- rálja.
A továbbiakban a szerző a folyamatos vál- tozók szimmetrikus és aszimmetrikus eloszlá—
sával kapcsolatos parabola paraméterek ki- számításával foglalkozik. Az aszimmetrikus eloszlás paramétereinek meghatározási kép-
letei:
a Ámen—gsm Zy
0 2S(52—I)
TZYEL
8 3——
1 (5-1)3
:_6[(S—i)2—651XI]Zy az $(sz—1)(s—1)2
A 100 alatti adatszám esetére most is egy—
szerűsített számítási képlet és koefficienstáb— '
STATISZTlKA! IRODALMI FIGYELÖ
la szolgál. Az alkalmazást több példa illuszt- rálja.
A negyedik fejezet harmadfokú parabolá- val közelített eloszlásszámításokat ismertet. A paraméterek kiszámításához — az előbbiekhez hasonlóan -— részletes és egyszerűsített kép- leteket kapunk.
Az ötödik fejezet a hiperbolával történő megközelítésekkel foglalkozik, külön tárgyalva a diszkrét és folyamatos változók eloszlását.
A paraméterek meghatározási képletei diszk—
lZ (X))? leY
Ás[(sm)z(—3(—) — zs]
:()[SH —ZX]ZY
(sa)z(7)—s zs
40—
folytonos jellegekre:
2[(inb—ina)X (waa)].zy Z—(b a)[(atb)(inÚ—lna) 2(á— a)]
l(atb)— szzy
_ (athlnb— lna) 2(b a)
40
ahol a és b a hiperbola integrálásánál X kezdő és végső határértékei. Az alkalmazást
példák illusztrálják.
A hatodik fejezet néhány alapvető statisz- tikai mutató számítását tárgyalja. Ezek: az aszimmetria jellege, a medián és a számtani átlag viszonya, a modusz és a számtani átlag viszonya, az átlagos négyzetes eltérés és a számtani átlag viszonya, a kvartilisek és a számtani átlag viszonya, a vizsgált jelleg kez—
dő és végső értéke meghatározásának kri- tériumai, a másodfokú parabola szerinti el—
oszlás számításának sorrendje (8 fázis).
Az utolsó fejezet a normál eloszlással kap- csolatos számításokat ismerteti.
(Ism.: Szász Kálmán)
BETUlNG, M. — BILLOT. PH. — MULLER. O.:
A STATISZTIKAI FELDOLGOZÁS iNTEGRÁLT RENDSZEREI
(Les systemes intégre's de traitement statistiaue.)
— Revue de Statístiaue Applíauée. 1972. 4. sz.
13—30. p.
Az utóbbi húsz év folyamán, a statisztikai feldolgozás terén a haladás egyik legfonto—
sabb tényezője az egyre nagyobb teljesitmé—
1157
nyű és egyre gyorsabb számítógépek alkal- mazása volt. Az új eszközökkel együtt meg- jelentek a programozás feladatai és a velük kapcsolatos problémák. Ennek az lett a kö- vetkezménye, hogy számos statisztikus prog—
ramozóvá vált. és így szem elől tévesztette vizsgálódásainak tulajdonképpeni tárgyát.
Az a törekvés, hogy a társadalomtudomá- nyok kutatói megszabaduljanak ezektől az informatikai kötöttségektől, végül is oda veze- tett, hogy ,,programkönyvtárakat" létesítettek, a szükségleteknek megfelelő gyűjteménnyel. A programkönyvtárak előnyei (kész és jó prog—
ramok, az adatfeldolgozás legújabb eredmé- nyeinek figyelembevétele) mellett néhány hátrányos vonását is megemlíthetjük (a prog—
ramok között nincs egységes koncepció, gyakran különböző nyelvűek. az adatok meg- változtatása gyakran a programok módosítá—
sát is igényli stb.). Az ebből származó ne—
hézségeket ún. programcsomagok létesítésé- vel oldották meg. Ezek lényeges sajátossága.
hogy kódolt utasítások segítségével működ—
nek, azaz létezik az utasításoknak egy olyan rendszere, amely a gyűjtemény minden prog- ramjára érvényes, és amelynek szintaxisát a nem specialisták is könnyen elsajátíthatják.
Az ilyen gyűjteményeket ,,standardizált prog- ramcsomagoknak" nevezik. Legismertebb köz- tük a Kaliforniai Egyetem BMD (Bíomedical Computer Programs) gyűjteménye. Ezeknek a statisztikai programoknak megvan az a hát- rányuk, hogy általában nem tartalmazzák a feldolgozásnak a nyers kiindulási adatok megszervezésére vonatkozó részeit.
A fejlődés következő fázisában számítógé- pekkel automatikusan figyelembe vétetik a file—okkal és programokkal végzendő összes műveletet, hogy az alkalmazónak ne marad- jon más hátra, mint a végrehajtandó műve—
letek meghatározásával foglalkozni. Ezt a célt szolgálják a .,statisztikai feldolgozások integ- rált rendszerei". Ezek olyan programgyűjte- mények, amelyek standardizált eljárások se- gítségével lehetővé teszik. hogy az elvégzen—
dő műveleteket olyan nyelven definiálják, amely legjobban hasonlít arra, amelyet a hu—
mán- és társadalomtudományok területén dolgozó kutató használni szokott.
A tanulmány ezután rátér a ténylegesen rendelkezésre álló főbb integrált rendszerek összehasonlítására. amihez a következő kri—
tériumokra támaszkodik: e rendszerek által létesített funkciók, elterjedésük jel'avnzői és használati jellemzőik.
A tanulmány csak a legelterjedtebb rend- szereket vonja be az összehasonlítás köré—
be. Ezek a következők:
SPSS: Statistical Package for the Social Sciences National Opinion Research Center, Chicago-i Egye- tem;
DATA-T'EXT: Department of Social Relations, Har- vard Egyetem;