• Nem Talált Eredményt

A statisztikai adatállomány összetétele és az adatbázis-rendszer

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A statisztikai adatállomány összetétele és az adatbázis-rendszer"

Copied!
17
0
0

Teljes szövegt

(1)

A STATISZTIKAl ,ADATÁLLOMÁNY ÖSSZETÉTELE ÉS AZ ADATBÁZlS-RENDSZER*

VÉGVÁRI JENÖ

A statisztika az állami statisztikai szolgálatban dolgozó statisztikus számára két

szerepkörben jelenik meg. A statisztika egyfelől eszköz a statisztikus kezében, amely-

nek segítségével megragadja. számszerűen jellemzi a vizsgált valóság elemeit és

összefüggéseit, leírja és értelmezi a társadalmi és gazdasági jelenségeket. Másfelől

a statisztika a vizsgálódás és a munka tárgya, amikor a statisztikus (: statisztikai fo—

lyamatok megszervezésével, adott esetben országos méretű megszervezésével kerül szembe. Ebben az esetben a statisztika más minőségében: információ-rendszerként van jelen.

Jelen tanulmány az információ-rendszerként felfogott statisztika egyik időszerű kérdésével, az adattárolással foglalkozik, és megkísérel néhány, a gyakorlat által

felszínre hozott problémára választ keresni.

1. A STATISZTl'KAl lNFORMÁClÓ-RENDSZER MÚKÓDÉSÉT ÉS FEJLÖDESÉT BEFOLYÁSOLÓ FONTOSABB KÖRULMÉNYEK

A statisztikai információ-rendszer, a statisztikai folyamatok lényegének megíté- lésében a statisztikai gyakorlatban dolgozó szakemberek között bizonyos felfogás- beli különbség létezik.

Az egyik felfogás szerint a statisztikai információ—rendszer elsődlegesen egy—

mással összefüggő, tartalmilag konzisztens statisztikai rendszerekből áll (iparstatisz- tika, beruházásstatisztika stb.), amelyek átfogó rendszer(ek)ben integrálódnak; eb- ben a felfogásban a tartalmi kérdéseken, a statisztikai módszertani összefüggése- ken van a hangsúly. és másodlagos kérdés a rendszer működése.

A másik felfogás szerint a statisztikai információ-rendszer elsődlegesen megha- tározott rend szerint áramló és egymással összefüggő információk, valamint sta- tisztikai műveletek, tevékenységek és szervezetek összefüggő rendszere; ebben a felfogásban a hangsúly a rendszer működésén van, és másodlagosak a tartalmi

kérdések. (

A kétféle felfogás eltérő vonásai ellenére valamiben egységes: mindkettő rendszerszemléletű. Azok a folyamatok, amelyek korunkban a statisztikai gyakorlat fejlődésére hatnak, erősítik ezt a közös szemléletet, és a felfogásbeli különbségek feloldódásához, a statisztika egységes rendszerként való felfogásához vezetnek. A statisztikai gyakorlat egyik olyan területe. ahol a tartalmi és működési kérdések

* A tanulmány az MKT Statisztikai Szakosztálya Statisztikai informatikai Szekciójának 1977. október 12.

14-én Mátrafüreden tartott Ill. Vándorgyűlésén elhangzott előadás kibővített változata.

(2)

VEGVARI: AZ ADATBAZlS—-RENDSZER 869

egyeztetett, egységes szemlélete és megitélése szükségszerűen kialakul és elmé- lyül: a korszerű statisztikai adattárolás.

A statisztikai információ—rendszerre korunkban a statisztikai adatok tárolásá—

val szembeni követelmények és lehetőségek szempontjából befolyást gyakorló leg- fontosabb körülmények a következők.

1. Növekszik a társadalmi—gazdasági élet különböző elemeinek — s egyben az ezekkel kapcsolatos döntéseknek -— egymásra gyakorolt hatása, erősödik a társa—

dalmi és gazdasági jelenségek egymástól való kölcsönös függősége. Egyidejűleg fokozódik az a követelmény, hogy a statisztika a társadalmi és gazdasági jelensé—

geket komplexen, kölcsönös összefüggéseikben, logikai—módszertani ellentmondá- sok nélkül tükrözze vissza.

Ezek a követelmények számos áttételen keresztül, a statisztikai módszertan olyan fejlődési tendenciái útján valósulnak meg. amelyek eredményeként kialakul a szak- statisztikák integrálódási folyamata. Mindezek a hatások végső soron a statisztika nyersanyagául szolgáló és produktumaiként előálló adatállományokban összegeződ—

nek: olyan adatállományok alakulnak ki, amelyek tartalmilag ellentmondásmente- sek, és alkalmasak a társadalmi és gazdasági jelenségek komplex módon történő

leírására.

2. A statisztikai információ—rendszer a maga döntéselőkészítő és ellenőrző funk—

cióját nem egymaga, hanem a tervinformáció—rendszerrel és a számvitellel együtt- működve végzi. miközben magát a statisztikai információ-rendszert is együttműködő szervezetek alkotják. A statisztika tágabb környezetébe tartoznak azok az okirati jel- legű államigazgatási nyilvántartási rendszerek is, amelyek a népesség és a nemzeti vagyon különböző csoportjairól különböző ismérvek szerint adatállományokat képe—

sek statisztikai célokra rendelkezésre bocsátani.

A felsorolt információ- és nyilvántartási rendszerekben, az ezeket alkotó szer- vezetekben a társadalmi igények fejlődése nyomán terjedelmes, összefüggő adat- állományok alakultak és alakulnak ki. A tájékoztatási feladatok párhuzamos adat- gyűjtések nélkül történő megoldása elkerülhetetlenné teszi a rendelkezésre álló adatállományok országos méretű áttekintését, tárolásának összehangolását, vala—

mint az adatok szervezetek közötti gyors, szervezett cseréjét.

3. A társadalmi és gazdasági vezetés információszükségleteit egyre kevésbé lehet oly módon kielégíteni, hogy a statisztika a feldolgozási folyamatban egyszer s mindenkorra ,,elfogyasztja" nyersanyagát, a különböző forrásokból összegyűjtött alapadatokat, mind gyakrabban van szükség a feldolgozási táblák számanyagává átalakított alapadat—állományok másodlagos, illetve többszöri, új ismérvek szerinti feldolgozására.

A társadalmi—gazdasági folyamatok felgyorsulása a statisztikától az újbóli és másodlagos feldolgozások tekintetében (is) gyorsaságot, rugalmasságot, fejlett rea—

gáló képességet követel. Ez a helyzet új igényeket támaszt az adatok tárolásával, a már egyszer feldolgozott adatokhoz való újbóli hozzáféréssel és általában az ado—

tok kezelésével szemben.

4. Végül a statisztikai gyakorlat fejlődésére e cikk témája szempontjából meg- határozó befolyást gyakorol a számítástechnikának (a számitógépeknek) az a ké—

pessége. hogy automatizálja az adatok kezelését, és új alapokra képes helyezni az adatok tárolását.

A vázolt körülmények, amelyek szerint a társadalmi szükségletek egyidejűleg

létrehozták e szükségletek kielégítésének feltételeit is. a statisztikai adattárolás új

útjait nyitották meg.

(3)

870 veovm JENO

2. A STATISZTlKAl ADATOK TÁROLÁSA

Mióta statisztikai adatokat gyűjtenek, feldolgoznak és publikálnak. mindig is szükség volt az e tevékenységek eredményeként képződött és rendelkezésre álló adatok tárolására és megőrzésére. A tárolással szemben — kimondatlanul is —-' mindig követelmény volt. hogy az adatokat lehetőleg egyszerűen vissza lehessen keresni, az adatokhoz könnyen hozzá lehessen férni, és egyben biztosítani kellett az adatok megőrzését, védelmét. Szükség volt és van olyan módszertani előírásokra.

amelyek az adatok felhasználását (összehasonlíthatóság stb,) és ügyrendi előírá—

sokra, amelyek az adatok cseréjét. közlését szabályozzák.

Az adattárolás mindmáig nagyrészt irattárolás. Az adatok kezelése ilyen kö—

rülmények között munkaigényes, s emellett nem képes biztosítani terjedelmes, komp- lett adatállományok egyszerű, gyors átadását és átvételét. körülményesen oldható meg az adatok másodlagos feldolgozása, hosszadalmas műveletaz adatok közlésre való előkészítése stb.

A hagyományos, kézi technikára és jórészt a statisztikusok tapasztalataira és memóriájára alapozott adattárolás a következő adatállományokra terjed ki:

1. a begyűjtött és megőrzött kérdőíveken eredeti formájukban tárolt (vállalati, személyi stb.) adatok, illetve a kérdőívek mikrofilmes másolatain megőrzött adatok;

2. a feldolgozás eredményeként rendelkezésre álló, valamilyen rendszerben aggregált.

feldolgozási táblákon tárolt adatok;

3. a statisztikai tájékoztatási rendszer keretében publikált, kiadványokban nyomdai úton rögzített adatok.

A számítógépek üzembe állítása az adatok tárolásában mennyiségi és minő—

ségi változást hozott magával.

A ..mennyiségi" változást az jelentette, hogy (: számítógépeken feldolgozott adatok mágneses adathordozókon — mágnesszalagokon -— rögzítésre kerülnek. A mágnesszalagon a feldolgozás (a kérdőív) szerkezetében rögzített és megőrzött adatállományok fizikai terjedelme — az eredeti, kérdőíves adatállományhoz képest — nagymértékben csökkent, kezelésük, szervezetek közötti cseréjük egyszerűsödött, s lehetővé vált, hogy újabb kézi műveletek nélkül az adatokat ismételten feldolgoz- zák. Az adattárolásnak ez a lehetősége azért minősíthető inkább mennyiségi vál-to—

zásnak. mert a mágnesszalag csupán az egyébként is megőrzésre kerülő, adatokkal kitöltött kérdőív funkcióját veszi át. s az adattárolás ily módon kisebb teret, keve- sebb időt és munkát igényel, de a hagyományos adattárolással szemben nincs új funkciója.

A mágnesszalagokon rögzített adatok tárolása természetesen követelményekkel is jár. Szükség van mindazokra az eszközökre, amelyeket a számítógépes adatfel—

dolgozás eleve megkövetel (az adatszolgáltatók számjelrendszere, (: kérdőívek so- rainak, oszlopainak azonosítása stb.). Meg kell szervezni a mágnesszalagok nyil—

vántartását. azonosítási rendszerét és tárolását is. Új momentum, hogy az adatok gyűjtése és megőrzése szervezetileg elkülönül. a mágnesszalagos adatállomány ..birtokosa" és ,,tulajdonosa" nem ugyanaz a szervezet.

A mágnesszalagos adattárolás tehát lehetővé teszi, hogy az egyébként is lé—

tező szükségleteket a statisztika a korábbinál lényegesen kedvezőbb feltételek

mellett elégítse ki, s csupán az adatokkal való rendelkezés kérdései merülnek fel

új módon.

A számítástechnika fejlődése az adattárolás minőségileg új feltételét is meg- teremtette: az adatok adatbázisokban történő tárolásának lehetőségét. Statisztikai adatbázisnak számítástechnikai eszközök, programok, statisztikai adatok, dokumen-

(4)

AZ ADATBÁZiS—REN DSZER 871

táciők és adatkezelési műveletek sajátos, összefüggő rendszerét tekintjük. Ebben a rendszerben a valamilyen szempontból összetartozó, homogén adatállományok tá-

rolása olyan struktúrában történik, hogy -- a rendszer különböző elemeinek (eszkö-

zök, programok) közbejöttével — az adatokhoz való hozzáférés időtartama lényege—

sen csökken. Mód nyílik az adatbázisban tárolt adatokkal statisztikai műveletek szá—

mítástechnikai eljárások útján történő gyors elvégeztetésére, az adatoknak, a mű- veletek eredményeinek gyors kiíratására. megjelenítésére.

Az adatoknak adatbázisokban történő tárolása a munkaigényes statisztikai te- vékenységekből (közlési táblák összeállítása, viszonyszámok, indexek számítása, bo—

nyolultabb statisztikai módszerek alkalmazása, az adatok valamilyen célból, vala- milyen ismérvek szerinti csoportosítása stb.) az élőmunka-felhasználásnak, a kézzel.

asztali számológéppel végzett műveleteknek nagy részét kiiktatja, a tájékoztatási te—

vékenység gyorsasága, rugalmassága, reagáló képessége nagymértékben fokozód- hat.

A különböző adatállományoknak adatbázisokba történő rendezése nyomán lét—

rejön a statisztikai információ-rendszer adatbázis-rendszere, s ez a statisztikai tájé- koztatásnak. a statisztikai információk nyújtásának új feltételeit és lehetőségeit te—

remti meg.

A statisztikai adatbázis-rendszer kiépítése viszonylag hosszú időre meghatá——

'rozza az adattárolás, és közvetett módon befolyásolja a statisztikai tájékoztatás rendszerét. Az adatbázisok létrehozása tehát olyan struktúraalakító beruházásnak tekinthető, amely a szükségletek és lehetőségek körültekintő mérlegelését, a rend- szerrel szemben támasztott követelmények gondos megfogalmazását és gyakorlati érvényesítését igényli.

Az adatbázis-hálózattal szemben azt az alapvető és természetes követelményt kell támasztani, hogy az adatbázisok megtervezett, összefüggő, egymással együtt—

működni képes, a statisztikai módszertan és a tájékoztatási gyakorlat követelményeit kielégítő rendszerként funkcionáljanak. Az ilyen tartalmilag összehangolt adatbá- zis—rendszer kialakításának előfeltétele az alkalmazott statisztikai fogalmak, osztá- lyozások (nómenklatúrák) konzisztenciája, egységes számjelrendszerek használata s az adatokkal végzett műveletek összehangolt módszertana. Ebből a szempontból is kitüntetett szerepe van a gazdasági folyamatok számbavételét és statisztikai el- számolását szabályozó népgazdasági mérlegrendszernek, valamint a társadalom-

statisztikai jelzőszámok összehangolt rendszerének.

E követelmények teljesülését föltételezve a statisztikai adatbázis-rendszer meg- tervezése statisztikai szempontból a következő lépésekben történhet:

1. körül kell határolni, fel kell térképezni és nyilván kell tartani a statisztikai információ—

rendszerben tárolt adatok teljes körét, a teljes statisztikai adatállományt;

2. el kell végezni a teljes statisztikai adatállomány rendszerezését olyan célból, hogy az alapján

- a többitől elkülöníthetők legyenek azok az állományok, amelyeket nem lehet vagy nem célszerű adatbázisokban tárolni;

— az így kialakult szűkebb körön belül el lehessen határolni egymástól a különböző adatbázisokba kerülő adatállományokat, vagyis meg lehessen tervezni az adatbázis-rendszer szerkezetét. az egyes adatbázisok tartalmát. az adatbázisok közötti tartalmi (statisztikai) ösz-

szefüggéseket;

3. meg kell határozni, hogy az adatbázisok a rendelkezésre álló szellemi és anyagi ka- pacitásoktól, a tájékoztatási igényektől függően milyen időrendben, milyen sorrendben épül.

jenek ki. lépjenek üzembe;

4. elő kell írni, hogy az adatok tárolási rendje, az alkalmazott számítástechnikai prog- ramrendszer milyen statisztikai módszertani követelményeket elégítsen ki; ennek keretében meg kell határozni, hogy valamennyi adatbázisban miként kell, biztosítani az egymást követő időszakokra (évekre) vonatkozó adatok összehasonlíthatóságát, és ki kell elégíteni az adatbá—

(5)

872 ' veovm JENÖ—

zis-rendszerben az ,,egyidejűség" követelményét (az összefüggő adatállományokban az idő- beli elhatárolások és az eszmei időpontok azonosságát);

5. végül rögzíteni kell azokat az elveket, amelyek alapján kidolgozhatók az adatbázisok—' hoz való hozzáférés iogr' és eliárási szabályai.

3. A STATISZTIKAI ADATÁLLOMÁNY SZERKEZETE

Mivel az adatbázisok rendszere — kiépülése után —— hosszabb időre rögzít egy olyan struktúrát, amely nem elhanyagolható hatást gyakorol a statisztikai informá-

ciók nyújtásának jövőbeli feltételeire. a rendszer megtervezésének egyik legfonto-

, sabb mozzanata a statisztikai adatállomány rendszerezése.

Feltételezve azt az igényt. hogy az adatbázis-rendszer a teljes adatállományt tartalmazza. a rendszerezés során azt a követelményt kell kielégíteni. hogy

-— valamennyi adat elhelyezhető legyen egy adatbázisban;

-— minden adat csak egy adatbázisban legyen elhelyezhető;

-— az egyes adatbázisokba valamilyen szempontból összetartozó adatállományok tartoz-—

zanak.

Ez a feladat nem más, mint a statisztikai adatállomány osztályozása, illetve az osztályozás végrehajtására szolgáló nómenklatúra szerkesztése.

A feladat induló lépése annak az ismérvnek (ismérveknek) a meghatározása,

amely(ek) szerint a vizsgált sokaság — esetünkben a statisztikai adatállomány — ele-a *

mei az adott cél szempontjából logikusan osztályokba sorolhatók. Azt keressük te—

hát, hogy az adatbázisok adatállománya milyen szempontból legyen homogén, ösz- szertartozó. E célból vizsgálnunk kell a statisztikai adatoknak azon ismérveit, amelyek

az ilyen osztályozás szempontjából szóbajöhetnek.

1. Időbeli ismérv. Az adatok tárolásának egyik természetes rendező elve az idő-

beliség, és elvben elképzelhető olyan adatbázis-rendszer, amely az egyes adatbázi—

sokat aszerint határolja el egymástól, hogy adatállományuk melyik időszakra (évre)—

vonatkozik. A rendszerint idősorokkal operáló tájékoztatási gyakorlat azonban in- kább azt igényli, hogy az időbeli megkülönböztetés a keresett osztályozás második

vagy további fokozatain jelenjék meg (mindig valaminek a különböző évekre vonat—

kozó adatait keressük). Az időbeli ismérv kizárólagosságának elismerése egyébként sem oldaná meg a kérdést: az adatokat a feltételezett, időszakok szerint elhatárolt adatbázisokon belül is rendszerezni kell.

2. Területi ismérv. Kétségtelen, hogy szükség van területi tagolású adatbázis—

rendszerre is. A tájékoztatási követelmények kielégítése, az adatok közlésében kö—

vetett gyakorlat azonban nem nélkülözheti az országos adatoknak a terület—torda—

toktól elkülönített tárolását. Emellett ismert az a körülmény is, hogy a pénzügyi és

a reálfolyamatok egy részének területi csoportosítása jelentős módszertani nehézsé—

gekbe ütközik. a teljes statisztikai adatállomány jelentős része számviteli és statisz-

tikai elszámolási gyakorlatunk szerint területi egységek szerint nem csoportosítható.

3. A statisztikai adatok ismérvei közül a keresett osztályozás szempontjából már

csak kettő jöhet szóba: a) az adatok tartalma, amely a statisztikai megfigyelések

tárgyának megfelelő statisztikai tárgykörök szerint csoportosítható (beruházási,

munkaügyi. pénzügyi. baleseti stb. adatok): b) az adatok vonatkozási köre.

Ez utóbbinál az adatok gazdasági alanyokra. illetve ezek csoportosításaira. va- lamint személyekre vonatkoznak. Ezeket — a statisztika tárgyköreinek analógiájára — a továbbiakban a statisztika alanyainak nevezzük.

A statisztika alanyainak fogalma nem azonos az adatszolgáltatók fogalmával.

Statisztikai alanynak egyfelől azokat a szervezeteket, intézményeket nevezzük, ame-

(6)

AZ ADATBÁZlS—RENDSZER 873

lyekben a statisztika tárgyköreibe tartozó jelenségek lezajlanak, amelyekre a statisz- tikai megfigyelés körébe tartozó folyamatokat és állományokat kifejező adatok vo- natkoznak: ezek a gazdasági alanyok (vállalatok, szövetkezetek, költségvetési in—

tézmények stb.), illetve ezek ágazati osztályai (ipar. építőipar stb.). Másfelől a sta—

tisztika alanyai a népesedési, társadalmi folyamatok hordozói: a népesség egyedei (személyek) és háztartásai. (A háztartások a statisztika alanyaiként kettős szerepkört

töltenek be: termelési és fogyasztási tevékenységük tekintetében gazdasági ala—

nyok, más tekintetben demográfiai egységek.)

A statisztikai adatállomány osztályozása szempontjából a statisztika tárgykörei és a statisztika alanyai tölthetik be az osztályozás ismérveinek a szerepét. E szerint a két szempont szerint szokás csoportosítani a szakstatísztikákat is: ennek megfele- lően beszélünk például munkaügyi, beruházási, pénzügyi, baleseti statisztikáról, il- letve iparstatisztikáról, építőipari, mezőgazdasági statisztikáról stb. Ezek a szaksta- tisztikák a statisztika két nagy ágához — a gazdaságstatisztikához, illetve a társada-

lomstatisztikához —— való tartozásuk szerint is megkülönböztethetők.

Magától kínálkozik az a lehetőség, hogy a statisztikai adatállományt is — első lépésben — gazdaságstatisztikai állományra és tórsadalomstatisztikai állományra osszuk.

A gazdaságstatisztikai és társadalomstatisztikai adatok egymástól megkülön- böztetése a gyakorlatban azonban számos nehézségbe ütközik. Példaként vizsgáljuk a társadalomstatisztika egyik területét, az oktatási statisztikát. Az oktatási statisztika adatállományának törzsét az oktatás ágazati adatai képezik. Az oktatás ágazata állóeszközökkel rendelkezik (állóeszköz-statisztika), munkaerőt foglalkoztat (munka—

ügyi statisztika), az ágazatban folyó tevékenység pénzmozgással jár (pénzügyi sta—

tisztika) stb. Az oktatás ágazatában lezajló folyamatokkal tehát olyan szakstatiszti—

kák is foglalkoznak. amelyeket egyértelműen a gazdaságstatisztika körébe sorolha- tunk. Ami pedig magát az oktatási tevékenységet illeti. ez -—- az oktatás ágazatának túlsúlya mellett — más ágazatokban is folyik (például tanfolyami oktatás az ipari szervezetekben stb.): oktatási adatok tehát más ágazatokra vonatkozó adatállomá-

nyokban is szerepelnek.

Hasonló problémák kerülnek felszínre az anyagi ágak egy-egy területének adatállományát vizsgálva is (például az iparban folyó üzemegészségügyi, szociális,

oktatási, kulturális tevékenységekre vonatkozó adatok).

Feladva ezért a gazdaságstatisztikai és a társadalomstatisztikai adatállományok elhatárolására irányuló törekvést, a továbbiakban a tárgykör és a statisztikai ala—

nyok szerinti csoportosítás kombinálására célszerű törekedni, abból kiindulva, hogy két halmazzal állunk szemben:

a) a statisztika alanyainak (A) halmazával.

b) a statisztikai tárgykörök (T) halmazávai.

A két halmaz elemei legyenek:

A :: 01: 02: 035 "" an T :t1,f2,f3, ..., tn

A két halmaz elemei között kapcsolatok. relációk állnak fenn. A halmazok ele—

mei közötti reláció:

a; Rt,—

esetünkben azt fejezi ki. hogy az a,- elemhez (statisztikai alanyhoz) valamely tj elem—

(7)

874 VÉGVARl JEN—Ó

(tárgykör) tartozik (például a mezőgazdaságba sorolt szervezetek üzemi baleseti tár- gyú adatai).

A két halmaz közötti kapcsolatokat vizsgálva az A halmaz valamennyi elemé—

hez hozzárendelhetők a T halmaz megfelelő elemei. A kapcsolatoknak ez a rend- szere a statisztika alanyai és tárgykörei közötti reláció logikai matrixával ábrázol-

ható. A matrixban (1.0) változók fejezik ki a kapcsolat meglétét vagy hiányá—t.— Pél—

daszerűen:

01 02 03 a,,

ti 1 1 1 O

tz 133

t,. 1 0 0 1

A logikai matrix sor- és oszlopirányban egyaránt értelmezhető: meghatároz-

ható. hogy az egyes tárgykörökhöz (a T halmaz egyes elemeihez) tartozó adatállo- mányok a statisztika mely alanyaira (az A halmaz mely elemeire) vonatkoznak, il- letve az egyes statisztikai alanyokhoz mely tárgykörbe tartozó adatállományok tar- toznak.

A logikai matrixszal tehát — statisztikai terminológiát használva — olyan statisz- tikai táblához jutunk. amelynek oldalrovatában a statisztika tárgykörei (ezek cso- portjai). fejrevatában a statisztika alanyai (ezek ágazati osztályai) szerepelnek. A sorok és oszlopok négyzethálót alkotnak, amelyben az egyes négyzetek megfelelő adatállományokkal azonosíthatók.

Az így szerkesztett logikai matrixban a munkaügyi statisztika tárgykör sorának és az ipari szervezetek oszlopának metszéspontja például az ipar munkaügyi adatainak _a ..helye" stb. Egyes metszéspontokhoz adatállományok nem tartoznak (,,üres" négy- zetek). ilyen például a népesedésstatisztika tárgykör sorának és az ipari szervezetek oszlopának metszéspontja.

Visszatérve az oktatási statisztika példaszerűen leírt problémáira: táblánk ol- dalrovatában — a statisztika tárgykörei között -— az oktatási statisztika tárgyköre, tejrovatában pedig az oktatási szervezetek ágazati osztálya szerepel. Az oktatási statisztikai tárgykör sorának az ipar oszlopával alkotott metszéspontjához az ipar- ban folyó oktatási tevékenység adatai tartoznak (és így tovább). az oktatás ágazat—

tal alkotott metszésponthoz pedig az az adathalmaz tartozik, amely az oktatás ága- "

zatba sorolt szervezetek oktatási tevékenységét jellemzi. Az oktatás ágazat oszlopá—

nak egyes négyzeteibe az oktatás ágazatba sorolt szervezetek teljesítményére (ter—

melési statisztika tárgyköre), beruházásaira (beruházási statisztika tárgyköre). okta-

tási tevékenységére (oktatási statisztika tárgyköre). az iskolai balesetekre (baleseti

statisztika tárgyköre) stb. vonatkozó adatállományok tartoznak.

Az oldal— és fejrevatok tételes meghatározásával előálló hálózat négyzeteinek valamelyikébe az egész statisztikai adatállomány besorolható, és az egy—egy négy- zetbe tartozó adatállomány két szempontból is — az adatok tartalma és vonatkozási

köre (alanya) szempontjából — egynemű. összetartozó.

(8)

AZ ADATBÁZiSoRENDSZER 875

Az állami statisztika rendszerének vizsgálati, megfigyelési körébe tartozó sta- tisztikai tárgykörök jegyzékét, valamint a statisztikai alanyok jegyzékét a Melléklet tartalmazza. Ezekkel kapcsolatban a következőket szükséges megjegyezni.

1. Mindkét jegyzék — a logikai matrixból származtatott tábla oldal— és fejrova- tai — csoportosítás, a tárgykörök és a statisztikai alanyok elemeinek a statisztikai

gyakorlat alapján kialakított csoportjai.

2. A statisztikai tárgykörök jegyzéke megkísérli teljes szélességében átfogni és logikusan rendszerezni a statisztika tárgyköreit. A jegyzék -— mivel nem elvont struk- túrát kíván megalkotni, hanem a statisztikai gyakorlatot kívánja tükrözni —- nem te—

kinthető véglegesnek. A statisztikai megfigyelések új területeinek kialakulása (mint például éveinkben a környezeti statisztika) vagy más okok miatt szükség lehet a jegyzék rendszeres kiigazítására. Hangsúlyozni szükséges, hogy a jegyzék nem a statisztika tudományának ágazatait sorolja fel, csupán az adatállományt csoporto-

sítja az adatok tartalma, tárgykörei szerint.

3. Bizonyos adatállományok a feldolgozások során olyan rendszerekké szerve- ződnek, amelyek a vázolt tábla négyzethálózatának megfelelő elemeivel tartalmilag

azonosíthatók ugyan, gyakorlati okok miatt mégis indokolt azokat a négyzethálózat alkotta struktúrán kívül, a tárgykörök rendszeréhez kapcsolódva (az oldalrovatot folytatva) a matrix ,,alsó szárnyaként" felfogni. Ezek a következő statisztikai mér-

legek:

-— termelési mérlegek,

anyag- és termékmérlegek,

— vagyonmérlegek,

— munkaerőmérlegek,

— jövedelemmérlegek,

— pénzügyi és hitelmérlegek,

— a külföldi gazdasági kapcsolatok mérlegei,

— ágazati kapcsolatok mérlege.

4. A STATISZTIKAI ADATBÁZlSOK RENDSZERE

Az eredeti kérdéshez — az adatbázis-rendszer szerkezetéhez — visszatérve, szük—

ségesnek látszik tisztázni azokat az elveket, amelyek szerint az adatbázisok rend—

szere logikai matrixunk segítségével megtervezhető, majd kiépíthető.

Ebből a szempontból alapvetőnek tűnik az a kérdés, hogy milyen nagyságú, mekkora adatállományt tároló adatbázisokat lehet és célszerű szervezni. A kérdésre adott választ nyilván részben statisztikai, részben számítástechnikai szempontok ti-

gyelembevételével lehet megfogalmazni.

Statisztikai szempontból a tájékoztatási követelmények, a tájékoztatási (a vár- ható lekérdezési) gyakorlat lehetnek fontosak. Nem látszik célszerűnek például olyan adatbázisok szervezése, amelyeknek adatállománya egymástól távoleső tá- jékoztatási igényeket elégít ki. ha nincs az adatállomány csoportjai között szoros.

elemzési szempontból lényeges tartalmi kapcsolat. (Nincs értelme például beruhá—

zási és népesedésstatisztikaí adatokat egy adatbázisban tárolni.) Az sem volna cél—

ravezető, ha az adatállományt olyan, viszonylag kis terjedelmű halmazokra szab- dalnánk, amelyek elszakítanák egymástól a tájékoztatási, elemzési gyakorlat szem- pontjából együtt kezelt és vizsgált állományokat. Nem lenne értelme külön adatbá- ziSOkban tárolni például a mezőgazdasági termelés és a mezőgazdasági földterület

adatait. Optimálisnak — első közelítésre -— az olyan adatbázisok látszanak, amelyek-

nek adatállomónya vagy egy tárgykör, vagy a statisztikai alanyok egy csoportja (pél—

dául népgazdasági ág) valamennyi adatát magában foglalja.

(9)

876 VÉGVAR! JENÖ

Számítástechnikai szempontból az egyes adatbázisokba kerülő adatállományok

adatai közötti azon kapcsolatok látszanak fontosaknak. amelyek az adatok hierarchi—

kus rendjét, szerkezeti elrendeződését meghatározzák. Ezek az adatkapcsolatok a

kapcsolódó fogalmakkal és nómenklatúrákkal vannak összefüggésben. Egy esetle—

ges munkaügyi statisztikai adatbázis szervezése például csak akkor látszik célsze- rűen megoldhatónak, ha a különböző ágazatok munkaügyi adatai azonos állomány—

csoportok és egyéb csoportosítások, valamint egységes és viszonylag stabil adat—

gyűjtési rendszer (adatstruktúra) szerint állnak rendelkezésre. Ezek -— a statisztikai felfogásban megfogalmazott -— számítástechnikai követelmények nincsenek ellent- mondásban a szorosan vett statisztikai követelményekkel, mód van tehát mindkét szempontból kielégítő megoldást találni.

Egy statisztikai adatbázis-rendszer tervét tehát abból kiindulva lehetne kidol-

gozni. hogy (visszautalva a logikai matrixra, illetve a kialakított táblára)

—- az egyes adatbázisokat a négyzetháló elemeiből kell ,,összerakni";

— az így kialakított adatbázisok fedjék le az egész hálózatot, kivéve természetesen az .,üres" négyzeteket, valamint azokat, amelyekhez tartozó állományokat valamilyen okból nem

kívánunk adatbázisokban tárolni.

Ebből kiindulva egyszerűnek és logikusnak tűnhet egy olyan adatbázis-rend—

szer, amelyben az adatbázisok vagy mind oszlopirányban (vertikálisan), vagy mind sorirányban (horizontálisan) szerveződnek. llyen esetben a mezőgazdasági adat- bázis például magában foglalná a mezőgazdasági szervezetekre vonatkozó teljes adatállományt a termelési adatoktól a beruházási adatokon át a mezőgazdasági üzemi balesetek adatköréig. Horizontális rendszerű szervezés esetén pedig a beru- házási adatbázis például tartalmazna minden beruházási adatot az ipari beruhá-

zástól (: háztartásokig (lakossági beruházások).

Ez a megoldás azonban nem valósítható meg. Vannak ugyanis olyan adatállo- mányok, amelyeket vagy csak horizontálisan (például idegenforgalmi adatok), vagy csak vertikálisan (például a ,.személyek" adatai) lehet adatbázisokba szervezni.

Emellett a tájékoztatási (a várható lekérdezési) gyakorlat is ellentmondana az ilyen következetes, de egyben merev szerkezetnek. A közlekedési szervezetekben folyó üzemegészségügyi adatokat például rendszerint nem a közlekedési teljesítmények, hanem az egészségügyi tevékenység (az egészségügyi ágazat gyógyító, megelőző tevékenysége) adataival együtt szükséges publikálni és elemezni.

Mindezek olyan adatbázis—rendszer irányába mutatnak, amelyben horizontáli- san és vertikálisan szervezett adatbázisok egyaránt vannak. anélkül, hogy egymást

átfedné'k. Az adatbázisoknak ez a halmaza természetesen akkor tekinthető össze-

függő rendszernek. ha a tárolt adatok tartalmilag ellentmondásmentesek, és az

adatok összehasonlíthatósága valamennyi adatbázisban azonos elvek és módszerek

szerint van megoldva. Ebben az esetben az egyes adatbázisok megfelelő számitás- technikai programok alkalmazásával akadálymentesen kapcsolatba hozhatók egy- mással. az adatok lekérdezése — ha szükséges— vertikálisan teljes mélységben, ho-

rizontálisan teljes szélességben zavartalan lehet.

A tervezett adatbázis-rendszer táblánkra mint egy térképre rárajzolható, bizto- sítva. hogy azon sem fehér foltok ne maradjanak (a már említett kivételektől elte—

kintve), sem átfedések ne képződjenek.

A rendszer működésének vázolt zavartalansága természetesen feltételezi, hogy az egyes adatbázisok a teljes adatállománynak mindazon elemeit tartalmazzák.

amelyek a komplexitásra képes tájékoztatási rendszer működéséhez elengedhetetle—

nek. Az ehhez szükséges adathalmaznak, a rendszerben tárolt adatok körének a

(10)

AZ ADATBÁZlS-RENDSZER 877

minimumát célszerű az adatbázis—rendszer tervezése során körülhatárolni. Ami a társadalmi jelenségeket leíró adatokat illeti: ez a minimum a társadalmi jelzőszám- rendszert kielégítő adatállomány lehet. A gazdasági folyamatokat és állományokat tükröző adatok esetében a minimum kevésbé látszik ily módon körülírhatónak. Az adatbázis—rendszerből mindenesetre — ezt alapkövetelményként lehet megfogal- mazni — nem hiányozhatnak a rendelkezésre álló ada'thalmaznak azon elemei, ame- lyek az ágazati kapcsolatok mérlege összeállításához szükségesek. Ez utóbbi köve—

telmény olyan további követelmények megfogalmazásához vezethet. hogy az ágazati

kapcsolatok mérlege a tárolt alapadatokból — a .,külső" beavatkozást a minimumra

szorítva — számítástechnikai algoritmussal legyen kidolgozható.

5. AZ ADATBÁZISOKKAL KAPCSOLATOS NÉHÁNY GYAKORLATI KÉRDÉS

A statisztikai adatbázis—rendszer szervezése az előzőkben leírtakon kívül mód—

szertani és szervezési problémák hosszú sorának megoldását igényli. Ezek jelentős hányada számítástechnikai kérdés, amely kívül esik e tanulmány keretein. A követ- kezőkben csupán néhány statisztikai jellegű gyakorlati kérdés kifejtésére szorít- kozom.

Elemi és aggregált adatokat tároló adatbázisok

Az egyik ilyen gyakorlati kérdés az, hogy milyen jellegű: eredeti formájukban és tartalmukban megőrzött elemi adatokat vagy valamilyen módon feldolgozott

(aggregált) adatokat célszerűbb—e az adatbázis-rendszerben tárolni.

A választ keresve érdemes áttekinteni, hogyan minősíthetők a statisztikai infor- máció-rendszerbe belépő adatok.

Az adatgyűjtési rendszer útján beérkező és az adatállományt gyarapító adatok következő típusai különböztethetők meg:

1. az elemi társadalmi és gazdasági eseményeket (születés, házasság, halálozás, keres- kedelmi ügylet stb.) kifejező adatok; a statisztikai számbavétel ilyen esetekben magukra az elemi eseményekre (ezek tényére) és az események körülményeire. jellemzőire (a továbbiak-

ban: tulajdonságaira) irányul;

2. személyekre és más demográfiai egységekre (például családokra) vagy a nemzeti va- gyon bizonyos egységeire (például a lakásokra) vonatkozó adatok; a statisztikai számbavétel

magukra a szóban forgó egységekre és tulajdonságaikra irányul;

3. a gazdasági alanyokra, illetve ezek meghatározott típusaira, a gazdasági egységekre (vállalatok, szövetkezetek. költségvetési szervek) vonatkozó adatok; az elemi gazdasági fo—

lyamatok és események (ügyletek) ez esetben a gazdasági egységek által vezetett nyilván- tartásokban összegeződnek és a statisztikai információ—rendszer számára ezek a mikroökonó- miai szinten aggregált adatok válnak elemi adatokká (ezek az adatok a gazdasági egységek ,,tulajdonságait" fejezik ki).

Az adatok e három típusának megfelelően különböztethetők meg azok a leg—

kisebb egységek -— nevezzük ezeket elemi nyilvántartási egységeknek —. amelyekhez ezen egységek tulajdonságait kifejező elerni adatok az adatbázis-rendszerben kap—

csolhatók. Elemi nyilvántartási egységek tehát

— az elemi társadalmi—gazdasági események;

— a személyek. az egyéb demográfiai egységek, valamint a nemzeti vagyon egyes elemei;

— a vállalati, valamint a költségvetési rend szerint működő gazdasági egységek.

A statisztikai elemzés és tájékoztatás szempontjából az adatbázisokban történő adattárolásnak az a legnagyobb előnye, hogy a tárolt adatokkal másodlagos és to-

(11)

878 VEGVARI .tENÖ

vábbi teldolgozások, új ismérvek szerinti csoportosítások, matematikai statisztikai

műveletek stb. kedvező feltételekkel végezhetők. Ezek az előnyök azonban csak az

elemi nyilvántartási egységekhez kapcsolt elemi adatok esetében használhatók ki

teljes mértékben, az aggregált adatokkal végezhető műveletek lehetőségei érthe—

tően korlátozottak. Az adatbázis-rendszerben ezért elsősorban elemi adatokat cél-

szerű tárolni.

Az adatbázis-rendszerből mégsem lehet teljesen kizárni az aggregált formában rendelkezésre álló adatállományokat, ilyen adatoknak adatbázisokba történő bevi—

tele több okból is szükséges, illetve elkerülhetetlen lehet.

Az elemi adatok bizonyos körének feldolgozása során például olyan adatállo- mányok keletkeznek, amelyeknek információtartalma túlmutat az eredeti elemi ada—

tok tartalmán, illetve a képződött, feldolgozott adatoknak az elemi adatok körében nincs .,megtelelőjük". Ilyenek például a logikai matrixunk alsó szárnyaként felsorolt népgazdasági mérlegek adatai. a különböző ár- és volumenindexek stb.

Más esetekben egyszerűen célszerűbb valamilyen szempontból már csoportosi- tott, feldolgozott (aggregált) adatokat tárolni (például egy teleptilésstatisztikai adat—

bázisban). vagy más megoldás nem is lehetséges (olyan esetekben, amikor az infor—

máció-rendszerbe valamilyen okból nem elemi, hanem aggregált adatok lépnek

be).

Aggregált, feldolgozott adatoknak az adatbázis—rendszerbe történő bevitelével a nyilvántartási egységek újabb típusainak megkülönböztetésére van szükség.

Az aggregált adatok nyilvántartási egységei természetesen az elemi nyilvántar- tási egységek valamilyen aggregátumai lehetnek. llyen aggregált nyilvántartási egy-

ségek például

— az ágazatok (szakágazatok, alágazatok);

— a társadalmi osztályok és rétegek;

— a területi egységek (községek, városok, járások. megyék);

—— az előbbiek kombinációi.

Az adatbázis adataival végzett közös műveletek feltételei

A nyilvántartási egységek ily módon való körülhatárolása elvezet a nyilvántar- tási egységek azonosításának, illetve ezzel összefüggésben tovább: az egymással tartalmi kapcsolatban álló adatbázisok közötti .,együttműködés" gyakorlati feltéte- leinek kérdéséhez. A kérdést úgy lehet megfogalmazni, hogy a fogalmi—tartalmi egységen túl milyen feltételei vannak az egymástól elhatárolt adatbázisok adatállo- mányával végzett együttes, közös műveleteknek.

A különböző ada'tbázisokban tárolt adatokkal végzett közös műveleteknek a

nyilvántartási egységek szempontjából a következő fontosabb típusai lehetnek.

1. Közös műveletek azon adatbázisok adataival. amelyeknek elemi nyilvántar- tási egységei azonosak. (Gyakorlatilag itt azokról a leggyakoribb adatbázisokról van szó. amelyeknek elemi nyilvántartási/egységei gazdasági egységek: vállalatok, szö—

vetkezetek. költségvetési szervek.) A közös műveletek lehetősége ilyen esetekben el—

vileg korlátlan: a különböző adotbázisokban tárolt elemi termelési, létszám-, be- ruházási. pénzügyi stb. adatok kapcsolatba hozhatók egymással, az elemi adatok

közös csoportosítási ismérvek szerinti feldolgozása és az egyéb műveletek végzése

akadálytalan.

2. Közös műveletek végzése olyan adatbázisok adataival, amelyek között egy- aránt előfordulnak olyanok. amelyeknek nyilvántartási egységei elemi szintűek (pél—

dául gazdasági egységek) és olyanok, amelyeknek nyilvántartási egységei aggregál-

(12)

AZ ADATBÁZlS-RENDSZER 879

tak (például a gazdasági egységek aggregátumai). Közös műveletek végzése céljá- ból ilyen esetekben az előbbi adatbázisok felhasználni kívánt adatait előzetesen

aggregálni kell az utóbbiak nyilvántartási egységeinek megfelelően (ha például az

adatbázisban szakágazatra összesített adatokat tárolunk. ezen adatokkal csak szakágazati adatok hozhatók kapcsolatba). Az adatokkal végzett közös műveletek lehetőségei ilyen esetekben korlátozottak, akár további csoportosítások. akár más, bonyolultabb műveletek lehetőségeivel számolunk.

3. Közös műveletek azon adatbázisok adataival, amelyeknek aggregált nyilván-

tartási egységei azonosak vagy azonos aggregálási szintre hozhatók. (Példaszerűen:

területi csoportosításban tárolt csecsemőhalandósági adatok kapcsolatba hozása az ugyanilyen csoportosításban tárolt egészségügyi statisztikai adatokkal stb.). Az eredeti elemi adatok hiánya, illetve az a tény, hogy azok valamilyen ismérv szerint csoportosítva. feldolgozva kerülnek az adatbázis—rendszerbe, ez esetben is korlá- tozza, de természetesen nem teszi lehetetlenné a különböző adatbázisokban tárolt adatokkal végzett közös műveleteket.

Az adatbázis—rendszerben tárolt adatokkal végzett műveletekre, illetve a külön- böző adatbázisokba tartozó adatokkal végzett közös műveletekre csak akkor kerül- het sor, ha az egész adatbázis-rendszerben szigorúan egységes a nyilvántartási egységek azonosítása.

A nyilvántartási egységek azonosítási rendszerében alapvető fontosságú az elemi nyilvántartási egységek azonosítása. Ebbe a körbe természetesen nem azonos

fajsúlyú, nem azonos hatókörű problémák tartoznak. Egészen más típusú feladat

például a népszámlálási adatállomány elemeinek személyekre vonatkozó azonosí—

tási rendszere és más például a gazdasági egységeké. Az azonosítás az előbbi eset- ben az adatbázis-rendszer egyetlen területén, az utóbbi esetben az adatbázisok szé- les körében jelent fontos követelményt.

Mivel a gazdasági egységek azonosítására épül az aggregált nyilvántartási egységeken alapuló lehetséges adatbázisok egy része is, a gazdasági egységek azonosításának megoldottsága, teljeskörűsége, a vállalati és költségvetési rend sze—

rint gazdálkodó szervezetek összességére voló kiterjedtsége az adatbázis-rendszer kiépítésének és zavartalan funkcionálásának egyik legfontosabb feltétele.

A gazdasági egységek azonosításának megoldása szükséges, de önmagában nem elégséges feltétele az adatbázis—rendszer zavartalan működésének. A külön—

böző adatbázisokban tárolt elemi adatokkal végzett közös műveletek lehetősége végső soron attól függ, hogy a statisztikának azokon a területein, ahol a statisztika alanyai a gazdasági egységek, az adatok gazdasági egységenként (elemi nyilván—

tartási egységenként, tehát elemi formában) álljanak rendelkezésre. Ezek a kérdé-

sek az adatgyűjtési rendszerben dőlnek el, az adatbázis-rendszer zavartalan tunk- cionálása tehát az adattárolás követelményei által is befolyásolt adatgyűjtési rend—

szert tételez fel.

Az elemi nyilvántartási egységek és különösen a gazdasági egységek azono- sítása mellett szlikség van azokra a szabványos, az egész statisztika területén azo—

nos értelmű és tartalmú osztályozási rendszerekre is. amelyek részben mint aggre—

gált nyilvántartási egységek funkcionálnak, részben pedig mint a statisztika alanyai- nak alapvető szabványos csoportosításai, az elemzés és tájékoztatás egyértelmű- sége szempontjából is nagyfontosságúak.

Ilyen osztályozási rendszerek:

-- az ágazati osztályozás:

—— a társadalmi szektorok szerinti osztályozás;

-— a gazdasági egységek gazdálkodási formák szerinti osztályozása;

(13)

880

VÉGVARI JENÓ

—- a gazdasági egységeknek a felügyeleti szervek és az ágazati felelösséget vrsela szer-—

vek szerinti osztályozása;

-— a társadalom egyedeinek életkor, gazdasági aktivitás, foglalkozási viszony, társadalmi osztályhoz és réteghez való tartozás, iskolai végzettség, családi állapot szerinti osztályozása;

—— a területi egységek és a települések osztályozásai. _

Az adatbázisokban történő odattárolás, amennyiben a tárolás elemi nyilvántar-

tási egységek szerint történik, az adatoknak a nyilvántartási egységek szerinti to-

vábbi változatos csoportosítását, feldolgozását kínálja. Egyebek között a különböző mennyiségi ismérvek, nagyságkategóriók (a foglalkoztatottak létszáma, az állóesz- közök értéke, a földterület nagysága, a települések lélekszáma stb.) szerinti osztá- lyozások nyújthatnak kedvező elemzési lehetőségeket.

A különböző feldolgozások, publikációk egymással történő összehasonlithatő—

sága megkívánja, hogy az ilyen mennyiségi ismérvek szerinti feldolgozásokhoz is

álljanak rendelkezésre szabványos osztályozások.

A meta—adatok adatbázisai

A statisztikai adatbázis—rendszerben tárolt óriási adathalmaz csak akkor kezel—

hető, az adatfelhasználók részére csak akkor hozzáférhető. ha nemcsak áttekintés,

hanem pontos nyilvántartás áll rendelkezésre a tárolt teljes adatállományról és an- nak tartalmáról, s ez a nyilvántartás célszerű formában (adatkatalógusokban stb.),

a szükséges terjedelemben mindazok birtokában van, akik az adatbázis—rendszer

használatára, a tárolt adatok lehívásóra jogosultak. Az adatbázisok tartalmára vo—

natkozó ezen információk —- miként maguk a statisztikai adatok is — számítógéppel

kezelhetők, adatbázisszerűen tárolhatók. Az adatbázis-rendszerben tárolt statisztikai adatokról szóló információk gépi tárolásának. vagyis a meta—adatok (az adatokról szóló információk) adatbázisainak megvalósításával válik az adatbázis-rendszer tel- jessé. A statisztikai adatbázis—rendszer ilyenformán két nagy alrendszerből áll: a

statisztikai adatok adatbázisaiból és a meta—adatok adatbázisaiból.

A meta-adatok adatbázisai számítástechnikai eszközökkel és módszerekkel ve-

zetett (tárolt és folyamatosan aktualizált) nyilvántartások és dokumentációk, ame-

lyek egyrészt passzív tükörképei a tuladjonképpeni adatbázis—rendszernek, másrészt azonban a meta-adatok adatbázisaiba olyan információk is kerülnek, amelyek adat-

kezelési műveletekre vonatkozó döntések alapjául szolgálhatnak.

A meta—adatok adatbázisai körébe a következő adatbázisok (adatbáziscsopor—

tok) tartozhatnak.

1. A gazdasági egységek. pontosabban a vállalati és költségvetési rend szerint működő gazdasági egységek nyilvántartására szolgáló adatbázis. Ennek az adatbá—

zisnak — az adatbázis—rendszer szempontjából — több funkciója van. A legfontosabb az a szervező—vezérlő funkció, amelyet ez az adatbázis a társadalmi—gazdasági élet szervezeti rendjének leképzésével, a szervezeti változások regisztrálásával, illetve ezeknek az adatbázis—rendszer számára történő közvetítésével tölt be. A szervezeti változásokról szóló információk szolgálnak (részben) alapul azokhoz az adatkezelési

műveletekhez, amelyeknek célja az adatok összehasonlithatóvá tétele mindazokban

az adatbázisokban. amelyekben a nyilvántartási egységek gazdasági egységek. Ez az adatbázis egyben egyszerűen információs forrás is arra nézve, hogy a tárolt adatok valamely időpontban a gazdasági egységek milyen körére vonatkoznak.

2. A statisztikai adatbázis—rendszerben tárolt adatok nyilvántartására, leírására szolgáló adatkatalógus-rendszer adatbázisa. Ez az adatbázis az adatbáziskezelés

ama funkcióját hivatott ..kiszolgálni", amely szerint az adatfelhasználókat el kell

(14)

AZ ADATBÁZlS-REN DSZER 881

látni mindazokkal a nyilvántartásokkal (adatkatalógusokkal), amelyekből tájékozód—

hatnak az adatbázis-rendszer adattartalmáról. A szóban forgó adatbázis ezen adat- katalógus—rendszer folyamatos aktualizálásának szolgálatában áll, azt teheti a le- hetséges mértékig automatizálttá.

3. A statisztikai fogalmi rendszer dokumentációjának adatbázisai. Az alapfunk- ció ez esetben is a statisztikai tevékenységet folytató központi szervek. az adatszol—

gáltatók és az adatfelhasználók részére készült írásos dokumentáció adatbázisszerű tárolása és aktualizálása. Ezekben az adatbázisokban tehát nagyobbrészt szöveges anyagok: statisztikai fogalmak és szabványos statisztikai osztályozások leírásának tárolása folyik. Az itt tárolt információk egyrészt a statisztikai fogalmi rendszer adott időpontban érvényes állapotát, másrészt pedig a tárolt adatok mindenkori tartalmát írják le és rögzítik.

4. Az ország valamennyi városának és községének nyilvántartására szolgáló adatbázis.

A meta-adatok adatbázisalnak kérdéséhez összefoglalóan két megjegyzés ki—

vánkozik. Az egyik: a szóban forgó nyilvántartások számítógépes eszközökkel és módszerekkel történő vezetése nem feltétlenül következik a statisztikai adatbázis- rendszer iétéből. a nyilvántartások (egy ideig bizonyosan) hagyományos módon is vezethetők, de kétségtelennek látszik, hogy az adattárolás korszerű rendszere akkor válik teljessé, az adattárolással járó munkaráforditások akkor csökkenthetők erőtel- jesen. ha ezeket a ,,kisegitő" folyamatokat is gépesitik. A másik megjegyzés: a szó- ban forgó nyilvántartások és dokumentációk tartalmilag folyamatosan egységesülő.

xkonzisztens statisztikai ada'tállományra vonatkoznak. Indokolt tehát, hogy a nyilván—

tartások is integrált dokumentációs rendszert képezzenek. s ez a vonatkozó adatbá—

zisok közötti összefüggésekben is jusson kifejezésre, a meta-adatokat tehát egymás—

sal összefüggő. egymást föltételező adatbázisokban kell tárolni.

Korszerű statisztikai odattárolós megvalósulása esetén tehát az állami statisz- tikai rendszerbe kerülő információk a statisztikai adatok tartalmilag és technikailag egységes adatbázis-rendszerébe áramlanak. Ennek és bizonyos mértékig a teljes statisztikai adatállománynak egyfajta tükörképei a meta—adatok adatbázisai. A két egymással szorosan összefüggő információállomány alkotja a statisztikai tevékeny- ség eredményeként létrejövő adatvagyon tárolását és megőrzését szolgáló teljes statisztikai adatbázis-rendszert.

MELLÉKLET

AZ ÁLLAMl STATISZTIKA TÁRGYKUREINEK OSZTÁLYOZÁSA 1. A reálfolyamatok tárgykörei

1.1. Termelés, termelő felhasználás és áruforgalom 1.1.1 Termelés, termelő felhasználás statisztikája 1.1.2 Anyagstatisztika

1.1.3 Belkereskedelmi áruforgalom statisztikája 1.1.4 Külkereskedelmi áruforgalom statisztikája 1.2. Felhalmozás. vagyon

2.1 Beruházósstatisztika

2.2 Nemzeti vagyon, állóeszközök, készletek statisztikája 2.3 Lakásépítés és -megszűnés statisztikája

.2.4 Kapacitások. kapacitáskihasználás statisztikája 1.3. Árak

1.3.1 Árstatisztika 1.4. Munkaügy

.4.1 Gazdasági aktivitás, munkaerő— és foglalkozásstatisztika .4.2 Munkaerő—forgalom statisztikája

.4.3 Munkaidő-statisztika

.4.4 Munkabér- és keresetstatisztika 2. A pénzügyi folyamatok tárgykörei

2.1. Jövedelemeloszta's

2.1.1 Jövedelemelosztás statisztikája 1

1 1 1

7 Statisztikai Szemle

(15)

882 VÉGVARl JENÓ

3. Az anyagi termelés ágazatainak egyéb tárgykörei1 4. A tudományos kutatás tárgykörei

4.1. Tudományos kutatás és iejiesztés

4.1.1 Tudományos kutatás és fejlesztés statisztikája 5. A lakosság jövedelmének és fogyasztásának tárgykörei

5.1. A lakOSság jövedelme és fogyasztása

5.1.1 A lakosság jövedelmének és fogyasztásának statisztikája 6. A népesség és társadalom tárgykörei

6.1. Népesség

6.1.1 Népesedésstatisztika 6.2. Társadalom

6.2.1 Társadalmi rétegződés és mobilitás statisztikája 6.2.2 Társadalmi életmód statisztikája

7. A szolgáltatások tárgykörei 7.1. Fogyasztási szolgáltatás

7.1.1 Fogyasztási szolgáltatások statisztikája 7.2. Társadalmi szolgáltatás

7.2.1 Egészségügyi statisztika 7.2.2 Szociális statisztika 7.2.3 Oktatási statisztika

7.2.4 Kulturális és sportstatisztika 7.2.5 Lakásszolgáltotási statisztika 7.2.6 Kommunális statisztika 7.2.7 igazságügyi statisztika

1.2.8 Igazgatási szolgáltatások statisztikája 7.3. idegenforgalom

7.3.1 idegenforgalmi statisztika 8. A környezet tárgykörei

8.1. Környezet

8.1.1 Környezeti statisztika 9. Egyéb tárgykörök

9.1. Baleset

9.1.1 Baleseti statisztika

A STATISZTIKA ALANYAINAK OSZTÁLYOZÁSA 1. Vállalati és költségvetési rend szerint működő gazdasági egységek

1.1. par .

1.1.1 ipari szervezetek 1.2. Épitői ar

1.2.1 pitőipari szervezetek 1.3. Mezőgazdaság, erdőgazdálkodás

1.3.1 Mezőgazdasági szervezetek 1.3.2 Erdőgazdáikodási szervezetek 1.4. Szállítás, hírközlés

1.4.1 Szállítási szervezetek 1.4.2 Hírközlési szervezetek 1.5. Kereskedelmi szervezetek

1.5.1 Belkereskedelmi szervezetek 1.5.2 Külkereskedeimi szervezetek 1.6. Vízgazdálkodás

1.6.1 Vízgazdálkodási szervezetek 1.7. Személyi és gazdasági szolgáltatás

1.7.1 Személyi és üzleti szolgáltatás szervezetei .7.2 Pénzintézetek

7 1.8. Eg s

3

., .4 Oktatási szervezetek .8.5 Kulturális szervezetek .8.6 Tudományos szervezetek

1.9. Közösségi, közigazgatási és egyéb szolgáltatás 1.9.1 Közigazgatási és egyéb szervezetek 2. Egyéb statisztikai alanyok

2.1. Egyéb gazdasági alanyok 2.1.1 Állami költségvetés 2.1.2 Külföld

2.1.3 A lakosság háztartásai 2.2. Települések. területi egységek

2.2.1 Települések 2.2.2 Terüieti egységek 2.3. Személyek

2.3.1 Személyek

1Az anyagi termelés ágainak azon tárgykörei. amelyek a reálfolyamatok. illetve a pénzügyi folyamatok felsoroit tórgyköreibe nem sorolhatók, csak a megfelelő ágazati statisztikában fordulnak elő.;

(16)

:AZ ADATBAZIS-RENDSZER _ 883

IRODALOM

Az Állami Statisztika Automatizólt Rendszere a Szovjetunióban. Központi Statisztikai Hivatal. Budapest.

1976. 128 old.

Györkí Ildikó Majtényi Edit: Az adatbázis-kezelés problémái. Statisztikai Kiadó Vállalat. Budapest.

1974. 220 old.

Pesti Lajos: A statisztikai információ-rendszer fejlesztésének időszerű kérdései. Statisztikai Szemle. 1975.

évi 4. sz. 365——382. old.

Dr. Dörnyeí József Dr. Ormai László: Bevezetés a statisztikai infarmatikóba. !. Központi Statisztikai Hivatal. Budapest. 1971. 132 old.

Az iparstatisztikai adatbazis-rendszer kialakitásának tapasztalatai. Statisztikai Szemle. 1974. évi 10. sz.

867—885. old.

Dr. Dörnyei József: Az informatika fejlődése és kapcsolata a statisztikával. Statisztikai Szemle. 1974.

évi 8—9. sz. 752—762. old.

lDr. Párniczky Gábor: A statisztikai informatika alapjai. Statisztikai Kiadó Vállalat. Budapest. 1976.

190 0 d.

Fellegi, !. P.: A statisztikai adatfeldolgozás, -f:óroiós és -visszakerese's szervezése. Statisztikai Szemle.

1976. évi 5. sz. SCO—513. old. u'

Hajdú Imre: integrált statisztikai adatbázis-rendszerek. Statisztikai Szemle. 1977. évi 7. sz. 756—759. old.

Pesti Lajos: Az informatika hatasa a statisztikai rendszer fejlődésére. Statisztikai Szemle. 1977. évi 11.

sz. 1113—1125. old.

A statisztikai hivatalokban alkalmazott adatbázis-rendszerek és fejlesztésük. Statisztikai Szemle. 1978.

évi 7. sz. 743—754. old.

Dr. Varga Lajos: A statisztikai munka szervezése és az adatfeldolgozás néhány kérdése. Statisztikai Szemle. 1977. évi 12. sz, 1243—1248. old.

PE3l-OME

ABTop saHumae'rcn OAHHM us GKTYöanle aonpocoa rocynapcraeHHoű cramcmxw

-— COBpeMeHHblM XpöHeHMeM CTaTMCTHHeCKHX AaHHbIX.

l'ipoem'npoaanne cpyHKunouupyiomeü a pöMKaX CMCTeMbl rocynapcreennoü crawcmxn CHCTeMbI Banka nam—ism npeAyCMa'rpueae-r pemeime xnaccmpnkauuonnoü saga-m. B xone aToro cnauana Hymno nponsaecm oő3op aceü coaoxynuocm cramcmuecxux AÖHHHX u Ha aram ocnosaum cneAyeT omenmb Te rpynnbi AaHHbIX, KO'ropble Heaosmomi—io mm Heuene- cooőpasno xpanm'b s ÖBHKe AaHHbIX.

B nmepecax aroro, uroőu ocpopMneHHoü TaxuM oőpasoM őonee ysxuü prr nai—mux u sannauupoaanuan cucreMa Salma AaHHle asauMHo cooTBeTCTBOBanH Apyr Apyry, p.aH—

Hble cnenyer rpynnnposarb TBKHM oőpasoM, uroőbi

-— ace AGHHbIe mornu 61,in nememenu a OAHOM Gai-me AaHHbIX;

nemnbie OTAeanble AaHHble MOI'J'IH 65in nememenbi Toano s OAHOM őaHKe AaHHbIX;

B OTAenbl-lhie őamm AaHHle onnunu rpynnbi BsauMocsnaam—rbix c KaxoR-Hnőynb

TouKu sperma .nem-lux. '

Ann Aocrmxenm avoíi uenn p.aHHble cnenyer rpynnMPOBaTb cornacuo ABYM anaHaKaM:

Ha ocuosannu conepmanua .nammx, c onnoü CTOpOHbl, u ccpepbi nx KaCBTeIleTBa, : .cipyroü.

Cornacno nepBOMy l'lpMSHaKY AaHHble rpynnupyiorcn no npenmery (Tai-(HM npenMeTOM KoTOple nanmorcn npousaoncrao, AOXOABI, Kann'ranoanomei—mn, prA, sapasooxpaneuue

" T. a.), a no BTOpOMy npnsuaky a name pacnopnmeune nocrynaior AaHHble Kacarenbno l'lpoMblLLlneHHle, cenbcxoxosnücneunux, Taproaux, yueőnux " 7. n. opraHnsaunü.

l'lyTeM Komöuunpoaauun rpynnnpoaxn cornacuo ABYM npnauakam Mhl nonyuaeM TB—

icyio paymepuyio 'raőnnuy, crponu xaropoü conepmar ynOMnHyruü npenmemuü prr, a rpacpbi orpacnesue xnaccu paanmubix opraunaauuü. B oőpaaoaaHi—loü TaKHM oőpasoM KsaApan-ioü cem Momer 65in nomemeua scsi COBOKYI'IHOCTb crawcrnuecnux AaHHbix "

oőecneueHa OAHOpOAHOCTb npunagnemaumx ;; aneMeHraM KBaApa'n-ioü cem .nem—lux : ra'-nm sperma npejwera " cmepbi Kauca'renbcraa. Cerb conepmm' Takme ,,nycrbie" REGA- pam. Cncrema Salma momer Sam, cnomena u: anemeuroa naaAparHoü cem__ KGK ua KYÖHKOB.

B nanbueüwem aurop sauumae'rcn cneAymmuMn npanmuecxumu sonpocaMn opranu- sauuu CHCTeMbI őauxa ABHHHX! sonpocm xpaneimn anemeurapubix " (mm) arpernpoaaHi-ibix AEHHbIX; meronuuecxue npennocsmkn COBMeCTHle cra'rucmuecxux onepauuü, abmonnn—

eMblx npu npusneuei—mn ABHHbIX pa3nnunbix Gamma ABHHHX; ccpepa " cpynnum Samma meta—namam.

SUMMARY

The article deals with up-to—date storage of statistical data which is one of the timely issues in national statistics.

7—

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

tanévben az általános iskolai tanulók száma 741,5 ezer fő, az érintett korosztály fogyásából adódóan 3800 fővel kevesebb, mint egy évvel korábban.. Az

Nem láttuk több sikerrel biztatónak jólelkű vagy ra- vasz munkáltatók gondoskodását munkásaik anyagi, erkölcsi, szellemi szükségleteiről. Ami a hűbériség korában sem volt

Legyen szabad reménylenünk (Waldapfel bizonyára velem tart), hogy ez a felfogás meg fog változni, De nagyon szükségesnek tar- tanám ehhez, hogy az Altalános Utasítások, melyhez

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A CLIL programban résztvevő pedagógusok szerepe és felelőssége azért is kiemelkedő, mert az egész oktatási-nevelési folyamatra kell koncentrálniuk, nem csupán az idegen

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A „bárhol bármikor” munkavégzésben kulcsfontosságú lehet, hogy a szervezet hogyan kezeli tudását, miként zajlik a kollé- gák közötti tudásmegosztás és a

táblázat: Az innovációs index, szervezeti tanulási kapacitás és fejlődési mutató korrelációs mátrixa intézménytí- pus szerinti bontásban (Pearson korrelációs