A dokumentációs célú adatbázis-kezelő rendszer. A rendszer helye, elvi működése és felépítése megtekintése

(1)

Követelmények és néhány megoldás

A D O K U M E N T Á C I Ó S CÉLÚ A D A T B Á Z I S - K E Z E L Ő R E N D S Z E R A rendszer helye, elvi működése és felépítése

Ungváry Rudolf

Országos Széchényi Könyviár

1. A dokumentációs célú adatbázis-kezelő rendszer helye a programrendszerek között 1.1 A három programfajta

A programok feladata az, hogy valamit önállóan megoldjanak, valamilyen folyamatot, eljárást végre

hajtsanak. A matematikai, szimulációs és a külön

féle — például termelési, élettani — folyamatokat irányító programokra j e l l e m z ő , hogy az adatokat, amelyek az általuk kezelt rendszerbe bekerülnek, valamilyen másik adattá alakítják át, vagy a bekerülő adatok alapján előre meghatározott belső minta sze

rint k i m e n ő (irányító) adatokat hoznak létre. Lé

nyegük éppen ez az átalakítás, illetve a minta alapján előállított e r e d m é n y .

Vannak programok, melyek feladata elsősorban az. hogy adatokat tároljanak, mégpedig azért, hogy velük valaminek a programon kívüli, szellemi meg

oldását — például gazdasági, kulturális szervezetek irányítását és gazdálkodását — támogassák. Ilyenek a pénzügyi, m u n k a ü g y i , személyzeti stb. irányítás, a számvitel és a gazdálkodás, valamint a különféle nyilvántartások (állóeszköz, raktári, szállodai szoba, utas stb.) programjai. A m i t ezek a programok megoldanak, az lényegében nem t ö b b , mint hogy a tárolóból a nyilvántartott adatokat a szellemi irányí

táshoz (megoldáshoz) szükséges formában és össze

függésekben kiadják. Éppen ezért e programok - k ü l ö n ö s e n ami az adatok közötti kapcsolatokat és megjelenítésük módját illeti — elsősorban e rend

szerek, azaz a gazdasági szervezetek igényeihez al

kalmazkodtak. Az adatok közötti kapcsolatokat az adott szervezet működéséből következő összefüg

gések szabják meg, melyeket a továbbiakban funkcionális-logikai kapcsolatoknak n e v e z ü n k .

A tárolt adatok a gazdasági szervezetek erőforrá

sai: közvetlenül felhasználják őket az értékelési és döntési tevékenységben. Egy részük változatlanul maradó vagy csak ritkán változó törzsadat, másik — többnyire jelentősebb - részüket viszont a nagy

fokú változékonyság jellemzi: ezek az e s e m é n y vagy tranzakciós adatok. Mindezeknek a program

rendszereknek nincs m é g mindenki által egyformán elfogadott, egyezményes nevük. M i a továbbiakban irányítási célú vagy ügyviteli (vállalati) progra

moknak nevezzük őket.

Vannak programok, melyek feladata elsősorban ugyancsak az. hogy adatokat tároljanak, és ugyan

csak azért, hogy valaminek a megoldását támogas

sák, de ez a megoldás egy sokkal tágabb és intézmé

nyesen korántsem annyira szervezett rendszernek is része, melyet szakmának, t u d o m á n y n a k , ismeret

területnek stb. n e v e z ü n k . A m i t ezek a programok megoldanak, az lényegében nem t ö b b , mint hogy a tárolóból az adott szakmában felhalmozott adatokat nyelvileg é r t h e t ő formában és összefüggésekben kiadják.

Ezekre az adatokra a nagyfokú állandóság jel

lemző: ők azoknak a szakismereteknek az alapjai, melyekkel az előző — szervezettebb - rend

szerekben az erőforrásként kapott, esetről esetre változó adatokat értékelni lehet. A szakmai, tudo

mányos és egyéb - a kultúra által szervezett — rendszerek beépülnek a civilizáció és a gazdaság rendszereibe, de ugyanakkor át is nyúlnak rajtuk, és keresztül-kasul fonják az egész társadalmat. Ha a szakmai, tudományos és egyéb, hozzájuk hasonlóan csak lassan változó ismereteket rögzítik, dokumen

tumokról beszélünk. A tárolt adatok vagy e doku

mentumokra vonatkoznak, vagy e dokumentumok-

(2)

Feladatmegoldó programok

Pl.:

szerszámgép vezérlése

hogy 0 e- g/ál talán működhes

sen

Irányítási- 1

ügyviteli programok Pl.:

•

anyagkészlet- nyilvántartás;

beszerzés kö

vetés

hogy 1 e- gyáitalán működhes

sen

Dokumentációs szaktájékozta

tási programok Pl.:

milyen szempontokat kell érvényesíteni a beszerzési mun

kában,

milyen rendelkezések vonatkoznak a kész

letgazdálkodásra, milyen következményei vannak az elfekvő készleteknek

AZ EMBERI - SZELLEMI - BEAVATKOZÁS ÉS MUNKA NÖVEKEDÉSÉNEK MÉRTÉKE

I. ábra A gazdasági, irányítási é s kuliurális szervezetekben hasznán főbb programfajlák

ból származnak. Az utóbbi esetben a teljes doku

mentumok kerülnek gépi hordozóra, vagy rövidí

tett, kivonatos, átdolgozott formájuk. Ezért ezeket a programokat nevezik dokumentációs — vagy könyvtári körülmények között bibliográfiai — célú programoknak. Mivel újabban m á r az is tapasztal

h a t ó , hogy a szakismereteket közvetlenül — a ha

gyományos dokumentumok megkerülésével - rög

zítik a géppel olvasható adathordozókon, dokumen

tációs helyett szaktájékoztatási célú programokról is beszélnek. Valójában ilyenkor nem papíros, film, festövászon stb., hanem mágneslemez vagy mág

nesszalag alapú d o k u m e n t u m o k r ó l van szó, hason

lóan a hang- é s zenei dokumentumokhoz. M i a to

vábbiakban a dokumentációs/szaktájékoztatási és

Ungvár) R.: A dokumentációs célú adatbázis-kezelő rendszer...

11

bibliográfiai programok összefoglaló megnevezésére egységesen a dokumentációs (célú) elnevezést használjuk (indoklásával részletesebben a 2. fejezet

ben foglalkozunk).¹ A mondottakat az / . ábrán fog

laltuk össze.

A K S H adatfeldolgozási termékek jegyzékében ezeket "szer

vezetek szakmai tevékenységéi ellátó programoknak" neve

zik, "melyek a népgazdaság egyes ágainak (ipar. kereskede

lem, egészségügy, tudomány, könyvtárügy, igazgatás, közle

kedés síb.) tevékenységét segítik e l ő " , szemben a "szerveze

tek irányítási rendszereinek programjaival", melyek "vala

mely szervezet gazdasági, pénzügyi, munkaügyi, személyzeti irányításénak é s gazdálkodásának egyes műveleleil végzik"

( K S H , 1982).

(3)

T M T 13. M. 1986/5—6—7.

1.2 A t á r o l t a d a t á l l o m á n y o k szerkezete 1.2.1 Az a d a t b á z i s és kezelőrendszere

Az adatokat mind a vállalati-ügyviteli, mind pedig a d o k u m e n t á c i ó s programok esetében olyan rendezettségben tárolják, hogy ez nemcsak a gazda

ságos tárolást, hanem az adott igényeknek megfelelő felhasználást (megjelenési, változtatási, keresési stb. lehetőségeket) is biztosítsa. Az adatállomány szerkezetére tehát a mindenkori felhasználói kör

"világa" is rányomja a bélyegét: az állománynak nemcsak fizikai, hanem a felhasználó szempontjait t ü k r ö z ő logikai szerkezete is van. E logikailag struk

turált, a vállalati erőforrásként vagy szakmai tájéko

zódásra használható adatállományokat a továbbiak

ban adatbázisnak, azt a programrendszert pedig, amely létrehozásukat, fenntartásukat, kezelésüket és szolgáltatásaikat biztosítja, adatbázis-kezelő rend

szernek nevezzük.

1.2.2 Az a d a t b á z i s f u n k c i o n á l i s - l o g i k a i modellje: a s é m a

Az irányítási adatbázisok logikai szerkezete és használati módja manapság jelentősen eltér a doku

mentációs adatbázisokétói (az eltérés átmeneti jelle

gével az 5. fejezetben foglalkozunk). A z első eset

ben elég pontosan megtervezhetők és formalizálha

tok a várható kérdések (a felhasználói kör "világa"

jól m o d e l l e z h e t ő ) , mert az irányítási-ügyviteli m ü v e l e t e k , funkciók nagymértékben előre láthatók és formalizál hatók.

Egy kereskedelmi vállalat értékesítési és beszer

zési r e n d s z e r é b e n például előre adott, mi jellemzi a lehetséges vevőt (neve, c í m e , egyszámlaszáma stb.) és a megrendelést ( d á t u m a , szállítási címe stb.), továbbá az is, hogy a kettőt mi kapcsolja össze (pl. a szállítási cím — lásd a 4.5 fejezetben a 4. és 5.

ábrát).

Úgy is mondhatjuk, hogy a lehetséges kérdések megfogalmazásának formái, szerkezetei előre adot

tak. Ezt az előre megadott szerkezetet az adatbázis funkcionális-logikai sémájának nevezzük.

1.2.3 Az a d a t b á z i s szemantikai-logikai modellje: a szótár

A d o k u m e n t á c i ó s adatbázisok esetében rendkí

vül k ü l ö n b ö z ő kérdésekre kell számítani, hiszen mind a szakmai problémák (a témák, tárgyak), mind a rájuk v o n a t k o z ó kérdések sok szempont alapján fogalmazhatók meg.

Például a "könyvtári információk automatikus k e z e l é s e " , a "számítógépes bibliográfiai tájékoz

t a t á s " , a "dokumentumadatok gépi feldolgozása"

és a "szakmai tevékenység támogatásának gépesí

t é s e " megfogalmazások lényegében ugyanarra a témára, tárgykörre vonatkoznak.

A felhasználói kör "világát" csak úgy lehet mo

dellezni, ha a lehetséges szavakat és a közöttük le

hetséges összefüggéseket figyelembe veszik. E " v i lágot" tehát maga a szaknyelv modellezi, mellyel a témákat és kérdéseket (problémákat) megfogalmaz

zák. Ezért az adatbázis logikai szerkezetét nem, vagy nemcsak a funkcionális é r t e l e m b e n vett forma

lizáltság, hanem a nyelvi megformállság: a "tar

talmi", szemantikai-logikai szervezettség is jel

lemzi. A tárolt információkat és a lehetséges kérdé

seket a szaknyelv szavai és a közöttük fennálló ér

telmi összefüggések strukturálják.

A z ilyen adatbázisokban kitünletett jelentősége van a szótárnak, mely nemcsak osztályozási rend

szer, tárgyszójegyzék, tezaurusz stb. lehet, hanem a címszavak, nevek, lelőhelyek, betegségmegnevezé

sek, tárgy- (objektum-) m e g n e v e z é s e k , helynevek stb. állománya is. A dokumentumok vagy a kérdé

sek tartalmának szemantikai-logikai struktúráját el

vileg a szótárak hivatottak formalizáltan reprezen

tálni. E r e d m é n y e s e n — k e r e s h e t ő e n - tárolni és kérdezni az általuk adott keretek között lehet.

Ezekben a szótárakban azonban ma még csak a nyelvi rendszer lehetséges modelljének alig töredé

két sikerül csak formalizáltan megragadni: a szava

kat és rendkivül leegyszerűsített formában néhány fontosabb értelmi összefüggést (szinonimákat, ho

m o n i m á k a t , alá- és fölérendelési viszonyokat, asz- szociációkat), m é g ritkábban bizonyos mondattani (szintaktikai) összefüggéseket (relálorok. szerepje- lötőkstb. formájában).

A megragadott szavak nagyon különbözők lehet

nek — például személynevek, szakkifejezések, hely

nevek, cégnevek, részlegnevek, c í m e k , időadatok, nyilvántartási számok stb. - . és a keresés szem

pontjából elvileg szükségtelen, hogy azonosított helyük és nevük legyen a tárolt szövegben. A tezau

ruszokban, osztályozási rendszerekben, egységesí

tett besorolási állományokban (az ún. "aulhority fáj

lokban") a szavak bizonyos fajtáit — például a szak

kifejezéseket vagy a szerzők, közreadók neveit — szabványosított formában rögzítik. Az esetek több

ségében azonban csak a felhasználó fejében, szub

jektíven és elég ellentmondásosan van adva e struk

túra (lásd a 3. fejezet [d] pontját). A felhasználó az adatbázisban a szavak jelentése - természetes nyelvismerete - alapján tájékozódik. E látszólag ka

otikus szabadságra a rugalmas szakmai tájékozódás érdekében ugyanúgy szükség van. mint az egyér

telmű döntések érdekében arra a látszólagos "kény

szerzubbonyra", mely a funkcionális-logikai szerke-

(4)

Ungvár? R . : A dokumentációs célú adatbázis-kezelő rendszer..

zet következtében az irányítási rendszerek sajátos

sága. Két teljesen ellentétes szükséglet kielégítésé

ről van szó, s ezért nem sikerül ma m é g a kettőt egyetlen programrendszerben közös nevezőre hozni (a hardver fejlettsége ebből a szempontból másodlagos).

Az adatbázis kezelőrendszere - pontosabban szemantikai-logikai komponense - biztosítja, hogy az adatbázishoz a t e r m é s z e t e s , beszélt nyelv szavai alapján hozzáférhessenek. Ha szótár van, akkor e szemantikai-logikai hozzáférés pontosabban tervez

hető. Ha a szótár strukturált, értelmi összefüggése

ket is tartalmaz, a pontosság tovább fokozható. A szótár az az eszköz, amellyel a dokumentum tartal

mát, illetve a tartalmára vonatkozó kérdéseket "le

transzformálják" arra a szintre, amelyen az adatbázis-kezelő rendszer fizikailag működik. (Azt is meg kell azonban mondani, hogy a legtökélete

sebb megoldás, ha e "transzformációt" a szakmát és a nyelvet ismerő szakemberre bízzák. Az ilyen szak

ember m á r ma is kiképezhető, a vele egyenrangú szabványosított szótár talán soha.)

1.3 Terminológia: bibliográfiai és faktográfiai adatbázis/'igazi" adatbázis-kezelő rendszer és információkereső rendszer

Ha a bibliográfiai és d o k u m e n t á c i ó s célú adatbá

zisokat a pályához nem kötött közlekedéshez hason

lítjuk, akkor az irányítási célú adatbázisok a vasúti, kötött pályás közlekedési hálózatot képviselhetik.

A z eltéréseket — ma még szakterületenként eléggé eltérő és ellentmondásos m ó d o n — a nyelvhasználat is jelzi:

• Könyvtári és dokumentációs környezetben az első esetben bibliográfiai adatbázisról vagy egy

szerűen csak gépi, automatizált nyilvántartásról ( d o k u m e n t á c i ó r ó l ) , az utóbbi esetben pedig fak

tográfiai adatbázisról beszélnek — elég szeren

csétlenül, mert a bibliográfiai adatbázisban leg

alább annyi tényadat található, mint a "faktográfi- aiban".

• Irányítási-vállalati környezetben egyszerűen csak adatbázisról beszélnek, mert vagy észre sem veszik, hogy létezik másféle adatbázis (annyira t e r m é s z e t e s a dokumentáció vagy a könyvtár lé

tezése) , vagy fel sem merül, hogy a dokumentációs-bibliográfiai célú adatbázisokat mások is j e l l e m e z h e t n é k , mint a mindennél fontosabb vezetési-irányítási-ügyviteli-vállalati szempontok. ("Szakemberek vagyunk — mit ér

dekelne b e n n ü n k e t a szakma maga?" - mond- • hatnák nemes egyszerűséggel, e m l é k e z e t ü k szép

irodalmi "adatbázisából" József Attila Ars poeti

cáját segítségül híva.)

Ez persze - tisztelet a kivételnek — a bibliográ

fiai és dokumentációs szakemberekre sem ke

vésbé vonatkozik; sőt: nekik éppen feladatuk volna a differenciált megkülönböztetés! Az ö kör

nyezetükben mintha az irányítási-ügyviteli keze

lőrendszerek nem léteznének — miközben foly

ton folyóirat-nyilvántartásról, szerzeményezési rendszerről, katalogizáló programról beszélnek, melyek (mint ezt a 6. fejezetben látni fogjuk) inkább irányítási-ügyviteli (vállalati = könyvtá

r i ) , vagy akár faktográfiai rendszerek, semmint bibliográfiaiak vagy információkeresők.

• Számítástechnikai környezetben általában csak az általunk irányítási, ügyviteli (váltalati) célúnak nevezett adatállományokat nevezik adatbázisok

nak, mert logikai struktúrán csak az adatok k ö zötti funkcionális-logikai struktúrákat értik, nem pedig minden logikai struktúrát (mint amilyen például a helyesen megfogalmazott kijelentő mondat tartalma, vagy egyáltalán: minden ter

m é s z e t e s nyelven megfogalmazott szöveg).

Éppen ezért a dokumentációs és bibliográfiai adatbázisokat szöveges adatállományoknak vagy szöveges adatrendszereknek, vagy -szerkezetek

nek nevezik, ami két szempontból is megté

vesztő: egyrészt, mert a d o k u m e n t á c i ó s célú adat

bázisok többsége manapság alig tartalmaz szö

veges adatokat (a szerző neve. a m ú z e u m i tárgy m e g n e v e z é s e , a tárolás helye, a készítés d á t u m a , a tárgyszó, az osztályozási jelzet stb. semmivel sem szövegszerübb adat, mint a beosztás, a mun

kahely, a végzettség, a születési hely, a szervezeti egység vagy a munkaköri leírás adata). Másrészt, mert sem a szövegek belső, "tartalmi" logikájá

nak teljesen automatikus kezelése, sem a nagy mennyiségű szövegben végzett gazdaságos ke

resés nem tekinthető megoldottnak ( m é g nagy

számítógépeken sem, mikroszámítógépekről nem is beszélve). Ezért az igazán szöveges adat

bázis legfeljebb a j ö v ő zenéje.

A fentiek miatt adatbázis-kezelő rendszernek is csak az irányítási célú rendszerek kezelőprogram

jait nevezték. Mivel a d o k u m e n t á c i ó s és bibliog

ráfiai célú rendszerekben a szabadon vagy szótár

ból választható szavakkal végzett keresésnek fontos szerepe van, adatbázisaik kezelőrendsze

rét információkereső rendszereknek szokták ne

vezni.²

1 A kétféle kezelőrendszer kérdését magyar nyelven Halassy (1978, p. 8 2 - 8 3 . és 1986) érinti. A külföldi közlemények közül utalunk Tagg(l9S2) ugyanebben a számban tömörített munkájára.

(5)

T M T 3 3 . é v f . 1 9 8 6 / 5 - 6 - 7 .

Az " i n f o r m á c i ó k e r e s ő " jelző ugyancsak megté

vesztő. S z ű k e b b é r t e l e m b e n u i . csak olyan kezelő

rendszert jelent, melynek kizárólagos rendeltetése a keresés és a kereseti találatok lehető leggyorsabb és legegyszerűbb megjelenítése. Számtalan dokumen

tációs célú adatbázis-kezelő rendszer készül ezzel a

"filozófiával", és csak a felhasználás során derül k i , hogy mennyire szegényes egy ilyen rendszer (lásd az 5. fejezetet). Tágabb é r t e l e m b e n ui. "információ

k e r e s ő " minden olyan kezelőrendszer, melynek tárgya dokumentum vagy rá vonatkozó információ.

Az információkereső rendszer kifejezést használó számítástechnikai szakember s z e m é b e n tehát egész általánosan egy könyvtári katalógus kezelörendszere is " i n f o r m á c i ó k e r e s ő " , holott itt a megjelenítési, a rendezési és a különféle egyéb szolgáltatások követ

keztében m á r nem is lehet ö n m a g á b a n vett keresés

ről beszélni.

Valójában ilyenkor is adatbázis-kezelésről van szó, csak éppen másfajta adatbázisról, mint az irányítási-vállalati adatbázisok esetében. Tisztelet

ben tartva mások (pl. Halassy. 1978. p. 8 2 - 8 3 . ) vé

l e m é n y é t , mi adatbázison adatok - valamifélekép

pen szervezett - bázisát értjük; olyan tárolótartal

mat, melyhez felhasználói szándékkal lehet for

dulni. Ilyen értelemben akár egy egyszerű fájl is adatbázis lehet — ha adatok szerzése céljából fel

használók igénybe veszik.

A tárolótartalom egyrészt meghatározható úgy, hogy megadjuk azokat az adatfajtákat (adattípuso

kat, célinformáció-fajtákat - lásd a 4.4 fejezetet), melyek elvileg előfordulhatnak benne, másrészt úgy, hogy megadjuk mindazokat a konkrét értéke

ket, melyek előfordulnak b e n n ü k . E kettősség lénye

gében ugyanaz, mint ami a fogalom tartalma és ter

jedelme esetében tapasztalható (Ungváry, 1986); a fogalmat megadhatjuk az ismertetőjegyei ( = "adat

fajták"), illetve a terjedelméhez tartozó dolgok ( = " é r t é k e k " ) alapján. A m i k o r adatbázisról beszé

lünk, a tartalma alapján meghatározott tárolóra gon

dolunk (a tároló elvileg lehetséges tartalmaira), amikor pedig adatállományról (fajiról), akkor a ter

jedelme, az értékei alapján meghatározott tárolóra.

Még a legegyszerűbb mai információkereső rend

szerekben is meghatározható az adatbázist jellemző tartalom: t i . " d o k u m e n t u m " célinformációkat tartalmaz.³

* E lénnyel vei s z á m o l Brting és Wenig (Beling. 1973. p.

74—75.). amikor így definiálnak: "Egy rendszer adatbázisa mindazoknak az adatfajtáknakaz összessége, melyek a rend

szeren belül rendelkezésre állnak." Továbbá: "Egy rendszer adatállománya mindazoknak a tárolt adamknak az összes

s é g e , melyek egy rendszeren belül (konkrétan) hozzáférhe

tők." A z — elsősorban irányitási-ügyvjteli — adatbázisok ter

vezésére a legnagyobb befolyást gyakorló Conference on Data System Languagcs Dala Basc Task Group (adalrendszernyel-

A gyakorlat mindenesetre az általunk használt és a köznyelvihez közelebb álló é r t e l m e z é s irányába mutat: a mikroszámítógépek elterjedésével megje

lentek a kereskedelmi forgalomban olyan általános programcsomagok (pl. a dBASE vagy az MDBS, lásd Sclmmacher [19851 ugyanebben a számban tö

mörített t a n u l m á n y á t ) , melyekből a felhasználó megfelelő programozási ismeretek alapján akár irá

nyítási, akár d o k u m e n t á c i ó s célú rendszert, szük

ségképpen akár információkereső rendszert is kiala

kíthat. Az 5. fejezetben ugyan r á m u t a t u n k arra, hogy ez a paradicsomi állapot m é g korántsem rea

litás, de ez nem változtat azon a t é n y e n , hogy ezeket az általános célú t e r m é k e k e t - tekintet nélkül az alkalmazásukra — ma m á r adatbázis- kezelő rendszereknek nevezik.

A z adatbázist és kezelörendszerét együttesen adatbázisrendszernek (Halassy, 1978. p. 79. é s

105.) nevezik. A m i k o r a szűkebb é r t e l e m b e n számí

tógépes (automatizált) információs rendszerről be

szélünk, lényegében adatbázisrendszert é r t ü n k rajta

— vagyis az adatbázist és környezetét, amelybe első

sorban a kezelörendszere tartozik bele. Ilyen érte

lemben a d o k u m e n t á c i ó s adatbázis és kezelőrend

szerének (az utóbbit nevezik információkereső rendszernek, szöveges adatkezelő rendszernek, bib

liográfiai adatbázis-kezelő rendszernek stb.) az együttese is információs rendszer. (Az információ

kereső rendszernek persze m é g további, nem auto

matizált összetevői is vannak, melyekkel itt nem foglalkozunk.)

Az elmondottak alapján a d o k u m e n t á c i ó s (célú) adatbázis-kezelő rendszer helyét a 2, ábrán ábrázol

tuk összefoglalóan. Ez az ábra ú n . címkézett, irányí

tott gráf formájában ábrázolt modellje annak a gon

dolatmenetnek, melyet e fejezetben leírtunk, azaz rendkívül leegyszerűsítve e szöveg szemantikai,

"tartalmi" logikai struktúrája (hasonlóan a 10. ábrá

hoz, mely a 6. fejezet szövegének szemantikai struk

túráját formalizálja rendkívül leegyszerűsítve). A d o k u m e n t á c i ó s céiú adatbázisban tárolt szöveges vagy egyéb, a dokumentumok tartalmára vonatkozó információk (tárgyszavak, jelzetek stb.) szemantikai szerkezetének lényegében ilyen a "formája".

A "tartalmi" vagy szemantikai struktúra a kifeje

zések közöli fennálló különféle kapcsolatokból épül fel, melyeket a tezauruszokban szokásos m ó d o n kü-

vek bizottságának adatbázis-munkacsoportja) definíciójában e kettősségre sajnos nem reflektálnak: " A z adatbázis a fel

használónak megfelelő formában kialakítható, megváltoztat

ható és kiadható, meghatározott rendszer állal fenntartott ál

lományok ö s s z e s s é g e " (Codasyl, 1971). De még e meghatá

rozás sem zárja ki. hogy az információkereső rendszerek által kezelt állományok a felhasználó szempontjából ne legye

nek adaibózisok. Eme adatállományok a szemantikai, tar

talmi igényeknek megfelelően vannak kialakítva.

(6)

l l n e v á r t R . : A dnk i n n e n i i d ós célú í d a t b á i i s - k e i e l ö rendszer.

i

(7)

T M T 3 3 . évf. 1 9 8 6 / 5 - 6 - 7 .

lönféle nyilakkal jelöltünk. A folytonos, egyirányú nyíl azt jelöli, hogy az egyik fogalom fajtája a másik

nak, a szaggatott azt, hogy része, a pontvonalas azt, hogy eszköze, a kétirányú nyíl pedig, hogy egyéb, nehezen meghatározható okból van összefüggés a két kifejezés között.⁴

Az ábra a következőképpen " o l v a s a n d ó " : az adatbázis-kezelő rendszer program rendszerfajta, része az információs rendszernek, tárgya áz adat

bázis. Fajtái:

• a cél, rendeltetés szempontjából az irányítási- ügyviteli és a d o k u m e n t á c i ó s ;

• a m ű k ö d é s , struktúra szempontjából a funkcioná

lis-logikai (a hagyományos, s z ű k e b b é r t e l e m b e n vett adatbázis-kezelő rendszer) és a szemantikai- logikai (az információkereső rendszer);

• a kezelt információfajták szempontjából a faktog

ráfiai és a szöveges;

• a felhasználási hely (szervezet) szempontjából a könyvtári, m ú z e u m i , vállalati, személyi stb.

adatbázis-kezelő rendszer.

A funkcionális-logikai kezelőrendszer — manap

ság - szorosan összefügg az irányítási típusú adatbázis-kezeléssel (ezt jelzi a kétirányú nyíl) és a faktográfiai típusú adatbázis-kezeléssel, a szemantikai-logikai pedig a szövegessel. Felfogá

sunkban a bibliográfiai adatbázis-kezelő rendszer egyik fajtája a dokumentációsnak: ugyanis doku

mentumokra v o n a t k o z ó információkat kezel a bib

liográfiai szabványok által előírt formában. A könyv

tári rendszerben viszont nemcsak bibliográfiai adatbázis-kezelés szükséges, hanem például a be

szerzés, a kölcsönzés stb. nyilvántartása is: ezért a könyvtári rendszerek tartalmaznak mind funkcioná

lis-logikai, mind szemantikai-logikai kezelőrészt, s ezért mind irányítási, mind pedig dokumentációs rendszernek felfoghatók (a d o k u m e n t á c i ó s rend

szerek fajtáit a 6. fejezetben foglaltuk össze). A szer

vezet tehát, melyben egy bibliográfiai vagy egy do

k u m e n t á c i ó s programrendszert használnak, lehet rendkívül eltérő, de a programrendszer lényegében nem fog különbözni egymástól.

2. Dokumentáció és tájékoztatás

Mielőtt a d o k u m e n t á c i ó s adatbázis-kezelő rend

szerek fajtáival foglalkoznánk, szükségesnek tartjuk tisztázni, hogyan értelmezzük a d o k u m e n t á c i ó fo

galmát, és miért ezzel a szóval jellemezzük az álta

lunk tárgyalt adatbázis-kezelő rendszerekel.

' Azt is mondhatjuk, hogy gondolatmenetünk modellezését a lezauruszelv segítségével végeztük el (Ungvári: 1983).

D o k u m e n t á c i ó n azt a tevékenységet értjük, melynek során "információkat gyűjtenek és tárol

nak, rendeznek és válogatnak, terjesztenek és hasz

nosítanak" ( F I D , 1960).⁵ Az információk lehetnek d o k u m e n t á l a t l a n o k és d o k u m e n t á l t a k , gyűjtésük során rögzíthetik őket hagyományos hordozókon (cédulán, lapokon, füzetben stb.), filmen, hangsza

lagon vagy géppel olvasható hordozón (mágnesle

mezen stb.). Terjesztésükre és hasznosításukra ugyancsak az előbbiek vonatkoznak. A h o r d o z ó ésa rajta rögzített információ együttesét dokumentum

nak n e v e z z ü k .⁶

A d o k u m e n t á c i ó n értjük azonban:

• nemcsak a fenti tevékenységet, hanem

• a tevékenység e r e d m é n y é t (a dokumentumok rendezett összességét),

• a rendszert, melynek keretében a tevékenység folyik, és az e r e d m é n y megjelenik.

• a szakterületet, amelyen e tevékenység folyik.

Ellentétben a teljesen határozott jelentésre tö

rekvő felfogással, ezt a fenti poliszémíát hasznosnak tartjuk — ettől gazdag tartalmilag éppen az a foga

lom, amely (hasonlóan az információ fogalmához) az általunk tárgyalt kérdés egyik legáltalánosabb fo

galma. Éppen ezért előny, hogy a fogalmat jelölő k i fejezés ilyen sokszínű: szükségtelenek a folyamato

san változó, pontos, de nehezen kezelhető, össze

tett leíró kifejezések — mindig a szövegösszefüggés szabja meg, milyen értelemben használatos a szó.

Az utóbbi évtizedben a hangsúly a gépesítés kö

vetkeztében áttevődött a d o k u m e n t u m o k r ó l az in

formációkra, azaz a d o k u m e n t u m o k t ó l független szakmai tájékoztatás támogatására.⁷ Ezért a doku

mentáció mellett megjelent a (szak) tájékoztatás fo

galma. A n é m e t szakirodalomban például "tájékoz

tatásról és d o k u m e n t á c i ó r ó l " ("Information und Dokumentation") beszélnek (Grundlaaen..., 1980.

p . 6 . ) .⁸

* Valamivel jobban hangsúlyozza a felhasználót az U N E S C O meghatározása: "Dokumentumok vagy adatok folytonos é s rendszeres feldolgozása, beleértve a felkutatást, azonosítási, beszerzést, elemzést-feltárási, tárolást, keresést, forgalma

zási és tanósitási a felhasználók speciális tájékoztatása erde

kében" ( Wenig, 1976. p. 98.).

* Az U N E S C O által kiadott értelmező szótár szerini: "Hordo

zóból, a rajta rögzíted adalból és az adat által jelöli jelentésből álló egység" (Wmk, 1976. p. 39.).

' Meghatározásában éppen ezt emeli ki t&'enig: "Az információ é s dokumentáció olyan gyakorlati t e v é k e n y s é f (szakterület), amelynek segítségével megkísérlik... a tájékoztatási helyzet javításai" (Grundtagen.... 1980. p. 16.).

" A kérdésről a 60-as évek végén Koblii: javaslatai nyomán - aki egyik szószólója volt a k e l t ö s kifejezés b e v e z e t é s é n e k - vita bontakozol! ki. melynek Pulzovks Irán is résztvevője volt (ennek k ö s z ö n h e t ő e n maradi nyoma az egyébkeni ter

minológiai é s "fitozofikusabb" szempontból végtelenül sze-

(8)

\

Ungvár? R-: A dokumentációs célú adatbázis-kezelő rendszer..

Valójában mindkét esetben olyan ismeretek táro

lásáról és kezeléséről van szó, melyek tudományos, szakmai vagy tapasztalaülag adott tényeken alapul

nak, azaz különböző időkben, különböző helyeken többször is felhasználhatók helyzethez kötött, aktu

ális problémák megoldásában. Ezeket az ismerete

ket bizonyos tartósság, állandóság jellemzi, leg

alábbis nem máról holnapra változnak meg. Eme tartósságuk és ebből következő ismételt felhasznál

hatóságuk miatt kerül sor dokumentálásukra. A fel

használó nem azért keresi őket, hogy velük kapcso

latban valamilyen intézkedést hajtson végre, hanem azért, hogy tudását gyarapítsa, és adódó alkalommal valaminek a megoldásában alkalmazza őket. Ilyen szakismeretek például az állattenyésztési tudnivalók (melyekről szakkönyvek, szakcikkek számolnak be), vagy az olyan információ, hogy az elfekvő kész

letek bizonyos nagysága fölött b ü n t e t ő kamatokkal kell számolni (melyet bizonyos gazdasági-pénzügyi dokumentumok tartalmaznak). A dokumentumot teljesen általánosan értelmezhetjük: lehet hagyomá

nyos, papíron rögzített szakirodalmi dokumentum, lehet tárgy (pl. régészeti lelet, festmény), akár ese

mény is, ha valahol dokumentálják, azaz a rá vonat

kozó információkat rögzítik. Adott esetben mág

neses adathordozón is.

A z irányítási, ügyviteli, vállalati információk esetén ezzel szemben olyan ismeretek tárolásáról és kezeléséről van szó, melyek egy adott szervezethez, k ö r ü l m é n y h e z , helyzethez, esethez kötött tényeken alapulnak, azaz meghatározott helyen vagy megha

tározott időpontban kell ismerni őket. Ezeket az "is

mereteket" a nagyfokú aktualitás, helyhez kötöttség és részben a változékonyság jellemzi. Ilyen informá

ciók például a tejhozam csökkenésének adatai egy mezőgazdasági nagyüzemben, vagy az olyan raktári adat, amely az elfekvő készletek nagyságáról tájé

koztat. Velük kapcsolatban mindig dönteni kell — ezért tekinthetők irányítási, ügyviteli információk

nak. A helyes döntéshez azokat az állandóbb szak

mai ismereteket kell felhasználni, melyeket az előbbi - vajon milyen n e v ű ? - rendszerekben tá

rolnak kereshelÖen.

(Persze dönteni dokumentumokra vonatkozó i n formációk esetében is kell. Például egy katalógus esetében ilyen irányítási d ö n t é s , hogy a kezelő mit hova soroljon be, vagy helyes-e egy adott bibliográ-

gényes hazai szakirodalomban). Polzovies szerint a doku

mentáció átfogóbb, ennek a szaktájékoztatás csak része. Kob- litz szerint a két kifejezés egyenrangú, s a német szakiroda

lomban hosszú ideig ez a felfogás érvényesült. Ma létezik olyan álláspont, amely szerint a szaktájékoztatás az átfogóbb, m o n d v á n , hogy létezik szakmai tájékoztatás, mely nem a szakirodalmi dokumentumokhoz kapcsolódik. (A vitára vo

natkozóan lásd A dokumentáció... 1961.)

fiai leírás stb. A katalógus kezelőjének a döntései pontosan olyanok, mint az irányítási rendszerek

használóinak döntései. A katalógus használójának döntései azonban teljesen különböznek ezektől: a dokumentumokra vonatkozó információval kapcso

latban neki elvileg nem olyan döntést kell hoznia, amely eme információfajtára van hatással, hanem eme információ, tudás birtokában egy másik rend

szerben kell eldönteni valamit. Az irányítási- ügyviteli és a dokumentációs rendszerek ebből kö

vetkező egymásrautaltságát jeleztük az 1. ábrán.) Mindkét rendszer tájékoztatási — azaz informá

ciós — célú. E kifejezés egyoldalú használatának tehát a természetes nyelvérzék eleve ellentmonda

na. Megkülönböztetésükre a következő szembeállí

tások adódhatnak:

(1.) információs

= tájékoztatási

szak tájékoztatási irányítási

(2.) információs

= tájékoztatási

d o k u m e n t á c i ó s - " " * ' ^ irányítási

M i a 2. megoldást választottuk. A tartós, többször is felhasználható szakismeretek feltétele minden

képpen valamiféle dokumentáltság. Nem lényeges, hogy a dokumentumot könyv, festmény, film vagy mágnesszalag képviseli. A d o k u m e n t á c i ó és a szak

tájékoztatás valójában ugyanúgy nem választhatók el egymástól, ahogy az agy az elmétől, a molekula a vegyülettől, az adat az információtól.

Harmadik megoldásként adódnék az 5. generá

ciós számítógépekkel kapcsolatos " i s m e r e t b á z i s "

("knowledge base") kifejezés használata (magyarul lásd Fuchl, 1983). így beszélhetnénk "ismeretbázis- kezelőrendszerröl". A dokumentáltságot itt — akárcsak az emberi agy esetében — m á r kizárólag a tár, a m e m ó r i a képviseli. Ez azonban — különösen mikroszámítógépek vonatkozásában — kissé korai volna.

Mindebből természetesen nem következik, hogy ne létezhetnének átmeneti formák is: egy összetett kísérletsorozatot nyilvántartó és kezelő program például dokumentációs és irányítási jellegű egyszer

re. Sőt: mint ahogy később m é g kimutatjuk, maga a d o k u m e n t á c i ó s adatbázis is tartalmazhat irányítási részt (ilyen pl. a kölcsönzési, szerzeményezést stb.), és elvileg a fordítottja is lehetséges; bár ma még ritka (részletesebben lásd az 5. és 6. fejezetet).

(9)

T M T 3 3 . évf. 1 9 8 6 / 5 - 6 - 7 .

bemenet

KÉRDESFELDOLGOZÓ RÉSZRENDSZER kérdés feldolgozás és kezelés f (állapotátmenet)

bemenet

Árén/eset fa/

műm

SGM4 és S/ÓMfi

meg/e/en/'fett*

térdésex f/J

információfeldolgozás és - kezelés (állapotátmenet)

r 4

M l / l l / l O

• kimenet

— s/rt/k/ws?/

/fyorméc/ofc

' f s J

S£Mt és SZűrjfi . , ,

^A

Jf *

**meg/e/emlert* \**

kimenet

INFORMÁCIOFELDOLGuZÓ RÉSZRENDSZER

5 abta A dokumemauc.s adaibizrs-keztlS rendszer á l n h n o s működési modellje

3. A dokumentációs adatbázis-kezelő rendszer elvi működése

A rendszer m ű k ö d é s é t és felépítését úgy szemlél

tethetjük, ha absztrakt a u t o m a t á n a k fogjuk fel ( Ung- váiy, 1984), melynek [a) bemenete ( = bemenöalfa- béta, X ) , [e] kimenete ( = kimenőalfabéta, Y ) , [d]

kisebb-nagyobb m é r t é k b e n strukturált adatállomá

nya ( = állapota, S) van, és benne meghatározott (dl modell alapján [b] feldolgozás folyik ( = állapot

á t m e n e t ) , melynek során egyrészt az adatállomány változik meg a bemenet következtében (SxX lekép

ződik S-be), másrészt az adatállomány vagy annak bizonyos része a bemenet k ö v e t k e z t é b e n [f] kiadás

ra kerül (SxX leképződik Y-ba) (3 . ábra).

[a] A bemeneten a gyűjtés, beszerzés, átvétel, k i választás stb. következtében keletkezett adatok rög

zítése játszódik le. A bemenőalfabéta ( X ) a minden

kori ábécé felhasználásával szerkesztett jelsoroza

tokból áll (pl. szerzőnév, cím, referátum, tárgyle

írás, diagnózis, deszkriptor). E jelsorozatok össze

kapcsolásának és elhelyezésének szabályait m e z ö n e - vek, elválasztó jelek stb. formájában a program tartalmazza.

[bl A feldolgozás egyrészt megváltoztatja a beér

kező információk tartalmát. Ilyen m ű v e l e t e k az osz

tályozás, indexelés, annotálás, referálás (kivona- tolás), t ö m ö r í t é s , fordítás, az analitikus-szintetikus feldolgozások stb. Ezek automatizálása gyerekcipő

ben jár. Léteznek ugyan automatikus osztályozási, indexelési és kivonatkészítési eljárások, de nem ver

senyképesek a szellemi feldolgozással. A rendkívül nagy tárigény miatt mikroszámítógépen egyelőre amúgy sem valósíthatók meg. Összefoglalóan tar

talmi feldolgozásnak fogjuk mindezeket a m ü v e l e t e  ket nevezni ( n e v e z h e t n é n k szemantikai vagy

" m é l y s é g i " feldolgozásnak is). A szellemi úton vég

zett tartalmi feldolgozás e r e d m é n y e k é n t tárgysza

vak, deszkriptorok, osztályozási jelzetek, címfordí

tások, tartalmi kivonatok, tárgyleírások, besorolási adatok stb. rögzítésére kerül sor.

(10)

IJnevárj R . : A d o k u m e n t á c i ó s célú adatbázis-kezelő" rendszer..

[c] A feldolgozás másrészt nem változtatja meg a beérkező információk tartalmát, hanem vagy helyet és nevet ad nekik, vagy megváltoztatja a n e v ü k e t és helyüket (strukturálja vagy átstrukturálja az adatál

l o m á n y t ) . Ilyen müveletek az iktatás, címleírás, ka

talógusba sorolás, iratrendezés, lelőhely-azonosítás stb. Mindezek a müveletek lényegében azonosítá

sok, rendezések és válogatások; a számítástechnika mai szintjén gyakorlatilag maradéktalanul automati

zálhatok. Összefoglalóan formális feldolgozásnak fogjuk nevezni őket ( n e v e z h e t n é n k "szintaktikai"

vagy "felszíni" feldolgozásnak is). A formális fel

dolgozás kiterjed mind a tartalmi feldolgozás során keletkezett adatokra, mind pedig a tartalmilag válto

zatlanul maradó adatokra (pl. iktatási szám, szerző

n é v , lakcím, megjelenési hely, lelőhely, születési adat, d o k u m e n t u m c í m . foglalkozás, m é r e t ) . Valójá

ban a formális feldolgozások alkotják az állapotát

meneteket.

[d] A feldolgozás e r e d m é n y e k é n t kisebb vagy na

gyobb m é r t é k b e n strukturált adatállomány keletke

zik, mely a rendszer állapotát (S) képviseli. E struk

túra s egyben a feldolgozás alapja - legalábbis az ál

talunk tárgyalt logikai szinten (a fizikai szint kérdé

seivel egyáltalán nem foglalkozunk) — annak a kör

nyezetnek ("világnak") a modellje, amelyből az adatbázis adatai és a vele szemben támasztott elvárá

sok (kérdések, megjelenitési és átalakítási igények stb.) származnak.

E modell kettős: egyrészt tartalmi logikai - a to

vábbiakban szemantikai - , másrészt funkcioná

lis-logikai.

A szemantikai modell (lásd az 1.2.3 fejezetet) szótárak (osztályozási rendszerek, tárgyszójegyzé

kek, tezauruszok, címjegyzékek, végzettségkódok, foglalkozásjegyzékek- stb.) formájában létezik. A mikroszámítógépek fejlettségének mai szintjén álta

lában nem előre épülnek be gépi szótárként a rend

szerbe, hanem különálló szellemi termékek formá

jában használják őket a tartalmi feldolgozáskor; a ke

zelőrendszer csak a ténylegesen felhasznált és bevitt kifejezésekből állítja össze a viszonylag egy

szerű b e t ű r e n d e s gépi szótárakat, melyek a további m u n k á b a n m á r felhasználhatók. Az is gyakori, hogy egyáltalán nem készül előre szellemi munkával önálló szótár, hanem a feldolgozások e r e d m é n y e ként keletkezett gépi szótárakat nyomtatják k i és használják fel a későbbi m u n k á b a n szótárként. (A szavak mellett gyakran feltűntetik azoknak a téte

leknek a számát is, melyek e szavakat tartalmazzák.) M i n t az 1.2.3 fejezetben már utaltunk rá, e szeman

tikai modell a tárgyszavak, deszkriptorok, osztályo

zási jelzetek stb. esetében valójában sokkal bonyo

lultabb, mint amennyi manapság még a legigénye

sebb szellemi munkával készült szótárban vagy osz

tályozási táblázatban megragadható. A teljes sze

mantikai modell a (szak)nyelv, a jelentés ismereté

nek formájában létezik a feldolgozók és felhasználók tudatában. Mintegy "ott lebeg" az adatbázis és keze

lőrendszere "fölött", és ebből a bonyolult szemanti

kai struktúrából csak a szótárakba kerülő szavak épülnek be magába az adatbázisba; ők biztosítják a belépési pontokat (a szemantikai hozzáférést) az adatbázisba. Ritka esetben, ha tezaurusz is beépül a rendszerbe, a szavak közötti kapcsolatok - például a 2. ábrán látható formában — valamennyire már strukturálják az állományt. Mindez nem változtat azon, hogy a szótárakba kerülő szavak valóban strukturálják tartalmi szempontból az adatállományt

- de ez a struktúra túlnyomórészt nem formalizál

tan van jelen.

A szemantikai modellben használt szavak, a szavak közötti kapcsolatok és használatuk szabályai

nak összességét információkereső nyelvnek neve

zik. Az információkereső nyelv szavai a lehetséges szemantikai vagy tartalmi hozzáférési pontokat al

kotják az adatbázisban.

Valójában nemcsak a jellegzetesen tartalomra vo

natkozó osztályozási jelzetek, tárgyszavak, deszkrip

torok stb. alkotnak információkereső nyelveket, hanem külön-külön a szerzői nevek, lakcímek, helynevek, raktári azonosítók, leltári számok, mun

kaköri megnevezések, árucikkek nevei stb. is.

Ezeket általában nem is szokták önálló szótárakba foglalni, mert hallgatólagosan tudomásul vett szabá

lyok szerint használják őket (például mindenki tudja, hogy a család- és keresztnevet közzel elvá

lasztva, nagybetűkkel kezdve, sorrendben előbb a családnevet téve írják). De még ilyen esetekben is előfordulnak szabványosított szótárak, például a fo

lyóiratnevek rövidítései, az országnevek, a címek esetében (ilyen szótárt alkotnak például a melléklet

ben közölt MSZ 3400, illetve MSZ 3410 szabvá

nyokban a nyelv-, illetve országnevek és kódjaik).

A funkcionális-logikai modell az adatbázis sémá

jának formájában létezik (lásd az 1.2.2 fejezetet). A séma elemeit az ún. adatszótár tartalmazza (Halassy, 1978. p. 275.). Szemben az információkereső nyelv szótárával, az adatszótárban nem a konkrét tartal

mat esetleg jellemző szavak, hanem e szavak fajtái

nak, funkcióinak megnevezései szerepelnek. A z előbbiekre példa: Jókai M ó r , T u d o m á n y o s és Műszaki Tájékoztatás, Vértesszöllős, archeológia, 27 cm (fizikai szinten ezek a m e z ő tartalmak). Az utóbbiakra példa: C í m , Lelőhely, Tárgyszó, Méret (fizikai szinten ezek a m e z ő n e v e k ) . Ugyanez vonat

kozik az összetettebb egységekre is, mint a tételek;

igy szerepelhetnek az adatszótárban olyan tételfaj

ták, mint " d o k u m e n t u m " (a dokumentum címét, szerzőjét, megjelenési adatait tartalmazó leírások).

(11)

T M T . r V ó f . 1 9 8 6 / 5 - 6 - 7 .

" b e s z e r z é s " (az árucikk n e v é t , a szállítót, az árát, az egyszámlaszámot tartalmazó tétel) stb.

Összefoglalóan azt mondhatjuk, hogy az informá

ciókereső nyelv szavai az adatbázis tartalmát alkot

hatják (a tartalom elemi é r t é k e i t ) , az adatszótár szavai pedig az adatbázis lehetséges tartalmát előre leírják (a tartalom lehetséges elemi típusait adják meg). Ezért az adatszótár, s vele a séma az adatbázis metaadatbázisa (Halassy, 1978. p. 277.).

[e) A kezelőrendszer edig leírt bemeneti (rögzí

tési) és feldolgozási műveletei egymással párhuza

mosan, két szinten játszódnak le. Az egyik szinten a d o k u m e n t á l t vagy d o k u m e n t á l a n d ó információk fel

dolgozása folyik a modellt reprezentáló szótárak és séma alapján: ez az információfeldolgozó részrend

szer vagy szint. A másikon az adatbázisnak fellett kérdések és a vele szemben támasztott egyéb igé

nyek feldolgozása folyik ugyancsak a modellt repre

zentáló szótárak és séma alapján: ez a kérdésfeldol

gozó vagy információkereső/lekérdező részrend

szer. M i n d k é t szinten szigorúan ugyanazt a modellt kell alapul venni, azaz ugyanazon a nyelven kell "fo

galmazni", és ugyanazon séma szerint kell a kapcso

latok m e n t é n "haladni" (navigálni). Máskülönben nem lehet a feldolgozás e r e d m é n y e k é n t strukturált kérdést e r e d m é n y e s e n összehasonlitani a feldol

gozás e r e d m é n y e k é n t strukturált adatállománnyal.

A kérdéseket például ugyanazoknak az információ

kereső nyelvi szótáraknak (pl. osztályozási rendsze

reknek, tárgyszójegyzékeknek, címjegyzékeknek, röviditésjegyzékeknek) a szavaival kell leírni, mint amelyeket a dokumentumok vagy információk tar

talmának feltárásakor használtak. Továbbá ugyanan

nak az adatszótárnak az alapján kell megadni, hogy az információkereső nyelv szavai az adatbázis szer

kezetén belül mire vonatkozzanak (szerzönevekre, címszavakra, tárgyszavakra, lakcímekre, folyóirat

rövidítésekre stb.).

[fl A két szint strukturált állományának Összeha

sonlítása e r e d m é n y e z i a rendszer kimeneténa talála

tokat. A kimenöalfabéta (Y) tehát az információ

kereső nyelvek és az adatszótár ábécéinek felhaszná

lásával szerkesztett jelsorozatokból áll, az adatbázis sémájának és modelljének megfelelő egységekbe szervezve.

A találatok adott esetben egy tételfajta vagy egy adatfajta teljes állományát is alkothatják. A "doku

m e n t u m " tételfajta teljes állománya például kataló

gust alkothat (lásd m é g a 4.10 fejezetet is), a témát jellemző szavak összessége pl.: a tárgyszójegyzéket.

Elvileg a kérdések is megjelenhetnek a kimene

ten, amire van is igény: célszerű ugyanis dokumen

tálni az alkalmazott keresési eljárást, vagy tárolni a következő alkalomra.

Ha az összehasonlítást a funkcionális-logikai szer

kezet, vagyis az adatszótárban megadott szavak és kapcsolalok alapján végzik, lekérdezésről ( " i n - quiry" vagy "query" - Halassy, 1978, p. 432.), ha ebbe az információkereső nyelv szavait és a kereső által megadott logikai kapcsolatokat ( h a l m a z m ű v e leteket, Boole-operátorokat stb.) is bevonják, kere

sésről ("search") beszélünk. A lekérdezés/keresés legprimitívebb formája a soros, sávban végzett "le

tapogatás" ("scanning"), azaz a séma ilyenkor csak annyi, hogy "egymás u t á n " . A keresés, lekérdezés és a velük összefüggő müvelelek és eljárások összes

sége az "information retrieval"; nincs rá önálló magyar szó, általában az összetett "információke

r e s é s " kifejezéssel utalunk rá (nem pedig az

"információ-visszakereséssel", mint ahogy nem be

szélünk "információ-visszakercső nyelvről" sem).

[g| Mindezek alapján az irányítási és a dokumen

tációs adatbázis-kezelő rendszer közötti különbség is pontosabban megfogalmazható.

A tiszta információkereső rendszerek nem kezel

nek semmiféle funkcionálisan strukturált logikai adatállományt (fizikailag strukturált állomány keze

lése persze ekkor is fennállhat). Az adatbázisban nincs a felhasználó szempontjából előre meghatáro

zott m e z ő n é v vagy m e z ő t a r t a l o m , sem különféle té

telfajták és közöttük kapcsolatok. (Például a bibliog

ráfiai tételek esetén nem különböztetik meg a téte

len belül az egyébként szabványosan kiírt szerzőt, cimet, annotációt, hanem funkcionális szempontból egyetlen egységnek tekintik.) A keresés a teljes szö

vegben, aszemantikai-logikai tartalom alapján törté

nik. Ezek a szövegben szabadon kereső rendszerek ("frce text syslem"): bármelyik szövegen belüli szó alapján a tétel megtalálható. A felhasználói " v i l á g "

csak szemantikailag valószínűsíthető, de funkcioná

lisan előre nem meghatározható. A hozzáférési pontok között csak a szavak jelentése alapján létezik összefüggés. Ezek a rendszerek — akárcsak fejlet

tebb változataik, az automatikus indexelő és osztá

lyozó rendszerek — ma m é g elég ritkák.

A tiszta irányítási rendszerek csak funkcionális é r t e l e m b e n strukturált adatállományt kezelnek. Azt is mondhatjuk, hogy a felhasználói " v i l á g " minden igénye és m ű v e l e t e előre meghatározott (szükség

szerű). A belépési pontok között magában az adat

bázisban előre megadott, funkcionális kapcsolalok vannak, melyek a megjelenítés e r e d m é n y é b e is szervesen beletartoznak. (Például megadják, hogy az adott beszerzési tétel ára milyen egyszámla

számra fizetendő be, vagy melyik olvasónál milyen könyv található.) Az ilyen adatbázisok lekérdezése

kor csak az előre meghatározott összeállítású kérdé

sek tehetők fel (a szavak mellett a "szintaxis" is kötött). Ezek a rendszerek ma elég gyakoriak.

(12)

I ncváry R . : A dokumentációs célú adatbázis-kezelő rendszer..

A gyakorlatban előforduló dokumentációs adat

bázis-kezelő rendszerek mindig tartalmaznak olyan összetevőket, melyekkel funkcionális-logikai struk

túrák alakithatók ki az adatbázisban. Mennél ke

vésbé szakmai, általános é r v é n y ű , hanem aktuális, meghatározott döntést vagy felhasználást igénylő i n formációkat kezelnek, vagy megjelenítési formátu

mokat szolgáltatnak, annál nagyobb m é r t é k b e n . Ez a kérdés átvezet a d o k u m e n t á c i ó s adatbázis

kezelő rendszerek fajtáihoz. Mivel ezek - elsősor

ban felhasználói szempontból - az általuk kezelt adatok/információk fajtái alapján térnek el egymás

tól, előbb velük foglalkozunk.

4. A dokumentációs adatbázisokban előforduló adatok/információk a felhasználó

szempontjából

4.1 Az adat és az információ kettőssége

Mielőtt az adatok/információk fajtáinak tárgyalá

sára rátérnénk, tisztáznunk kell az adatnak és infor

mációnak egymáshoz fűződő kapcsolatát, s azt, hogyan használjuk őket a továbbiakban. E két kife

jezés ugyanis egymástól elválaszthatatlan, mégpedig azért, mert az általunk jelölt két fogalomnak ugyan

az a terjedelme, de nem ugyanaz a tartalma; m á s szóval a két kifejezés ugyanazt a dolgot jelöli (azonos a d e n o t á t u m u k , a j e l ö l e t ü k ) , de különböző értelemben teszik ezt. Jól érzékelhető ez a követ

kező példában:

A 19 mint grafikus jel vizuális, érzéki "adat", de ehhez képest az az ismeret, hogy ez szám, informá

ció; a 19 mint szám adat, de ehhez képestaz az isme

ret, hogy ez hőmérsékleti érték, információ; a "19 fokos h ő m é r s é k l e t " adat, de ehhez képestaz az isme

ret, hogy ez a víz hőmérséklete, információ; a "19 fokos a víz h ő m é r s é k l e t e " adat, de ehhez képestaz az "ismeret", hogy ez valakinak a fürdéshez még hideg (vagy m á r meleg), ínformáció.

A skála láthatóan az értelmi szint alatti érzéki szinttől az értelmi szint feletti érzelmi szintig terjed (ezért szerepel az első "adat" és az utolsó "ismeret"

idézőjelben), s közte a végtelenségig finomíthatjuk a tisztán logikai kettőződéseket. Hasonló a helyzet, mint az adatbázis és az adatállomány kettőssége ese

tében (lásd az 1.3 fejezetet és a 3. lábjegyzetet): ha információról beszélünk, a tartalom alapján is meg

határozott dologra gondolunk (a dolog lehetséges tulajdonságaira), amikor pedig adatról beszélünk, akkor az előbbi dologra, de csak a terjedelme (a dolog " é r t é k e i " ) alapján meghatározva.⁹ A z infor

máció az ismeret szerepére, hatására, tartalmára utal, az adat pedig az ismeret puszta tényére, meglé

tére, formájára. Ezért az előbbi valamivel szorosabb

an kapcsolódik az ismeretek felhasználásához, az utóbbi pedig az ismeretek kezeléséhez. Talán főképp ennek tulajdonitható, hogy a d o k u m e n t á c i ó , a tájékoztatás, a könyvtárügy stb. területén gyakori az előbbi használata, a számítástechnikában — és ál

talában a formálisabb, mechanikusabb megközelíté

sek e s e t é n - viszont túlnyomórészt az utóbbi hono

sodott meg. Ezzel magyarázható az is, hogy ha álta

lánosabban közelítik meg a kérdést, a számítástech

nikában is információról beszélnek (pl. azt mondják:

információs rendszer, információkeresés), ha pedig szabványosításról, nagyon is speciális, részletező megközelítésről van szó, a dokumentációban stb. is inkább az adat kifejezést használják (pl. bibliográfiai adatelem, kölcsönzési adatok).

A továbbiakban elsősorban az információ kifeje

zést fogjuk használni, ezzel is hangsúlyozva, hogy mondanivalónkat egyrészt — noha a számítástech

nikai szakembernek is címezzük — a felhasználó szempontjából, másrészt pedig a lehető legáltaláno

sabban igyekszünk megfogalmazni. A két kifejezé

sen azonban mindig ugyanazt é r t j ü k .^{1 0}

Az ilyen fogalmi kcltözödések nem is olyan riikák. Például a

" m o l e k u l a — v e g y ü l d " , " a l o m - e l e m " , "agy—elme", "is

meret—tudás", "civilizáció—kultúra" stb. eseiében is páron

ként ugyanarról van s z ó , de más-más értelemben (lásd t/n- gváry. 1986).

Ez a megoldás nincs összhangban s z á m o s szabványosítási tö

rekvéssel, melyekben kizárólag az adat használatát szorgal

mazzák, mivel az információ fogalmát — Wiener nyomán - az anyag és az energia fogalmaival egyenértékű általánosítás

nak ismerik el {Beling, 1973, p. 13.). A javasolt definíciókból azonban rendre kiderül, hogy az egyik a tartalmibb, a másik a formálisabb oldalát emeli csak ki ugyanannak a dolognak.

Az információ "a határozatlanság csökkentése kommuniká

ciós folyamatok következtében", illetve "olyan adai vagy ki

jelentés, melyről ... feltehető, hogy tájékoztató hatása van"

{Beling. 1973, p. 17. és 22.), továbbá "közöli fény", "lény vagy fogalom hordozó és jel (adathordozó é s jelentés) együt- lese által megvalósiioti re prezentálásra való üzenet', "adatnak tulajdonitól! jelentéi' { Wenig, 1976. p. 74 ). Az adatok

"tények legkisebb megvalósítható reprezentációi, melyek ...

interpretálhatók és diszkrét jelek formájában zartósan rögzít

hetők" {Beling, 1973, p. 21.), lovábbá "lények, fogalmak vagy utasítások formatiiátl reprezentációi.." ( Wersig. 1976, p.

72.). Az információ tehát "csökkentés", "hatás", "tény",

"üzenet", az adat pedig "jelek formájában megvalósiioti rep

rezentáció", "formalizál! reprezentáció". Hasonló következ

tetésre jut Halassy (1982, p. 22.) is: " A z adal ... reprezentált, de nem értelmezett ismeret" és " A z információ ... értelme

zett ismeret". Végső soron tehát mindig ugyanannak a dolog

nak formaibb, illetve tartalmibb megnyilvánulására lyuka

dunk ki. Ebből az is következik, hogy elsősorban a minden

kori szövegösszefüggés szabja meg, melyik kifejezés haszná

lata találóbb.

(13)

T M T 3 3 . évi. 1986/5—fi—7.

4.2 Eredeti és származtatott információ

A dokumentáltság szempontjából megkülönböz

tetjük a közvetlenül a dokumentálatlan dolgokra ( t é n y e k r e , tárgyakra, személyekre, helyzetekre, ál

lapotokra, tulajdonságokra, esetekre, e s e m é n y e k r e ) vonatkozó eredeti (elsődleges, primer), a dokumen

tumokban rögzített információkra vonatkozó má

sodlagos (szekunder), az ezekre vonatkozó harmad

lagos (tercier) stb. információkat. (Értelemszerűen ez a dokumentumokra is vonatkozik: az elsődleges, másodlagos, harmadlagos stb. információkat tartal

m a z ó dokumentumokat elsődleges, másodlagos, harmadlagos stb. dokumentumoknak nevezzük.)

A d o k u m e n t á c i ó s célból feldolgozott információk lehetnek akár elsődlegesek (pl. a tárgy-, hang-, kép-, személyi, m u n k a ü g y i , egészségügyi, gazda

sági, határidő-információk), akár másodlagosak (pl.

a bibliográfiai információk), természetesen harmad- lagosak stb. is. A másodlagos információk azonban nemcsak a hagyományos könyvtári dokumentu

mokra vonatkozhatnak. Mivel a statisztikai appará

tusok manapság már olyan adattömeget gyűjtenek be és tárolnak, melyek a maguk elsődleges formá

jában áttekinthetetlenek, kialakulófélben van a rájuk v o n a t k o z ó metainformációk rendszere, melyek segítségével a statisztikailag rögzített elsőd

leges Ínformációk leírhatók (Domokos, 1983). Ezek tehát nem bibliográfiai jellegű másodlagos informá

ciók. Nem bibliográfiai jellegűek az irányítási (célú) adatbázis-kezelő rendszerek metaadatbázisaiban szereplő adatszótárak információi sem (Halassy,

1978, p. 275.).

A másodlagos információk é r t e l m e z é s ü n k b e n in

formációkat azonosítanak, jellemeznek, ábrázolnak, írnak le. A harmadlagosakra ugyanez érvényes a má

sodlagos információkra vonatkozóan, ezért doku

mentációs szempontból lényegében már nem kü

lönböznek egymástól. M i n d közvetett, származta

tott (a hivatkozás, a nyilvántartás, a d o k u m e n t á c i ó s célú jellemzés és felhasználás vagy a metanyelvi leírás é r d e k é b e n keletkezett) információk.

A z elsődleges információknak létezik egy másik é r t e l m e z é s e is, amely az információ eredetiségét ál

talában, a dokumentáltságtól függetlenül ragadja meg. így kritérium pl. az információ újszerűsége (Lexikon des Bibliothekswesens, 1974, p. 699.)^{1 1} Az újszerűség e feltételének fennállása egyrészt jóval nehezebben ellenőrizhető, mint az, hogy az infor-

"Egy primer dokumentum ... a tudományos munka eredmé

nyeként keletkező (eredeti) információforrás (pl. monográ

fia, szakcikk, disszertáció, szabadalmi leírás), mely új tudo

mányos felismeréseket vagy ismeri gondolatok és tények új értelmezését, magyarázatát tartalmazza..."

máció a dokumentációs feldolgozás tárgya volt-e, vagy sem. Másrészt a számítástechnikai feldolgozás szempontjából nincs jelentősége, hogy valaki mit tart újszerűnek, és mit nem; annak viszont van je

lentősége, hogy dokumentációs szempontból feldol

gozott vagy feldolgozatlan információkra vonatkozó információk kezeléséről van-e szó, mert hozzájuk teljesen más feldolgozási és megjelenítési igények fűződnek.

Ezért a továbbiakban az elsődleges ínformációk helyett mindig eredeti információkról, a másodlagos, harmadlagos stb. információk helyett pedig származ

tatott információkról fogunk beszélni. Az elsődleges információkat a számítástechnikai gyakorlatban alapadatoknak nevezik (Halassy, 1978, p. 22.).

4.3 T é n y - és szöveges (értelmezett és értelmezésre szoruló) információ

Az információk egyértelműsége, feltártsága, ma

gyarázatot, értelmezést igénylő, illetve nem igénylő mivolta alapján megkülönböztetjük a faktográfiai vagy tény információkat és a szöveges információkat.

A tényínformációk már megjelenési formájukban egyértelműbben kifejeznek egy meghatározott — m o n d h a t n á n k azt is, hogy egységnyi - tényállást (pl. "Beosztás: főelőadó", "falvastagság: 5 c m " ,

"Szerző: Gyulai Gergely Á k o s " , "Főzni jó ( M o n - spart Éva — Bp., Móra, 1981"); azaz nincs szükség magyarázatra, interpretációra. A tényállások ebben az értelemben azt fejezik k i , hogy egy dolognak milyen összefüggésben, é r t e l e m b e n van valamilyen tulajdonsága, vagy milyen é r t e l e m b e n áll fenn a dolgok között valamilyen összefüggés.

Valami akkor — és olyan m é r t é k b e n — fényin

formáció, ha — és amennyiben — az információ helye vagy egy rá vonatkozó azonosító ( n é v ) meg

mondja, hogy miről van szó.

Ha az adat helyéből tudjuk, hogy Ö micsoda, akkor pozícionált adat, ha valamilyen azonosító (név) mondja meg, akkor névvel azonosított, meg

nevezett adat.

Az információnak azt a részét, amelyet így azono

sítanak, információtartalomnak (fizikai szempont

ból m e z ő t a r t a l o m n a k ) , azt a részét pedig, amely azonosít, információnévnek (fizikai s z e m p o n t b ó l m e z ö n é v n e k ) nevezik. Valójában megnevezetlen

— szöveges — és megnevezett — tény- — informá

ció esetében ugyanaz a kettősség alakult ki az adat

feldolgozásban, mint amelyet az adat/ínformáció kettőssége képvisel a természetes nyelvben (lásd a 4.1 fejezetet).

Mezőnév például az, hogy "Beosztása:", m e z ő tartalom pedig az, hogy " f ő e l ő a d ó " . A m e z ő n é v és