Követelmények és néhány megoldás
A D O K U M E N T Á C I Ó S CÉLÚ A D A T B Á Z I S - K E Z E L Ő R E N D S Z E R A rendszer helye, elvi működése és felépítése
Ungváry Rudolf
Országos Széchényi Könyviár
1. A dokumentációs célú adatbázis-kezelő rendszer helye a programrendszerek között 1.1 A három programfajta
A programok feladata az, hogy valamit önállóan megoldjanak, valamilyen folyamatot, eljárást végre
hajtsanak. A matematikai, szimulációs és a külön
féle — például termelési, élettani — folyamatokat irányító programokra j e l l e m z ő , hogy az adatokat, amelyek az általuk kezelt rendszerbe bekerülnek, valamilyen másik adattá alakítják át, vagy a bekerülő adatok alapján előre meghatározott belső minta sze
rint k i m e n ő (irányító) adatokat hoznak létre. Lé
nyegük éppen ez az átalakítás, illetve a minta alapján előállított e r e d m é n y .
Vannak programok, melyek feladata elsősorban az. hogy adatokat tároljanak, mégpedig azért, hogy velük valaminek a programon kívüli, szellemi meg
oldását — például gazdasági, kulturális szervezetek irányítását és gazdálkodását — támogassák. Ilyenek a pénzügyi, m u n k a ü g y i , személyzeti stb. irányítás, a számvitel és a gazdálkodás, valamint a különféle nyilvántartások (állóeszköz, raktári, szállodai szoba, utas stb.) programjai. A m i t ezek a programok megoldanak, az lényegében nem t ö b b , mint hogy a tárolóból a nyilvántartott adatokat a szellemi irányí
táshoz (megoldáshoz) szükséges formában és össze
függésekben kiadják. Éppen ezért e programok - k ü l ö n ö s e n ami az adatok közötti kapcsolatokat és megjelenítésük módját illeti — elsősorban e rend
szerek, azaz a gazdasági szervezetek igényeihez al
kalmazkodtak. Az adatok közötti kapcsolatokat az adott szervezet működéséből következő összefüg
gések szabják meg, melyeket a továbbiakban funkcionális-logikai kapcsolatoknak n e v e z ü n k .
A tárolt adatok a gazdasági szervezetek erőforrá
sai: közvetlenül felhasználják őket az értékelési és döntési tevékenységben. Egy részük változatlanul maradó vagy csak ritkán változó törzsadat, másik — többnyire jelentősebb - részüket viszont a nagy
fokú változékonyság jellemzi: ezek az e s e m é n y vagy tranzakciós adatok. Mindezeknek a program
rendszereknek nincs m é g mindenki által egyformán elfogadott, egyezményes nevük. M i a továbbiakban irányítási célú vagy ügyviteli (vállalati) progra
moknak nevezzük őket.
Vannak programok, melyek feladata elsősorban ugyancsak az. hogy adatokat tároljanak, és ugyan
csak azért, hogy valaminek a megoldását támogas
sák, de ez a megoldás egy sokkal tágabb és intézmé
nyesen korántsem annyira szervezett rendszernek is része, melyet szakmának, t u d o m á n y n a k , ismeret
területnek stb. n e v e z ü n k . A m i t ezek a programok megoldanak, az lényegében nem t ö b b , mint hogy a tárolóból az adott szakmában felhalmozott adatokat nyelvileg é r t h e t ő formában és összefüggésekben kiadják.
Ezekre az adatokra a nagyfokú állandóság jel
lemző: ők azoknak a szakismereteknek az alapjai, melyekkel az előző — szervezettebb - rend
szerekben az erőforrásként kapott, esetről esetre változó adatokat értékelni lehet. A szakmai, tudo
mányos és egyéb - a kultúra által szervezett — rendszerek beépülnek a civilizáció és a gazdaság rendszereibe, de ugyanakkor át is nyúlnak rajtuk, és keresztül-kasul fonják az egész társadalmat. Ha a szakmai, tudományos és egyéb, hozzájuk hasonlóan csak lassan változó ismereteket rögzítik, dokumen
tumokról beszélünk. A tárolt adatok vagy e doku
mentumokra vonatkoznak, vagy e dokumentumok-
Feladatmegoldó programok
Pl.:
szerszámgép vezérlése
hogy 0 e- g/ál talán működhes
sen
Irányítási- 1
ügyviteli programok Pl.:
•
anyagkészlet- nyilvántartás;
beszerzés kö
vetés
hogy 1 e- gyáitalán működhes
sen
Dokumentációs szaktájékozta
tási programok Pl.:
milyen szempontokat kell érvényesíteni a beszerzési mun
kában,
milyen rendelkezések vonatkoznak a kész
letgazdálkodásra, milyen következményei vannak az elfekvő készleteknek
AZ EMBERI - SZELLEMI - BEAVATKOZÁS ÉS MUNKA NÖVEKEDÉSÉNEK MÉRTÉKE
I. ábra A gazdasági, irányítási é s kuliurális szervezetekben hasznán főbb programfajlák
ból származnak. Az utóbbi esetben a teljes doku
mentumok kerülnek gépi hordozóra, vagy rövidí
tett, kivonatos, átdolgozott formájuk. Ezért ezeket a programokat nevezik dokumentációs — vagy könyvtári körülmények között bibliográfiai — célú programoknak. Mivel újabban m á r az is tapasztal
h a t ó , hogy a szakismereteket közvetlenül — a ha
gyományos dokumentumok megkerülésével - rög
zítik a géppel olvasható adathordozókon, dokumen
tációs helyett szaktájékoztatási célú programokról is beszélnek. Valójában ilyenkor nem papíros, film, festövászon stb., hanem mágneslemez vagy mág
nesszalag alapú d o k u m e n t u m o k r ó l van szó, hason
lóan a hang- é s zenei dokumentumokhoz. M i a to
vábbiakban a dokumentációs/szaktájékoztatási és
Ungvár) R.: A dokumentációs célú adatbázis-kezelő rendszer...
11
bibliográfiai programok összefoglaló megnevezésére egységesen a dokumentációs (célú) elnevezést használjuk (indoklásával részletesebben a 2. fejezet
ben foglalkozunk).1 A mondottakat az / . ábrán fog
laltuk össze.
A K S H adatfeldolgozási termékek jegyzékében ezeket "szer
vezetek szakmai tevékenységéi ellátó programoknak" neve
zik, "melyek a népgazdaság egyes ágainak (ipar. kereskede
lem, egészségügy, tudomány, könyvtárügy, igazgatás, közle
kedés síb.) tevékenységét segítik e l ő " , szemben a "szerveze
tek irányítási rendszereinek programjaival", melyek "vala
mely szervezet gazdasági, pénzügyi, munkaügyi, személyzeti irányításénak é s gazdálkodásának egyes műveleleil végzik"
( K S H , 1982).
T M T 13. M. 1986/5—6—7.
1.2 A t á r o l t a d a t á l l o m á n y o k szerkezete 1.2.1 Az a d a t b á z i s és kezelőrendszere
Az adatokat mind a vállalati-ügyviteli, mind pedig a d o k u m e n t á c i ó s programok esetében olyan rendezettségben tárolják, hogy ez nemcsak a gazda
ságos tárolást, hanem az adott igényeknek megfelelő felhasználást (megjelenési, változtatási, keresési stb. lehetőségeket) is biztosítsa. Az adatállomány szerkezetére tehát a mindenkori felhasználói kör
"világa" is rányomja a bélyegét: az állománynak nemcsak fizikai, hanem a felhasználó szempontjait t ü k r ö z ő logikai szerkezete is van. E logikailag struk
turált, a vállalati erőforrásként vagy szakmai tájéko
zódásra használható adatállományokat a továbbiak
ban adatbázisnak, azt a programrendszert pedig, amely létrehozásukat, fenntartásukat, kezelésüket és szolgáltatásaikat biztosítja, adatbázis-kezelő rend
szernek nevezzük.
1.2.2 Az a d a t b á z i s f u n k c i o n á l i s - l o g i k a i modellje: a s é m a
Az irányítási adatbázisok logikai szerkezete és használati módja manapság jelentősen eltér a doku
mentációs adatbázisokétói (az eltérés átmeneti jelle
gével az 5. fejezetben foglalkozunk). A z első eset
ben elég pontosan megtervezhetők és formalizálha
tok a várható kérdések (a felhasználói kör "világa"
jól m o d e l l e z h e t ő ) , mert az irányítási-ügyviteli m ü v e l e t e k , funkciók nagymértékben előre láthatók és formalizál hatók.
Egy kereskedelmi vállalat értékesítési és beszer
zési r e n d s z e r é b e n például előre adott, mi jellemzi a lehetséges vevőt (neve, c í m e , egyszámlaszáma stb.) és a megrendelést ( d á t u m a , szállítási címe stb.), továbbá az is, hogy a kettőt mi kapcsolja össze (pl. a szállítási cím — lásd a 4.5 fejezetben a 4. és 5.
ábrát).
Úgy is mondhatjuk, hogy a lehetséges kérdések megfogalmazásának formái, szerkezetei előre adot
tak. Ezt az előre megadott szerkezetet az adatbázis funkcionális-logikai sémájának nevezzük.
1.2.3 Az a d a t b á z i s szemantikai-logikai modellje: a szótár
A d o k u m e n t á c i ó s adatbázisok esetében rendkí
vül k ü l ö n b ö z ő kérdésekre kell számítani, hiszen mind a szakmai problémák (a témák, tárgyak), mind a rájuk v o n a t k o z ó kérdések sok szempont alapján fogalmazhatók meg.
Például a "könyvtári információk automatikus k e z e l é s e " , a "számítógépes bibliográfiai tájékoz
t a t á s " , a "dokumentumadatok gépi feldolgozása"
és a "szakmai tevékenység támogatásának gépesí
t é s e " megfogalmazások lényegében ugyanarra a témára, tárgykörre vonatkoznak.
A felhasználói kör "világát" csak úgy lehet mo
dellezni, ha a lehetséges szavakat és a közöttük le
hetséges összefüggéseket figyelembe veszik. E " v i lágot" tehát maga a szaknyelv modellezi, mellyel a témákat és kérdéseket (problémákat) megfogalmaz
zák. Ezért az adatbázis logikai szerkezetét nem, vagy nemcsak a funkcionális é r t e l e m b e n vett forma
lizáltság, hanem a nyelvi megformállság: a "tar
talmi", szemantikai-logikai szervezettség is jel
lemzi. A tárolt információkat és a lehetséges kérdé
seket a szaknyelv szavai és a közöttük fennálló ér
telmi összefüggések strukturálják.
A z ilyen adatbázisokban kitünletett jelentősége van a szótárnak, mely nemcsak osztályozási rend
szer, tárgyszójegyzék, tezaurusz stb. lehet, hanem a címszavak, nevek, lelőhelyek, betegségmegnevezé
sek, tárgy- (objektum-) m e g n e v e z é s e k , helynevek stb. állománya is. A dokumentumok vagy a kérdé
sek tartalmának szemantikai-logikai struktúráját el
vileg a szótárak hivatottak formalizáltan reprezen
tálni. E r e d m é n y e s e n — k e r e s h e t ő e n - tárolni és kérdezni az általuk adott keretek között lehet.
Ezekben a szótárakban azonban ma még csak a nyelvi rendszer lehetséges modelljének alig töredé
két sikerül csak formalizáltan megragadni: a szava
kat és rendkivül leegyszerűsített formában néhány fontosabb értelmi összefüggést (szinonimákat, ho
m o n i m á k a t , alá- és fölérendelési viszonyokat, asz- szociációkat), m é g ritkábban bizonyos mondattani (szintaktikai) összefüggéseket (relálorok. szerepje- lötőkstb. formájában).
A megragadott szavak nagyon különbözők lehet
nek — például személynevek, szakkifejezések, hely
nevek, cégnevek, részlegnevek, c í m e k , időadatok, nyilvántartási számok stb. - . és a keresés szem
pontjából elvileg szükségtelen, hogy azonosított helyük és nevük legyen a tárolt szövegben. A tezau
ruszokban, osztályozási rendszerekben, egységesí
tett besorolási állományokban (az ún. "aulhority fáj
lokban") a szavak bizonyos fajtáit — például a szak
kifejezéseket vagy a szerzők, közreadók neveit — szabványosított formában rögzítik. Az esetek több
ségében azonban csak a felhasználó fejében, szub
jektíven és elég ellentmondásosan van adva e struk
túra (lásd a 3. fejezet [d] pontját). A felhasználó az adatbázisban a szavak jelentése - természetes nyelvismerete - alapján tájékozódik. E látszólag ka
otikus szabadságra a rugalmas szakmai tájékozódás érdekében ugyanúgy szükség van. mint az egyér
telmű döntések érdekében arra a látszólagos "kény
szerzubbonyra", mely a funkcionális-logikai szerke-
Ungvár? R . : A dokumentációs célú adatbázis-kezelő rendszer..
zet következtében az irányítási rendszerek sajátos
sága. Két teljesen ellentétes szükséglet kielégítésé
ről van szó, s ezért nem sikerül ma m é g a kettőt egyetlen programrendszerben közös nevezőre hozni (a hardver fejlettsége ebből a szempontból másodlagos).
Az adatbázis kezelőrendszere - pontosabban szemantikai-logikai komponense - biztosítja, hogy az adatbázishoz a t e r m é s z e t e s , beszélt nyelv szavai alapján hozzáférhessenek. Ha szótár van, akkor e szemantikai-logikai hozzáférés pontosabban tervez
hető. Ha a szótár strukturált, értelmi összefüggése
ket is tartalmaz, a pontosság tovább fokozható. A szótár az az eszköz, amellyel a dokumentum tartal
mát, illetve a tartalmára vonatkozó kérdéseket "le
transzformálják" arra a szintre, amelyen az adatbázis-kezelő rendszer fizikailag működik. (Azt is meg kell azonban mondani, hogy a legtökélete
sebb megoldás, ha e "transzformációt" a szakmát és a nyelvet ismerő szakemberre bízzák. Az ilyen szak
ember m á r ma is kiképezhető, a vele egyenrangú szabványosított szótár talán soha.)
1.3 Terminológia: bibliográfiai és faktográfiai adatbázis/'igazi" adatbázis-kezelő rendszer és információkereső rendszer
Ha a bibliográfiai és d o k u m e n t á c i ó s célú adatbá
zisokat a pályához nem kötött közlekedéshez hason
lítjuk, akkor az irányítási célú adatbázisok a vasúti, kötött pályás közlekedési hálózatot képviselhetik.
A z eltéréseket — ma még szakterületenként eléggé eltérő és ellentmondásos m ó d o n — a nyelvhasználat is jelzi:
• Könyvtári és dokumentációs környezetben az első esetben bibliográfiai adatbázisról vagy egy
szerűen csak gépi, automatizált nyilvántartásról ( d o k u m e n t á c i ó r ó l ) , az utóbbi esetben pedig fak
tográfiai adatbázisról beszélnek — elég szeren
csétlenül, mert a bibliográfiai adatbázisban leg
alább annyi tényadat található, mint a "faktográfi- aiban".
• Irányítási-vállalati környezetben egyszerűen csak adatbázisról beszélnek, mert vagy észre sem veszik, hogy létezik másféle adatbázis (annyira t e r m é s z e t e s a dokumentáció vagy a könyvtár lé
tezése) , vagy fel sem merül, hogy a dokumentációs-bibliográfiai célú adatbázisokat mások is j e l l e m e z h e t n é k , mint a mindennél fon- tosabb vezetési-irányítási-ügyviteli-vállalati szempontok. ("Szakemberek vagyunk — mit ér
dekelne b e n n ü n k e t a szakma maga?" - mond- • hatnák nemes egyszerűséggel, e m l é k e z e t ü k szép
irodalmi "adatbázisából" József Attila Ars poeti
cáját segítségül híva.)
Ez persze - tisztelet a kivételnek — a bibliográ
fiai és dokumentációs szakemberekre sem ke
vésbé vonatkozik; sőt: nekik éppen feladatuk volna a differenciált megkülönböztetés! Az ö kör
nyezetükben mintha az irányítási-ügyviteli keze
lőrendszerek nem léteznének — miközben foly
ton folyóirat-nyilvántartásról, szerzeményezési rendszerről, katalogizáló programról beszélnek, melyek (mint ezt a 6. fejezetben látni fogjuk) inkább irányítási-ügyviteli (vállalati = könyvtá
r i ) , vagy akár faktográfiai rendszerek, semmint bibliográfiaiak vagy információkeresők.
• Számítástechnikai környezetben általában csak az általunk irányítási, ügyviteli (váltalati) célúnak nevezett adatállományokat nevezik adatbázisok
nak, mert logikai struktúrán csak az adatok k ö zötti funkcionális-logikai struktúrákat értik, nem pedig minden logikai struktúrát (mint amilyen például a helyesen megfogalmazott kijelentő mondat tartalma, vagy egyáltalán: minden ter
m é s z e t e s nyelven megfogalmazott szöveg).
Éppen ezért a dokumentációs és bibliográfiai adatbázisokat szöveges adatállományoknak vagy szöveges adatrendszereknek, vagy -szerkezetek
nek nevezik, ami két szempontból is megté
vesztő: egyrészt, mert a d o k u m e n t á c i ó s célú adat
bázisok többsége manapság alig tartalmaz szö
veges adatokat (a szerző neve. a m ú z e u m i tárgy m e g n e v e z é s e , a tárolás helye, a készítés d á t u m a , a tárgyszó, az osztályozási jelzet stb. semmivel sem szövegszerübb adat, mint a beosztás, a mun
kahely, a végzettség, a születési hely, a szervezeti egység vagy a munkaköri leírás adata). Másrészt, mert sem a szövegek belső, "tartalmi" logikájá
nak teljesen automatikus kezelése, sem a nagy mennyiségű szövegben végzett gazdaságos ke
resés nem tekinthető megoldottnak ( m é g nagy
számítógépeken sem, mikroszámítógépekről nem is beszélve). Ezért az igazán szöveges adat
bázis legfeljebb a j ö v ő zenéje.
A fentiek miatt adatbázis-kezelő rendszernek is csak az irányítási célú rendszerek kezelőprogram
jait nevezték. Mivel a d o k u m e n t á c i ó s és bibliog
ráfiai célú rendszerekben a szabadon vagy szótár
ból választható szavakkal végzett keresésnek fontos szerepe van, adatbázisaik kezelőrendsze
rét információkereső rendszereknek szokták ne
vezni.2
1 A kétféle kezelőrendszer kérdését magyar nyelven Halassy (1978, p. 8 2 - 8 3 . és 1986) érinti. A külföldi közlemények közül utalunk Tagg(l9S2) ugyanebben a számban tömörített munkájára.
T M T 3 3 . é v f . 1 9 8 6 / 5 - 6 - 7 .
Az " i n f o r m á c i ó k e r e s ő " jelző ugyancsak megté
vesztő. S z ű k e b b é r t e l e m b e n u i . csak olyan kezelő
rendszert jelent, melynek kizárólagos rendeltetése a keresés és a kereseti találatok lehető leggyorsabb és legegyszerűbb megjelenítése. Számtalan dokumen
tációs célú adatbázis-kezelő rendszer készül ezzel a
"filozófiával", és csak a felhasználás során derül k i , hogy mennyire szegényes egy ilyen rendszer (lásd az 5. fejezetet). Tágabb é r t e l e m b e n ui. "információ
k e r e s ő " minden olyan kezelőrendszer, melynek tárgya dokumentum vagy rá vonatkozó információ.
Az információkereső rendszer kifejezést használó számítástechnikai szakember s z e m é b e n tehát egész általánosan egy könyvtári katalógus kezelörendszere is " i n f o r m á c i ó k e r e s ő " , holott itt a megjelenítési, a rendezési és a különféle egyéb szolgáltatások követ
keztében m á r nem is lehet ö n m a g á b a n vett keresés
ről beszélni.
Valójában ilyenkor is adatbázis-kezelésről van szó, csak éppen másfajta adatbázisról, mint az irányítási-vállalati adatbázisok esetében. Tisztelet
ben tartva mások (pl. Halassy. 1978. p. 8 2 - 8 3 . ) vé
l e m é n y é t , mi adatbázison adatok - valamifélekép
pen szervezett - bázisát értjük; olyan tárolótartal
mat, melyhez felhasználói szándékkal lehet for
dulni. Ilyen értelemben akár egy egyszerű fájl is adatbázis lehet — ha adatok szerzése céljából fel
használók igénybe veszik.
A tárolótartalom egyrészt meghatározható úgy, hogy megadjuk azokat az adatfajtákat (adattípuso
kat, célinformáció-fajtákat - lásd a 4.4 fejezetet), melyek elvileg előfordulhatnak benne, másrészt úgy, hogy megadjuk mindazokat a konkrét értéke
ket, melyek előfordulnak b e n n ü k . E kettősség lénye
gében ugyanaz, mint ami a fogalom tartalma és ter
jedelme esetében tapasztalható (Ungváry, 1986); a fogalmat megadhatjuk az ismertetőjegyei ( = "adat
fajták"), illetve a terjedelméhez tartozó dolgok ( = " é r t é k e k " ) alapján. A m i k o r adatbázisról beszé
lünk, a tartalma alapján meghatározott tárolóra gon
dolunk (a tároló elvileg lehetséges tartalmaira), amikor pedig adatállományról (fajiról), akkor a ter
jedelme, az értékei alapján meghatározott tárolóra.
Még a legegyszerűbb mai információkereső rend
szerekben is meghatározható az adatbázist jellemző tartalom: t i . " d o k u m e n t u m " célinformációkat tartalmaz.3
* E lénnyel vei s z á m o l Brting és Wenig (Beling. 1973. p.
74—75.). amikor így definiálnak: "Egy rendszer adatbázisa mindazoknak az adatfajtáknakaz összessége, melyek a rend
szeren belül rendelkezésre állnak." Továbbá: "Egy rendszer adatállománya mindazoknak a tárolt adamknak az összes
s é g e , melyek egy rendszeren belül (konkrétan) hozzáférhe
tők." A z — elsősorban irányitási-ügyvjteli — adatbázisok ter
vezésére a legnagyobb befolyást gyakorló Conference on Data System Languagcs Dala Basc Task Group (adalrendszernyel-
A gyakorlat mindenesetre az általunk használt és a köznyelvihez közelebb álló é r t e l m e z é s irányába mutat: a mikroszámítógépek elterjedésével megje
lentek a kereskedelmi forgalomban olyan általános programcsomagok (pl. a dBASE vagy az MDBS, lásd Sclmmacher [19851 ugyanebben a számban tö
mörített t a n u l m á n y á t ) , melyekből a felhasználó megfelelő programozási ismeretek alapján akár irá
nyítási, akár d o k u m e n t á c i ó s célú rendszert, szük
ségképpen akár információkereső rendszert is kiala
kíthat. Az 5. fejezetben ugyan r á m u t a t u n k arra, hogy ez a paradicsomi állapot m é g korántsem rea
litás, de ez nem változtat azon a t é n y e n , hogy ezeket az általános célú t e r m é k e k e t - tekintet nélkül az alkalmazásukra — ma m á r adatbázis- kezelő rendszereknek nevezik.
A z adatbázist és kezelörendszerét együttesen adatbázisrendszernek (Halassy, 1978. p. 79. é s
105.) nevezik. A m i k o r a szűkebb é r t e l e m b e n számí
tógépes (automatizált) információs rendszerről be
szélünk, lényegében adatbázisrendszert é r t ü n k rajta
— vagyis az adatbázist és környezetét, amelybe első
sorban a kezelörendszere tartozik bele. Ilyen érte
lemben a d o k u m e n t á c i ó s adatbázis és kezelőrend
szerének (az utóbbit nevezik információkereső rendszernek, szöveges adatkezelő rendszernek, bib
liográfiai adatbázis-kezelő rendszernek stb.) az együttese is információs rendszer. (Az információ
kereső rendszernek persze m é g további, nem auto
matizált összetevői is vannak, melyekkel itt nem foglalkozunk.)
Az elmondottak alapján a d o k u m e n t á c i ó s (célú) adatbázis-kezelő rendszer helyét a 2, ábrán ábrázol
tuk összefoglalóan. Ez az ábra ú n . címkézett, irányí
tott gráf formájában ábrázolt modellje annak a gon
dolatmenetnek, melyet e fejezetben leírtunk, azaz rendkívül leegyszerűsítve e szöveg szemantikai,
"tartalmi" logikai struktúrája (hasonlóan a 10. ábrá
hoz, mely a 6. fejezet szövegének szemantikai struk
túráját formalizálja rendkívül leegyszerűsítve). A d o k u m e n t á c i ó s céiú adatbázisban tárolt szöveges vagy egyéb, a dokumentumok tartalmára vonatkozó információk (tárgyszavak, jelzetek stb.) szemantikai szerkezetének lényegében ilyen a "formája".
A "tartalmi" vagy szemantikai struktúra a kifeje
zések közöli fennálló különféle kapcsolatokból épül fel, melyeket a tezauruszokban szokásos m ó d o n kü-
vek bizottságának adatbázis-munkacsoportja) definíciójában e kettősségre sajnos nem reflektálnak: " A z adatbázis a fel
használónak megfelelő formában kialakítható, megváltoztat
ható és kiadható, meghatározott rendszer állal fenntartott ál
lományok ö s s z e s s é g e " (Codasyl, 1971). De még e meghatá
rozás sem zárja ki. hogy az információkereső rendszerek által kezelt állományok a felhasználó szempontjából ne legye
nek adaibózisok. Eme adatállományok a szemantikai, tar
talmi igényeknek megfelelően vannak kialakítva.
l l n e v á r t R . : A dnk i n n e n i i d ós célú í d a t b á i i s - k e i e l ö rendszer.
i
T M T 3 3 . évf. 1 9 8 6 / 5 - 6 - 7 .
lönféle nyilakkal jelöltünk. A folytonos, egyirányú nyíl azt jelöli, hogy az egyik fogalom fajtája a másik
nak, a szaggatott azt, hogy része, a pontvonalas azt, hogy eszköze, a kétirányú nyíl pedig, hogy egyéb, nehezen meghatározható okból van összefüggés a két kifejezés között.4
Az ábra a következőképpen " o l v a s a n d ó " : az adatbázis-kezelő rendszer program rendszerfajta, része az információs rendszernek, tárgya áz adat
bázis. Fajtái:
• a cél, rendeltetés szempontjából az irányítási- ügyviteli és a d o k u m e n t á c i ó s ;
• a m ű k ö d é s , struktúra szempontjából a funkcioná
lis-logikai (a hagyományos, s z ű k e b b é r t e l e m b e n vett adatbázis-kezelő rendszer) és a szemantikai- logikai (az információkereső rendszer);
• a kezelt információfajták szempontjából a faktog
ráfiai és a szöveges;
• a felhasználási hely (szervezet) szempontjából a könyvtári, m ú z e u m i , vállalati, személyi stb.
adatbázis-kezelő rendszer.
A funkcionális-logikai kezelőrendszer — manap
ság - szorosan összefügg az irányítási típusú adatbázis-kezeléssel (ezt jelzi a kétirányú nyíl) és a faktográfiai típusú adatbázis-kezeléssel, a szemantikai-logikai pedig a szövegessel. Felfogá
sunkban a bibliográfiai adatbázis-kezelő rendszer egyik fajtája a dokumentációsnak: ugyanis doku
mentumokra v o n a t k o z ó információkat kezel a bib
liográfiai szabványok által előírt formában. A könyv
tári rendszerben viszont nemcsak bibliográfiai adatbázis-kezelés szükséges, hanem például a be
szerzés, a kölcsönzés stb. nyilvántartása is: ezért a könyvtári rendszerek tartalmaznak mind funkcioná
lis-logikai, mind szemantikai-logikai kezelőrészt, s ezért mind irányítási, mind pedig dokumentációs rendszernek felfoghatók (a d o k u m e n t á c i ó s rend
szerek fajtáit a 6. fejezetben foglaltuk össze). A szer
vezet tehát, melyben egy bibliográfiai vagy egy do
k u m e n t á c i ó s programrendszert használnak, lehet rendkívül eltérő, de a programrendszer lényegében nem fog különbözni egymástól.
2. Dokumentáció és tájékoztatás
Mielőtt a d o k u m e n t á c i ó s adatbázis-kezelő rend
szerek fajtáival foglalkoznánk, szükségesnek tartjuk tisztázni, hogyan értelmezzük a d o k u m e n t á c i ó fo
galmát, és miért ezzel a szóval jellemezzük az álta
lunk tárgyalt adatbázis-kezelő rendszerekel.
' Azt is mondhatjuk, hogy gondolatmenetünk modellezését a lezauruszelv segítségével végeztük el (Ungvári: 1983).
D o k u m e n t á c i ó n azt a tevékenységet értjük, melynek során "információkat gyűjtenek és tárol
nak, rendeznek és válogatnak, terjesztenek és hasz
nosítanak" ( F I D , 1960).5 Az információk lehetnek d o k u m e n t á l a t l a n o k és d o k u m e n t á l t a k , gyűjtésük során rögzíthetik őket hagyományos hordozókon (cédulán, lapokon, füzetben stb.), filmen, hangsza
lagon vagy géppel olvasható hordozón (mágnesle
mezen stb.). Terjesztésükre és hasznosításukra ugyancsak az előbbiek vonatkoznak. A h o r d o z ó ésa rajta rögzített információ együttesét dokumentum
nak n e v e z z ü k .6
A d o k u m e n t á c i ó n értjük azonban:
• nemcsak a fenti tevékenységet, hanem
• a tevékenység e r e d m é n y é t (a dokumentumok rendezett összességét),
• a rendszert, melynek keretében a tevékenység folyik, és az e r e d m é n y megjelenik.
• a szakterületet, amelyen e tevékenység folyik.
Ellentétben a teljesen határozott jelentésre tö
rekvő felfogással, ezt a fenti poliszémíát hasznosnak tartjuk — ettől gazdag tartalmilag éppen az a foga
lom, amely (hasonlóan az információ fogalmához) az általunk tárgyalt kérdés egyik legáltalánosabb fo
galma. Éppen ezért előny, hogy a fogalmat jelölő k i fejezés ilyen sokszínű: szükségtelenek a folyamato
san változó, pontos, de nehezen kezelhető, össze
tett leíró kifejezések — mindig a szövegösszefüggés szabja meg, milyen értelemben használatos a szó.
Az utóbbi évtizedben a hangsúly a gépesítés kö
vetkeztében áttevődött a d o k u m e n t u m o k r ó l az in
formációkra, azaz a d o k u m e n t u m o k t ó l független szakmai tájékoztatás támogatására.7 Ezért a doku
mentáció mellett megjelent a (szak) tájékoztatás fo
galma. A n é m e t szakirodalomban például "tájékoz
tatásról és d o k u m e n t á c i ó r ó l " ("Information und Dokumentation") beszélnek (Grundlaaen..., 1980.
p . 6 . ) .8
* Valamivel jobban hangsúlyozza a felhasználót az U N E S C O meghatározása: "Dokumentumok vagy adatok folytonos é s rendszeres feldolgozása, beleértve a felkutatást, azonosítási, beszerzést, elemzést-feltárási, tárolást, keresést, forgalma
zási és tanósitási a felhasználók speciális tájékoztatása erde
kében" ( Wenig, 1976. p. 98.).
* Az U N E S C O által kiadott értelmező szótár szerini: "Hordo
zóból, a rajta rögzíted adalból és az adat által jelöli jelentésből álló egység" (Wmk, 1976. p. 39.).
' Meghatározásában éppen ezt emeli ki t&'enig: "Az információ é s dokumentáció olyan gyakorlati t e v é k e n y s é f (szakterület), amelynek segítségével megkísérlik... a tájékoztatási helyzet javításai" (Grundtagen.... 1980. p. 16.).
" A kérdésről a 60-as évek végén Koblii: javaslatai nyomán - aki egyik szószólója volt a k e l t ö s kifejezés b e v e z e t é s é n e k - vita bontakozol! ki. melynek Pulzovks Irán is résztvevője volt (ennek k ö s z ö n h e t ő e n maradi nyoma az egyébkeni ter
minológiai é s "fitozofikusabb" szempontból végtelenül sze-
\
Ungvár? R-: A dokumentációs célú adatbázis-kezelő rendszer..
Valójában mindkét esetben olyan ismeretek táro
lásáról és kezeléséről van szó, melyek tudományos, szakmai vagy tapasztalaülag adott tényeken alapul
nak, azaz különböző időkben, különböző helyeken többször is felhasználhatók helyzethez kötött, aktu
ális problémák megoldásában. Ezeket az ismerete
ket bizonyos tartósság, állandóság jellemzi, leg
alábbis nem máról holnapra változnak meg. Eme tartósságuk és ebből következő ismételt felhasznál
hatóságuk miatt kerül sor dokumentálásukra. A fel
használó nem azért keresi őket, hogy velük kapcso
latban valamilyen intézkedést hajtson végre, hanem azért, hogy tudását gyarapítsa, és adódó alkalommal valaminek a megoldásában alkalmazza őket. Ilyen szakismeretek például az állattenyésztési tudnivalók (melyekről szakkönyvek, szakcikkek számolnak be), vagy az olyan információ, hogy az elfekvő kész
letek bizonyos nagysága fölött b ü n t e t ő kamatokkal kell számolni (melyet bizonyos gazdasági-pénzügyi dokumentumok tartalmaznak). A dokumentumot teljesen általánosan értelmezhetjük: lehet hagyomá
nyos, papíron rögzített szakirodalmi dokumentum, lehet tárgy (pl. régészeti lelet, festmény), akár ese
mény is, ha valahol dokumentálják, azaz a rá vonat
kozó információkat rögzítik. Adott esetben mág
neses adathordozón is.
A z irányítási, ügyviteli, vállalati információk esetén ezzel szemben olyan ismeretek tárolásáról és kezeléséről van szó, melyek egy adott szervezethez, k ö r ü l m é n y h e z , helyzethez, esethez kötött tényeken alapulnak, azaz meghatározott helyen vagy megha
tározott időpontban kell ismerni őket. Ezeket az "is
mereteket" a nagyfokú aktualitás, helyhez kötöttség és részben a változékonyság jellemzi. Ilyen informá
ciók például a tejhozam csökkenésének adatai egy mezőgazdasági nagyüzemben, vagy az olyan raktári adat, amely az elfekvő készletek nagyságáról tájé
koztat. Velük kapcsolatban mindig dönteni kell — ezért tekinthetők irányítási, ügyviteli információk
nak. A helyes döntéshez azokat az állandóbb szak
mai ismereteket kell felhasználni, melyeket az előbbi - vajon milyen n e v ű ? - rendszerekben tá
rolnak kereshelÖen.
(Persze dönteni dokumentumokra vonatkozó i n formációk esetében is kell. Például egy katalógus esetében ilyen irányítási d ö n t é s , hogy a kezelő mit hova soroljon be, vagy helyes-e egy adott bibliográ-
gényes hazai szakirodalomban). Polzovies szerint a doku
mentáció átfogóbb, ennek a szaktájékoztatás csak része. Kob- litz szerint a két kifejezés egyenrangú, s a német szakiroda
lomban hosszú ideig ez a felfogás érvényesült. Ma létezik olyan álláspont, amely szerint a szaktájékoztatás az átfogóbb, m o n d v á n , hogy létezik szakmai tájékoztatás, mely nem a szakirodalmi dokumentumokhoz kapcsolódik. (A vitára vo
natkozóan lásd A dokumentáció... 1961.)
fiai leírás stb. A katalógus kezelőjének a döntései pontosan olyanok, mint az irányítási rendszerek
használóinak döntései. A katalógus használójának döntései azonban teljesen különböznek ezektől: a dokumentumokra vonatkozó információval kapcso
latban neki elvileg nem olyan döntést kell hoznia, amely eme információfajtára van hatással, hanem eme információ, tudás birtokában egy másik rend
szerben kell eldönteni valamit. Az irányítási- ügyviteli és a dokumentációs rendszerek ebből kö
vetkező egymásrautaltságát jeleztük az 1. ábrán.) Mindkét rendszer tájékoztatási — azaz informá
ciós — célú. E kifejezés egyoldalú használatának tehát a természetes nyelvérzék eleve ellentmonda
na. Megkülönböztetésükre a következő szembeállí
tások adódhatnak:
(1.) információs
= tájékoztatási
szak tájékoztatási irányítási
(2.) információs
= tájékoztatási
d o k u m e n t á c i ó s - " " * ' ^ irányítási
M i a 2. megoldást választottuk. A tartós, többször is felhasználható szakismeretek feltétele minden
képpen valamiféle dokumentáltság. Nem lényeges, hogy a dokumentumot könyv, festmény, film vagy mágnesszalag képviseli. A d o k u m e n t á c i ó és a szak
tájékoztatás valójában ugyanúgy nem választhatók el egymástól, ahogy az agy az elmétől, a molekula a vegyülettől, az adat az információtól.
Harmadik megoldásként adódnék az 5. generá
ciós számítógépekkel kapcsolatos " i s m e r e t b á z i s "
("knowledge base") kifejezés használata (magyarul lásd Fuchl, 1983). így beszélhetnénk "ismeretbázis- kezelőrendszerröl". A dokumentáltságot itt — akárcsak az emberi agy esetében — m á r kizárólag a tár, a m e m ó r i a képviseli. Ez azonban — különösen mikroszámítógépek vonatkozásában — kissé korai volna.
Mindebből természetesen nem következik, hogy ne létezhetnének átmeneti formák is: egy összetett kísérletsorozatot nyilvántartó és kezelő program például dokumentációs és irányítási jellegű egyszer
re. Sőt: mint ahogy később m é g kimutatjuk, maga a d o k u m e n t á c i ó s adatbázis is tartalmazhat irányítási részt (ilyen pl. a kölcsönzési, szerzeményezést stb.), és elvileg a fordítottja is lehetséges; bár ma még ritka (részletesebben lásd az 5. és 6. fejezetet).
T M T 3 3 . évf. 1 9 8 6 / 5 - 6 - 7 .
bemenet
KÉRDESFELDOLGOZÓ RÉSZRENDSZER kérdés feldolgozás és kezelés f (állapotátmenet)
bemenet
Árén/eset fa/
műm
SGM4 és S/ÓMfi
meg/e/en/'fett*
térdésex f/J
információfeldolgozás és - kezelés (állapotátmenet)
r 4
M l / l l / l O
• kimenet
— s/rt/k/ws?/
/fyorméc/ofc
' f s J
S£Mt és SZűrjfi . , ,
AJf *
meg/e/emlert* \
kimenetINFORMÁCIOFELDOLGuZÓ RÉSZRENDSZER
5 abta A dokumemauc.s adaibizrs-keztlS rendszer á l n h n o s működési modellje
3. A dokumentációs adatbázis-kezelő rendszer elvi működése
A rendszer m ű k ö d é s é t és felépítését úgy szemlél
tethetjük, ha absztrakt a u t o m a t á n a k fogjuk fel ( Ung- váiy, 1984), melynek [a) bemenete ( = bemenöalfa- béta, X ) , [e] kimenete ( = kimenőalfabéta, Y ) , [d]
kisebb-nagyobb m é r t é k b e n strukturált adatállomá
nya ( = állapota, S) van, és benne meghatározott (dl modell alapján [b] feldolgozás folyik ( = állapot
á t m e n e t ) , melynek során egyrészt az adatállomány változik meg a bemenet következtében (SxX lekép
ződik S-be), másrészt az adatállomány vagy annak bizonyos része a bemenet k ö v e t k e z t é b e n [f] kiadás
ra kerül (SxX leképződik Y-ba) (3 . ábra).
[a] A bemeneten a gyűjtés, beszerzés, átvétel, k i választás stb. következtében keletkezett adatok rög
zítése játszódik le. A bemenőalfabéta ( X ) a minden
kori ábécé felhasználásával szerkesztett jelsoroza
tokból áll (pl. szerzőnév, cím, referátum, tárgyle
írás, diagnózis, deszkriptor). E jelsorozatok össze
kapcsolásának és elhelyezésének szabályait m e z ö n e - vek, elválasztó jelek stb. formájában a program tartalmazza.
[bl A feldolgozás egyrészt megváltoztatja a beér
kező információk tartalmát. Ilyen m ű v e l e t e k az osz
tályozás, indexelés, annotálás, referálás (kivona- tolás), t ö m ö r í t é s , fordítás, az analitikus-szintetikus feldolgozások stb. Ezek automatizálása gyerekcipő
ben jár. Léteznek ugyan automatikus osztályozási, indexelési és kivonatkészítési eljárások, de nem ver
senyképesek a szellemi feldolgozással. A rendkívül nagy tárigény miatt mikroszámítógépen egyelőre amúgy sem valósíthatók meg. Összefoglalóan tar
talmi feldolgozásnak fogjuk mindezeket a m ü v e l e t e ket nevezni ( n e v e z h e t n é n k szemantikai vagy
" m é l y s é g i " feldolgozásnak is). A szellemi úton vég
zett tartalmi feldolgozás e r e d m é n y e k é n t tárgysza
vak, deszkriptorok, osztályozási jelzetek, címfordí
tások, tartalmi kivonatok, tárgyleírások, besorolási adatok stb. rögzítésére kerül sor.
IJnevárj R . : A d o k u m e n t á c i ó s célú adatbázis-kezelő" rendszer..
[c] A feldolgozás másrészt nem változtatja meg a beérkező információk tartalmát, hanem vagy helyet és nevet ad nekik, vagy megváltoztatja a n e v ü k e t és helyüket (strukturálja vagy átstrukturálja az adatál
l o m á n y t ) . Ilyen müveletek az iktatás, címleírás, ka
talógusba sorolás, iratrendezés, lelőhely-azonosítás stb. Mindezek a müveletek lényegében azonosítá
sok, rendezések és válogatások; a számítástechnika mai szintjén gyakorlatilag maradéktalanul automati
zálhatok. Összefoglalóan formális feldolgozásnak fogjuk nevezni őket ( n e v e z h e t n é n k "szintaktikai"
vagy "felszíni" feldolgozásnak is). A formális fel
dolgozás kiterjed mind a tartalmi feldolgozás során keletkezett adatokra, mind pedig a tartalmilag válto
zatlanul maradó adatokra (pl. iktatási szám, szerző
n é v , lakcím, megjelenési hely, lelőhely, születési adat, d o k u m e n t u m c í m . foglalkozás, m é r e t ) . Valójá
ban a formális feldolgozások alkotják az állapotát
meneteket.
[d] A feldolgozás e r e d m é n y e k é n t kisebb vagy na
gyobb m é r t é k b e n strukturált adatállomány keletke
zik, mely a rendszer állapotát (S) képviseli. E struk
túra s egyben a feldolgozás alapja - legalábbis az ál
talunk tárgyalt logikai szinten (a fizikai szint kérdé
seivel egyáltalán nem foglalkozunk) — annak a kör
nyezetnek ("világnak") a modellje, amelyből az adatbázis adatai és a vele szemben támasztott elvárá
sok (kérdések, megjelenitési és átalakítási igények stb.) származnak.
E modell kettős: egyrészt tartalmi logikai - a to
vábbiakban szemantikai - , másrészt funkcioná
lis-logikai.
A szemantikai modell (lásd az 1.2.3 fejezetet) szótárak (osztályozási rendszerek, tárgyszójegyzé
kek, tezauruszok, címjegyzékek, végzettségkódok, foglalkozásjegyzékek- stb.) formájában létezik. A mikroszámítógépek fejlettségének mai szintjén álta
lában nem előre épülnek be gépi szótárként a rend
szerbe, hanem különálló szellemi termékek formá
jában használják őket a tartalmi feldolgozáskor; a ke
zelőrendszer csak a ténylegesen felhasznált és bevitt kifejezésekből állítja össze a viszonylag egy
szerű b e t ű r e n d e s gépi szótárakat, melyek a további m u n k á b a n m á r felhasználhatók. Az is gyakori, hogy egyáltalán nem készül előre szellemi munkával önálló szótár, hanem a feldolgozások e r e d m é n y e ként keletkezett gépi szótárakat nyomtatják k i és használják fel a későbbi m u n k á b a n szótárként. (A szavak mellett gyakran feltűntetik azoknak a téte
leknek a számát is, melyek e szavakat tartalmazzák.) M i n t az 1.2.3 fejezetben már utaltunk rá, e szeman
tikai modell a tárgyszavak, deszkriptorok, osztályo
zási jelzetek stb. esetében valójában sokkal bonyo
lultabb, mint amennyi manapság még a legigénye
sebb szellemi munkával készült szótárban vagy osz
tályozási táblázatban megragadható. A teljes sze
mantikai modell a (szak)nyelv, a jelentés ismereté
nek formájában létezik a feldolgozók és felhasználók tudatában. Mintegy "ott lebeg" az adatbázis és keze
lőrendszere "fölött", és ebből a bonyolult szemanti
kai struktúrából csak a szótárakba kerülő szavak épülnek be magába az adatbázisba; ők biztosítják a belépési pontokat (a szemantikai hozzáférést) az adatbázisba. Ritka esetben, ha tezaurusz is beépül a rendszerbe, a szavak közötti kapcsolatok - például a 2. ábrán látható formában — valamennyire már strukturálják az állományt. Mindez nem változtat azon, hogy a szótárakba kerülő szavak valóban strukturálják tartalmi szempontból az adatállományt
- de ez a struktúra túlnyomórészt nem formalizál
tan van jelen.
A szemantikai modellben használt szavak, a szavak közötti kapcsolatok és használatuk szabályai
nak összességét információkereső nyelvnek neve
zik. Az információkereső nyelv szavai a lehetséges szemantikai vagy tartalmi hozzáférési pontokat al
kotják az adatbázisban.
Valójában nemcsak a jellegzetesen tartalomra vo
natkozó osztályozási jelzetek, tárgyszavak, deszkrip
torok stb. alkotnak információkereső nyelveket, hanem külön-külön a szerzői nevek, lakcímek, helynevek, raktári azonosítók, leltári számok, mun
kaköri megnevezések, árucikkek nevei stb. is.
Ezeket általában nem is szokták önálló szótárakba foglalni, mert hallgatólagosan tudomásul vett szabá
lyok szerint használják őket (például mindenki tudja, hogy a család- és keresztnevet közzel elvá
lasztva, nagybetűkkel kezdve, sorrendben előbb a családnevet téve írják). De még ilyen esetekben is előfordulnak szabványosított szótárak, például a fo
lyóiratnevek rövidítései, az országnevek, a címek esetében (ilyen szótárt alkotnak például a melléklet
ben közölt MSZ 3400, illetve MSZ 3410 szabvá
nyokban a nyelv-, illetve országnevek és kódjaik).
A funkcionális-logikai modell az adatbázis sémá
jának formájában létezik (lásd az 1.2.2 fejezetet). A séma elemeit az ún. adatszótár tartalmazza (Halassy, 1978. p. 275.). Szemben az információkereső nyelv szótárával, az adatszótárban nem a konkrét tartal
mat esetleg jellemző szavak, hanem e szavak fajtái
nak, funkcióinak megnevezései szerepelnek. A z előbbiekre példa: Jókai M ó r , T u d o m á n y o s és Műszaki Tájékoztatás, Vértesszöllős, archeológia, 27 cm (fizikai szinten ezek a m e z ő tartalmak). Az utóbbiakra példa: C í m , Lelőhely, Tárgyszó, Méret (fizikai szinten ezek a m e z ő n e v e k ) . Ugyanez vonat
kozik az összetettebb egységekre is, mint a tételek;
igy szerepelhetnek az adatszótárban olyan tételfaj
ták, mint " d o k u m e n t u m " (a dokumentum címét, szerzőjét, megjelenési adatait tartalmazó leírások).
T M T . r V ó f . 1 9 8 6 / 5 - 6 - 7 .
" b e s z e r z é s " (az árucikk n e v é t , a szállítót, az árát, az egyszámlaszámot tartalmazó tétel) stb.
Összefoglalóan azt mondhatjuk, hogy az informá
ciókereső nyelv szavai az adatbázis tartalmát alkot
hatják (a tartalom elemi é r t é k e i t ) , az adatszótár szavai pedig az adatbázis lehetséges tartalmát előre leírják (a tartalom lehetséges elemi típusait adják meg). Ezért az adatszótár, s vele a séma az adatbázis metaadatbázisa (Halassy, 1978. p. 277.).
[e) A kezelőrendszer edig leírt bemeneti (rögzí
tési) és feldolgozási műveletei egymással párhuza
mosan, két szinten játszódnak le. Az egyik szinten a d o k u m e n t á l t vagy d o k u m e n t á l a n d ó információk fel
dolgozása folyik a modellt reprezentáló szótárak és séma alapján: ez az információfeldolgozó részrend
szer vagy szint. A másikon az adatbázisnak fellett kérdések és a vele szemben támasztott egyéb igé
nyek feldolgozása folyik ugyancsak a modellt repre
zentáló szótárak és séma alapján: ez a kérdésfeldol
gozó vagy információkereső/lekérdező részrend
szer. M i n d k é t szinten szigorúan ugyanazt a modellt kell alapul venni, azaz ugyanazon a nyelven kell "fo
galmazni", és ugyanazon séma szerint kell a kapcso
latok m e n t é n "haladni" (navigálni). Máskülönben nem lehet a feldolgozás e r e d m é n y e k é n t strukturált kérdést e r e d m é n y e s e n összehasonlitani a feldol
gozás e r e d m é n y e k é n t strukturált adatállománnyal.
A kérdéseket például ugyanazoknak az információ
kereső nyelvi szótáraknak (pl. osztályozási rendsze
reknek, tárgyszójegyzékeknek, címjegyzékeknek, röviditésjegyzékeknek) a szavaival kell leírni, mint amelyeket a dokumentumok vagy információk tar
talmának feltárásakor használtak. Továbbá ugyanan
nak az adatszótárnak az alapján kell megadni, hogy az információkereső nyelv szavai az adatbázis szer
kezetén belül mire vonatkozzanak (szerzönevekre, címszavakra, tárgyszavakra, lakcímekre, folyóirat
rövidítésekre stb.).
[fl A két szint strukturált állományának Összeha
sonlítása e r e d m é n y e z i a rendszer kimeneténa talála
tokat. A kimenöalfabéta (Y) tehát az információ
kereső nyelvek és az adatszótár ábécéinek felhaszná
lásával szerkesztett jelsorozatokból áll, az adatbázis sémájának és modelljének megfelelő egységekbe szervezve.
A találatok adott esetben egy tételfajta vagy egy adatfajta teljes állományát is alkothatják. A "doku
m e n t u m " tételfajta teljes állománya például kataló
gust alkothat (lásd m é g a 4.10 fejezetet is), a témát jellemző szavak összessége pl.: a tárgyszójegyzéket.
Elvileg a kérdések is megjelenhetnek a kimene
ten, amire van is igény: célszerű ugyanis dokumen
tálni az alkalmazott keresési eljárást, vagy tárolni a következő alkalomra.
Ha az összehasonlítást a funkcionális-logikai szer
kezet, vagyis az adatszótárban megadott szavak és kapcsolalok alapján végzik, lekérdezésről ( " i n - quiry" vagy "query" - Halassy, 1978, p. 432.), ha ebbe az információkereső nyelv szavait és a kereső által megadott logikai kapcsolatokat ( h a l m a z m ű v e leteket, Boole-operátorokat stb.) is bevonják, kere
sésről ("search") beszélünk. A lekérdezés/keresés legprimitívebb formája a soros, sávban végzett "le
tapogatás" ("scanning"), azaz a séma ilyenkor csak annyi, hogy "egymás u t á n " . A keresés, lekérdezés és a velük összefüggő müvelelek és eljárások összes
sége az "information retrieval"; nincs rá önálló magyar szó, általában az összetett "információke
r e s é s " kifejezéssel utalunk rá (nem pedig az
"információ-visszakereséssel", mint ahogy nem be
szélünk "információ-visszakercső nyelvről" sem).
[g| Mindezek alapján az irányítási és a dokumen
tációs adatbázis-kezelő rendszer közötti különbség is pontosabban megfogalmazható.
A tiszta információkereső rendszerek nem kezel
nek semmiféle funkcionálisan strukturált logikai adatállományt (fizikailag strukturált állomány keze
lése persze ekkor is fennállhat). Az adatbázisban nincs a felhasználó szempontjából előre meghatáro
zott m e z ő n é v vagy m e z ő t a r t a l o m , sem különféle té
telfajták és közöttük kapcsolatok. (Például a bibliog
ráfiai tételek esetén nem különböztetik meg a téte
len belül az egyébként szabványosan kiírt szerzőt, cimet, annotációt, hanem funkcionális szempontból egyetlen egységnek tekintik.) A keresés a teljes szö
vegben, aszemantikai-logikai tartalom alapján törté
nik. Ezek a szövegben szabadon kereső rendszerek ("frce text syslem"): bármelyik szövegen belüli szó alapján a tétel megtalálható. A felhasználói " v i l á g "
csak szemantikailag valószínűsíthető, de funkcioná
lisan előre nem meghatározható. A hozzáférési pontok között csak a szavak jelentése alapján létezik összefüggés. Ezek a rendszerek — akárcsak fejlet
tebb változataik, az automatikus indexelő és osztá
lyozó rendszerek — ma m é g elég ritkák.
A tiszta irányítási rendszerek csak funkcionális é r t e l e m b e n strukturált adatállományt kezelnek. Azt is mondhatjuk, hogy a felhasználói " v i l á g " minden igénye és m ű v e l e t e előre meghatározott (szükség
szerű). A belépési pontok között magában az adat
bázisban előre megadott, funkcionális kapcsolalok vannak, melyek a megjelenítés e r e d m é n y é b e is szervesen beletartoznak. (Például megadják, hogy az adott beszerzési tétel ára milyen egyszámla
számra fizetendő be, vagy melyik olvasónál milyen könyv található.) Az ilyen adatbázisok lekérdezése
kor csak az előre meghatározott összeállítású kérdé
sek tehetők fel (a szavak mellett a "szintaxis" is kötött). Ezek a rendszerek ma elég gyakoriak.
I ncváry R . : A dokumentációs célú adatbázis-kezelő rendszer..
A gyakorlatban előforduló dokumentációs adat
bázis-kezelő rendszerek mindig tartalmaznak olyan összetevőket, melyekkel funkcionális-logikai struk
túrák alakithatók ki az adatbázisban. Mennél ke
vésbé szakmai, általános é r v é n y ű , hanem aktuális, meghatározott döntést vagy felhasználást igénylő i n formációkat kezelnek, vagy megjelenítési formátu
mokat szolgáltatnak, annál nagyobb m é r t é k b e n . Ez a kérdés átvezet a d o k u m e n t á c i ó s adatbázis
kezelő rendszerek fajtáihoz. Mivel ezek - elsősor
ban felhasználói szempontból - az általuk kezelt adatok/információk fajtái alapján térnek el egymás
tól, előbb velük foglalkozunk.
4. A dokumentációs adatbázisokban előforduló adatok/információk a felhasználó
szempontjából
4.1 Az adat és az információ kettőssége
Mielőtt az adatok/információk fajtáinak tárgyalá
sára rátérnénk, tisztáznunk kell az adatnak és infor
mációnak egymáshoz fűződő kapcsolatát, s azt, hogyan használjuk őket a továbbiakban. E két kife
jezés ugyanis egymástól elválaszthatatlan, mégpedig azért, mert az általunk jelölt két fogalomnak ugyan
az a terjedelme, de nem ugyanaz a tartalma; m á s szóval a két kifejezés ugyanazt a dolgot jelöli (azonos a d e n o t á t u m u k , a j e l ö l e t ü k ) , de különböző értelemben teszik ezt. Jól érzékelhető ez a követ
kező példában:
A 19 mint grafikus jel vizuális, érzéki "adat", de ehhez képest az az ismeret, hogy ez szám, informá
ció; a 19 mint szám adat, de ehhez képestaz az isme
ret, hogy ez hőmérsékleti érték, információ; a "19 fokos h ő m é r s é k l e t " adat, de ehhez képestaz az isme
ret, hogy ez a víz hőmérséklete, információ; a "19 fokos a víz h ő m é r s é k l e t e " adat, de ehhez képestaz az "ismeret", hogy ez valakinak a fürdéshez még hideg (vagy m á r meleg), ínformáció.
A skála láthatóan az értelmi szint alatti érzéki szinttől az értelmi szint feletti érzelmi szintig terjed (ezért szerepel az első "adat" és az utolsó "ismeret"
idézőjelben), s közte a végtelenségig finomíthatjuk a tisztán logikai kettőződéseket. Hasonló a helyzet, mint az adatbázis és az adatállomány kettőssége ese
tében (lásd az 1.3 fejezetet és a 3. lábjegyzetet): ha információról beszélünk, a tartalom alapján is meg
határozott dologra gondolunk (a dolog lehetséges tulajdonságaira), amikor pedig adatról beszélünk, akkor az előbbi dologra, de csak a terjedelme (a dolog " é r t é k e i " ) alapján meghatározva.9 A z infor
máció az ismeret szerepére, hatására, tartalmára utal, az adat pedig az ismeret puszta tényére, meglé
tére, formájára. Ezért az előbbi valamivel szorosabb
an kapcsolódik az ismeretek felhasználásához, az utóbbi pedig az ismeretek kezeléséhez. Talán főképp ennek tulajdonitható, hogy a d o k u m e n t á c i ó , a tájékoztatás, a könyvtárügy stb. területén gyakori az előbbi használata, a számítástechnikában — és ál
talában a formálisabb, mechanikusabb megközelíté
sek e s e t é n - viszont túlnyomórészt az utóbbi hono
sodott meg. Ezzel magyarázható az is, hogy ha álta
lánosabban közelítik meg a kérdést, a számítástech
nikában is információról beszélnek (pl. azt mondják:
információs rendszer, információkeresés), ha pedig szabványosításról, nagyon is speciális, részletező megközelítésről van szó, a dokumentációban stb. is inkább az adat kifejezést használják (pl. bibliográfiai adatelem, kölcsönzési adatok).
A továbbiakban elsősorban az információ kifeje
zést fogjuk használni, ezzel is hangsúlyozva, hogy mondanivalónkat egyrészt — noha a számítástech
nikai szakembernek is címezzük — a felhasználó szempontjából, másrészt pedig a lehető legáltaláno
sabban igyekszünk megfogalmazni. A két kifejezé
sen azonban mindig ugyanazt é r t j ü k .1 0
Az ilyen fogalmi kcltözödések nem is olyan riikák. Például a
" m o l e k u l a — v e g y ü l d " , " a l o m - e l e m " , "agy—elme", "is
meret—tudás", "civilizáció—kultúra" stb. eseiében is páron
ként ugyanarról van s z ó , de más-más értelemben (lásd t/n- gváry. 1986).
Ez a megoldás nincs összhangban s z á m o s szabványosítási tö
rekvéssel, melyekben kizárólag az adat használatát szorgal
mazzák, mivel az információ fogalmát — Wiener nyomán - az anyag és az energia fogalmaival egyenértékű általánosítás
nak ismerik el {Beling, 1973, p. 13.). A javasolt definíciókból azonban rendre kiderül, hogy az egyik a tartalmibb, a másik a formálisabb oldalát emeli csak ki ugyanannak a dolognak.
Az információ "a határozatlanság csökkentése kommuniká
ciós folyamatok következtében", illetve "olyan adai vagy ki
jelentés, melyről ... feltehető, hogy tájékoztató hatása van"
{Beling. 1973, p. 17. és 22.), továbbá "közöli fény", "lény vagy fogalom hordozó és jel (adathordozó é s jelentés) együt- lese által megvalósiioti re prezentálásra való üzenet', "adatnak tulajdonitól! jelentéi' { Wenig, 1976. p. 74 ). Az adatok
"tények legkisebb megvalósítható reprezentációi, melyek ...
interpretálhatók és diszkrét jelek formájában zartósan rögzít
hetők" {Beling, 1973, p. 21.), lovábbá "lények, fogalmak vagy utasítások formatiiátl reprezentációi.." ( Wersig. 1976, p.
72.). Az információ tehát "csökkentés", "hatás", "tény",
"üzenet", az adat pedig "jelek formájában megvalósiioti rep
rezentáció", "formalizál! reprezentáció". Hasonló következ
tetésre jut Halassy (1982, p. 22.) is: " A z adal ... reprezentált, de nem értelmezett ismeret" és " A z információ ... értelme
zett ismeret". Végső soron tehát mindig ugyanannak a dolog
nak formaibb, illetve tartalmibb megnyilvánulására lyuka
dunk ki. Ebből az is következik, hogy elsősorban a minden
kori szövegösszefüggés szabja meg, melyik kifejezés haszná
lata találóbb.
T M T 3 3 . évi. 1986/5—fi—7.
4.2 Eredeti és származtatott információ
A dokumentáltság szempontjából megkülönböz
tetjük a közvetlenül a dokumentálatlan dolgokra ( t é n y e k r e , tárgyakra, személyekre, helyzetekre, ál
lapotokra, tulajdonságokra, esetekre, e s e m é n y e k r e ) vonatkozó eredeti (elsődleges, primer), a dokumen
tumokban rögzített információkra vonatkozó má
sodlagos (szekunder), az ezekre vonatkozó harmad
lagos (tercier) stb. információkat. (Értelemszerűen ez a dokumentumokra is vonatkozik: az elsődleges, másodlagos, harmadlagos stb. információkat tartal
m a z ó dokumentumokat elsődleges, másodlagos, harmadlagos stb. dokumentumoknak nevezzük.)
A d o k u m e n t á c i ó s célból feldolgozott információk lehetnek akár elsődlegesek (pl. a tárgy-, hang-, kép-, személyi, m u n k a ü g y i , egészségügyi, gazda
sági, határidő-információk), akár másodlagosak (pl.
a bibliográfiai információk), természetesen harmad- lagosak stb. is. A másodlagos információk azonban nemcsak a hagyományos könyvtári dokumentu
mokra vonatkozhatnak. Mivel a statisztikai appará
tusok manapság már olyan adattömeget gyűjtenek be és tárolnak, melyek a maguk elsődleges formá
jában áttekinthetetlenek, kialakulófélben van a rájuk v o n a t k o z ó metainformációk rendszere, melyek segítségével a statisztikailag rögzített elsőd
leges Ínformációk leírhatók (Domokos, 1983). Ezek tehát nem bibliográfiai jellegű másodlagos informá
ciók. Nem bibliográfiai jellegűek az irányítási (célú) adatbázis-kezelő rendszerek metaadatbázisaiban szereplő adatszótárak információi sem (Halassy,
1978, p. 275.).
A másodlagos információk é r t e l m e z é s ü n k b e n in
formációkat azonosítanak, jellemeznek, ábrázolnak, írnak le. A harmadlagosakra ugyanez érvényes a má
sodlagos információkra vonatkozóan, ezért doku
mentációs szempontból lényegében már nem kü
lönböznek egymástól. M i n d közvetett, származta
tott (a hivatkozás, a nyilvántartás, a d o k u m e n t á c i ó s célú jellemzés és felhasználás vagy a metanyelvi leírás é r d e k é b e n keletkezett) információk.
A z elsődleges információknak létezik egy másik é r t e l m e z é s e is, amely az információ eredetiségét ál
talában, a dokumentáltságtól függetlenül ragadja meg. így kritérium pl. az információ újszerűsége (Lexikon des Bibliothekswesens, 1974, p. 699.)1 1 Az újszerűség e feltételének fennállása egyrészt jóval nehezebben ellenőrizhető, mint az, hogy az infor-
"Egy primer dokumentum ... a tudományos munka eredmé
nyeként keletkező (eredeti) információforrás (pl. monográ
fia, szakcikk, disszertáció, szabadalmi leírás), mely új tudo
mányos felismeréseket vagy ismeri gondolatok és tények új értelmezését, magyarázatát tartalmazza..."
máció a dokumentációs feldolgozás tárgya volt-e, vagy sem. Másrészt a számítástechnikai feldolgozás szempontjából nincs jelentősége, hogy valaki mit tart újszerűnek, és mit nem; annak viszont van je
lentősége, hogy dokumentációs szempontból feldol
gozott vagy feldolgozatlan információkra vonatkozó információk kezeléséről van-e szó, mert hozzájuk teljesen más feldolgozási és megjelenítési igények fűződnek.
Ezért a továbbiakban az elsődleges ínformációk helyett mindig eredeti információkról, a másodlagos, harmadlagos stb. információk helyett pedig származ
tatott információkról fogunk beszélni. Az elsődleges információkat a számítástechnikai gyakorlatban alapadatoknak nevezik (Halassy, 1978, p. 22.).
4.3 T é n y - és szöveges (értelmezett és értelmezésre szoruló) információ
Az információk egyértelműsége, feltártsága, ma
gyarázatot, értelmezést igénylő, illetve nem igénylő mivolta alapján megkülönböztetjük a faktográfiai vagy tény információkat és a szöveges információkat.
A tényínformációk már megjelenési formájukban egyértelműbben kifejeznek egy meghatározott — m o n d h a t n á n k azt is, hogy egységnyi - tényállást (pl. "Beosztás: főelőadó", "falvastagság: 5 c m " ,
"Szerző: Gyulai Gergely Á k o s " , "Főzni jó ( M o n - spart Éva — Bp., Móra, 1981"); azaz nincs szükség magyarázatra, interpretációra. A tényállások ebben az értelemben azt fejezik k i , hogy egy dolognak milyen összefüggésben, é r t e l e m b e n van valamilyen tulajdonsága, vagy milyen é r t e l e m b e n áll fenn a dolgok között valamilyen összefüggés.
Valami akkor — és olyan m é r t é k b e n — fényin
formáció, ha — és amennyiben — az információ helye vagy egy rá vonatkozó azonosító ( n é v ) meg
mondja, hogy miről van szó.
Ha az adat helyéből tudjuk, hogy Ö micsoda, akkor pozícionált adat, ha valamilyen azonosító (név) mondja meg, akkor névvel azonosított, meg
nevezett adat.
Az információnak azt a részét, amelyet így azono
sítanak, információtartalomnak (fizikai szempont
ból m e z ő t a r t a l o m n a k ) , azt a részét pedig, amely azonosít, információnévnek (fizikai s z e m p o n t b ó l m e z ö n é v n e k ) nevezik. Valójában megnevezetlen
— szöveges — és megnevezett — tény- — informá
ció esetében ugyanaz a kettősség alakult ki az adat
feldolgozásban, mint amelyet az adat/ínformáció kettőssége képvisel a természetes nyelvben (lásd a 4.1 fejezetet).
Mezőnév például az, hogy "Beosztása:", m e z ő tartalom pedig az, hogy " f ő e l ő a d ó " . A m e z ő n é v és