A SZÁMÍTÓGÉPEK ALKALMAZÁSA AZ ORVOS- ÉS EGÉSZSÉGTUDOMÁNYI
3. Relációs adatmodell. Ma leggyakrabban használatos
Az egyed megadása táblázattal (a táblázat oszlopai az egyed tulajdon
ságai, a táblázat sorai az egyed konkrét értékei, a tulajdonságok konkrét értékei a mezők) történik, a kapcsolat nem épül be az adatmodellbe.
A relációs adatmodellen alapuló adatbázisok kapcsoló eleme az azonos tartalmú oszlop, vagyis a közös tulajdonság.55
4. Objektum orientált adatmodell. Az egyedeket objektumoknak nevezzük.
Az objektum tulajdonságai az objektum állapotát (tulajdonságainak aktuá
lis értékét) írják le. A tulajdonságok szerepe azonos a relációs adatmodel
lével, de lényeges különbség, hogy objektum orientált adatmodellben egy tulajdonság bármi lehet, akár egy másik objektum is. Pl.: bibliográfiai re
kordhoz valamilyen média csatolható, azaz bármihez bármi.56 Adatbáziskezelő szoftver mint az adatbázis működtetés alapfeltétele:
DBMS= Database Management System Fő funkciói:
- adatbázis létrehozása, szerkezetének kialakítása - adatbázis karbantartása
- új adatok (rekordok) bevitele - adatok (rekordok) törlése - adatok (rekordok) módosítása - adatbázis lekérdezése
- adatvédelem, adatbiztonság, azaz az adatbázis integritásának megőrzése - konkurrencia kezelés, azaz a jogosult felhasználók adatbázishoz való
egyidejű hozzáférésének kezelése (userek száma)
- DBMS + fejlesztő környezet = célalkalmazások készítésére, pl.: integrált könyvtári rendszer működtetésére.
Ma használatos adatbázisok adatmodell típusai fejlődési sorrendben:
Sályi 19 9 1. p. I2-I7.
56 Elérhető: URL:http://www.ktk.jpte.hu/VU/dbtech/dbt06l.htm
Legelterjedtebb relációs adatbáziskezelő rendszerek:
- személyi számítógépeken dbase, FoxPro, Clipper=xBase - M icrosoft Office - Acess, Microsoft SQL Server
- többfelhasználós nagy teljesítményű szerver gépeken Oracle - világ nagyméretű adatbázisaihoz IBM DB2
Adatbázisok tervezési folyamata
1. A célnak legjobban megfelelő adatbázis típus kiválasztása, azaz az adat
bázis jellemzőinek részletes meghatározása.57 Adatbázisok osztályozása58
A) a felhasználs céljai szerint - irányítási
- ügyviteli
- dokumentációs célú, mely
legjellemzőbb a könyvtári adatbázisokra. Keresés a nagy szöveges adatál
lományokból a dokumentum tartalma szerint - a keresőképet az információke
reső nyelvi szótár szavaival és azok kapcsolataival írjuk le.
Általános megnevezésük: információkereső rendszer.
B) felhasználás helye szerint - államigazgatás - ipar, kereskedelem - közgyűjtemények, stb.
C) felhasználási szakterületük szerint - átfogó, általános (SCI 120 szakterület) - szakterületi (ERIC, MEDLINE, CINAHL) - interdiszciplináris (Biological Abstract)
- egy szűk szakterület problémáinak megoldására létrehozott (INIS, űr
kutatás)
- egy dokumentumtípust feltáró (szabadalom, szabvány, jogszabály, stb.) D) funkció szerint
- forrásra hivatkozó adatbázisok
- bibliográfiai szakirodalmi adatbázisok,melyek a dokumentumok, infor
mációforrások bibliográfiai leírását, esetenkénti tartalmi ismertetését is tárolják.
- forrástájékoztató (referál) adatbázisok, amelyek személyek, intézmé
nyek, szervezetek adatait dolgozzák fel. (céginformációs, szakértői, stb.) - forrás vagy forrástipusú adatbázisok, azaz a primer információt tartal
mazzák
Raffai M. Információrendszer — fejlesztés. Győr: Novadat; 1999. p.496-522.
Pálvölgyi M. Információs technológia. Budapest: Tankönyvkiadó; 1991.p. 208-212. (a továb
biakban: Pálvölgyi, 1991.)
- numerikus adatbázisok (statisztikák, számsoros jellemzések)
- szöveges - numerikus adatbázisok (képletgyűjtemények, műszaki út
mutatók)
- teljes szöveges (full-text) adatbázisok, melyek bármely tipusú doku
mentumot (könyv, folyóirat, jogszabály, stb.) dolgoznak fel
- szakértői rendszerek vagy tudásbázisok (kompilációk), értékelt infor
mációkat dolgoznak fel (pl. Micromedex modulok)
- integrált adatbázisok, melyek az előző funkciók közül többet is egyesíte
nek. (integrált könyvtári rendszerek más-más funkciójú moduljai)
2. Logikai tervezés: az adatállományok, a logikai rekordok, az adattípusok és az elemi adatok (adatszintek) használatának megtervezése a használni ki- vánt adatmodell alapján. Az adatszintek közötti kapcsolat megjelenítése a találati halmazban történik, amely a valamilyen szinten összetartozó, azonosan jellemezhető egyedelőfordulásokat jelenti.
Fő funkcionális adatállományok:
- bibliográfiai vagy master file - a dokumentumok bibliográfiai leírását tárolja - invertált file vagy index file - a keresés általában ebben a betűrendes fiié
ban kezdődik, és az egyes ismérvekhez kapcsolódó azonosítók vezetnek el a bibliográfiai adatállományhoz, azaz a konkrét dokumentumképhez. A keresés útja lehet: soros (szekvenciális - nincs külön index file), közvet
len (direkt - master és invertált file-ban egyszerre)60
Adattípusok: a dokumentumokat leíró ismérvek csoportja, amelyek felsoro
lása az adatszótárban található (TI,AU,SO,PY, stb );
- rekord: az adatfile legkisebb feldolgozható egysége, amely egy tárolt egyed tulajdonságait foglalja össze, mintegy egységes egészt, adatmon
datot képezve;
- mező: a rekordot felépítő, egy-egy tulajdonsághoz tartozó adat ábrázolá
sát szolgáló területeket a rekord mezőinek, az adatmondat szavainak ne
vezzük, mivel még önállóan is értelmezhető adatot tartalmaznak.
Adatelemek: körét az adatbázis funkciójának megfelelően kell megválasz
tani. (hány szerző munkahelye szerepeljen, közlemény címe hány nyelven sze
repeljen, tárgyszavazás hány nyelven történjen, stb.)
Az adatállományokban történő keresési kombinációk döntő meghatározója a választott információkereső nyelv.61
Stolnicki Gy. SQL kézikönyv. 2.átd.böv.kiad. Budapest: Computerbooks: 1995. p. 29. (a to
vábbiakban: Stolnicki. 1995.) Pál völgyi 19 9 1. p. 212-217.
Ungváry R, Vajda E. Könyvtári információkeresés. 2.jav.kiad. Budapest: Typotex; 2002. p. 17- 34. (a továbbiakban: Ungváry, 2002.)
Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalma
zott kérdések szabályozott nyelvre történő lefordítására.
Az információkereső nyelvvel kapcsolatos követelmények:
- meghatározott lexikai egységekből álljon (homonímák, szinonimák ki
szűrése, utalók és utalások beépítése)
- fejezze ki az általánosabb (nem-) és a szűkebb (faj-) fogalom közötti tartalmi összefüggéseket
- tükrözze a rész és egész viszonyait
- cél és megvalósítási eszköz oksági kapcsolatát - tükrözze a mondattani (szintaktikai) összefüggéseket.
Az információkereső nyelv elemei:
- jel
- jelkészlet (tudománya a jelelmélet vagy szemiotika)
- szóképzés: a fogalmak közötti értelmi, jelentésbeli - szemantikai - összefüggések alapján
Az információkereső nyelvek típusai:
- hierarchikus: az információkereső nyelvi szavak tükrözik, hogy az általuk reprezentált fogalom mely másik fogalomnak specifikus fogalma, vagyis melyik
nek van alárendelve. A szóképzés szabályai a fogalmi hierarchián alapulnak, bővebb fogalmak szerint tárgyi információkeresésre alkalmasak. Fő alkalmazási területük az Osztályozási rendszerek.
- mellérendelő: a természetes nyelvből egy valamilyen módon szabályozott kontrollált nyelvet kell létrehozni, és erre a nyelvre kell lefordítani a kérdés és a keresett információ tartalmát egyaránt. Eszköz: szinonimák kiküszöbölése, kitün
tetett tárgyszó kiválasztása, Id.még típusú utalók beépítése.
Fő alkalmazási területük az indexek, melyek a dokumentum tartalmát leíró szóláncok - indextételek - rendezett gyűjteményei.
Az indexelő eljárások során az indexkifejezéseket általában a dokumentum címéből vagy tartalmából emelik ki.
Főbb index típusok:
címindexek - KWIC, KWOC (keyword in - out - context) szerepük osztályo
zási szempontból azonos, felépítésük különböző
KWIC: elvágott találati cím + kód, teljes tétel leírás a kód alapján csatolt bibli
ográfiában
KWOC: a kiemelt kulcsszó után rögtön megjelennek a teljes címek.
permutált tárgyi index - a besorolást és a kívánt tétel elérését a tárgyszó-lánc elemeinek ciklikus permutációjával oldják meg.
lánceljárásos tárgyi index - a különböző fogalmi szinteken elhelyezkedő tárgysza
vakat a specifikustól generikusig történő rendezésük után permutáljuk.62 PRECIS (Preserved Context Indexing System) - szövegösszefüggést megtartó indexelési rendszer, amely grammatikai szabályainak köszönhetően az indextétel felépítését a természetes nyelvű mondat szerkezetének felelteti meg.63
- szemantikai (relációs): a valamely fogalom leírása, megjelenítésére szolgá
ló kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak ne
vezzük.
A tezaurusz tehát egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható polihierarchikus szótára, amely feltün
teti a fogalmak közötti legfontosabb logikai kapcsolatokat (relációkat). A tezau
russzal végzett fogalmi osztályozás alapjai a lexikai egységek. A tezaurusz lexikai egységei a deszkriptorok és a nemdeszkriptorok, melyek az osztályozó fogalmak szabályozott nyelvi kifejezései.
Deszkriptor: az adatbázis funkciójának megfelelően az információk leírására és keresésére közvetlenül használható, több hasonló kifejezés közül kiválasztott privilegizált szóalak.
Nemdeszkriptor: a deszkriptor szinonimnak tekintett kifejezése, amely az in
formációk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható.
A tezaurusz fő részei: Deszkriptorcikkek és nemdeszkriptorcikkek, teljes kapcsolatrendszerükkel, azaz a fogalmak egymás közötti relációit tüntetik fel.
Tezauruszok további részei: tárgyköri mutatókötet, hierarchikus mutatókötet, szerkezeti mutatókötet. (MeSH részei) •
Befejezésül a találatok megjelenítési formátumának tervezése, azaz az adatbázis funkcióinak megfelelő találati rekordmezök kiíratása.
VÉGEREDMÉNY: a komplex logikai rekord. (Bibliográfiai leírás, osztályo
zás, referátum, azonosítók, stb.) 3. Az adatbázis fizikai tervezése
Az adatbázis fizikai tervezése a logikai rekordok fizikai rekordokban történő leképezéséhez szükséges.64 Tehát a fizikai rekord az az adatmennyiség (bitokban) a háttértárolón, amelyet egy logikai rekord foglal el. A rekordok köz
vetlen, párbeszédes formában történő elérését a címzés teszi lehetővé.
Leggyakoribb rekord és mező specifikációk: hívójel, név, rövidítés, ismétel- hetőség, hosszúság, jelkészlet, megjelenítés, stb.
Sárdy P. Gépi indexek. In: Bibliográfiai tanulmányok. Budapest: Országos Széchényi Könyv
tár Könyvtártudományi és Módszertani Központ; 1978. p. 180-203.
63 Horváth T. Orbán É. PRECIS. Tudományos és Műszaki Tájékoztatás 1987; 33(7):311-323.
64 Stolnicki 1995. p. 133-149.
Adatbázis kereshetőségét döntően meghatározó fizikai tervezési szempont, a mező kereshetősége.
Kereshetőség: a kereshető ismérvek meghatározása index kulcsokkal, azaz az invertálás.
Kifejezésre invertálás: a teljes mezőtartalom, pl. szerző, cím, stb.kereshető Szavas invertálás: a tiltott szavakat kivéve, a mező minden egyes szava, pl.
cím, absztrakt, stb. kereshető
Kijelöléses invertálás: csak a feldolgozó által kijelölt karaktersorozatok ke
reshetők, így biztosított a védelem a szabadszavas keresés nem értékelhető kifejezései ellen.
4. A gyűjtött, feldolgozott és adatbázisban tárolt információ keresése