• Nem Talált Eredményt

Relációs adatmodell. Ma leggyakrabban használatos

A SZÁMÍTÓGÉPEK ALKALMAZÁSA AZ ORVOS- ÉS EGÉSZSÉGTUDOMÁNYI

3. Relációs adatmodell. Ma leggyakrabban használatos

Az egyed megadása táblázattal (a táblázat oszlopai az egyed tulajdon­

ságai, a táblázat sorai az egyed konkrét értékei, a tulajdonságok konkrét értékei a mezők) történik, a kapcsolat nem épül be az adatmodellbe.

A relációs adatmodellen alapuló adatbázisok kapcsoló eleme az azonos tartalmú oszlop, vagyis a közös tulajdonság.55

4. Objektum orientált adatmodell. Az egyedeket objektumoknak nevezzük.

Az objektum tulajdonságai az objektum állapotát (tulajdonságainak aktuá­

lis értékét) írják le. A tulajdonságok szerepe azonos a relációs adatmodel­

lével, de lényeges különbség, hogy objektum orientált adatmodellben egy tulajdonság bármi lehet, akár egy másik objektum is. Pl.: bibliográfiai re­

kordhoz valamilyen média csatolható, azaz bármihez bármi.56 Adatbáziskezelő szoftver mint az adatbázis működtetés alapfeltétele:

DBMS= Database Management System Fő funkciói:

- adatbázis létrehozása, szerkezetének kialakítása - adatbázis karbantartása

- új adatok (rekordok) bevitele - adatok (rekordok) törlése - adatok (rekordok) módosítása - adatbázis lekérdezése

- adatvédelem, adatbiztonság, azaz az adatbázis integritásának megőrzése - konkurrencia kezelés, azaz a jogosult felhasználók adatbázishoz való

egyidejű hozzáférésének kezelése (userek száma)

- DBMS + fejlesztő környezet = célalkalmazások készítésére, pl.: integrált könyvtári rendszer működtetésére.

Ma használatos adatbázisok adatmodell típusai fejlődési sorrendben:

Sályi 19 9 1. p. I2-I7.

56 Elérhető: URL:http://www.ktk.jpte.hu/VU/dbtech/dbt06l.htm

Legelterjedtebb relációs adatbáziskezelő rendszerek:

- személyi számítógépeken dbase, FoxPro, Clipper=xBase - M icrosoft Office - Acess, Microsoft SQL Server

- többfelhasználós nagy teljesítményű szerver gépeken Oracle - világ nagyméretű adatbázisaihoz IBM DB2

Adatbázisok tervezési folyamata

1. A célnak legjobban megfelelő adatbázis típus kiválasztása, azaz az adat­

bázis jellemzőinek részletes meghatározása.57 Adatbázisok osztályozása58

A) a felhasználs céljai szerint - irányítási

- ügyviteli

- dokumentációs célú, mely

legjellemzőbb a könyvtári adatbázisokra. Keresés a nagy szöveges adatál­

lományokból a dokumentum tartalma szerint - a keresőképet az információke­

reső nyelvi szótár szavaival és azok kapcsolataival írjuk le.

Általános megnevezésük: információkereső rendszer.

B) felhasználás helye szerint - államigazgatás - ipar, kereskedelem - közgyűjtemények, stb.

C) felhasználási szakterületük szerint - átfogó, általános (SCI 120 szakterület) - szakterületi (ERIC, MEDLINE, CINAHL) - interdiszciplináris (Biological Abstract)

- egy szűk szakterület problémáinak megoldására létrehozott (INIS, űr­

kutatás)

- egy dokumentumtípust feltáró (szabadalom, szabvány, jogszabály, stb.) D) funkció szerint

- forrásra hivatkozó adatbázisok

- bibliográfiai szakirodalmi adatbázisok,melyek a dokumentumok, infor­

mációforrások bibliográfiai leírását, esetenkénti tartalmi ismertetését is tárolják.

- forrástájékoztató (referál) adatbázisok, amelyek személyek, intézmé­

nyek, szervezetek adatait dolgozzák fel. (céginformációs, szakértői, stb.) - forrás vagy forrástipusú adatbázisok, azaz a primer információt tartal­

mazzák

Raffai M. Információrendszer — fejlesztés. Győr: Novadat; 1999. p.496-522.

Pálvölgyi M. Információs technológia. Budapest: Tankönyvkiadó; 1991.p. 208-212. (a továb­

biakban: Pálvölgyi, 1991.)

- numerikus adatbázisok (statisztikák, számsoros jellemzések)

- szöveges - numerikus adatbázisok (képletgyűjtemények, műszaki út­

mutatók)

- teljes szöveges (full-text) adatbázisok, melyek bármely tipusú doku­

mentumot (könyv, folyóirat, jogszabály, stb.) dolgoznak fel

- szakértői rendszerek vagy tudásbázisok (kompilációk), értékelt infor­

mációkat dolgoznak fel (pl. Micromedex modulok)

- integrált adatbázisok, melyek az előző funkciók közül többet is egyesíte­

nek. (integrált könyvtári rendszerek más-más funkciójú moduljai)

2. Logikai tervezés: az adatállományok, a logikai rekordok, az adattípusok és az elemi adatok (adatszintek) használatának megtervezése a használni ki- vánt adatmodell alapján. Az adatszintek közötti kapcsolat megjelenítése a találati halmazban történik, amely a valamilyen szinten összetartozó, azonosan jellemezhető egyedelőfordulásokat jelenti.

Fő funkcionális adatállományok:

- bibliográfiai vagy master file - a dokumentumok bibliográfiai leírását tárolja - invertált file vagy index file - a keresés általában ebben a betűrendes fiié­

ban kezdődik, és az egyes ismérvekhez kapcsolódó azonosítók vezetnek el a bibliográfiai adatállományhoz, azaz a konkrét dokumentumképhez. A keresés útja lehet: soros (szekvenciális - nincs külön index file), közvet­

len (direkt - master és invertált file-ban egyszerre)60

Adattípusok: a dokumentumokat leíró ismérvek csoportja, amelyek felsoro­

lása az adatszótárban található (TI,AU,SO,PY, stb );

- rekord: az adatfile legkisebb feldolgozható egysége, amely egy tárolt egyed tulajdonságait foglalja össze, mintegy egységes egészt, adatmon­

datot képezve;

- mező: a rekordot felépítő, egy-egy tulajdonsághoz tartozó adat ábrázolá­

sát szolgáló területeket a rekord mezőinek, az adatmondat szavainak ne­

vezzük, mivel még önállóan is értelmezhető adatot tartalmaznak.

Adatelemek: körét az adatbázis funkciójának megfelelően kell megválasz­

tani. (hány szerző munkahelye szerepeljen, közlemény címe hány nyelven sze­

repeljen, tárgyszavazás hány nyelven történjen, stb.)

Az adatállományokban történő keresési kombinációk döntő meghatározója a választott információkereső nyelv.61

Stolnicki Gy. SQL kézikönyv. 2.átd.böv.kiad. Budapest: Computerbooks: 1995. p. 29. (a to­

vábbiakban: Stolnicki. 1995.) Pál völgyi 19 9 1. p. 212-217.

Ungváry R, Vajda E. Könyvtári információkeresés. 2.jav.kiad. Budapest: Typotex; 2002. p. 17- 34. (a továbbiakban: Ungváry, 2002.)

Információkereső nyelv: az a nyelv, amely alkalmas az információk és az információkereső kérdések leírására, azaz a természetes nyelven megfogalma­

zott kérdések szabályozott nyelvre történő lefordítására.

Az információkereső nyelvvel kapcsolatos követelmények:

- meghatározott lexikai egységekből álljon (homonímák, szinonimák ki­

szűrése, utalók és utalások beépítése)

- fejezze ki az általánosabb (nem-) és a szűkebb (faj-) fogalom közötti tartalmi összefüggéseket

- tükrözze a rész és egész viszonyait

- cél és megvalósítási eszköz oksági kapcsolatát - tükrözze a mondattani (szintaktikai) összefüggéseket.

Az információkereső nyelv elemei:

- jel

- jelkészlet (tudománya a jelelmélet vagy szemiotika)

- szóképzés: a fogalmak közötti értelmi, jelentésbeli - szemantikai - összefüggések alapján

Az információkereső nyelvek típusai:

- hierarchikus: az információkereső nyelvi szavak tükrözik, hogy az általuk reprezentált fogalom mely másik fogalomnak specifikus fogalma, vagyis melyik­

nek van alárendelve. A szóképzés szabályai a fogalmi hierarchián alapulnak, bővebb fogalmak szerint tárgyi információkeresésre alkalmasak. Fő alkalmazási területük az Osztályozási rendszerek.

- mellérendelő: a természetes nyelvből egy valamilyen módon szabályozott kontrollált nyelvet kell létrehozni, és erre a nyelvre kell lefordítani a kérdés és a keresett információ tartalmát egyaránt. Eszköz: szinonimák kiküszöbölése, kitün­

tetett tárgyszó kiválasztása, Id.még típusú utalók beépítése.

Fő alkalmazási területük az indexek, melyek a dokumentum tartalmát leíró szóláncok - indextételek - rendezett gyűjteményei.

Az indexelő eljárások során az indexkifejezéseket általában a dokumentum címéből vagy tartalmából emelik ki.

Főbb index típusok:

címindexek - KWIC, KWOC (keyword in - out - context) szerepük osztályo­

zási szempontból azonos, felépítésük különböző

KWIC: elvágott találati cím + kód, teljes tétel leírás a kód alapján csatolt bibli­

ográfiában

KWOC: a kiemelt kulcsszó után rögtön megjelennek a teljes címek.

permutált tárgyi index - a besorolást és a kívánt tétel elérését a tárgyszó-lánc elemeinek ciklikus permutációjával oldják meg.

lánceljárásos tárgyi index - a különböző fogalmi szinteken elhelyezkedő tárgysza­

vakat a specifikustól generikusig történő rendezésük után permutáljuk.62 PRECIS (Preserved Context Indexing System) - szövegösszefüggést megtartó indexelési rendszer, amely grammatikai szabályainak köszönhetően az indextétel felépítését a természetes nyelvű mondat szerkezetének felelteti meg.63

- szemantikai (relációs): a valamely fogalom leírása, megjelenítésére szolgá­

ló kifejezéseket deszkriptoroknak, szótáraikat pedig tezauruszoknak ne­

vezzük.

A tezaurusz tehát egy szakterület természetes nyelven kifejezett fogalmainak szabályozott, szükség szerint változtatható polihierarchikus szótára, amely feltün­

teti a fogalmak közötti legfontosabb logikai kapcsolatokat (relációkat). A tezau­

russzal végzett fogalmi osztályozás alapjai a lexikai egységek. A tezaurusz lexikai egységei a deszkriptorok és a nemdeszkriptorok, melyek az osztályozó fogalmak szabályozott nyelvi kifejezései.

Deszkriptor: az adatbázis funkciójának megfelelően az információk leírására és keresésére közvetlenül használható, több hasonló kifejezés közül kiválasztott privilegizált szóalak.

Nemdeszkriptor: a deszkriptor szinonimnak tekintett kifejezése, amely az in­

formációk leírására és visszakeresésére az őt képviselő deszkriptor figyelembe vételével használható.

A tezaurusz fő részei: Deszkriptorcikkek és nemdeszkriptorcikkek, teljes kapcsolatrendszerükkel, azaz a fogalmak egymás közötti relációit tüntetik fel.

Tezauruszok további részei: tárgyköri mutatókötet, hierarchikus mutatókötet, szerkezeti mutatókötet. (MeSH részei) •

Befejezésül a találatok megjelenítési formátumának tervezése, azaz az adatbázis funkcióinak megfelelő találati rekordmezök kiíratása.

VÉGEREDMÉNY: a komplex logikai rekord. (Bibliográfiai leírás, osztályo­

zás, referátum, azonosítók, stb.) 3. Az adatbázis fizikai tervezése

Az adatbázis fizikai tervezése a logikai rekordok fizikai rekordokban történő leképezéséhez szükséges.64 Tehát a fizikai rekord az az adatmennyiség (bitokban) a háttértárolón, amelyet egy logikai rekord foglal el. A rekordok köz­

vetlen, párbeszédes formában történő elérését a címzés teszi lehetővé.

Leggyakoribb rekord és mező specifikációk: hívójel, név, rövidítés, ismétel- hetőség, hosszúság, jelkészlet, megjelenítés, stb.

Sárdy P. Gépi indexek. In: Bibliográfiai tanulmányok. Budapest: Országos Széchényi Könyv­

tár Könyvtártudományi és Módszertani Központ; 1978. p. 180-203.

63 Horváth T. Orbán É. PRECIS. Tudományos és Műszaki Tájékoztatás 1987; 33(7):311-323.

64 Stolnicki 1995. p. 133-149.

Adatbázis kereshetőségét döntően meghatározó fizikai tervezési szempont, a mező kereshetősége.

Kereshetőség: a kereshető ismérvek meghatározása index kulcsokkal, azaz az invertálás.

Kifejezésre invertálás: a teljes mezőtartalom, pl. szerző, cím, stb.kereshető Szavas invertálás: a tiltott szavakat kivéve, a mező minden egyes szava, pl.

cím, absztrakt, stb. kereshető

Kijelöléses invertálás: csak a feldolgozó által kijelölt karaktersorozatok ke­

reshetők, így biztosított a védelem a szabadszavas keresés nem értékelhető kifejezései ellen.

4. A gyűjtött, feldolgozott és adatbázisban tárolt információ keresése