Nyilvános adatbankok megtekintése

Teljes szövegt

(1)

T M T 3 8 . é v f.1991. 8 . SÍ.

b ö l é s é r e ú j a b b a n kifinomultabb s t r a t é g i á k a t alkal­

maznak (automatikus i n d e x e l é s tezaurusszal, s z a k é r t ő rendszerek a l k a l m a z á s a a dokumentumok e l e m z é s é r e , i n d e x e l é s é r e é s a v i s s z a k e r e s é s r e ) .

A javasolt programcsomag egy nagyobb projekt r é s z e . C é l j a az e l m ú l t fiz é v b e n a dokumentumok szabad i n d e x e l é s é v e l kialakított PRODOC a d a t b á z i s á t s z e r v e z é s e , majd egy k é s ő b b i szakaszban automa­

tikus ú j r a i n d e x e l é s e . A PRODOC a d a t b á z i s j e l l e m z ő i : t ö b b mint 350 000 rekordot tartalmaz; tematikailag átfogja a t e r m é s z e t t u d o m á n y o k , az alkalmazott t u d o m á n y o k , a technika é s a k ö z g a z d a s á g e g é s z t e r ü l e t é t ; az i n d e x e l é s t e r m é s z e t e s nyelven történik, az i n d e x e l ő által szabadon létrehozott s z i n t a g m á k k a l ; az alkalmazott hardver é s a k é t l e m e z e g y s é g e s INDEPENDENT m i n i s z á m í t ó g é p 1 - 1 5 M b á j t b e l s ő m e m ó r i á v a l .

Az a d a t b á z i s ú j r a s z e r v e z é s e k é t feladat m e g o l d á ­ sát jelenti: a rekordok s z ö v e g é b e n t a l á l h a t ó h i b á k kijavítását, mive! az a d a t b e v i t e l n é l nagyon sok hiba k e r ü l t be; a rekordok t e r j e d e l m é n e k c s ö k k e n t é s é t a t á r o l ó k a p a c i t á s jobb k i h a s z n á l á s a c é l j á b ó l .

A m e g o l d á s : a z o k b ó l a s z a v a k b ó l (szón é r t v e minden karaktersort, amelyet s z ó k ö z ö k h a t á r o l n a k ) , amelyek m á r szerepelnek a rendszerben, szótárt állí­

tanak ö s s z e , s a s z ó t á r szavait numerikus k ó d d a l k ó d o l j á k . A rekordokban a deszkriptorokat ezekkel a k ó d o k k a l h e l y e t t e s í t i k , s e z á l t a l l é n y e g e s e n tömörítik őket.

A szótárt ugyanakkor fel lehet h a s z n á l n i egy inverz fájl e l k é s z í t é s é r e , amelyben a szavakhoz ren­

delve e l ő f o r d u l n a minden dokumentum, amelyben az illető s z ó szerepel.

A szótár e l k é s z í t é s é n é l a legnagyobb p r o b l é m a a k ü l ö n b ö z ő nyelvtani alakok f e l i s m e r é s e , mivel ezeket nem lehet k ü l ö n - k ü l ö n mind beírni, hiszen ez nagyon f e l d u z z a s z t a n á a szótárt, nagyon sok m e m ó r i á t i g é n y e l n e , m e g n e h e z í t e n é a k e r e s é s t .

Ezt a p r o b l é m á t oldja meg a "nyelvi analizátor", amely a f ő n e v e k é s m e l l é k n e v e k e l e m z é s é v e l biztosít­

ja lexikális é s morfológiai s z e m p o n t b ó l a h e l y e s s é g ü ­ ket. M e g v i z s g á l j a , hogy azok a szavak, amelyek a k u l c s s z ó t a l k o t j á k , a s z ó t á r h o z tartoznak-e, é s a k u l c s s z ó n b e l ü l e l l e n ő r z i a szavak hajirtását ó s a szintaxist. Az a n a l i z á t o r a l k a l m a z á s a nem k o r l á t o z z a az i n d e x e l é s t , de a l e x i k á l i s r é s z e szótárt épít fel, é s benne keresi a szavakat.

A nyelvi a n a l i z á t o r n a k k é t a l k o t ó r é s z e van: a lexikális é s a nyelvtani a n a l i z á t o r . Ez u t ó b b i n a k s z i n t é n k é t r é s z e van: a morfológiai és a szintaktikai a n a l i z á t o r .

A szintaktikai analizátor

Ellenőrzi a szavak kapcsolódását, és egy fadiagra- mot hoz létre, amely az alárendeltségi viszonyokat tükrözi. A szavakat szópárokká alakítja (szótő + tol­

dalék), s a gráfot úgy építi fel, hogy a szópárok alkot­

ják a szövegpontokat, az élek pedig az alárendeltségi viszonyokat mutatják. A szintaktikai elemzést nem mindig lehet teljesen elvégezni, mert a szavak alakja nem mindig határozza meg egyértelműen a köztük levő kapcsolatot.

A lexikális analizátor

A szavak tövét azonosítja úgy, hogy összehasonlít­

ja egy különleges szótárral, amelyben a szavakat alkotó betűk fadiagram formájában vannak elren­

dezve, s a szótövek végének megfelelő szögpontok­

ban információk találhatók a szótőre vonatkozólag.

Az analizátor összeállítja a lehetséges szótövek listá­

ját. Természetesen előfordulhat, hogy ilyen módon nem lehet a helyes szótövet meghatározni. Ilyen ese­

tekben csak a szemantikai elemzés segíthetne.

Morfológiai analizátor

A lexikális elemzés után a szó a morfológiai ana­

lizátorba kerül, amely a szó végződését (a szótőhöz csatlakozó betűket) elemzi. Az elemzés úgy történik, hogy a végződés végighalad egy hálódiagramon, amelynek szögpontjai a toldalékokban előforduló betűk. Ha a végződés (a szótő morfológiai sajátossá­

gaihoz viszonyítva) szabályos toldalék, az út egy vég­

ponthoz vezet, amelyben a toldalékhoz hozzárendelö- dik a megfelelő kód.

Az elemzés végül egy kételemű numerikus kódot eredményez, amelynek az elemei a szótő és a toldalék kódja. Ez a kód helyettesíti a rekordban a kulcsszót.

Az eljárás előnyei: a rekordok legalább 50%-os tömörítése; a változó hosszúságú alfanumerikus mező átalakítása állandó hosszúságú mezövé, s ezáltal a feldolgozás egyszerűsítése; a szavak alakjá­

tól független visszakeresés lehetősége.

Az analizátort alkalmassá lehet majd tenni más beszédrészek elemzésére is, s akkor felhasználható lesz teljes szövegek feldolgozására.

/PETCU, B.: Analizor lexlcal sf gramatlcal pentru substan- tlve si adjactlva. = Probleme de lnformar« si documen­

tare, 24. köt. 1. sz. 1 990. p. 3 - 6./

Nyilvános adatbankok

R o m á n i á b a n a helyzet nagyon rossz. Nem b e s z é l ­ h e t ü n k egyetlen m ű k ö d ő a d a t b a n k r ó l sem, s a k i l á t á ­ sok a k ö z e l j ö v ő t illetően nem b i z t a t ó k . Az ok: az illeté­

kesek nem é r t i k meg az adatbankok s z e r e p é t é s fon­

t o s s á g á t , s e z é r t nem biztosítják a l é t e s í t é s ü k h ö z é s m ű k ö d t e t é s ü k h ö z s z ü k s é g e s p é n z ü g y i , m ű s z a k i é s emberi e r ő f o r r á s o k a t . A l e m a r a d á s m é g a t ö b b i ex- kommunfsta o r s z á g h o z k é p e s t is nagyon nagy.

349

(2)

Beszámolók, szemlék, referátumok Az i n f o r m á c i ó g y ű j t e m é n y e k akut h i á n y a mellett

h i á n y o z n a k a k o m m u n i k á c i ó s l e h e t ő s é g e k is ( s z á m í t ó g é p - h á l ó z a t , Teletext/Videotex t í p u s ú n y i l v á ­ nos s z o l g á l t a t á s o k , a külföldi h á l ó z a t o k h o z csatla­

k o z ó k a p u s z o l g á l a t , a gateway), amelyek m e g k ö n n y í - t e n é k a h o z z á f é r é s t a l é t e s í t e n d ő hazai é s a létező külföldi adatbankokhoz.

R o m á n i á b a n az á t a l a k u l á s i d ő s z a k á b a n a z é r t lenne nagyon fontos a n y i l v á n o s adatbankok l é t r e ­ h o z á s a é s a már p o t e n c i á l i s a n l é t e z ő k h o z z á f é r h e t ő v é tétele, mert m e g g y o r s í t a n á az á t t é r é s t a p i a c g a z d á l ­ k o d á s r a , s e g í t e n é a szakemberket, hogy az adatban­

k o k b ó l szerzett i n f o r m á c i ó k f e l h a s z n á l á s á v a l gyor­

sabban t u d j á k h e l y e t t e s í t e n i a régi c e n r a l i z á l t v e z e t é s i mechanizmust egy ú j . rugalmas mechaniz­

mussal. Ezt a m e g á l l a p í t á s t t á m a s z t j a a l á a K ö z ö s Piac e l h a t á r o z á s a , hogy K ö z é p - é s K e l e t - E u r ó p á b a n , valamint a S z o v j e t u n i ó b a n f e l l e l t á r o z z á k az i n f o r m á ­ ciós e r ő f o r r á s o k a t , s e b b ő l kiindulva d o l g o z z á k ki a s e g í t s é g a d á s m ó d o z a t a i t .

A felgyorsítás útjai

Az adatbankok l é t e s í t é s é t é s h a s z n á l a t á t a k ö v e t ­ k e z ő m ü v e l e t e k k e l lehetne f e l g y o r s í t a n i :

• az o r s z á g b a n létező információs torrások, a külföldi nagy k ö z p o n t o k t ó l kapott m á g n e s s z a l a g o k

(AGRIS, INIS, CAS, MEDLARS, INPADOC) m a x i m á ­ lis h a s z n o s í t á s a . Ennek legnagyobb a k a d á l y a a nagy k a p a c i t á s ú s z á m í t ó g é p e k h i á n y a ;

• a m á r l é t e z ő automatizált adatgyűjtemények hasz­

n o s í t á s a . Azonnal lehetne h a s z n o s í t a n i a k ü l ö n b ö ­ z ő t e r ü l e t e k e n l é t r e h o z o t t d o k u m e n t á c i ó s adat­

g y ű j t e m é n y e k e t (Könnyűipar, k o h á s z a t , energetika stb.);

• a pénzügyi alapok é s a műszaki feltételek megte­

r e m t é s e , hogy a nyugati adatbankok i n f o r m á c i ó i h o z z á f é r h e t ő k k é ( b e s z e r e z h e t ő k k é ) v á l j a n a k ;

• állami szubvenció olyan adatbankok l é t e s í t é s é h e z , amelyeket nem lehet külföldről á t v e n n i ( t ö r v é n y ­ h o z á s , i g a z s á g s z o l g á l t a t á s , s z á l l í t á s , kereskede­

lem, e r ő f o r r á s o k stb.);

• a t ö r v é n y e s keretek m e g t e r e m t é s e az I n f o r m á c i ó s i n t é z m é n y e k m ű k ö d é s é n e k s z a b á l y o z á s á r a . A s z e r z ő a t o v á b b i a k b a n r é s z l e t e s e n Ismerteti az adatbankok elvi alapjait, h a s z n á l a t u k m ó d j á t , az a d a t b a n k - k a t a l ó g u s o k a t , a k r i t é r i u m o k a t , amelyek a l a p j á n ki lehet v á l a s z t a n i az i g é n y e k n e k legmegfe­

lelőbb adatbankot vagy bankokat.

T E O D O R E S C U , B • Bancl de date publlce. - Probleme de informare si documentare, 24. köt. 3. sz. 1990. p.

91-102./

A tudományos-műszaki tájékoztatás és a nemzeti bibliográfia kapcsolata

A f e l h a s z n á l ó k m i n é l teljesebb, pontosabb é s gyor­

sabb t á j é k o z t a t á s a a mai k ö r ü l m é n y e k között, amikor minden t e r ü l e t e n hihetetlen m é r t é k b e n elszaporodtak a l e g k ü l ö n b ö z ő b b k a t e g ó r i á j ú folyóiratok é s k i a d v á ­ nyok, s z ü k s é g e s s é teszi az i n f o r m á c i ó f e l d o l g o z ó é s - f o r g a l m a z ó i n t é z m é n y e k közötti e g y ü t t m ű k ö d é s s t r a t é g i á j á n a k új alapokra h e l y e z é s é t .

R o m á n i á b a n a t u d o m á n y o s - m ű s z a k i t á j é k o z t a t á s i h á l ó z a t b a n a k ü l ö n b ö z ő s z a k o s í t o t t e g y s é g e k (doku­

m e n t á c i ó s i n t é z e t e k , irodák, k ö n y v t á r a k stb.) meg­

s z e r v e z é s e é s m ű k ö d é s e az egyszeri f e l d o l g o z á s - t ö b b c s a t o r n á n való t e r j e s z t é s e l v é n alapul, azaz arra t ö r e k e d n e k , hogy a primer dokumentumokat csak egyszer d o l g o z z á k fel, s az i n f o r m á c i ó k a t a z u t á n m i n é l t ö b b c s a t o r n á n j u t t a s s á k el a f o g y a s z t ó k h o z .

Az o r s z á g o s h a t á s k ö r r e l f e l r u h á z o t t i n t é z m é n y e k k ö z ü l a legfontosabbak az Institutul National de Infor­

mare si Documentare (INID = O r s z á g o s I n f o r m á c i ó s é s D o k u m e n t á c i ó s Intézet) é s a Biblíoteca Nationala (BN = Nemzeti K ö n y v t á r ) . Az e l ő b b i feladata a t u d o m á n y o s - m ű s z a k i t á j é k o z t a t á s , az u t ó b b i é t ö b b e k között — s a jelen dolgozat s z e m p o n t j á b ó l ez a legfon­

tosabb - a hazai n y o m t a t v á n y o k bibliográfiai s z á m ­ b a v é t e l e . A k é t i n t é z m é n y közötti e g y ü t t m ű k ö d é s n e k régi h a g y o m á n y a i vannak, t ö b b síkon is. Szoros az e g y ü t t m ű k ö d é s egyebek mellett az I n f o r m á c i ó é s d o k u m e n t á c i ó á l t a l á n o s m ó d s z e r t a n á n a k a kidol­

g o z á s á b a n , e s z k ö z e i n e k k i m u n k á l á s á b a n ( s z a b v á ­ nyok, e l ő í r á s o k , ú t m u t a t ó k , az E T O r o m á n n y e l v ű k i a d á s a stb.). A s z á m í t ó g é p e s rendszerek l é t r e h o z á ­ sa a k é t i n t é z m é n y b e n új l e h e t ő s é g e k e t teremtett az e g y ü t t m ű k ö d é s r e , é s j e l e n t ő s e n m ó d o s í t o t t a a c é l ­ jaikat. Jelenleg a szakemberek figyelme a k ö v e t k e z ő feladatokra ö s s z p o n t o s u l : a f e l d o l g o z á s b a n a p á r h u ­ z a m o s s á g o k k i k ü s z ö b ö l é s é n e k s z i g o r ú b b e l l e n ő r ­ z é s e , a dokumentumok l e í r á s á n a k ( a d a t s t r u k t ú r á j á ­ nak) e g y s é g e s í t é s e , a k é t i n t é z m é n y b e n l é t r e h o z o t t i n f o r m á c i ó á l l o m á n y k ö l c s ö n ö s á t v é t e l e .

Ezeknek a c é l o k n a k a m e g v a l ó s í t á s a a z é r t l e h e t s é g e s , mert b á r a k é t I n t é z m é n y informatikai r e n d s z e r é n e k m á s - m á s a feladata, s a j á t o s a k a funk­

ciói, m é g i s vannak k ö z ö s v o n á s a i k Is. E l s ő s o r b a n az, hogy a hardver azonos, r o m á n g y á r t m á n y ú , s így e g y m á s s a l kompatibilis. Az Informatikai e g y ü t t m ű ­ k ö d é s e l s ő s z a k a s z á b a n az volt a c é l , hogy a hazai t u d o m á n y o s - m ű s z a k i irodalmi t e r m é s bibliográfiáját, amelyet a BN állít elő, a k ö z ö s e n m e g á l l a p í t o t t szerke­

zetben m á g n e s s z a l a g o n á t a d j á k az INID-nek.

A BN t ö b b sorozatban adja ki a nemzeti b i b l i o g r á ­ fiát. Ebben a v o n a t k o z á s b a n k é t sorozata é r d e k e s , a havonta k é t s z e r m e g j e l e n ő Carfl, a l b u m é , hartj ( K ö n y v e k , albumok, t é r k é p e k ) ó s az é v e n t e m e g j e l e n ő Teze de doctorat (Doktori d i s s z e r t á c i ó k ) . 1 9 8 3 - t ó l m i n d k e t t ő t Félix s z á m í t ó g é p e n készítik, eredeti prog­

ramok s e g í t s é g é v e l .

350

Ábra

Updating...

Hivatkozások

Updating...

Kapcsolódó témák :