• Nem Talált Eredményt

Az ideális parancsnyelv: a Dialog, a Data-Star, az Orbit, a Pergamon InfoLine és az STN parancsnyelvének összehasonlítása megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az ideális parancsnyelv: a Dialog, a Data-Star, az Orbit, a Pergamon InfoLine és az STN parancsnyelvének összehasonlítása megtekintése"

Copied!
15
0
0

Teljes szövegt

(1)

A Z IDEÁLIS P A R A N C S N Y E L V : A DIALÓG, A D A T A - S T A R , A Z O R B I T , A P E R G A M O N I N F O L I N E ÉS A Z S T N

P A R A N C S N Y E L V É N E K Ö S S Z E H A S O N L Í T Á S A

Nóvák Teréz

Országos Műszaki Információs Közponi és Könyviár

1. Bevezetés

Az Országos Műszaki Információs Központ és Könyviár ( O M I K K ) online számitógépes informá­

ciókereséseket végző részlegében jelenleg hat kül­

földi online szolgáltatóközponthoz van hozzáférési lehetőségünk. Ez a viszonylag nagy szám azzal ma­

gyarázható, hogy az O M I K K - h o z mint országos i n ­ formációs központhoz szinte valamennyi műszaki- t u d o m á n y o s szakterületről fordulhatnak informá­

ciókeresési kéréssel. A legtöbbet a Dialóg és a Data-Star szolgáltatóközpontot használjuk (1]; a Dialóg rendszert rendkívül gazdag adatbázis- kínálata és leginkább "felhasználóbarát" jellege miatt, a Data-Start pedig elsősorban földrajzi közel­

sége (a kisebb távközlési költség és az offline prin- tek gyorsabb megérkezése) miatt. Az Orbii és a Per- gamon InfoLine rendszereken főleg az exkluzív, azaz a csak általuk szolgáltatott és az adott tárgykör­

ben egyedülálló adatbázisokat szoktuk keresni. Az STN International rendszert eddig kizárólag a CAS Online által a Chemical Abstracts ( C A ) adatbázis keresésére nyújtott speciális lehetőségei miatt használtuk.

A felhasználókért folyó, erősödő piaci verseny a felhasználói igényeket minél inkább figyelembe vevő újdonságok bevezetésére készteti a szolgáltató­

központokat. Szinte havonta meglepnek b e n n ü n k e t valami egészen új vagy tökéletesített keresési lehe­

tőséggel, illetve adatbázissal. Az online piacon folyó verseny igazi nyertesei m i , felhasználók vagyunk.

Az utóbbi é v e k b e n megfigyelhető, hogy az egyes rendszerek igyekeznek parancsnyelvükbe beépíteni a többi rendszer előnyös keresési sajátosságait. Erre talán a legjellemzőbb példa a Dialóg parancsnyelv új változatának, a D I A L Ó G 2-nek a bevezetése volt.

A D I A L Ó G 2 bevezetése előtt a CA adatbázis kere­

sésére majdnem mindig a Data-Start választottam, mivel ennek volt n é h á n y , különösen a C A keresésé­

hez előnyösen használható parancsnyelvi sajátos­

sága (lásd k é s ő b b ) , ami a Dialóg parancsnyelvének régi változatából ( D I A L Ó G ) hiányzott. A D I A L Ó G 2-nek azonban m á r megvan valamennyi, korábban csak a Data-Star által nyújtott keresési le­

hetősége, ugyanakkor megtartotta az egyébként kifi­

nomultabb D I A L Ó G parancsnyelv egyéb előnyös jellemzőit (2).

A címben szereplő öt online rendszer (szolgálta­

tóközpont) öt k ü l ö n b ö z ő parancsnyelvet használ. A használatuk során szerzett tapasztalatok alapján sze­

retném összehasonlítani az egyes rendszerek legfon­

tosabb keresési sajátosságait, azok előnyeit és hiá­

nyosságait, valamint a szolgáltatóközpont kiválasz­

tásának szempontjait, különös tekintettel a kémiai tárgyú keresésekre. A kritikai összehasonlítás alap­

szempontja, hogy mi az ideális megoldás, keresési lehetőség a felhasználók számára, és azt az egyes rendszerek mennyire elégítik ki.

2. A legfontosabb keresési sajátosságok 2.1 Helyzeti operátorokkal való keresés

(proximity)

A helyzeti operátorok a keresőszavak egymáshoz viszonyított helyzetét szabják meg a rekordon belül.

Ezek alkalmazásával n ö v e l h e t ő a szabadszöveges keresés pontossága, és módot adnak a keresési stra-

(2)

Nóvák T.: Az ideális parancsnyelv..

/. lábiázai Helyzeti operátorok

A keresőszavak egymáshoz viszonyított helyzete

Dialóg Daia-Star Orbit* Pergőmön IiffoLine

STN

Egymás melleit, adott sorrendben + +

-

+

Maximum n szó távolságra,

adott sorrendben + + +

Egymás mellett, tetszőleges

sorrendben (NEAR) + - + +

Maximum n szó távolságra,

letszölegessorrendben (NEAR) + -

-

+ +

Egy mondatban vagy almezöben + " + + + " +"

Egy adatmezőben + + +

-

+ **

NOT típusú helyzeti operátorok +

- +** - -

" Nem minden adatbázisban használható helyzeti operátor.

"' Korlátozott, adatbázisonként változó alkalmazás.

tégia rugalmas kidolgozására és módosítására. A z / . táblázat mutatja az egyes rendszereken alkalmaz­

ható helyzeti operátorok típusait.

A helyzeti operátorok legnagyobb választékát a Dialóg biztosítja, a legszegényesebb a Pergamon InfoLine kínálata. A Dialóg rendszeren az egyetlen hiányosság, hogy az egy mondaton belüli előfordulást megszabó (S) operátor nem alkalmazható általáno­

san valamennyi adatbázisban. Ez a lehetőség külö­

nösen a teljes szövegű adatbázisok keresésére lenne j ó , de a kivonatban való keresést is megkönnyítené.

A z (S) operátor helyettesítésére jól alkalmazható azonban a keresőszavak tetszőleges sorrendű egymás melletti előfordulását megszabó N E A R ope­

rátor, ha a két szó között elég nagyszámú, egyéb szó közbejöttét is megengedjük ( n N ) . Használható v i ­ szont az (S) operátor a kémiai kereséseknél legfon­

tosabb két adatbázisban, a CA és a World Patents Index (WPI) adatbázisokban. A CA esetén ez azért különösen j e l e n t ő s , mert a deszkriptormezöt egy kötött címszóból (General Subjecl Index Heading vagy a vegyületeket azonositó Registry Number) és a hozzájuk kapcsolódó, nem kötött szavakból álló, magyarázó szövegrészt tartalmazó mondatok alkot­

ják. A szabadtárgyszó- vagy azonosítómező is több mondatból áll (Keyword Index), amelyek a publiká­

ció lényegi mondanivalóját kifejező szavakat tartal­

mazzák felsorolásszerűen (1. ábra). Az egymással szoros tartalmi kapcsolatban lévő fogalmak tárgysza­

vai nagy valószínűséggel egy mondaton belül fordul­

nak e l ő , és az (S) operátor lehetőséget nyújt a c í m b e n , egy azonosítómondatban, egy deszkriptor-

mondatban vagy egy szekciócímben előforduló tárgyszavak összekapcsolására. Az ( L ) operátor a deszkriptormezö egy mondatára való korlátozást leszi lehetővé.

A WPI adatbázis esetén az (S) operátorral kap­

csolhatók össze a kémiai szabadalmak indexelésére használt, külön almezökbe sorolt, összetartozó kémiai kódok. Alkalmazható azonban az (S) operá­

tor a címet és a kivonatot tartalmazó a d a t m e z ő b e n , ill. az alapszótárban tárgyszavak összekapcsolására is. Ez utóbbi lehetőségnek a W P I adatbázisban azért van nagy jelentősége, mert a kémiai és a villamos­

sági szabadalmak kivételével, a Nemzetközi Szaba­

dalmi Osztályozás viszonylag durva rendszerén kívül nincs kötött keresőnyelvi eszköz. A kémiai és villamossági szabadalmak indexelésére használt spe­

ciális kódokat azonban csak az adatbázis-készítő Derwent cég előfizetői érhetik el. A WPI adatbázis­

ban így a legtöbb esetben szabad tárgyszavas kere­

sésre kényszerülünk, amelynek a pontossága — a teljesség j e l e n t ő s e b b csökkenése nélkül - lényege­

sen növelhető a keresőszavak egy mondaton belüli előfordulását megszabó (S) operátorral.

A deszkriplormezőn belül, az egy almezöben elő­

forduló szavak összekapcsolására a Dialóg rendsze­

ren előnyösen alkalmazható az (L) operátor a több­

szintű deszkriptorokat ( f ő d e s z k r i p t o r - a l d e s z k r i p - tor párok) tartalmazó (pl. Medline, Compendex, FSTA) adatbázisokban, vagy a Predicasts adatbázi­

sokban az összetartozó t e r m é k e k , e s e m é n y e k és országok neveinek és/vagy kódjainak összekapcso­

lására is.

(3)

T M T 34. évf. 1987. 5. sz.

Azonosílómonaatok;

resoln mandelic add l - -a chromatog hydroxymandelic acid resoln liq chromatog

Deszk riptormonda lok:

Chromatog raphy, column and liquid < 1 high performance, for resoln ofmandelic 7 ^ j and hydroxymandelic acids J

90-64-2 1198-84-1 17119-15-2 * 3 high peMbrmance liq chromatog resoln of, ~)

using L-phenylalanine-copper sulfate í * • 2

complex elueni J 1 Kötött címszó

2 Nem kötött, magyarázó szövegrész 3 Registry Numberck

/. ábra Egy C A rekordhoz tartozó azonositó- és deszk nptormezo részlete

A keresőszavak egy mondaton belüli előfordulása a legszélesebb k ö r b e n , valamennyi adatbázis szinte valamennyi adatmezőjében a Data-Star rendszeren kereshető.

A NEAR operátor, amely a keresőszavak tetsző­

leges sorrendű egymás melletti (vagy m i n i m u m n szó közbejöttével) előfordulását írja elő, csak a Dialóg, a Pergamon InfoLine és az STN parancs­

nyelvének a része. Ennek az operátornak a haszná­

lata a CA adatbázisban különösen fontos, mivel nagyon sok deszkriptorkifejezés a szaknyelvben használt kifejezés invertált alakja. Például a t e r m é ­ szetes gumira a Naiuroi rubber helyett deszkriptor- ként a Rubber, natural kifejezési kell használni. Ha a teljes alapszótárra kiterjedő keresőprofilt akarunk megszerkeszteni, a NEAR operátorral mindkét forma k e r e s h e t ő egyetlen keresőkifejezéssel, példá­

ul a Dialóg rendszeren: S Natural (N) Rubber for­

mában.

A Pergamon InfoLine és az Orbit rendszeren több szóból álló kifejezések egy m á r kiválasztott re­

kordhalmazon belül, a soros állományban (a rekor­

dok "végigolvasásával") kereshetők kifinomultan ( S C A N , i l l . STRINGSEARCH vagy SENSEARCH, lásd 2.7 pont). Ez azonban időigényes művelet.

A helyzeti operátorokkal való kereséstől elvár­

ják a felhasználók, hogy a helyzeti operátorok alkal­

mazhatók legyenek a halmazszámokkal is, ami nagyon megkönnyíti és rugalmassá teszi a keresési stratégia utólagos módosítását. Ez a lehetőség az STN kivételével valamennyi rendszerben megvan, a Dialóg esetén a D I A L Ó G 2 parancsnyelv egyik új vonásaként. Az STN rendszeren a találati halmazok nem kapcsolhatók össze helyzeti operátorokkal (ez évre tervezik a lehetővé t é t e l é t ) , de az S STEPS pa­

rancs használatakor az egyes, k ö z b e n s ő keresősza­

vakhoz rendelt L-számok (nem valódi halmazok!) összekapcsolhatók.

A több keresőszó kombinációjából álló kereső­

kérdés bevitelekor az S STEPS keresőparancs alkal­

mazásakor a Dialóg rendszer minden egyes kereső­

szóra külön halmazt képez S-számok hozzárendelé­

sévei (2. ábra), az STN pedig L-számokat rendel hozzájuk; m i n d k e t t ő később újra felhasználható. A Pergamon InfoLine SELECT parancsának alapértel­

m e z é s szerinti sajátsága a közbenső halmazok kép­

zése. Ezzel szemben a Data-Staron és az Orbiton nem képződnek közbenső találati halmazok, ame­

lyek pedig nagyon sokszor szükségesek lehetnek a keresési stratégia módosításakor. Ha egy újabb kere­

sőkérdésben akarunk felhasználni egy adott kereső­

szót, ismételt beírása helyett elegendő a halmaz­

számra hivatkozni.

Keresőkérdés bevitele SELECT (S) paranccsal Inem képződnek halmazok az egyes keresőszavakra)

1 S Petroleum A N D Prices A N D O P E C A N D P Y = 1979 2711 Petroleum

2683 Prices 151 O P E C 101655 PY = 1979

51 83 Petroleum A N D Prices A N D O P E C A N D PY=1979

Keresőkérdés bemele SELECTSTEPS (S STEPS.SS) paranccsal (az egyes keresőszavakra is képződnek halmazok)

? SS Petroleum A N D Prices A N D O P E C A N D P Y = 1979 52 2711 Petroleum

53 2683 Prices 54 151 O P E C 55 101655 PY=1979

56 83 Petroleum A N D Prices A N D O P E C A N D PY = 1979

2. ábra Több keresőszóból álló keresőkérdés bevitele a Dialóg rendszeren S E L E C T é s S E L E C T STEPS

paranccsal

Szabadszöveges keresésnél, amikor egy foga­

lomra minél több lehetséges szinonimát kell figye­

lembe venni, gyakran felvetődik t ö b b , OR logikai operátorral kombinált keresőszóból álló keresÖkife- jezések helyzeti operátorokkal való összekapcsolásá­

nak a szükségessége (distributed proximity). Ezt mind az öt, itt tárgyalt rendszer lehetővé teszi, a Dialóg rendszeren ez is a D I A L Ó G 2 parancsnyelv új vonása. A helyzeti operátoroknak ez az alkalma­

zása igen gyakori a CA adatbázisban való keresések­

nél, hiszen itt m é g a deszkriptormezŐ nagyobbik része (a deszkriptorokhoz kapcsolódó magyarázó mondatok) is szabad szavakból áll.

A helyzeti operátorok alkalmazását a Dialóg, a Data-Star és az STN rendszeren a C A adatbázisban végzett keresési példán mutatom be. A feladat a

(4)

Novak T.: A i ideális parancsnyelv..

folyadék- és a vékonyréteg-kromatográfiában alkal­

mazható álló fázisokra vonatkozó publikációk meg­

keresése. A keresési stratégia elvi vázlatát a 3. ábra szemlélteti. Maga a keresés a 4. ábrán látható, a 4.a ábra a Dialóg, a 4.b ábra az STN, a 4.c pedig a Data- Slar rendszeren végzett keresést mutatja.

A keresöprofilok bevitelekor a 3. ábrán szereplő A N D helyen a legtöbb esetben a megfelelő helyzeti operátort alkalmaztam. A "chromatography OR chromatog" és a "liquid OR liq OR thin(W) layer", ill. a Data-Staron " t h i n A D J layer" keresőkifejezé­

sek vagy halmazszámaik összekapcsolására az egy

I. fogalomkör

Folyadék- vagy vékonyréleg-kromatográfia Ichromaiography OR chromalog']

A N D

[liquid OR liq" OR Ihin A N D layerl OR

H P L C O R T L C

II. fogalomkör Álló fázisok pack????

OR

stalionary AND phase?

OR sörben!1

OR support?

///. fogalomkör Gáz króm Biográfia

gas AND Ichromaiography OR chromatog*]

A végleges straiégta:

[1. fogalomköt AND II. fogatomköri NOT111. fogalomkör ' A C A szabványos rövidítései.

? = a csonkolás jele (egy ? maximum egy karaklen jelenít.

.?. ábra A folyadék- és vékonyréteg-kromatográfiás állófázisok témára a C A adatbázisban kidolgozott keresési stratégia vázlata

mondaton belüli előfordulást megszabó (S>, ( L ) , Ül. W I T H helyzeti operátori használtam a minél na­

gyobb teljesség kedvéért, hogy pl. a Chromaiog- raphy, column and liquid deszkriptorkifejezést is megtaláljuk. Ezt a keresőkérdés-sort a Dialóg esetén (4.a ábra) nem az S STEPS paranccsal, egy állításban vittem be, mivel a "liquid OR liq OR lhin(W)layer" keresőszavak halmazára külön később nem volt szükségem. A "chromatography OR chromalog" halmazra viszont szükségem volt később, és mivel nagy halmazok képzése a Dialóg rendszeren — különösen olyan nagy adatbázisok­

ban, mint a teljes CA adatbázis (1967-IŐ1 napjainkig több mint hétmillió rekord) — nagyon időigényes, külön halmazt képeztem rá (Sl>, amelyet azután (S) helyzeti operátorral külön lépésben kapcsoltam a "liquid... stb." szavakkal (S2). A gázkromatográfi­

á s szóba j ö h e l ő keresőkifejezések — gas chroma- tog(raphy); chromatography, gas; gas liquid chro- maiog(raphy) stb. — előhívására a "gas" szót kap­

csoltam ( I N ) helyzeti operátorral az Sl halmazhoz:

"chromatog(raphy)", és ezt zártam ki (S6) a folyadék- vagy vékonyréteg-kromatográfiára (S3) ÉS az állófázisokra (S4) vonatkozó rekordhalmazból (S5). Az STN-en (4.bábra) hasonló a keresőprofil,

azzal a különbséggel, hogy az első keresőkérdést egy lépésben, S STEPS paranccsal vittem be, mivel itt nem képződnek közbenső halmazok, viszont az egyes keresőszavakhoz rendelt L-számok felhasz­

nálhatók további keresésre (nem kell újra beirnt, de az L-számoknak megfelelő keresőszóra ismételt ke­

resést fog végezni a rendszer). A Data-Staron (4.c ábra) azokra a keresőszavakra, amelyekre külön is szükségem volt (pl. l-es és 9-es halmaz), illetve amelyek ö n m a g u k b a n nagy találatszámot e r e d m é ­ nyeznek (pl. 2-es és 3-as halmaz), külön halmazt képeztem, és kombináltam őket a már ismertetett logika szerint. A Data-Star rendszeren nem a nagy lalálatszámú halmazok képzése, hanem ezek

t/ff-ral való kombinálása ("összeadása") az időigé­

nyes lépés. Ezért a "chromatog(raphy)" halmaznak (l-es) a " l i q u i d " (2-es), a " l i q " (3-as) és a " t h i n ADJ layer" (4-es) halmazokkal W I T H operátorral külön-külön képzelt kombinációit kapcsoltam össze a logikai O/í-ral (5-Ös halmaz). Mivel a Data- Starban nincs N E A R operátor, a gázkromatográfia fogalmára kél formában kerestem; "chroma- tog(raphy)" (l-es) A D J "gas" (9-es) OR "gas A D J chromatog(raphy)", másképpen 9 A D J 1 (10-es halmaz).

(5)

T M T 3 4 . évf. 1987.5. sz.

F i l c Z99-.CH SEARCH 1947-1984 UDM0420

• C O B C 1986 L J ttie Anor. Chca. 5 o c >

Sül I L G Í . S Pdicr ipt ion

?S CHROMATOGRAPHY OR CHROMATOG Fr ocessina

S6140 CHROHATOGRAFHY ÍSEt ?IGN0TE>

120194 CHROMATOG

51 129024 CHRONATGGRAPHY OR CHROMATOG ' S S K S V U Q U I P OR LtO OR THIN>:U>LAYER>

Processi na

F ' T D C G S S rna

129024 S l 209473 LIOUIP 130391 LIO CLIOUIK

51379 THIN

Í.79QZ LAYER

19243 IHINítT'LAYEIÍ

52 55087 SlCSXLIGUICi OR LIO OR THINtll>LAYEft>

?S S2 OR HF'LC OR TLC Processina

Processing

550B7 S2 757B HPLC 373B TLC

53 54581 S2 OR HPLC OR TLC

PACK77T? OR SA TATIONARYCU/PHASE'' ? OR G0RBEHT7 ? OR SUPPORT?*?

Frocessins

15342 PACK7777 7679 STATIONARY 255377 PHASE? ?

4715 STATIONARY<U>FHASE? ? 5248 SORBENT? 7

27605 SUPPORT???

54 5103* PACK??*? OR STATIOWARYÍIOPHASE? ? OR SORBENT? ? OR SUPPORT???

"C3«4 fr-ct (•'.-. ins

565B1 3 51834 4 SS 3<J54 3>4

?S S5 NOT BAS<1H>SI Frocessina

Frocesiina

3954 S5

£íl£

129024 Sl 482»9 GASC1N>S1 SA 2894 SS NOT MS<1K>S1

"LOGOFF

04junB4 03:54:41 User033285

»9.S1 0.109 Krs Filc399

4.a ábra Keresési példa a C A adatbázisban (Dialóg 399-cs fájl)

2.2 Csonkolás

A Pergamon InfoLine kivételével valamennyi rendszer lehetővé leszi a jobb oldali (szóvégi) cson­

kolási meghatározott vagy tetszőleges számú karak­

terre. A Pergamon InfoLine csak a tetszőleges számú karakterre való csonkolást engedi meg, i l l . speciális végződésekkel rendelkező szótőre kereshe­

tünk, pl. c o l _ ( o u r OR or). ( A soros állományban való kereséskor jóval több csonkolási lehetőség van, m é g bal oldali csonkolás is.) A Data-Staron a jobb oldali csonkolás kissé n e h é z k e s lehel, ha túl erősen csonkoltunk, mivel a rendszer csak száz, az

adott szótövei kezdődő keresőszót lud megkeresni egyszerre, és a keresés folytatását további százsza­

vanként kell mindaddig kérni, amíg a szótárállo­

mányban ilyen szótövü szavak találhatók.

A Data-Star kivételével valamennyi rendszer le­

hetővé teszi a szón belüli karaktermaszkolást.

Különösen a kémiai kereséseknél lenne fontos a bal oldali (szóeleji) csonkolás, amely lehetővé teszi bizonyos vegyületfragmentumokat, csoportokat tar­

talmazó vegyületek megkeresését. A bal oldali cson­

kolás általános érvényességgel egyik rendszeren sem megengedett. A vegyületnevek esetén ( i l l . a Dialóg rendszeren a CA adatbázisban általános

(6)

Nóvák T.: Az ideális parancsnyelv..

FILE 'CA' ENTERED AT o2!45:29 ON 0 6 JUN 36 COPYRIGHT 1986 BY THE AMERICAN CHEHICAL SOCIETY

= > 3 STEPS • CHROMATOGRAPHY OR CHROMATOG'" L VLIQUID OR LIO OR THIN<W>LAYER>

L l < 38*49>CHR0HATGGRAPHY L2 < 120*47>CHR0HATGG L3 í 140788>LIQUID L4 < 13o910>LIQ L5 í 51320JTHIN L6 < 68229>LAYER

L7 55302 (CHROMATOGRAPHY OR CHROMATOGXLXLIGUID OR LIO OR THINÍHUA -= 5 L7 OR TLC OR HPLC

3765 TLC 7692 HPLC

L8 56814 L7 OR TLC OR HPLC

»> 3 PACSÍÍí! OR GT AT I • NA R Y •;U•P HAS E f OR 50RPENTÍ OR SUFPORT;ií 15*09 PACKíiíí

7730 STATIONARY 162097 PKASEí

4760 STATIONARYi'lDPHASEf 5227 SORBENT*

27741 SUPPORTtíí

L9 52030 PACKÍii! OR STATIONARYÍ IPPHASEi OR SORBENT! OR SUPPORTü;

-> S L3 AND L'

LIO 3997 LS ANB L?

•» S í t l OR L2 X I AJ GAS 30449 CHROMATOGRAPHY 170447 CHROMATOG 233045 GAS

L l l 43*30 CLÍ OR L 2 K W G A 8 - 5 LIO NOT L l l

L12 293Z LIO HOT L l l

= : LOGOFF Y

COST IN POUNDS STERLING 3INCE FILE TOTÁL ENTRY SE3SI0N FIJLL ESTIMATED COST 4.74 *.95 DISCOUNT AM0UNT3 'TOR QUALIFYING ACC0UNT3>

CA SUPSCRI&ER -0.56 -0.54 STN INTERNATIONAL LOGGFF AT 02:49=44 ON Qé JUN 8 6

4.bábia Keresési példa a C A adatbázisban (STN CA-fájl)

tárgyszavaknál is) a bal oldali csonkolás pótlására szolgál a vegyületnevek fragmentálása, ami azt je­

lenti, hogy az adatbázis szótárába belekerül a teljes név is, valamint a központozási jeleknél ( " - " ,

" ( ) " , " l ] " ) , ill. a kémiai jelentésű szótöredé­

keknél való hasítással kapott névfragmentumok is (5. ábra). Ezek helyzeti vagy logikai operátorokkal való összekapcsolásával bármely vegyület vagy rész- szerkezet egyszerűen és flexibilisen leírható.

A vegyületnevek fragmenlálására alkalmazott al­

goritmus a Dialóg rendszeren a Chemical Abstracts bibliográfiai (CA Search) és a vegyületszótár- (Chemname, Chemsis, Chemsis, Chemzero) adat­

bázisok mellett a Claims és a WPI szabadalmi adat­

bázisokra is kiterjed, jelentősen megnövelve a ve­

gyületekre vonatkozó keresések teljességét, ami a

szabadalomkutatásoknál különösen fontos. A Data- Star is alkalmazza ezt a fragmentálási rutint a CA adatbázisokban, az STN viszont csak a vegyületszó­

tárnak megfelelő Regislry File-ban, a CA bibliográ­

fiai adatbázisban viszont nem.

Az Orbit és az STN rendszerek néhány adatbázi­

sában a bal oldali csonkolás is megengedett, igy az Orbilon a C A , a Compendex és az Ei Engineering Meetings adatbázisokban. A Dialóg és a Pergamon InfoLine védjegy-adatbázisaiban (Trademarkscan, ill. UK Trade Marks) is van lehetőség a szavakon belüli karakterlánc keresésére. Az Orbit és a Perga­

mon InfoLine nyújtotta közvetlen, soros keresési le­

hetőség valamennyi adatbázisban biztosítja a bal oldali csonkolást, azonban sok gépidő-felhasználás­

sal.

(7)

T M T 3 4 . évf. 1987. S . S Í .

D-S/CrlZZ/CHErl APS 1967-V104.I20/19M SESSION 1414 COPYRIGHT EY AMERICAN CHEMICAL SOCIETY. COLUMBUS/OHIO. U.S.A.

P-S - SEARCH MOPE - ENTER QUERY

L_: 'CHROMATOGRAPHY OR CHROMATOG/.DE.I S I . T I . RESULT I2S4É3

LI8UID RESULT 140499

L I Q

RESULT 134199 4_: THIN ADJ LAYER RESULT 19257

5_: I UITH 2 OR 1 WITH Z OR 1 WITH 4 RESULT 52012

6.: 5 OR HPLC OR TLC RESULT 54310

7_: ."FACKÍ4-0R STATIONARY APJ F HASEI1 OR SORBENTtl OR SUFF'0RTt3.-.PC S l . T I . RESULT S l i i o

8 . : 6 ANP 7 RESULT 3706 1_: GAS

RESULT 245Í22 10.: 1 APJ 9 OR 9 AEJ 1

RESULT 45074 l l . l 3 NOT 10

RESULT 2729 12.: . . o

•CONNECT TIME CHZ2: o:05:06 HH:HM:SS D.085 PEC HRS. 3ESSI0N !41«>

4 i ábra Kertitsi példa a C A adatbázisban (Dala-Slar C H Z / adatbázis)

1.4-butanediol * credeli név

2.4 A szótárállomány felépítése

4

butaitediol A Dala-Star kivételével valamennyi vizsgált

rendszerben löbb szótárállomány van: egy alapszó­

tár, amely a téma szerinti kereséseknél fontos, ú n . tematikus mezők (cím, deszkriptorok, szabad tárgy­

szavak, kivonat, osztályozási szekció címe) egyes szavait tartalmazza, valamint az egyéb, inkább a bib­

liográfiai adatelemeket tartalmazó ú n . kiegészítő szótárak. A Data-Star adatbázisoknak egyetlen szó­

tárállományuk van, ami sokszor m é g a valamennyi tematikus m e z ő r e kiterjedő keresésnél is szüksé­

gessé teszi a m e z ő k r e való minősítést (4.c á b r a ) , mert bizonyos keresőszavak előfordulhatnak pl. a folyóirat címében vagy a szerző n e v é b e n .

5. ábra Az 1.4-butanediol fragmentálása a Dialóg rendszeren

2.3 Halmazszámok utólagos minősítése

adatmezőre

A szótárállomány kapcsán szeretnék kitérni a

deszkriptorok keresésére. A Data-Star kivételével valamennyi rendszer valamennyi adatbázisában az összetett deszkriptorkifejezések eredeti formájuk­

ban (helyközzel, vesszővel stb.) is és szavanként is bekerülnek az alapszótárba (double posting = kettős szóelöfordulás), és mindkét m ó d o n kereshe­

tők. Ez lehetővé teszi, hogy egyetlen deszkriplorszó keresésével előhívjuk valamennyi, az adott szót tar- Ezt a lehetőséget csak a Data-Star és a Dialóg új

változata, a D I A L Ó G 2 nyújtja. A halmazszámok utólagos minősítésével az alapszótárban végzett ke­

resés e r e d m é n y e k é n t kapott rekordhalmazt a kere­

sési stratégia módosításakor igen egyszerűen korlá­

tozhatjuk utólagosan pl. a deszkriptor- vagy címme­

zőre a pontosság növelése érdekében.

(8)

Novak T : Az ideális parancsnyelv..

lalmazó deszkriptorkifejezéssel indexeli rekordot, pl. az AHoys szó kereséséve! az Alumínium Alloys, Gallium Alloys stb. deszkríptorokat. Ezenkívül a több szóból álló deszkriptorkifejezések az egyes szavak helyzeti operátorokkal való Összekapcsolásá­

val is kereshetők.

A Dialóg és az Orbit rendszerben az is megkülön­

böztethető, hogy egy deszkriptorként keresett szó egyszavas deszkriptor vagy egy összetett kifejezés része-e ( D F , D E , ill. I T , 1W).

A Pergamon InfoLine rendszeren a deszkriptor­

kifejezések egyes szavai szerepelnek ugyan az alap­

szótárban, de a deszkriptormezöre korlátozva csak kifejezésként kereshetők ( C T = ) .

A Data-Star esetében egyes adatbázisokban, pl.

INSPEC, Medline az összetett deszkriptorok csak teljes kifejezésként kerülnek be a szótárba, és egyes szavaik alapján nem kereshetők, ami nagyon meg­

nehezíti a keresést. Az ötvözetek példáját véve: ha valamennyi fém ötvözetét meg akarjuk keresni, akkor az összes olyan kifejezésre keresnünk kell, amelynek második szava az "alloys" s z ó , és ilyen szép számmal akad.

A legrugalmasabb keresést a Dialóg adatbázisok szótárállománya teszi lehetővé. Sok, tezaurusszal rendelkező adatbázisba m é g a tezaurusz is be van építve, és ennek tanulmányozásával ( E X P A N D ) online is megkereshetők az adott témát leíró deszk­

riptorok. Végezetül az egyes adatbázisok szótárállo­

mányának felépítése és az adatmezők jelölése is itt a legegységesebb, ami — több adatbázisra kiterjedő kereséskor — megkönnyíti a keresési stratégia átvi­

telét egyik adatbázisból a másikba. Ez legkevésbé a Data-Starra m o n d h a t ó el, ahol pl. a CA adatbázis deszkriptormezőjének a mezőazonosítója az általá­

nosan elterjedt DE helyett Sl.

2.5 Megőrzési parancsok

A keresési stratégia mind az öt rendszeren ideig­

lenesen (általában az adott hét végéig) és tartósan megőrizhető, későbbi újrafuitatásra. A Pergamon InfoLine rendszeren azonban egyidejűleg több kere­

sőprofil nem őriztethető meg ideiglenesen.

Az STN parancsnyelve ezenkívül egyedülálló le­

hetőséget nyújt a találati halmazok megőrzésére is, ami lehetővé teszi a rekordok későbbi kinyomtatá­

sát. Erre pl. olyankor lehet szükség, ha a keresés során nem tudjuk azonnal eldönteni, hogy releván­

sak-e a találataink. Ilyenkor a keresést megszakítva és konzultálva a végfelhasználóval, majd ismét visz- szakapcsolódva a rendszerbe, a hét folyamán bármi­

kor kiírathatjuk a megőriztetett találati halmazt.

Vagy pl. a rendszer felső határainak (max. megenge­

dett rekord- vagy halmazszám) túllépése esetén megőrizhetjük a feltétlenül szükséges rekordhalma¬

zokai, majd a nemkívánatos halmazok törlése és a megőrzött halmazok előhívása után tovább folytat­

haljuk a keresést. A találati halmazok megőrzésének a lehetősége arra is módot ad, hogy kérjük a folya­

matos témafigyelés (SDI) e r e d m é n y é n e k megőrzé­

sét helyi nyomtatás céljára.

Valamennyi rendszerben van lehetőség a megőr­

zött keresöprofil "megtisztítására", vagyis azoknak a halmazoknak a törlésére, amelyekre a későbbi fut­

tatásnál nincs szükségünk. A Dialóg és a Pergamon InfoLine rendszereken erre külön szövegszerkesztő program (EDIT) szolgál, míg a másik három rend­

szeren ez egyszerű parancsokkal végezhető el.

2.6 Találati rekordok adatelemeinek automatikus felhasználása keresésre

Az Orbit, az STN és a Pergamon InfoLine pa­

rancsnyelve valamennyi adatbázisban lehetővé te­

szi, hogy adott rekordhalmaz tetszőleges a d a t m e z ő ­ jében található egyes adatelemeket (pl. deszkrípto­

rokat, a szerzők nevét) újrabeírásuk nélkül, auto­

matikusan felhasználjuk további keresésre, ugyan­

abban vagy egy másik adatbázisban. Erre az Orbit rendszeren a PRINT SELECT, a Pergamon infoLine-on pedig a G E T parancs szolgál. A kigyűj­

tött adatelemeket az eredetitől eltérő adatmezőre is átminősíthetjük (QUALSELECT, i l l a GET parancs speciális argumentuma). Az STN-en csak az elmúll évben vezették be ezt a lehetőségei (SELECT, i l l . EDIT az a d a t m e z ő átminősítésére). A Dialóg rend­

szer M A P parancsa csak meghatározott adaibázisok bizonyos adatmezőiben működik, tehát nem any- nyira általános érvényű, mint az előbb említett rend­

szereken. A Data-Staron viszont egyáltalán nincs ilyen lehetőség.

Az adatelemek kigyűjtésének és keresésre való újrafelhasználásának néhány tipikus esete:

• a CA vegyületszótár-adatbázisban megtalált Re- gistry Numberek automatikus átvitele a CA bib­

liográfiai adatbázisba és a rájuk vonatkozó hivat­

kozások megkeresése (erre a Dialóg rendszeren a M A P R N parancs szolgál, lásd 6. ábra);

• a CA vegyületszótár-adatbázisban megkeresett vegyületek szinonim elnevezéseinek kigyűjtése, majd felhasználásuk más adatbázisokban való ke­

resésre. A Dialóg MAPSY parancsával kigyűjtött, több szóból álló vegyületnevek más adatbázisba való átvitelekor a Dialóg például automatikusan a ( W ) helyzeti operátorral (egymás mellett, adott sorrendben) kapcsolja össze az egyes szavakat.

Ez rendkívül megkönnyíti a vegyületek keresését

(9)

T M T 34. évi. 1987. 5. S Í .

filé 301:CHEK«AÍ1E[tm> I 9 6 7 - S E P 8 5 1,547,12:3 5UbS I C o p c . D i a l o q I n f . S e t . I n e . l s í í )

S í t I t e m s D e s c r i p t i o n

? S E L E C T S Y - A L I M I N A

S l [ S Y Í A L U M I N A

? T Y P E 1/2 1 / 1 / 1

CAS R E G 1 S T B Y N U M B E B : 1 3 4 1 - 2 8 - 1 F O B H U L A : M i O J

BEPLACED C A S B E C 1 S T R I H I M B E R ( S ) : 1 2 5 2 2 - 8 8 - 2 1 2 7 3 7 - 1 6 - 5 1 9 3 5 1 - 4 9 - 9 5 3 8 0 9 - 9 6 - 4 6 7 8 5 3 - 3 5 - 1 6 7 8 9 4 - 1 4 - 8 6 7 8 9 4 - 4 2 - 2 6 8 1 8 9 - 6 3 - 1 6 8 3 9 9 - 4 2 - 4 6 8 3 8 9 - 4 3 - 5 9 0 6 6 9 - 6 2 - 8

CA NAWEI51 :

HP-Aluroinum o x i d * IA1203I 1 9 C I ] KP"Ai JIP jnum o x i d é I S C I I

5 Y N 0 N Y M 5 L F a s e t t o n ; F a 5 e t t o n e r d e ; A l u m i n a ; E x o l e m XH 6 0 ; . a l p h a . - A l u m i n a ; .qanüQA. - A l u m i A a ; . , . i - r . j , - A l i a n i - num o x i d é ; . aiprLa.-Aluifii num o x i d é ; L u c a t o x ; . e t a , - A l JJTI: n a ; L u d ű i C L ; Á l o n ; Alummum t r i o i i d t j H a j t a x i n ; c o n o p a l ; A l u m i t e ; A l u r o i t e ( o x i d é ) ; A l u n i n u n o n d e íBiockmaíin) ; . be t a . - A l u m i n u m o x i d é ; L A 6;

D l a l u m i n u m t i l o x i c e ; ALurdum 6 0 0 : D i s p a l M ; P S l l a l u m i n a ) ; C a L - O - G r i p ; A l . n i t e ; KHP 2 ; A l o x i t e ; H y p a l o x I I : KA 101; Aluminum s e s q u i o x i d e : C a C A p a l S ; P o r a m i n a r D i s p a l ; K e t j e n B: A l u m . n i t e 37; P S 1; A l c o a F 1; A l o n C Cocopalox; Dotnent 3 2 4 ; D o t n e n t 358; Q - l o i d A 3 0 ; NeoDead C ; M i c r o q i i t tfCA; . d e l t a . - A l u j T ú n u m o x i d é ; A l u m o q e l A 1; A 1; A L t s o r b H l t ) ; e 3 6 0 ; P 3 6 0 [ a l u m i ; i a >

JuOenon B : G O t o m d e ) ; G 0 ; C 2 < e i i d * ) ; G K ( o x i o e ) ; G 2 C K ; P C 172DBM; Alufflina C . g a m m a . ; A l u m i n a s o l 100; ü e i o 1 0 0 ; K i ü l j L i n d e A ; CKA; A O 5 0 : A0 2 S | A0 1 0 : Mrt í l ; H A l K m e t a l o x i d é ) ; K A 11; K y o a a c d 200; J R C - A L O 4; A L

1 3 ( o x i d é ) ; A L 1 3 : KHD 4 6

Í.HAPBN S l

1 s e l e c t s t a t e m e n t I s ) a e n a l SD03J

Í B E G I H 309

F i l e 309:CA S e a r c h - 1 * 7 2 - 1 9 7 6 ICOpt , 1984 Dy t n e Amet. Chem. S o c . )

Set I t e n s D e s c r i p t i o n

?EXECUTE STEPS SD037 10956

JB 0 49 1 0 0 0 0 0 0 0 11007

B M = 1 3 l 4 - 2 8- l B N - 1 2 5 2 2 - 8 8 - 2 BN • 127 3 7 - 1 6 - 5 B N = 3 9 3 5 4 - 4 9 - 9 B N - 5 3 9 0 9 - 9 6 - 1 U N - 6 7 9 5 3 - 3 5 - 4 R M - 6 7 8 9 1 - 1 4 - 8 B N . 6 7 8 9 1 - 1 2 - 2 B N > 6 8 1 8 9 - 6 8 - 4 B M . 6 8 3 8 9 - 4 2 - 4 R j l . 6 8 3 8 9 - 4 3 - 5 B N - 9 0 Í 6 9 - 6 2 - 9 B H ' 1 3 4 4 - 2 8 - 1 • B N - 1 2 7 3 7 - 1 6 - 5 B N - 5 3 8 0 9 - 9 6 - 4 B N -6 7 8 9 4 -1 4 -8 B N ' 6 8 1 8 9 - 6 8 - 4 B N' 6 8 3 8 9 - 4 3 - 5

S E E 7 I C N 0 T E )

B N - 1 2 S J Í - 9 9 - 2 • B N - 3 9 3 5 4 - 4 9 - 9 - B N - 6 7 8 5 3 - 3 5 - 4

• B B - 6 7 8 9 4 - 4 2 - 2

• R M - 6 8 3 S 9 - I 2 - 4 B N - 9 0 6 6 9 - 6 Í - 8

6. abra A M APRN parancs használata a Dialóg rendszeren

azokban az adatbázisokban, amelyekben nincse­

nek deszkriptorok vagy egyéb kötött kereső­

nyelvi eszközök (pl. speciális kódok) a vegyület- keresésre (7. ábra);

• a CA adatbázisban talált szabadalmak szabada­

lomszámának vagy prioritási számának kigyűj­

tése, majd a megfelelő rekordok megkeresése

ezek alapján a Derwent WPI adatbázisában, amely a CA-val ellentétben kivonatot (mégpedig nagyon j ó t ) és a szabadalomcsaládra v o n a t k o z ó információt is tartalmaz (erre a Dialógban a M A P P N , i l l . a M A P A N parancs szolgál);

egy ismert, releváns szabadalom rekordjáról a nemzetközi és/vagy az amerikai szabadalmi osz­

tályozás jelzeteinek kigyűjtése, majd felhasználá­

suk az adott t é m a k ö r b e n végzett téma szerinti ke­

resésnél (a Dialógban a M A P I C vagy a M A P C L parancs segítségével);

a WPI adatbázisban, a nemzetközi szabadalmi szervezetek (EPO és WIPO) szabadalmaiban hi­

vatkozásként szereplő szabadalmak számának k i ­ gyűjtése, majd ezekre keresve a hivatkozott vagy a rájuk hivatkozó, későbbi szabadalmak rekordjá¬

nak megkeresése (a Dialóg M A P C T parancsa);

? BEG1N 301

File 301 CMEMNAME(TM) I967-Jun86 1.689 212 SUBS ICopr Dráma lnl.Serlne.19S6]

Sel llertis Deserrpnoti

? SELECT SY^LIDOCAINE Sl 1 SY = UD0CAINE

? TYPE 1J5 1)911

CAS RÉGISTBY NUMBER: 137-58-6 FORMULA' C14M22N20 3ING SYSTEM DATA;

(01) !nr=Ql: sr^6; ar- fr-C6 01. *'46-150-18)

FEPLACED CAS HEGISTRY NUMHER(S1 6059-42-5 6059-66-3 91481-71-8 CA NAMEfSl:

MP = AcelamirJe I9CI). SB=2-(aicir,)ían>in[i)-N-[2.6-íime"iylpnenyl)-HP = 2.6'-AcetcixylirJiae (SCn. SB^Mdieinyiammol-

SYMONYMS. alolia.-tJ«lhylanimo-26-acel(liylxJ«e. 2-(Oielnylaminol-2".6'-acem.ylKlioe líicaine. Leostes hj Lidocame- Lignocame: Maricainfl; Rucama: Xycaine: •'. Kyloofin Duncaine: Xyieatesin: GJavocam. Anestacon; Solcam- Xy*xa,n; Isicama; Xjlpna; Xyline Perwi:aine: Medicame

? WAPSY TEUP ' seieci Mateintfrlti]

serrai-TDJ42 ' BEGIN 16

F'le 16PR0MT • 72-96'Ajg. Week 1 (Copr. Predicasfa Inc. 1986)

" M&nlhly SOI service for Ihis lile is rvort availaOle.

" Week'y SOI ier»ite is oniy availaBie on 0IA10G i.

Sel llems Descrierioíi ' EXS T 0 3 1 2

ANESTACON OUNCAINE EHAVOCAIN

SIC AIWA IS ICÁIN E LEOSTESIH LID0CA1NE LIGNOCAINE IMRICAINE UEOICAINE REHICAJNE RUCAINA SOLCAIN IILINA JYCAINE IYLÉSTES1N 1YLINE IYLOCAIN XYLOCAINE HVLOCITIN

ANESTACON + DUNCAINE • GfiAVOCAIN + ISICAINA * ISICAINE * LEOSTESIN •• LIDOCAINE + LIGNOCAINE * MARICAINE t UEOICAINE + REUICAINE * HUCAINA - SOLCAIN + XILINA + IYCAINE • XYLESTESIN + XYLINE -f XYLOCAIN t XYLOCAINE * SYLOCITIN

? TYPE lfi/3 I I M 1350663

PharmaceuEical^AnaesIhelic replacflmem Írom Aslra ManuracEunnn, Cnemisl A Aerosoi Na*s Apni o. 1998 p. 20

Asira Pharmaceuncal? (US) rias úaveloped a locai anaeíiheit ceam. Emla. wnirjt coü'd replace local ariaesltielK inieclion. An eutechc mmure Dl pjilocaina and lignocelni nas been deualoped lo űvercome ihe problem ot a lormjialion coniammg anaísrhenc n sullicieni corKenlralion tor il lo De aDsQ'bec The cream i5 aDP'ied ft>r a rnin.mum ol nour under a oc:ijS'va (frankig, wnen ine ceam is *iped oii. anflearnesia lasis lor 3<

mxi.

•IUSA -IJniied Srares "2834260 "Anestr-eiic Preparalions '33 'proOucu: 'Astr P ü a i r r - j ü F i i M i i i Pifid

7. ábra A MAPSV parancs használata a Dialóg rendszeren

(10)

Nóvák T.: Az ideális parancsnyelv..

• a WPI adatbázisban a szabadalmak prioritási szá­

mának ismételt felhasználása keresésre az ú n . eltérő, nem uniós elsőbbségű, de az adott szaba­

dalommal tartalmi kapcsolatban lévő (related) szabadalmak feltárására ( M A P A N vagy MAPPR a Dialógban);

• a téma szerinti kereséssel kapott találati rekordo­

kon szereplő cégekre (pl. szabadalomtulajdonos, szerző munkahelye) vonatkozó információk megkeresése a céginformációs adatbázisokban.

2.7 Közvetlen keresés a soros állományban

Már a helyzeti operátorokkal való keresés (2.1 pont) és a csonkolás (2.2 pont) sajátosságainak tár­

gyalásakor utaltam erre a keresési lehetőségre, ame­

lyet csak az Orbit (STRINGSEARCH, SEN- SEARCH) és a Pergamon InfoLine (SCAN) nyújt.

(Korlátozott m é r t é k b e n a teljes szövegű adatbázi­

sokban az STN-en is lehetséges, a DISPLAY BROWSE parancson belüli SEARCH paranccsal).

A soros keresés kifinomult módot nyújt arra, hogy tetszőleges karaktersort, kifejezést keressünk egy már kiválasztott, lehetőleg nem túl nagy rekordhal­

maz rekordjain belül. így alkalmazhatjuk a bal oldali csonkolást, tiltott szavakat (stopwords, pl. of, for, by) tartalmazó kifejezésekre is kérdez' etünk stb.

ranccsal pedig az egész további keresés korlátozható bizonyos szempont szerint.

A Data-Star L I M I T parancsa nem terjed ki minden adatbázisra, így pl. a CA adatbázisban nem alkalmazható, és adatbázisonként változnak a korlá­

tozható adatmezők. Itt a L I M I T parancsban mindig meg kell adni a mezők azonosítóját (amely szerint a korlátozás történik), egy relációs operátort ( = , > , < ) és az adatelem értékét:

. . L I M I T / N Y R > 8 2 az /r-edik sorszámú halmaz korlátozása az 1982 után publikált do­

kumentumokra.

Az STN RANGÉ parancsa csak időszak szerinti szűkítést tesz lehetővé.

Az Orbit és a Pergamon InfoLine parancsnyelve nem rendelkezik korlátozó paranccsal. Az Orbíton azonban lehetőség van a k e r e s ő m ó d b a n évszám sze­

rinti korlátozásra relációs operátorok alkalmazásá­

val: pl. n A N D P Y > 8 2 ( n = halmazszám). Az Or­

bíton és a Pergamon InfoLíne-on — nem túl nagy halmazok esetén — leghatékonyabban soros kere­

séssel szűkíthetünk a korlátozni kivánt adatelem ak­

tuális értékére. Például az angol nyelvű publikáci­

ókra való korlátozás:

S T R I N G S E A R C H / L A English (Orbit) SCAN L A = English (Pergamon InfoLine)

2.8 Korlátozási ( L I M I T ) parancs

Ezzel a paranccsal egy már kiválasztott rekordhal­

maz tovább szűkíthető év, nyelv, d o k u m e n t u m t í p u s stb. szerint. Erre a legegyszerűbb és leggyorsabb le­

hetőséget a Dialóg biztosítja. A Dialóg rendszeren például valamennyi adatbázisban lehetőség van az adatbázisba való bekerülés éve szerinti korlátozásra a rekordok azonosítószáma (Accession N u m - ber = A N ) alapján, amit pillanatok alatt elvégez a rendszer:

L I M I T n/650001-999999,.

/ t \

halmazszám alsó halár elméleii felső (megfelel va- halár lamely év el­

ső AN-jének)

A többi korlátozási lehetőség adatbázisonként változik. A D I A L Ó G 2 lehetőséget ad arra is, hogy a L I M I T parancs paramétereit a SELECT paranccsal használjuk a keresőszó vagy halmazszám után bevitt utótag (suffix) formájában: pl. S Laser/ENG a lézerrel kapcsolatos angol nyelvű publikációk ke­

resésére. A keresés elején bevitt L I M I T A L L pa-

2.9 Nyomtatási formátumok

Valamennyi rendszer lehetőséget nyújt bizonyos adatmezők kombinációjából álló, " e l ő r e gyártott"

formátumok vagy tetszőleges adatmezők online vagy offline kinyomtatására. A Data-Staron és a Dialógon a felhasználó által gyakran használt, adatbázis-specifikus formátumok is definiálhatók.

Tetszőleges adatmezők kijelölésének a lehetőségél, mint nyomtatási formátumot, a Dialóg és az STN rendszeren csak n e m r é g vezették be. Ennek segítsé­

gével a CA adatbázisban pl. mód van arra, hogy olyan formátumokat jelöljünk k i , amelyek az index­

mezők közül a relevancia megítéléséhez általában elegendő információt tartalmazó és nem túl hosszú azonosítómezöt tartalmazzák egyéb mezőkkel (pl.

csak a cím- vagy a bibliográfiai adatokat tartalmazó mezők) kombinálva, de a gyakran egy-két oldal hosszúságú deszkriptormező nélkül. Ennek különö­

sen az online nyomtatásnál van jelentősége.

A Dialóg, a Data-Star és az STN teljes szövegű adatbázisaiban, valamint az Orbit néhány adatbázi­

sában kiíratható a rekordnak az a része, amelyben a keresőszavak előfordulnak. Erre a Dialóg rendsze-

(11)

T M T 3 4 . évi. 1987.5. sz.

ren a KWIC (KeyWord-In-Context), a Dala-Staron a HITS és az OC (OCcurence), az Orbiton a HIT paraméler nyomtatási parancson belüli alkalmazásá­

val, az STN-en pedig a DISPLAY BROWSE paran­

cson belül van lehetőség. Az STN-en ezenkívül au­

tomatikusan, a Dialóg rendszeren pedig a HILIGHT lehetőség (SET H I L I G H T O N ) alkalmazásával a szövegen belül a találatot e r e d m é n y e z ő keresősza­

vak, m e g k ü l ö n b ö z t e t v e , kiemelten jelennek meg.

A Dialóg egyes, elsősorban céginformációkat tar­

talmazó adatbázisokban speciális kinyomtatási lehe­

tőséget kínál a REPORT paranccsal. A találati halmaz rekordjainak néhány adatelemét (pl. a cég neve, létszáma és éves forgalma) ezzel táblázatba

rendezve írathatjuk k i . Ez a nyomtatási forma egy­

részt á t t e k i n t h e t ő b b , másrészt olcsóbb, mint a teljes rekord kinyomtatása.

A Pergamon InfoLine egyedülálló, statisztikai analízis végzésére alkalmas GET parancsának segít­

ségével egy adott rekordhalmaz valamely adalmező- j é b e n szereplő adatelemeket előfordulási gyakorisá­

guk szerint rangsorolva gyüjthetjük ki {pl. azoknak a cégeknek a nevét az I N P A D O C adatbázisban, amelyek egy adott t é m a k ö r b e n a legtöbb szabadal­

mat nyújtják be). A kigyűjtött adatelemek ismételt keresésre való felhasználásáról m á r a 2.6 pontban szó volt.

2.10 Grafikus keresési lehetőség

Erre csak az STN-en elérhető CAS Online rend­

szer Registry File-jában van lehetőség. Grafikus ter­

minálon közvetlenül felrajzolható, alfanumerikus karakterkészletű terminálon pedig egyszerű utasítá­

sokkal felépíthető a keresni kívánt vegyület szerke­

zeli képlete. Lehetőség van adott szerkezeti frag­

mentumokat (egyes kötések, vegyértékek nyitva hagyva) tartalmazó vegyületek családjának megke­

resésére ( s z u b s t r u k t ú r a - k e r e s é s ) , több szubsztitu- ens-variáns egyidejű megadására (Markush-képlet) is. A vegyületkeresés legegyszerűbb és leghatéko­

nyabb módja a szerkezeti képlet alapján való gra­

fikus keresés, ami a kémiai elnevezések alapján gyakran m é g a vegyész szakembereknek sem könnyű feladat. Az STN ezzel a keresési lehetőség­

gel egyedülálló helyet foglal el az öt rendszer között.

Érdekes megfigyelni, hogyan reagáltak a CA adatbázist szintén szolgáltató központok az STN- nek arra a kihívására, amil a grafikus keresés beve­

zetése és a CA-ktvonatok online elérése (kizárólag az STN-en) jelentett. A Pergamon InfoLine " k i ­ szállt" a versenyből, és visszavonta a CA adatbázist a rendszeréről. A Data-Star megtartotta ugyan a vegyületszótár-adatbázisát ( C N A M ) , de csak korlá­

tozott keresési lehetőséggel: nemcsak hogy felha­

gyott az adatbázis továbbfejlesztésével, hanem tö­

rölte például a kifinomultabb keresést l e h e t ő v é tevő, a gyűrürendszerekre vonatkozó adatelemekel is. A Dialóg ezzel szemben olyan kifinomult vegyü­

letkeresési lehetőségeket dolgozott k i , amelyek szinte felveszik a versenyt a grafikus kereséssel.

E r e d m é n y e s alkalmazásuk azonban — az egy­

szerűbb kérdéstípusokat leszámítva — alapos kémiai ismereteket kíván meg.

3. Adatbázis-kínálat

A Dialóg nyújt az adatbázisok legnagyobb válasz­

tékához hozzáférést, szinte valamennyi t u d o m á ­ nyos, műszaki, gazdasági, társadalomtudományi és h u m á n szakterületen. 250-nél több adatbázisával a világ legnagyobb szolgáltatóközpontja. A műszaki adatbázisok kínálatából talán egyedül a gépészeti, bányászati és építészeti adatbázisok választéka nem kielégítő.

A második helyen a Data-Star áll több mint száz adatbázisával. Elsősorban az orvosbiológiai és az üzleti adatbázisok területén foglal el k i e m e l k e d ő helyet. Előnye az is, hogy sok nagy adatbázishoz, amelyek például a Dialóg rendszeren csak több rész­

állományban kereshetők, egyetlen állományban, az ún. szuperállományban (ZZ végződésű adatbázis­

címkével) is hozzáférést biztosít. Ilyen adatbázisok pl. a CA (CHZZ), a Medline ( M E Z Z ) , az Embase ( E M Z Z ) ; a Biosis (BIZZ), a Predicasts cég PTS PROMT, PTS Forecasts és PTS Time Series adatbá­

zisait egyesítő (PTZZ) adatbázis. 1986-tól a C A és a Biosis adatbázist a Dialóg is elérhetővé tette egyet­

len állományban. Az összevont adatbázisokban való kereséssel a keresési idő, ezzel a költségek is csök­

kenthetők (lásd 4.1 pont).

Az STN-en elérhető adatbázisok száma 30 körül van, de ez a szám tovább bővül majd, ahogy az I N K A rendszer adatbázisai fokozatosan átkerülnek az STN-re, illetve ha bekapcsolódik a hálózatba a Japán T u d o m á n y o s és Műszaki Információs Köz­

pont (JICST) is, mint a hálózat harmadik c s o m ó ­ pontja. Az STN azon kívül, hogy itt k e r e s h e t ő legha­

tékonyabban a C A , néhány egyedülálló adatbázis­

hoz is hozzáférést nyújt; pl.: D E C H E M A (vegyipari technológia), I C O N D A (építészet), BIOMASS (a biomassza energetikai felhasználása), CJACS (az Amerikai Kémiai Társaság 17 folyóiratának teljes s z ö v e g e ) , C A O L D (az 1967 előtti CA-hivatkozá- sok, amit 1920-ig visszamenően terveznek kiterjesz­

teni).

A z Orbit rendszer mintegy 60 adatbázisa közül néhány kizárólag rajta keresztül érhető el: A P I -

(12)

Nóvák T.: \t ideális parancsnyelv.

L I T / A P I P A T (petrolkémia). TULSA (kőolajbá­

nyászat), PESTDOC (növényvédő szerek), VETDOC (állatgyógyászati szerek), CRDS (szerves kémiai reakciók), Biotechnology (biotech­

nológia), CEH Online (vegyianyag-árak). Az Orbit különösen a szabadalmi keresésekhez rendelkezik sok adatbázissal és előnyös keresési lehetőségekkel (pl. PR1NT SELECT).

A Pergamon InfoLine csaknem 60 adatbázisának nagyobbik része exkluziv, és főleg az ilyen adatbázi­

sok számát növelik. Közöttük szerepelnek olyan fontos adatbázisok, mint a RAPRA (műanyag- és gumiipar), a Pl R A (papírgyártás, csomagolás, nyomdaipar), az Aqualine (vízügy) és az I N P A D O C (a világ legteljesebb körű szabadalmi adatbázisa).

Az Orbit rendszer megvásárlása az SDC-töl és a BRS, valamim az ESA-IRS szolgáltatóközpontokkal tervezett kapuszolgálat (gateway) minden való­

színűséggel jelentősen ki fogja szélesíteni a Perga­

mon InfoLine felhasználóinak táborát. Az erősödő piaci versennyel való lépéstartás jellemző módja az utóbbi években az erőforrások egyesitése, cégek megvásárlása, kapuszolgálatok megnyitása, vagy - mint az STN esetén — hálózat létrehozása.

Az olyan témák keresésénél, amelyek több adat­

bázis igénybevételét is megkívánják, természetesen azok a rendszerek élveznek előnyt, amelyeken lehe­

tőleg valamennyi, a témához szükséges adatbázis megtalálható. Van egy speciális lehetőség, amely segít a megfelelő adatbázisok kiválasztásában, A Dialóg, a Data-Star és az Orbit rendszereken létezik egy-egy olyan adatbázis, amely a rendelkezésre álló valamennyi adatbázis szótárállományait tartalmazza.

Ebben az adatbázisban a témát leíró egyetlen kere­

sőkérdés lefuttatható egyszerre több adatbázis szótá­

rában is, és a kapott találatszámok alapján kiválaszt­

hatók a legmegfelelőbb adatbázisok. A Dialóg rendszeren az erre szolgáló DIALINDEX-hcn és a Data-Staron a CROS adatbázisban a teljes szótárál­

lomány k e r e s h e t ő , és a keresőkérdésben logikai és helyzeti operátorokat is használhatunk. Az Orbit DBI (Data Base Index) összevont szótár-adatbázi­

sába csak az alapszótár adatelemei kerülnek, és egyedi szavakra vagy kifejezésekre keresve, annak az öt adatbázisnak a nevét kapjuk meg, amelyekben a kérdéses keresőszó a legtöbbször előfordul.

4.Időtényező 4.1 A keresési idő

A keresési idő függ az adatbázis nagyságától, a ke­

resőprofil bonyolultságától, a csonkolás mértékétől, gyakran még attól is, hogy a nap melyik szakában

végeztük a keresést. A 2.! pontban már kitértem arra, hogy a Dialógon például az S STEPS parancs al­

kalmazása egy Összetett keresőkérdés bevitelére — amikor minden egyes keresőszóra külön halmaz képződik - időigényesebb, mint a sima SELECT esetén. A Data-Star, a Pergamon InfoLine és az Orbit rendszeren a nagy halmazokkal végzett logikai műveletek végrehajtása tart nagyon sokáig.

A 2.1 pontban bemutatott, a Dialóg, a Data-Star és az STN összevont CA állományában végrehajtott mintakeresés (4. ábra) keresési időit összehason­

lítva, az STN bizonyult a leggyorsabbnak, ezt követi a Data-Star, majd a Dialóg. A keresési idő az STN-en mintegy 35%-kal volt rövidebb, mint a Dia­

lógon, és 16,5%-kal rövidebb, mint a Data-Staron; a Data-Star pedig mintegy 22 —23%-kal bizonyult gyorsabbnak a Dialógnál [2]. Az öt rendszer közül leglassúbbnak az Orbitot és a Pergamon InfoLine-t találom, de ezt számadatokkal nem tudom alátá­

masztani.

Azoknál az adatbázisoknál, amelyek több részál­

lományban és egy állományban is kereshetők, a vá­

laszidő m e g n ő ugyan az összevont állományban, de a keresési idő mégis rövidebb, mintha ugyanazt a keresöprofilt minden egyes részállományban végig kellene futtatni. A CA adatbázis esetén a 4. ábra sze­

rinti keresés mind a Dialógon, mind a Data-Staron mintegy 20%-kal rövidebb ideig tartott az összevont állományban, mint az egyes kollektív indexperiódu­

soknak megfelelő részadatbázisokban kapott idők összege | 2 ] ,

4.2 Az offline printek megérkezésének ideje

Az STN (a karlsruhei c s o m ó p o n t h o z kapcso­

lódva), a Data-Star és a Pergamon InfoLine előnye s z á m u n k r a , hogy az offline printek általában egy hét alatt megérkeznek, az STN-től néha még hama­

rabb. Az USA-beli Dialóg és Orbit szolgáltatóköz­

pontok esetén ez az idő átlagosan két hét. A hosszú postai átfutási idő kiküszöbölésére mind a Dialóg, mind az Orbit bevezette az offline printek elektro­

nikus továbbiiásái (electronic mailbox). A Dialóg DIALMAIL rendszerén keresztül a keresés utáni napon viszonylag alacsony óradíjjal (12 $/óra) online kiíralhatók az offline megrendelt találatok, a nyomtatási parancs a r g u m e n t u m á b a mindössze annyit kell beírni, hogy VIA DIALMAIL Az Orbi- ton pedig a PRINT ELEC(TRONIC) paranccsal megrendelt találatok legkésőbb két óra múlva kiíral­

hatók online a PRINTS nevű adatbázisból, hasonló­

an alacsony óradíj mellett. Ezzel a lehetőséggel álta­

lában csak akkor élünk, ha a találatok száma nem

(13)

T M T 34. évf. 1987. 5. sz.

túl nagy. mert a magyar NEDIX-hálózat által meg­

engedett 300 baud adatátviteli sebesség mellett az online n y o m t a t á s sok időt vesz igénybe, és a k i ­ nyomtatott anyag nem olyan jó minőségű, mint a

hagyományos offline nyomtatásnál.

5. Költségtényező

Az adatátviteli költségeket tekintve egyértelmű, hogy azok az európai szolgáltatóközpontok esetén kisebbek. A N E D I X - h á l ó z a t használatának dija Eu­

rópába 15 Ft/perc, az USA-ba pedig 25 Ft/perc.

A szolgáltatóközpontoknak fizetendő költségeket (adatbázis-használati díj, nyomtatási díj) illetően már nehezebb az összehasonlítás. A költségeket még a valutaárfolyamok alakulása is befolyásolja, így ha a dollár erős, a nem dollárelszámolású köz­

pontok az olcsóbbak és fordítva. Ha egy adatbázis több szolgáltatóközponton is e l é r h e t ő , általában nincsenek nagy különbségek az óradíjakban (kivéve, ha valamelyik központon az előfizetők ár­

k e d v e z m é n y t kapnak, mint a CA e s e t é n a STN-en).

A tényleges költségeket inkább a rendszer válasz­

ideje és a kereső személy gyakorlottsága szabja meg.

A kettő közül általában a gyakorlottság a meghatáro­

zóbb, így például én a CA adatbázist legtöbbször a Dialóg rendszeren keresem, jóllehet az STN-en sokszor gyorsabb a válaszidő. A Dialóg parancsnyel­

vét azonban jobban ismerem, és e r e d m é n y e s e b b e n tudom alkalmazni [2], A 4. ábrán bemutatott minta- keresés teljes költsége (beleértve az adatátviteli költséget is) az STN-en keresztül volt a legalacso­

nyabb, a Dialóghoz képest mintegy 40%-kal, a Data- Starhoz képest pedig csaknem 14%-kal volt olcsóbb [2], hasonlóan a 4.1 pontban leírt időarányokhoz.

Az említett példa azonban nem egy tipikus keresés, amikor menet közben változtatni, módosítani kell a keresési stratégiát. Az utóbbi gyors és hatékony el­

végzésében az adott parancsnyelvben való jártasság,

" o t t h o n o s s á g " igen sokat számít. Egy kevésbé ismert parancsnyelv e s e t é n az erre fordított hoszabb idő miatt nem biztos, hogy ki tudjuk használni a gyorsabb válaszidőt.

Végezetül, v é l e m é n y e m szerint a költségeknél is fontosabb, hogy az adott rendszerben megvannak-e azok a keresési sajátosságok, amelyek az adott téma leghatékonyabb lekérdezését elősegítik, és várható­

an a legjobb e r e d m é n y t adják.

6. A felhasználókat támogató szolgáltatások

A Data-Star kivételével valamennyi rendszeren k é r h e t ü n k online információkat a rendszer paran­

csairól, adatbázisairól stb. (HELP, E X P L A I N ) . A Dialóg, az Orbit és az STN azt is l e h e t ő v é teszik, hogy online ü z e n e t e t küldjünk a szolgáltatóközpont¬

nak, vagy pl. a rendszer használatára vonatkozó ke­

resési segédleteket rendeljünk meg ( D I A L M A I L , D I A L O R D E R , C O M M E N T , S E N D ) . Valamennyi szolgáltatóközpontban vannak a rendszer használa­

tát ismertető keresési segédletek (a parancsnyelvet leíró kézikönyv, adatbázis-leírások, newsletter).

Összehasonlítva az öt rendszer keresési segédleteit és a felhasználók tájékoztatásának gyorsaságát, ala­

posságát a különféle változásokról, a Dialóg messze kiemelkedik az öt rendszer közül, leghátul pedig a Data-Star áll. Ugyanez vonatkozik a felhasználók képzésére is. A sokféle és rendszeresen megtartott tanfolyamok mellett a felhasználók képzését nagy­

m é r t é k b e n elősegíti a Dialóg olcsó oktató adatbázi­

sainak ( O N T A P = Online Training A n d Practíce) gazdag választéka és az ún. Classroom lnstruction Program (CIP), amelynek keretében oktatási cé­

lokra a legtöbb adatbázis teljes állománya k e r e s h e t ő minimális — 15 S/óra — óradíj ellenében.

7. Összefoglalás

Az ideális parancsnyelv az lenne, amely a szöve­

gesen megfogalmazott kérdés alapján elvégezné mindazt, ami ma még nagyrészt a közvetítő szakem­

berre hárul (az adatbázis kiválasztása, a keresőprofil megszerkesztése és a keresés végrehajtása stb.).

Ennek egy közelítő megoldását nyújtja a gazdasági adatbázisok keresésére a Dialóg m e n ü által vezérelt Business Connection szoftverje és m é g n é h á n y , Ma­

gyarországon nem használt rendszer. Maradjunk azonban a valóság talaján, és nézzük meg, hogy az öt jelentős szolgáltatóközpont parancsnyelve mennyire felel meg a hagyományos é r t e l e m b e n vett parancsnyelvvel szemben támasztott igényeknek.

A 2. táblázatban összefoglaltam, hogy a cikkben tárgyalt, általam fontosnak tartott keresési jellemzők mely rendszereken találhatók meg, és melyeken nem.

A D I A L Ó G 2 bevezetése óta a Dialóg parancs­

nyelve t e k i n t h e t ő a legfejlettebbnek, különösen akkor, ha figyelembe vesszük a rendszer megbízha­

tóságát és a felhasználókat támogató szolgáltatásokat is. A m i t m é g szívesen látnék: az egy mondaton belüli keresést biztosító (S) operátor és a M A P pa­

rancs szélesebb körű, valamennyi adatbázisra kiter­

j e d ő alkalmazhatósága; a bal oldali csonkolás; a GET-hez hasonló statisztikai analízis program; gra­

fikus keresési lehetőség.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Legyen szabad reménylenünk (Waldapfel bizonyára velem tart), hogy ez a felfogás meg fog változni, De nagyon szükségesnek tar- tanám ehhez, hogy az Altalános Utasítások, melyhez

tanévben az általános iskolai tanulók száma 741,5 ezer fő, az érintett korosztály fogyásából adódóan 3800 fővel kevesebb, mint egy évvel korábban.. Az

* A levél Futakról van keltezve ; valószínűleg azért, mert onnan expecli áltatott. Fontes rerum Austricicainm.. kat gyilkosoknak bélyegezték volna; sőt a királyi iratokból

Garamvölgyi „bizonyítási eljárásának” remekei közül: ugyan- csak Grandpierre-nél szerepel Mátyás királyunk – a kötet szerint – 1489 májusá- ban „Alfonso

A kiállított munkák elsősorban volt tanítványai alkotásai: „… a tanítás gyakorlatát pe- dig kiragadott példákkal világítom meg: volt tanítványaim „válaszait”

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

táblázat: Az innovációs index, szervezeti tanulási kapacitás és fejlődési mutató korrelációs mátrixa intézménytí- pus szerinti bontásban (Pearson korrelációs

Buik Narcolits Buik Opressanti NEC Buik Stimuiams NEC 283 3400 Buik Cardiovauular 4 Blood Agenti 283 3^10 Buik Cardiovascuiar Drugs 283 3*20 Buik Aninoaguiants. 283 3430