6 8 1 . 3 / 0 8 3 - 7 2 /
MAGYAR NYELVŰ
SZÁMÍTÁSTECHNIKAI TEZAURUSZ II.
A TEZAURUSZ ÖSSZEHASONLÍTÓ STATIKAI ELEMZÉSE
Molnár Imre
Építésügyi Tájíkonatási Köiporrt
Az alább következő elemzés megjelenésekor a Számítástechnikai F o g a l m a k T e z a u r u s z a / l / már m e g j e l e n t és e l j u t o t t a z érdeklődő s z a k e m b e r e k h e z . A Tudományos ós Műszaki Tájékoztatás 1 9 7 3 . d e c e m b e r i számában részletes ismertetés j e l e n t meg a t e z a u r u s z elkészítésének indítékairól, módszereiről és g y a k o r l a t i lefolyásáról / 2 / , E c i k k célja a kész t e z a u r u s z megvizsgálása abból a szempontból, h o g y m i l y e n s t a t i k a i paraméterek j e l l e m z i k , s kísérletet teszünk a megállapított paraméterek értékelésére i s . Elsősorban a n n a k elemzésére törekszünk, h o g y m i b e n és m e n n y i b e n v a n i n d o k a t e z a u r u s z továbbfejlesztésére, i l l e t v e m e l y paraméterek tekintetében látszik megfelelőnek - már a t e z a u r u s z f o l y a m a t o s felhasználásának k e z d e t e előtt.
Az elemzés során k a p o t t a d a t o k a t , jellemzőket összevetjük n é hány - korábbi elemzéseink eredményeként rendelkezésünkre álló - e¬
gyéb h a z a i t e z a u r u s z - m o d e l l , i l l e t v e m a k r o t e z a u r u s z megfelelő a d a t a i v a l / 3 , 4, 5/, h o g y a számértékek p l a s z t i k u s a b b értékelését, közvet
l e n e b b megértését biztosíthassuk. A hasonlítás céljából felhasznált a d a t o k természetesen nem tekinthetők o l y a n e l f o g a d o t t és kétségkívül h e l y e s mennyiségeknek, a m s l y e k h e z mérve j o g o s a n minősíteni l e h e t e g y t e z a u r u s z t . Az összevetés megegyezései n e m c s a k a Számítástechnikai F o g a l m a k Tezauruszát, hanem a z idézett m o d e l l e k e t i s minősitik. Az a nézetünk a z o n b a n , h o g y több, egymástól többé-kevésbé független, elté
rő körülmények között, eltérő természetű fogalomkörök megmunkálásáról k a p o t t a d a t o k feltűnően megegyező sajátosságai mindenképpen f i g y e l m e t érdemelnek, s hisszük, h o g y az összehasonlítások száménak Bzaporitésa révén e g y r e j o b b a n általánosítható következtetések vonhatók l e a v i z s gált és összevetett fogalomcsoportokról. Az elemzések t a p a s z t a l a t a i a m a g y a r n y e l v és a m a g y a r szakterminológia s z e m a n t i k a i mélységeihez, eajátosságaihoz i s közelebb v e z e t h e t n e k .
Hasonlóképpen: a r e f e r e n c i a - m o d e l l e k adataitól való szignifikáns eltérés i s éppúgy l e h e t érv a vizsgált t e z a u r u s z m e l l e t t , m i n t az e l l e n . A p u s z t a mennyiségi a d a t o k - önmagukban véve - még c s a k a sajá
tosságokat mutatják meg, a z o k értékeléséhez m é g további, a t e z a u r u s z - épités g y a k o r l a t i tapasztalataiból származó megfigyelések ás m e g f o n tolások szükségesek.
8 1
Í.OLKÁH I . i Számítástechnikai t e z a u r u s z
A t e z a u r u s z áttekintő jellegű s t a t i k a i elemzését 3 területen végezzük e l :
1 . A t e z a u r u s z fogalom-készletének vizsgálata 2. A f o g a l m a k reláció-hálózatának vizsgálata 3. A s z e r k e z e t mélységi tagozódásának vizsgálata
1 . A TEZAURUSZ F0SAL01Í-EÉS2LETÉHSK VIZSGALATA
Az elemzés lefolytatásához néhány jelölésre v a n szükségünk.
K z e k az alábbiak:
• a t e z a u r u s z d e s z k r i p t o r a i n a k száma: d
• a t e z a u r u s z non-deszkriptórainak száma: n
• a t e z a u r u s z összes f o g a l m a i n a k száma: f f = d + n
• a t e z a u r u s z d e s z k r i p t o r a i permutált változatainak száma: pf l
• a t e z a u r u s z n o n - d e s z k r i p t o r a i permutált változatainak száma:
*n
• a t e z a u r u s z összes permutált fogalom-változatainak száma: p P = Pd + Pn
• a t e z a u r u s z összes tételeinek száma: t t = f + p = / d + n / + / pd + pn/
A t e z a u r u s z e l e m e i n e k funkcionális megoszlását a z l . s z . táblá
z a t m u t a t j a b e .
A táblázat a d a t a i értékelésének elősegítéséül a 2 - 4 . a z . tábláza
t o k b a n b e m u t a t j u k a f e n t e b b e m i i t e t t h a z a i kezdeményezések néhány h a sonló adatsorát.
Az összefoglaló f o g a l m i arányok /£, p / érdekes megegyezéseket m u t a t n a k a számítástechnikai t e z a u r u s z és az összehasonlításul bemu- t a t o t t t e z a u r u s z - m o d e l l e k között,
A t e z a u r u s z f o g a l m i kimunkáltságának e g y i k l e g f o n t o s a b b mutatója a n o n - d e s z k r i p t o r o k /valóságos és "mesterséges" szinonimák és k v á z i - szinonimák/ és d e s z k r i p t o r o k egymáshoz mért számaránya. Ez a hányados a t e z a u r u s z f o g a l m i anyagának redundar.cia-hátterét /R/ a d j a meg.
TiiT 21.évi. 2.szám 1974.február
l . s z . táblázat
A TEZAURUSZ FOGALMAINAK F U N K C I O N Á L I S MEGOSZLÁSA
tétel egyaég hányad
d n
f = / d + n /
2347 256
2603
0 , 5 1 0,06
0,57
? d Pn
1 7 5 6 233
1989
0,38 0,05
0,43
t 4592 1,00
2.e - z . táblázat
A KÖZÉT T E ZAU R U S Z - K O D E L L FOGALMAINAK FUNKCIONÁLIS iiSGOSZLÁSA
tétel egyaég hányad
d n
f = / d + n /
210 80
290
0, 4 5 0,17
0,62
Pd Pn
P V pd+ Pn/
108 70
178
0,23 0,15
0,38
t 468 1,00
83
MOLNÁR I . : Számítástechnikai t e z a u r u s z
3. s z . táblázat A MUNKABÉR TEZAURUSZ-MODULI FOGALMAINAK
FUNKCIONÁLIS MEGOSZLÁSA
tétel egység hányad
d D f V d + n /
39 9
4 6
0,43 0,10
0,53
* d
pn
P - / Pd+ Pn/
37 5
42
0,41 0,06
0,47
t 90 1,00
4. s z , táblázat A MUNKAÜGY. MUNKATUDOMÁN Y MAKROTEZAURUSZ FOGALMAINAK
FUNKCIONÁLIS MEGOSZLÁSA
tétel egység hányad
d n f«/d+n/
244 5 1
295
0,43 0,00
0,52
pd Pn
P"/»d**tt/
219 5 1
270
0, 3 9 0,09
0,48
t 565 1,00
T«T 21.évf. 2.szám 1974.február
H - I - 2 § Í 7 "
Az Összehasonlításként b e m u t a t o t t t e z a u r u s z - m o d e l l e k R-értékei a következők:
0,23 /kőzet t e z a u r u s z - m o d e l l /
0 , 2 1 /munkaügy, munkatudomány m a k r o t e z a u r u s z / 0,23 /munkabér t e z a u r u s z - m o d e l l /
Az összehasonlítás a r r a m u t a t , h o g y a t e z a u r u s z R = 0 , 1 1 értéke a szükségesnél mindenképpen a l a c s o n y a b b redundancia-hátteret t a k a r . A számítástechnika szakterülete m o d e r n , d i n a m i k u s fejlődésben lévő i s - meretág. Fogalom-készletének túlnyomó része a n g o l formában került a magyar s z a k e m b e r e k e l é . Számos területen még nem rendelkezünk t e l j e s értékű megfelelőkkel, s o k e s e t b e n egymás m e l l e t t él az a n g o l nyelvű fogalomváltozat és a magyar szakszó / p l . p r i n t e r - gyorsnyomtató/, számos e s e t b e n p e d i g több m a g y a r megfelelő i s f o r g a l o m b a n v a n e g y - e g y a d o t t a n g o l szakkifejezésre, m i n t e g y e z z e l i s j e l e z v e , h o g y a m a g y a r számítástechnikai s z a k n y e l v még " i n s t a t u n a s c e n d i " található. E z t a h e l y z e t e t i s m e r v e , m i n d e n különösebb vizsgálat nélkül, a t e z a u r u s z néhány lapjának p u s z t a átolvasása révén i s a kötetbe f e l nem v e t t szinonimáknak, értelmi megfelelőknek t u c a t j a i t találhatjuk.
Az R - 0 , 1 1 érték i g e n a l a c s o n y v o l t a , i l l e t v e a f e n t i m e g f o n t o lás egyértelműen u t a l e g y kéaőbbi, d i n a m i k a i jellegű elemzés f o n t o s ságára. Az u g y a n i s b i z o n y o s r a vehető, h o g y a t e z a u r u s z g y a k o r l a t i felhasználása e g y a d o t t információrendszerben, jelentős n o n - d e s z k r i p - t o r karakterű a n y a g g a l gazdagítja m a j d a fogalom-állományt. J e l e n megjegyzésünk mindössze a n n y i t kivén rögzíteni, h o g y a t e z a u r u s z n o n - d e s z k r i p t o r állományának kiteljesítése szükséges és várható. Könnyű belátni, h o g y a g y a k o r l a t i életben felvetődött igények kielégítését aegitő t e z a u r u s z annál hasznosabbá válik, annál több irányból köze
líthető meg, minél g a z d a g a b b s z i n o n i m a - és kvázi-azinonima-környezet v e s z i körűi az e g y e s d e s z k r i p t o r o k a t .
A t e z a u r u s z szerkezetének e g y másik lényegi jellemzője a f o g a - lomszervezésl s z i n t /!•/ mérőszáma. Ez a paraméter a n n a k vizsgálata révén határozható meg, h o g y m e n n y i b e n s z e r e p e l n e k a t e z a u r u s z b a n e g y tagú, i l l e t v e többtagú f o g a l m a k , tehát: m i l y e n h e l y e t f o g l a l e l a t e z a u r u s z a tisztán u n i t e r m e s , i l l e t v e a többszörösen összetett f o g a l makból építkező, p o l i k o n c e p t t i p u s u t e z a u r u s z o k között, A f o g a l o m - szervezési s z i n t mérőazéma / L / a következő képlettel határozható meg:
Az összehasonlítási alapként b e m u t a t o t t m o d e l l e k L-értékei a k ö vetkezők:
0 , 6 1 /kőzet t e z a u r u s z - m o d e l l /
= 0,76
£5
MOLNÁR I . j Számitástechnlkai t e z a u r u s z
0,92 /munkaügy, munkatudomány m a k r o t e z a u r u s z / 0,88 /munkabér t e z a u r u s z - m o d e l l /
Az 1 = 0,76 érték belül Tan a z o k o n a határokon, a m e l y e k e t a szem
léltetésül m e g a d o t t referenciák vázolnak, de t a r t a l m i megértéséhez r ö v i d magyarázat szükséges. A tisztán u n i t e r m e s fogalom-gyűjtemények e¬
setében L = 0 /zéró/. A tisztán kéttagú / u n i k o n c e p t / t i p u s u f o g a l m a k a t tartalmazó gyűjteményeknél L « 1 . A tisztán p o l i k o n c e p t t i p u s u fogalmakból álló t e z a u r u s z o k esetében p e d i g L = 2. A valóságban a z o n ban i l y e n t i s z t a , szélsőségesen r e n d e z e t t f o g a l m i konstrukciókra nem l e h e t számítani, az a d o t t fogalom-gyűjtemény m i n d i g több a l a p e l v e r e dő értékével jellemzhető c s a k . A Számítástechnikai F o g a l m a k T e z a u r u s z a tehát átmeneti jellegzetességeket m u t a t a tisztán u n i t e r m e s és a z u n i k o n c e p t fogalomszervezésü t e z a u r u s z o k között. Cgy tűnik - több mo
d e l l vizsgálatának egybehangzó "vallomása" alapján -, h o g y a m a g y a r nyelvű s z a k t e z a u r u s z o k r a , sőt: talán a magyar n y e l v . s z a k f o g a l o m - s z e r kesztési a l a p e l v e i r e i s jellemző l e h e t az' L - 0 , 5 - l i P közötti érték.
Ez az észrevétel még további megfigyelést és elemzéseket kiván, de valószínűnek látjuk, hogy objektív tendenciáról v a n szó.
2 . A FOGALMAZ RELÁCIÓ-HÁLÓZATÁNAK VIZSGÁLATA
A reláció-hálózat vizsgálata során voltaképpen a t e z a u r u s z " b e l ső intelligenciáját", kapcsolási képességét, asszociativitását, t r a n - zitivitását, belső logikáját vesszük szemügyre, i l y módon - áttétele
s e n bár - a t e z a u r u s z fogalom-állománya megmunkálásának s z e l l e m i t e vékenységét minősitjük.
A t e z a u r u s z t e l j e s reláció-hálózata c s a k kétoldalú, kölcsönös kapcsolatokból tevődik össze. A t e z a u r u s z b a n a l k a l m a z o t t reláció-ti- p u s o k a következők:
• h i e r a r c h i k u s relációk / r ^ / Jelölés: G - S
• a f f i n i t i v relációk / r / Jelölés: R - R a
• preferenciális relációk / r ^ f Jelölés: T - L
A t e z a u r u s z a h i e r a r c h i k u s reláció-tipust két felmenő s z i n t e n i s t a r t a l m a z z a :
• közvetlen g e n e r i k u s relációk /G/ G = 1204
• legfelsőbb g e n e r i k u s relációk / * 3 / * 3 = 2140
A t e z a u r u s z relációinak elemzéséhez nekünk a G k a p c s o l a t o k meny- nyiségére v a n szükségünk, a tezauruszból nyerhető ií-érték a z o n b a n nem hűséges kifejezője a valóságnak, m i v e l számos o l y a n d e s z k r i p t o r v a n az a n y a g b a n , a m e l y n e k közvetlen g e n e r i k u s /G/ k a p c s o l a t a e g y s z e r s m i n d
TMT 2 1 . é r i . 2,Bzám 1974.február
legfelsőba g e n e r i k u s k a p c s o l a t a / « G / i s , h i s z e n a d e s z k r i p t o r o k j e l e n tős csoportjának c s a k e g y e t l e n felmenő k a p c s o l a t a v a n . A t e z a u r u s z e ¬ z e k e t a k a p c s o l a t o k a t i s • £ jelöléssel a d j a meg. Ezért a reláció-háló- z a t elemzéséhez a követkesd a d a t o t k e l l t e k i n t e t b e Tennünk:
*0 - 2140
Az «G kapcsolatjelölések számának - e l v i l e g - e g y e z n i e k e l l a z S / s p e - c i f i k u s / k a p c s o l a t o k számával. E z érthető, h i s z e n h a X g e n e r i k u s f o galomhoz kapcsolódik Z l s p e c i f i k u s f o g a l o m , a k k o r - kétoldalú k a p c s o l a t o k esetében - X1 s p e c i f i k u s fogalomhoz i s szükségképpen kapcsoló
d i k egy I g e n e r i k u s f o g a l o m . E z a t e l j e s mennyiségi azonosság - n y i l ván egyszerű t e c h n i k a i okokból - nem áll f e n n a t e z a u r u s z b a n , a h i e r a r c h i k u s kapcsolódás két iránya között, h i s z e n
S - 2103 I l y módon
rb • »G + S • 4243 Az a f f l n i t i v relációk / t J összege
ra - 7 6 6 ,
ami 383 fogalompár rokonsági /asszociációs/ kapcsolatát f e j e z i k i . Az a f f i n i t i v relációk értelmezését a t e z a u r u s z bevezetője világosan és h e l y e s e n határozza meg.
A t e z a u r u s z p r e f e r e n c i á n a relációinak hálózatát részint s z L /non-deszkriptortól d e e z k r i p t o r h o z v e z e t ő / relációk, részint p e d i g a T / t i l t o t t f o g a l o m / relációk adják meg. E z e k számának i a e g y e z n i e k e l l e n e . A tezauruszból kigyűjtött a d a t o k alapján
1 - 254 I « 252
I l y módon a t e z a u r u s z preferenciális relációinak / r / száma:
r » L + I « 506
összegezve, a t e z a u r u s z összes relációinak száma;
r "rh + ra + ro "4 2 43 + 76 6 + 50 6 " 5515
Az c s s z e s relációk megoszlását a z 5. e z . táblázat m u t a t j a b e .
MOLNÁR I . : Számítástechnikai t e z a u r u s z 5 . a z . táblázat A TEZAURUSZ RELÁCIÓINAK MEGOSZLÁSA
jelölés egység hányad
rh 42*5 0,77
ra 766 0,14
rP
506 0,09
p 5515 1,00
E táblázat a d a t a i n a k értékeléséhez b e m u t a t j u k a hasonlítást a l a p ként már idézett fogalom-gyűjtemények m e g f e l e l d a d a t a i t / 6 . s z . táblá
z a t / .
Az összehasonlítás a z t m u t a t j a , hogy a t e z a u r u s z markánsan k i d o l g o z o t t h i e r a r c h i k u s kapcsolat-hálózata m e l l e t t a z a f f i n i t i v ás - különösen - a preferenelálls relációk hálózata még nem eléggé f e j l e t t - a r e f e r e n c i a - a d a t o k h o z viszonyítva /márpedig e z utóbbi két k a p c s o l a t i kategória a z idézett fogalom-gyűjteményékben sem megnyugtatóan kimunkált/.
Egyébként a preferenoiáliB relációkra vonatkozó számszerű a d a t o k a l a c s o n y v o l t a i s a z aránylag kevés számú s z i n o n i m a feltüntetésével függ össze.
A kapcaolat-hálózat funkcionális megoszláaának bemutatása után lehetővé vált a t e z a u r u s z egy u j a b b Jellemzőjének megállapítása, meg
határozható a t e z a u r u s z egy a d o t t deszkriptorának kapcsolódási mérő
száma / k / s
Hasonlítás! alapként b e m u t a t j u k a már idézett három forrás meg
f e l e l d jellemzőit A - e z . táblázat/.
Az összehasonlítás egyértelmű eredménye a z a megállapítás, h o g y a t e z a u r u s z fogalom-hálózata még - egészében véve - nem megfelelően részletezett, továbbfejlesztése feltétlenül i n d o k o l t n a k látszik.
Nem érdektelen annak vizsgálata aeo, hogy *z egy d e s z k r i p t o r r a jutó Összee relációk hogyan o s z l a n a k meg a z e g y e a kapcsolat-típusok között. E z t a 8 . s z . táblázat szemlélteti.
TMT 21.érí. 2.ázom 1974.február
6 .B Z. táblázat NÉHÁNY TEZAURUSZ-MODELL RELÁCIÓINAK MEGOSZLÁSA*
Jelölés ^ °sszee relációk hányada
Közét Munkaügy Munkabér
rh 0,59 0 , 7 1 0,69
ra 0,18 0, 1 3 0,15
rp 0,23 0,16 0,16
r 1,00 1,00 1,00
7 . a z . táblázat NÉHÁNY TEZAURUSZ-MODELL FAJLAGOS RELÁCIÓ-MENNYISÉGÉNEK / r / d /
BEMUTATÁSA**
Kőzet Munkaügy Munkabér f a j l a g o s reláciő- _ „
mennyiség / k / 3*36 2'67 2'82
A táblázat a d a t a i e tanulmány összehasonlító vizsgálatai számára á t d o l g o z o t t értékek, m i v e l a z idézett e r e d e t i közleményekben l e i r t f o galom-gyűjtemények egyirányú /nem kölcsönös/ relációkat i s t a r t a l maznak, s az összehasonlítás érdekében e z e k e t l e v o n t u k a m o d e l l e k t e l j e s reláció-mennyiségéből, a hányad-értékeket p e d i g megfelelően módosítottuk.
Az összehasonlítás kedvéért átszámított a d a t o k .
^9
MOLNÁR I . : Számítástechnikai t e z a u r u s z
8. B Z . táblázat A TEZAURUSZ EGY DESZKRIPTORA KAPCSOLATAINAK MEGOSZLÁSA
KAPC SO LAT-TÍPUSOK SZERINT
k a p c s o l a t —
t l p u e egység
rh 1 , 8 1
ra 0,33
rp 0 , 2 1
r 2,35
Hasonlításul b e m u t a t j u k a referencia-források megfelelő megosz
lási a d a t a l t / g . s z . táblázat/.
3 . a z . táblázat NÉHüNY TEZAURUSZ-MODELL EGY DESZKRIPTÓRÁRA JUTÓ FAJLAGOS KAPCSOLAT-MENNYISÉGÉNEK MEGOSZLÁSA KAPCSOLAT-TÍPUSOK SZERINT
r e f e r e n c i a
m o d e l l rh ra rp
Kőzet 1,97 0,63 0,76
Munkaügy 1,90 0,35 0,42
Munkabér 1,95 0 , 4 1 0,46
Az összehasonlítás n e m c s a k a z t m u t a t j a meg, h o g y a t e z a u r u s z l é n y e g e s e n kevésbé f e j l e t t reláció-hálőzattal r e n d e l k e z i k , m i n t a bemu
t a t o t t referenciák, hanem a z t i s m e g m u t a t j a , h o g y elsősorban a p r e f e - renciális relációk száma s z o r u l szaporításra. E d d i g i t a p a s z t a l a t a i n k alapján u g y véljük, h o g y a megfelelően k i f e j l e s z t e t t t e z a u r u s z n a k r a
é s r p értéke 0,5 é s 1,0 között változhat, az a d o t t szakterület s p e c i f i k u s adottságai s z e r i n t , de n e m i g e n m a r a d h a t 0,5 a l a t t . Ez a meg
jegyzés t a p a s z t a l a t i természetű, bár s z á m o B e d d i g i elemzés támasztja alá. Egyértelmű a z o n b a n az i s , h o g y a vizsgált t e z a u r u s z m é g a g y a k o r l a t i felhasználás előtt áll, a m i kétségkívül gyarapító hatással l e s z a preferenciái!s és a f f l n i t i v relációk számára.
TMT 21.ári. 2.szám 1974.február
3. A SZERKEZET MÉLYSÉGI TAGOZÓDÁSÁNAK VIZSGÁLATA
A kapcsolat-hálózat áttekintő elemzése után - a t e z a u r u s z h i e r a r c h i k u s indexének elemzése alapján - vizsgáljuk meg a t e z a u r u s z - s z e r k e z e t mélységi tagozódását. A fogalom-állomány megoszlását a z e g y e s h i e r a r c h i a - s z i n t e k s z e r i n t a 1 0 . s z . táblázat, i l l e t v e - e g y r e f e r e n c i a - forrással összevetve - az l . s z . ábra m u t a t j a b e .
1 0 . s z . táblázat A TEZAURUSZ FOGALOM-ÁLLOMÁNYÁNAK iEGÖSZLÁSA
HIERARCHIA-SZINTEK SZERINT
h i e r a r c h i a
s z i n t egység i
1 . 197 8,4
2. 944 40,2
3. 838 35,7
4. 293 12,5
5. 63 2,7
6. 12 0,5
1-6. 2347 1 0 0 , 0
Az l . s z , ábrán p o n t o z o t t v o n a l l a l b e m u t a t o t t referenciaforrás jellegzetességei jó megegyezést m u t a t n a k a tezauruszéival - e g y h i erarchia-lépcső eltolással. M i n t a z t a t e z a u r u s z bevezetője i s k i f e j t i , a tezauruszból - i n d o k o l t a n - hiányzik az egyértelmű, felső g e n e r i k u s összefonódás / a m i t a referencia-forrás 1 . h i e r a r c h i a - s z i n t j e t a r t a l m a z / . Ebből a szempontból J o b b n a k k e l l Ítélnünk a t e z a u r u s z struktúráját, m i n t a felhasznált referenciákét. E g y i k legjellemzőbb pozitív tulajdonsága a t e z a u r u s z n a k éppen a z , h o g y v i s z o n y l a g n a g y számú / 1 9 7 / f o g a l o m található a z 1 . /csoportképző d e s z k r i p t o r o k a t tartalmazó/ h i e r a r c h i a - s z i n t e n . Ez a jellegzetesség hangsúlyosan mu
t a t j a be a l a z a h i e r a r c h i k u s bontás - i g e n h e l y e s - szemléletmódját, i l l e t v e a t e z a u r u s z bevezetőjében k i f e j t e t t szerkesztési a l a p e l v meg
valósulását .
Az ábra tanúsága és a 1 0 . s z . táblázat a d a t a i s z e r i n t , a t e z a u r u s z g e r i n c e / a fogalom-állomány 3/4 részénél t ö b b / a 2 - 3 , h i e r a r c h i a - s z i n t e k e n található. Az ábra egyébként Jól közelíti a z u n . n o r m á l - e l - osslési görbét, a m i t különböző t e z a u r u s z o k esetében egyaránt j e l l e m zőnek találtunk a f o g a l m i eloszlás g r a f i k u s ábrázolásában.
91
KC'Lüó I . : Számítástechnikai t e z a u r u s z
1 . I I . ábra
A T E Z A U R U S Z F O G A L M A I N A K S Z Ó R Ó D Á S A H I E R A R C H I A - S Z I N T E K S Z E R I N T
Tezauruszról lévén szó, mégpedig o l y a n tezauruszról, a m e l y a r r a a célra készült, h o g y inforaációfeltáró, -tároló és -kereső r e n d s z e r e k eszközévé váljék, a f o g a l m a k h i e r a r c h i k u s tagolása k i f e j e z e t t e n a felhasználási s z e m p o n t kiemelésével - és ezért: o l y k o r a szigorú tudománylogikai megfontolások háttérbe szorításával - történt. E z z e l a szemléletmóddal a z o n b a n m i n d e n o l y a n információs s z a k e m b e r n e k e g y e t k e l l e n e értenie, a k i az információkezelés m i n d e n n a p o s g y a k o r l a tában é l . Ez a szemléletmód o l y a n "önkényes" megoldásokat kiván meg, a m e l y e k lényegesen n e h e z e b b munkát o k o z n a k , m i n t a legszigorúbb t u d o mánylogikai osztályozási e l v e k alkalmazása. A t e z a u r u s z a f o g a l m i r e n d világa, de nem a merevségé, hanem a d i n a m i k u s , a változásra m i n -
I M I 21.évi. 2.azám 1974.f e b r u á r
d i g kész és a l k a l m a s rendé. Találóan f e j e z i k i e z t a szemléletmódot M e p h i s t o t e l e s e g y m o n d a t a GOETHE Faust-jában / f i / :
" G r a u , t e u r e r F r e u n d , i 3 t a l l e r h e o r i e , u n d grün des L e b e n s golöner 3aum."
/"Szürke, Öcsém, m i n d e n teória, a s z élet aranyfújt) zöld."/
A f e n t i e k során a t e z a u r u s z s t a t i k a i elemzésének néhány f o n t o s irányát követtük a megállapítottuk a kialakított fogalom-állomány éa reláció-hálózat néhány s z e r k e z e t i és mennyiségi Jellemzőjét. Világo
s a n látjuk a z o n b a n , h o g y a t e z a u r u s z g y a k o r l a t i használhatóságát, a fogalom-állomány célszerű méretét és szükséges - horizontális és v e r tikális - tagolását m a j d c s a k a g y a k o r l a t i kísérletek a d a t a i r a a l a p o
z o t t d i n a m i k a i elemzés eredményei határozhatják meg, s indíthatják e l a használati s z e m p o n t kiemelésével megcélzott o p t i m u m felé.
#
Az elenzéshez felhasznált és idézett s z a k i r o d a l o m
/ ! / Számítástechnikai f o g a l m a k t e z a u r u s z a . S z e r k . : S c h i f f E r v i n , tí?.
1 9 7 3 . OUKDK, 396 p .
/ 2 / SCHIFF E r v i n : M a g y a r nyelvű számítástechnikai t e z a u r u s z . I . ^ T J. 1 , 2 0 . k . 1 1 - 1 2 . s z . 1973. n o v . - d e c . p . 7 8 5 - S 0 9 .
/ 3 / MOLNAH I m r e ; Újszerű t e z a u r u s z - s z e r k e z e t kíalaicit&sa. = TMT,19.k.
3 - s z . 1972.márc. p . 1 4 9 - 1 6 9 .
/ 4 / liOLHAH I m r e : Az információs s z a k t e z a u r u s z f o g a l m a , r e n d s z e r e és felépítése, különös t e k i n t e t t e l az építésügyi ágazati s z a k t e z a u r u s z kialakítására. Bp. 1 9 7 3 . £ T E . 392 p .
/ 5 / MOLMAfi I m r e : Az információkezelés f o g a l o m r e n d s z e r e . Bp. 1 9 7 3 . Zözgazd. és J o g i k i a d ó . 2 1 8 p .
/ 6 / GOETHE, J.W.: F a u s t . G e s a m t a u s g a b e . L e i p z i g , é.n. I n a e l v e r l , 573 p , T e i l 1 . 19o p . / m a g y a r r a Sárközi György forditása/
*
93
JcOLNAR I . : Számitásteohnikai t e z a u r u s z
MOLNÁR. I . : T h e s a u r u s on o o m p u t e r t e c h n i q u . e s i n Hungárián.Part TT_
C o m p a r a t i v e s t a t i c a n a l v s i s o f t h e t h e s a u r u s
The "Számítástechnikai F o g a l m a k T e z a u r u s z a " / T h e s a u r u s o n Comput
e r T e c h n i q u e s / i s examíned, a s t a t i c a l a n a l y s i s o f d e s c r i p t o r i n t e r - r e l a t i o n s h i p s a n d o f s t r u c t u r a l d e p t h i s g i v e n i n 3 p a r t s :
1 . I n t h e o o u r s e o f t h e v o r d - s t o c k a n a l y s i s t h e f o l l o v ; i n g s a r e i l l u s t r a t e d j q u a n t l t a t i v e i n d i c a t o r s o f t h e f u n c t i o n a l d i s t r i b u t i o n ; v a l u e o f t h e r e d u n d a n c y f a c t o r /R/ r e f e r r i n g t o s y n o n i m e - a m p l e n e s s ; i n d e x o f t h e levél o f w o r d compílation / L / r e f e r r i n g t o c h a r a c t e r l s - t i c s o f d e s c r i p t o r - c o m p l e x i t i e s . T h e s e c h a r a c t e r i s t i c s compareá w i t h t h e c o n c e r n i n g d a t a o f somé t h e s a u r u s m o d e l s p r o v e t h a t t h e T h e s a u r u s c o n s i s t s o f r e l a t i v e l y f e w n o n - d e s c r i p t o r s u r r o u n d i n g s , h o w e v e r , i t i s a c o l l e c t i o n w i t h s u i t a b l e s t r u c t u r a l levél.
2. D e s c r i p t o r i n t e r - r e l a t i o n s h i p s a r e a n a l y z e d . I n t h e m e a n t i m e b a s i c t y p e s o f i n t e r - r e l a t i o n s h i p s / h i e r a r c h i c a l , a f f i n i t i v e a n d p r e - f e r e n t i a l / a n d t h e l r q u a n t i t a t i v e d i v i s i o n i s s t a t e d . S p e c i f i c r e l a - t i o n v a l u e /'&./ p e r d e s c r i p t o r e x p r e s s i n g t h e s t a g e o f i n t e r - r e l a t i o n s h i p s d e v e l o p m e n t as m e l l a s t h e s t r u c t u r e o f t h e v a r i o u s c o n n e c t i o n s a r e alsó e x a m i n e d .
Paramétere r e g i s t e r e d a r e alsó c o m p a r e d w i t h r e f e r e n c e d a t a . 3. As t o t h e s t r u c t u r a l d e p t h i t i s f o u n d t h a t t h e T h e s a u r u s c o n s i s t s o f 6 h i e r a r c h i c a l l e v e l s , t h i s s t r u c t u r e p r o v e s t h e a p p l i c a ¬ t i o n o f t h e weak h i e r a r c h i c a l p r i n c i p l e . The d i s p e r s i o n o f t e r m s w i t h i n t h e s e l e v e l s i s i n c o n g r u e n c e v - i t h t h e normál d i s p e r s i o n d i a
gram, The s t a t i c a l a n a l y s i s i s t o be c o n t i n u e d l a t e r b y a d i n a m i c one a d o p t i n g c h a r a c t e r i s t i c s f r o m t h e u s e o f t h e T h e s a u r u s .
MOJIHAP. H. : T e a a y p y o n o S H q g c j i H T e j i b a o a T O X T T K K O H B B e n r e p c K O u
flauKe. q a o T b I I . C p a B H H T ej t . m f i c r a T H t e o K t í R a H a j B a T e a a y p y o a
B O T a T t e s T p e x l a c T H X j a e T O f l C T a T H i e o x t i H a H S J i H 3 c a o a a p H o r o s a n a c a , o e r s cesaeR w e a a y n o B A T a a i i K H r a n x e rjiyŐHHHofi c t p y K T y p a T e a a y p y o a n o B H » m c a a T e j ! b H o t l r e x ü H K e .
1 . B x o z e ananH3a w r o B a p H o r o a a n a c a s s m H C j i H K i T O f l c j i e a y B n i i e B e j m i K H H :
- K O J i s o e c T B e H T r a e n o K S 3 a T e a H í y n K i j K O H a í b H o r o p a c n p e a e j i e n i u r n o H a ¬
- s e j i s i H n a í a K T o p a p e n y w r a m i H i f ( T. e . o T H o n e m t e i s o j t a n e i e c K p s n - r o p o o K < r a c a y H e c K p a n r o p o B ) , x a p a x T e p n a H p y» n a a "ÖorafCTao" r e - a a y p y c a B O B H O H U K S X ;
TMT 21.évi. 2.ezám 1974.február
- B e a n v K H a , x a p a K T e p H 3 H p y i ) i n a í r y p o B a n b W I O X H O C T B noHüTHfi ( r. e . a e - a a i n n a , p a B H a j i o r K O m e n B » u n c i a B c e x n e p M y T H p o B a H H H X s a p H a n n K K
B O B X n O H R T K Í ) .
C p a B H H B Q H n o^ y ^ e H H H e a afané c a a n m i i i K i p y n t r T 8 3 a y p y o o B y T B e p - x í a e T o s , I T O aaHHHfl T e s a y p y o oöjianaeT o p a B H B T e a b n o Hatío^LmoS O K P S C T -
H O C T t n R S J i e o K p H n T o p o B , n o B w e e r J t o c T a T O i n o B U O O K H H y p o a e H b C J I O X K O O T H n o n a T« t .
2. B x o a e a n a j i B a a o e r a OBUseft B K T O C I S O T C S :
- K o j n i a c T í e H R o e p a c n- p e i e- n e m i e O Ű H O B H H X T I U O B O B g s e f t ( r . e. i i e p a p - i B i e c K H i , a $ $ H H R T R 8 H H X • a p e í- e p e a n H a i b i w x ) j
- s e j i H i H H a , x a p a K T e p H 3 H p y » m a J ! p a 3 B K T O O T b o e r n o a s t s e f l n p a B H a n O T - R o m e H i m i n c i a a c e x e s ő s e i t K v i r o j i y B c e x a e c K p r o i r o p o B .
H o a y i e n m j e * a n n n e c p a a m i B a n T c j i c HMerommiHOJi.
3. B x o n e a H a J i ü 3 a rayŐHSHoB O T p y K T y p u B a s o H s e T O f l , I T O T e a a y p y c x a - p a K T e p H a B p y e r a f l 6 y p o s K J i u n j r e p a p x m r , a H e p a p x H i e c K H e C B U S H y o T a - n o B J i e r a n o n p H H U H i i y T S X n a a K B a e u o i l "cjiaCoií H e p a p z a n " . P a o n p e z e - j i a H i t e nORüTitfi i i e u i y O T n e j i b r r a i i H y p o B a n u s a a o c T a T O * i H O f t n é p e c o a - a a n a e T c o a n o f l O T o p o n u o íyHKUHefl H O p i i a x b R o r o p a c n p e a e j i e H i i H , o a p y r o f l O T o p o n u c p a c n p e n . e j i a T e j i b H H M B : ocoöaHHOOTAMI i p y r n x i i o i e a e f l . nocJie c r a T H i e o K o r o a t r a j i H a a i o n o n o j i e z o B a T t a JtKHaiiK- i e o i c a f t a H a - j i z af B K O T o p O M H O J I X H H Ö H T b y ^ T e H H H n o K a. - 3 a T e . i n r e s a y p y c a , n o a y - M P H H u a a x o a e e r o H 0 n o j n. 3 o s a H H » .
jiOLKAR. I . i R e c h e n t e c h n i a c h e r T h e s a u r u s i n u n g a r i s c h e r S p r a c h e .
I I . V e r g l e i c f a e n d e s t a t i s c h e A n a l y a e d e s T h e s a u r u s "
Ea w i r d d e r " T h e s a u r u s r e c h e n t e c h n i s c h e r B e g r i f f e " e i n e r s t a t i - s c h e n A n a l y a e s e i n e s B e g r i f f s b e s t a n d e a , dea R e l a t i o n s n e t z e s d e r Be- g r i f f e u n d a e i n e r T i e f e n s t r u k r t u r , i n d i e f o l g e n d e n d r e i T e i l e geglíe- d e r t , u n t e r z o g e n :
1 . I m L a u f e d e r A n a l y a e dea B e g r i f f s b e s t a n d e a w e r d e n d i e o u a n t i - t a t i v e n K e n n z i f f e r n d e r f u n k t i o n e l l e n Y e r t e l l u n g , d e r V.'ert d e a a u f d e n Synonyménreichtum h i n v . e i s e n d e n H e d u n d a n z f a k t o r s /R/ / á . h . Q u o t i -
95
MOLMAR I . : Számítástechnikai t e z a u r u s z
e n t a u s den l m T h e s a u r u s e n t h a l t e n e n H i c h t d e s k r i p t o r e n u n d D e s k r i p - t o r e n / , s o w i e d i e Messziírer des a u x d i e Komplexitát d e r D e s f c r i p t o r e n h i n w e i a e n d e n B e g r i f f s o r g a n l s a t l o n s n i v e a u s / ! / / d . h . Verháltnis d e r p e r m u t i e r t e n u n d d e r n i c h t - p e r m u t i e r t e n Ausdrücke/ f e e t g e s t e l l t . D i e - ee K e n n d a t e n w e r d e n d e n einschlágan Angaben e l n i g e r T h e a a u r u s m o d e l l e gegenübergestellt u n d a u f g r u n d d e r e r h a l t e n e n V e r t e w i r d d e r T h e s a u - r u s a l s e i n e Sammlung m i t e i n e r g e r i n g e n H i c h t d e s k r i p t o r e n u m g e b u n g k l a s s i f i z i e r t , d i e J e d o c h e i n e n t s p r e c h e n d e s B e g r i f f s o r g a n i s a t i o n a - n i v e a u b e s i t z t .
2. B e i d e r U n t e r s u c h u n g dee R e l a t i o n s n e t z e s w i r d d i e q u a n t i t s t i - v e V e r t e i l u n g d e r g r u n d l e g e n d e n / h l e r a r c h i s c h e n , a f f i n i t i v e n u n d p r a - f e r e n t i e l l e n / R e l a t i o n e t y p e n n a c h g e n i e s e n u n d es w i r d d e r a u f den E n t w i c l c l u n g 3 8 t a n d d e s R e l a t i o n s n e t z e s h i n w e i s e n d e , für e i n e n D e a k r i p - t o r b e r e c h n e t e s p e z i f i a c h e R e l a t i o n a w e r t / k / , bzw. a e l n e G l i e d e r u n g j e n a o h d e n R e l a t i o n e n v e r s c h i e d e n e r T y p e n f e s t g e s t e l l t .
D i e e r m i t t e l t e n Paraméter w u r d e n m i t d e n R e f e r e n z w e r t e n e b e n - f a l l s v e r g l i c h e n .
3. D i e U n t e r s u o h u n g d e r tiefenmássigen G l i e d e r u n g d e r S t r u k t u r z e i g t e , dase d e r T h e s a u r u s d u r c h eecha H i e r a r c h i e n i v e a u s c h a r a k t e r i - s i e r t w i r d u n d d i e s e G l i e d e r u n g b e w e i s t , d a s s s i c h d a s P r i n z i p d e r Bchv. a c h e n H i e r a r c h i e d u r c h s e t z t . D i e S t r e u u n g d e r B e g r i f f e j e n a o h den e i n z e l n e n N i v e a u s s t e h t i n g u t e r U b e r e i n s t i m m u n g m i t d e n S t r e u - u n g s c h a r a k t e r i s t i k e n d e s .vorgeführten R e f e r e n z m o d e l l s . D e r a t a t i s o h e n A n a l y s e s o l l s p a t e r u n t e r Anwendung d e r G e b r a u c h a k e n n w e r t e d e s T h e - s a u r u s e i n e d y n a m i s c h e A n a l y a e f o l g e n .