• Nem Talált Eredményt

Magyar nyelvű számítástechnikai tezaurusz II. A tezaurusz összehasonlító statikai elemzése megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Magyar nyelvű számítástechnikai tezaurusz II. A tezaurusz összehasonlító statikai elemzése megtekintése"

Copied!
16
0
0

Teljes szövegt

(1)

6 8 1 . 3 / 0 8 3 - 7 2 /

MAGYAR NYELVŰ

SZÁMÍTÁSTECHNIKAI TEZAURUSZ II.

A TEZAURUSZ ÖSSZEHASONLÍTÓ STATIKAI ELEMZÉSE

Molnár Imre

Építésügyi Tájíkonatási Köiporrt

Az alább következő elemzés megjelenésekor a Számítástechnikai F o g a l m a k T e z a u r u s z a / l / már m e g j e l e n t és e l j u t o t t a z érdeklődő s z a k ­ e m b e r e k h e z . A Tudományos ós Műszaki Tájékoztatás 1 9 7 3 . d e c e m b e r i számában részletes ismertetés j e l e n t meg a t e z a u r u s z elkészítésének indítékairól, módszereiről és g y a k o r l a t i lefolyásáról / 2 / , E c i k k célja a kész t e z a u r u s z megvizsgálása abból a szempontból, h o g y m i l y e n s t a t i k a i paraméterek j e l l e m z i k , s kísérletet teszünk a megállapított paraméterek értékelésére i s . Elsősorban a n n a k elemzésére törekszünk, h o g y m i b e n és m e n n y i b e n v a n i n d o k a t e z a u r u s z továbbfejlesztésére, i l l e t v e m e l y paraméterek tekintetében látszik megfelelőnek - már a t e z a u r u s z f o l y a m a t o s felhasználásának k e z d e t e előtt.

Az elemzés során k a p o t t a d a t o k a t , jellemzőket összevetjük n é ­ hány - korábbi elemzéseink eredményeként rendelkezésünkre álló - e¬

gyéb h a z a i t e z a u r u s z - m o d e l l , i l l e t v e m a k r o t e z a u r u s z megfelelő a d a t a i ­ v a l / 3 , 4, 5/, h o g y a számértékek p l a s z t i k u s a b b értékelését, közvet­

l e n e b b megértését biztosíthassuk. A hasonlítás céljából felhasznált a d a t o k természetesen nem tekinthetők o l y a n e l f o g a d o t t és kétségkívül h e l y e s mennyiségeknek, a m s l y e k h e z mérve j o g o s a n minősíteni l e h e t e g y t e z a u r u s z t . Az összevetés megegyezései n e m c s a k a Számítástechnikai F o g a l m a k Tezauruszát, hanem a z idézett m o d e l l e k e t i s minősitik. Az a nézetünk a z o n b a n , h o g y több, egymástól többé-kevésbé független, elté­

rő körülmények között, eltérő természetű fogalomkörök megmunkálásáról k a p o t t a d a t o k feltűnően megegyező sajátosságai mindenképpen f i g y e l m e t érdemelnek, s hisszük, h o g y az összehasonlítások száménak Bzaporitésa révén e g y r e j o b b a n általánosítható következtetések vonhatók l e a v i z s ­ gált és összevetett fogalomcsoportokról. Az elemzések t a p a s z t a l a t a i a m a g y a r n y e l v és a m a g y a r szakterminológia s z e m a n t i k a i mélységeihez, eajátosságaihoz i s közelebb v e z e t h e t n e k .

Hasonlóképpen: a r e f e r e n c i a - m o d e l l e k adataitól való szignifikáns eltérés i s éppúgy l e h e t érv a vizsgált t e z a u r u s z m e l l e t t , m i n t az e l ­ l e n . A p u s z t a mennyiségi a d a t o k - önmagukban véve - még c s a k a sajá­

tosságokat mutatják meg, a z o k értékeléséhez m é g további, a t e z a u r u s z - épités g y a k o r l a t i tapasztalataiból származó megfigyelések ás m e g f o n ­ tolások szükségesek.

8 1

(2)

Í.OLKÁH I . i Számítástechnikai t e z a u r u s z

A t e z a u r u s z áttekintő jellegű s t a t i k a i elemzését 3 területen végezzük e l :

1 . A t e z a u r u s z fogalom-készletének vizsgálata 2. A f o g a l m a k reláció-hálózatának vizsgálata 3. A s z e r k e z e t mélységi tagozódásának vizsgálata

1 . A TEZAURUSZ F0SAL01Í-EÉS2LETÉHSK VIZSGALATA

Az elemzés lefolytatásához néhány jelölésre v a n szükségünk.

K z e k az alábbiak:

• a t e z a u r u s z d e s z k r i p t o r a i n a k száma: d

• a t e z a u r u s z non-deszkriptórainak száma: n

• a t e z a u r u s z összes f o g a l m a i n a k száma: f f = d + n

• a t e z a u r u s z d e s z k r i p t o r a i permutált változatainak száma: pf l

• a t e z a u r u s z n o n - d e s z k r i p t o r a i permutált változatainak száma:

*n

• a t e z a u r u s z összes permutált fogalom-változatainak száma: p P = Pd + Pn

• a t e z a u r u s z összes tételeinek száma: t t = f + p = / d + n / + / pd + pn/

A t e z a u r u s z e l e m e i n e k funkcionális megoszlását a z l . s z . táblá­

z a t m u t a t j a b e .

A táblázat a d a t a i értékelésének elősegítéséül a 2 - 4 . a z . tábláza­

t o k b a n b e m u t a t j u k a f e n t e b b e m i i t e t t h a z a i kezdeményezések néhány h a ­ sonló adatsorát.

Az összefoglaló f o g a l m i arányok /£, p / érdekes megegyezéseket m u t a t n a k a számítástechnikai t e z a u r u s z és az összehasonlításul bemu- t a t o t t t e z a u r u s z - m o d e l l e k között,

A t e z a u r u s z f o g a l m i kimunkáltságának e g y i k l e g f o n t o s a b b mutatója a n o n - d e s z k r i p t o r o k /valóságos és "mesterséges" szinonimák és k v á z i - szinonimák/ és d e s z k r i p t o r o k egymáshoz mért számaránya. Ez a hányados a t e z a u r u s z f o g a l m i anyagának redundar.cia-hátterét /R/ a d j a meg.

(3)

TiiT 21.évi. 2.szám 1974.február

l . s z . táblázat

A TEZAURUSZ FOGALMAINAK F U N K C I O N Á L I S MEGOSZLÁSA

tétel egyaég hányad

d n

f = / d + n /

2347 256

2603

0 , 5 1 0,06

0,57

? d Pn

1 7 5 6 233

1989

0,38 0,05

0,43

t 4592 1,00

2.e - z . táblázat

A KÖZÉT T E ZAU R U S Z - K O D E L L FOGALMAINAK FUNKCIONÁLIS iiSGOSZLÁSA

tétel egyaég hányad

d n

f = / d + n /

210 80

290

0, 4 5 0,17

0,62

Pd Pn

P V pd+ Pn/

108 70

178

0,23 0,15

0,38

t 468 1,00

83

(4)

MOLNÁR I . : Számítástechnikai t e z a u r u s z

3. s z . táblázat A MUNKABÉR TEZAURUSZ-MODULI FOGALMAINAK

FUNKCIONÁLIS MEGOSZLÁSA

tétel egység hányad

d D f V d + n /

39 9

4 6

0,43 0,10

0,53

* d

pn

P - / Pd+ Pn/

37 5

42

0,41 0,06

0,47

t 90 1,00

4. s z , táblázat A MUNKAÜGY. MUNKATUDOMÁN Y MAKROTEZAURUSZ FOGALMAINAK

FUNKCIONÁLIS MEGOSZLÁSA

tétel egység hányad

d n f«/d+n/

244 5 1

295

0,43 0,00

0,52

pd Pn

P"/»d**tt/

219 5 1

270

0, 3 9 0,09

0,48

t 565 1,00

(5)

T«T 21.évf. 2.szám 1974.február

H - I - 2 § Í 7 "

Az Összehasonlításként b e m u t a t o t t t e z a u r u s z - m o d e l l e k R-értékei a következők:

0,23 /kőzet t e z a u r u s z - m o d e l l /

0 , 2 1 /munkaügy, munkatudomány m a k r o t e z a u r u s z / 0,23 /munkabér t e z a u r u s z - m o d e l l /

Az összehasonlítás a r r a m u t a t , h o g y a t e z a u r u s z R = 0 , 1 1 értéke a szükségesnél mindenképpen a l a c s o n y a b b redundancia-hátteret t a k a r . A számítástechnika szakterülete m o d e r n , d i n a m i k u s fejlődésben lévő i s - meretág. Fogalom-készletének túlnyomó része a n g o l formában került a magyar s z a k e m b e r e k e l é . Számos területen még nem rendelkezünk t e l j e s értékű megfelelőkkel, s o k e s e t b e n egymás m e l l e t t él az a n g o l nyelvű fogalomváltozat és a magyar szakszó / p l . p r i n t e r - gyorsnyomtató/, számos e s e t b e n p e d i g több m a g y a r megfelelő i s f o r g a l o m b a n v a n e g y - e g y a d o t t a n g o l szakkifejezésre, m i n t e g y e z z e l i s j e l e z v e , h o g y a m a g y a r számítástechnikai s z a k n y e l v még " i n s t a t u n a s c e n d i " található. E z t a h e l y z e t e t i s m e r v e , m i n d e n különösebb vizsgálat nélkül, a t e z a u r u s z néhány lapjának p u s z t a átolvasása révén i s a kötetbe f e l nem v e t t szinonimáknak, értelmi megfelelőknek t u c a t j a i t találhatjuk.

Az R - 0 , 1 1 érték i g e n a l a c s o n y v o l t a , i l l e t v e a f e n t i m e g f o n t o ­ lás egyértelműen u t a l e g y kéaőbbi, d i n a m i k a i jellegű elemzés f o n t o s ­ ságára. Az u g y a n i s b i z o n y o s r a vehető, h o g y a t e z a u r u s z g y a k o r l a t i felhasználása e g y a d o t t információrendszerben, jelentős n o n - d e s z k r i p - t o r karakterű a n y a g g a l gazdagítja m a j d a fogalom-állományt. J e l e n megjegyzésünk mindössze a n n y i t kivén rögzíteni, h o g y a t e z a u r u s z n o n - d e s z k r i p t o r állományának kiteljesítése szükséges és várható. Könnyű belátni, h o g y a g y a k o r l a t i életben felvetődött igények kielégítését aegitő t e z a u r u s z annál hasznosabbá válik, annál több irányból köze­

líthető meg, minél g a z d a g a b b s z i n o n i m a - és kvázi-azinonima-környezet v e s z i körűi az e g y e s d e s z k r i p t o r o k a t .

A t e z a u r u s z szerkezetének e g y másik lényegi jellemzője a f o g a - lomszervezésl s z i n t /!•/ mérőszáma. Ez a paraméter a n n a k vizsgálata révén határozható meg, h o g y m e n n y i b e n s z e r e p e l n e k a t e z a u r u s z b a n e g y ­ tagú, i l l e t v e többtagú f o g a l m a k , tehát: m i l y e n h e l y e t f o g l a l e l a t e ­ z a u r u s z a tisztán u n i t e r m e s , i l l e t v e a többszörösen összetett f o g a l ­ makból építkező, p o l i k o n c e p t t i p u s u t e z a u r u s z o k között, A f o g a l o m - szervezési s z i n t mérőazéma / L / a következő képlettel határozható meg:

Az összehasonlítási alapként b e m u t a t o t t m o d e l l e k L-értékei a k ö ­ vetkezők:

0 , 6 1 /kőzet t e z a u r u s z - m o d e l l /

= 0,76

£5

(6)

MOLNÁR I . j Számitástechnlkai t e z a u r u s z

0,92 /munkaügy, munkatudomány m a k r o t e z a u r u s z / 0,88 /munkabér t e z a u r u s z - m o d e l l /

Az 1 = 0,76 érték belül Tan a z o k o n a határokon, a m e l y e k e t a szem­

léltetésül m e g a d o t t referenciák vázolnak, de t a r t a l m i megértéséhez r ö ­ v i d magyarázat szükséges. A tisztán u n i t e r m e s fogalom-gyűjtemények e¬

setében L = 0 /zéró/. A tisztán kéttagú / u n i k o n c e p t / t i p u s u f o g a l m a ­ k a t tartalmazó gyűjteményeknél L « 1 . A tisztán p o l i k o n c e p t t i p u s u fogalmakból álló t e z a u r u s z o k esetében p e d i g L = 2. A valóságban a z o n ­ ban i l y e n t i s z t a , szélsőségesen r e n d e z e t t f o g a l m i konstrukciókra nem l e h e t számítani, az a d o t t fogalom-gyűjtemény m i n d i g több a l a p e l v e r e ­ dő értékével jellemzhető c s a k . A Számítástechnikai F o g a l m a k T e z a u r u ­ s z a tehát átmeneti jellegzetességeket m u t a t a tisztán u n i t e r m e s és a z u n i k o n c e p t fogalomszervezésü t e z a u r u s z o k között. Cgy tűnik - több mo­

d e l l vizsgálatának egybehangzó "vallomása" alapján -, h o g y a m a g y a r nyelvű s z a k t e z a u r u s z o k r a , sőt: talán a magyar n y e l v . s z a k f o g a l o m - s z e r ­ kesztési a l a p e l v e i r e i s jellemző l e h e t az' L - 0 , 5 - l i P közötti érték.

Ez az észrevétel még további megfigyelést és elemzéseket kiván, de valószínűnek látjuk, hogy objektív tendenciáról v a n szó.

2 . A FOGALMAZ RELÁCIÓ-HÁLÓZATÁNAK VIZSGÁLATA

A reláció-hálózat vizsgálata során voltaképpen a t e z a u r u s z " b e l ­ ső intelligenciáját", kapcsolási képességét, asszociativitását, t r a n - zitivitását, belső logikáját vesszük szemügyre, i l y módon - áttétele­

s e n bár - a t e z a u r u s z fogalom-állománya megmunkálásának s z e l l e m i t e ­ vékenységét minősitjük.

A t e z a u r u s z t e l j e s reláció-hálózata c s a k kétoldalú, kölcsönös kapcsolatokból tevődik össze. A t e z a u r u s z b a n a l k a l m a z o t t reláció-ti- p u s o k a következők:

• h i e r a r c h i k u s relációk / r ^ / Jelölés: G - S

• a f f i n i t i v relációk / r / Jelölés: R - R a

• preferenciális relációk / r ^ f Jelölés: T - L

A t e z a u r u s z a h i e r a r c h i k u s reláció-tipust két felmenő s z i n t e n i s t a r t a l m a z z a :

• közvetlen g e n e r i k u s relációk /G/ G = 1204

• legfelsőbb g e n e r i k u s relációk / * 3 / * 3 = 2140

A t e z a u r u s z relációinak elemzéséhez nekünk a G k a p c s o l a t o k meny- nyiségére v a n szükségünk, a tezauruszból nyerhető ií-érték a z o n b a n nem hűséges kifejezője a valóságnak, m i v e l számos o l y a n d e s z k r i p t o r v a n az a n y a g b a n , a m e l y n e k közvetlen g e n e r i k u s /G/ k a p c s o l a t a e g y s z e r s m i n d

(7)

TMT 2 1 . é r i . 2,Bzám 1974.február

legfelsőba g e n e r i k u s k a p c s o l a t a / « G / i s , h i s z e n a d e s z k r i p t o r o k j e l e n ­ tős csoportjának c s a k e g y e t l e n felmenő k a p c s o l a t a v a n . A t e z a u r u s z e ¬ z e k e t a k a p c s o l a t o k a t i s • £ jelöléssel a d j a meg. Ezért a reláció-háló- z a t elemzéséhez a követkesd a d a t o t k e l l t e k i n t e t b e Tennünk:

*0 - 2140

Az «G kapcsolatjelölések számának - e l v i l e g - e g y e z n i e k e l l a z S / s p e - c i f i k u s / k a p c s o l a t o k számával. E z érthető, h i s z e n h a X g e n e r i k u s f o ­ galomhoz kapcsolódik Z l s p e c i f i k u s f o g a l o m , a k k o r - kétoldalú k a p c s o ­ l a t o k esetében - X1 s p e c i f i k u s fogalomhoz i s szükségképpen kapcsoló­

d i k egy I g e n e r i k u s f o g a l o m . E z a t e l j e s mennyiségi azonosság - n y i l ­ ván egyszerű t e c h n i k a i okokból - nem áll f e n n a t e z a u r u s z b a n , a h i e r ­ a r c h i k u s kapcsolódás két iránya között, h i s z e n

S - 2103 I l y módon

rb • »G + S • 4243 Az a f f l n i t i v relációk / t J összege

ra - 7 6 6 ,

ami 383 fogalompár rokonsági /asszociációs/ kapcsolatát f e j e z i k i . Az a f f i n i t i v relációk értelmezését a t e z a u r u s z bevezetője világosan és h e l y e s e n határozza meg.

A t e z a u r u s z p r e f e r e n c i á n a relációinak hálózatát részint s z L /non-deszkriptortól d e e z k r i p t o r h o z v e z e t ő / relációk, részint p e d i g a T / t i l t o t t f o g a l o m / relációk adják meg. E z e k számának i a e g y e z n i e k e l l e n e . A tezauruszból kigyűjtött a d a t o k alapján

1 - 254 I « 252

I l y módon a t e z a u r u s z preferenciális relációinak / r / száma:

r » L + I « 506

összegezve, a t e z a u r u s z összes relációinak száma;

r "rh + ra + ro "4 2 43 + 76 6 + 50 6 " 5515

Az c s s z e s relációk megoszlását a z 5. e z . táblázat m u t a t j a b e .

(8)

MOLNÁR I . : Számítástechnikai t e z a u r u s z 5 . a z . táblázat A TEZAURUSZ RELÁCIÓINAK MEGOSZLÁSA

jelölés egység hányad

rh 42*5 0,77

ra 766 0,14

rP

506 0,09

p 5515 1,00

E táblázat a d a t a i n a k értékeléséhez b e m u t a t j u k a hasonlítást a l a p ­ ként már idézett fogalom-gyűjtemények m e g f e l e l d a d a t a i t / 6 . s z . táblá­

z a t / .

Az összehasonlítás a z t m u t a t j a , hogy a t e z a u r u s z markánsan k i ­ d o l g o z o t t h i e r a r c h i k u s kapcsolat-hálózata m e l l e t t a z a f f i n i t i v ás - különösen - a preferenelálls relációk hálózata még nem eléggé f e j l e t t - a r e f e r e n c i a - a d a t o k h o z viszonyítva /márpedig e z utóbbi két k a p c s o ­ l a t i kategória a z idézett fogalom-gyűjteményékben sem megnyugtatóan kimunkált/.

Egyébként a preferenoiáliB relációkra vonatkozó számszerű a d a t o k a l a c s o n y v o l t a i s a z aránylag kevés számú s z i n o n i m a feltüntetésével függ össze.

A kapcaolat-hálózat funkcionális megoszláaának bemutatása után lehetővé vált a t e z a u r u s z egy u j a b b Jellemzőjének megállapítása, meg­

határozható a t e z a u r u s z egy a d o t t deszkriptorának kapcsolódási mérő­

száma / k / s

Hasonlítás! alapként b e m u t a t j u k a már idézett három forrás meg­

f e l e l d jellemzőit A - e z . táblázat/.

Az összehasonlítás egyértelmű eredménye a z a megállapítás, h o g y a t e z a u r u s z fogalom-hálózata még - egészében véve - nem megfelelően részletezett, továbbfejlesztése feltétlenül i n d o k o l t n a k látszik.

Nem érdektelen annak vizsgálata aeo, hogy *z egy d e s z k r i p t o r r a jutó Összee relációk hogyan o s z l a n a k meg a z e g y e a kapcsolat-típusok között. E z t a 8 . s z . táblázat szemlélteti.

(9)

TMT 21.érí. 2.ázom 1974.február

6 .B Z. táblázat NÉHÁNY TEZAURUSZ-MODELL RELÁCIÓINAK MEGOSZLÁSA*

Jelölés ^ °sszee relációk hányada

Közét Munkaügy Munkabér

rh 0,59 0 , 7 1 0,69

ra 0,18 0, 1 3 0,15

rp 0,23 0,16 0,16

r 1,00 1,00 1,00

7 . a z . táblázat NÉHÁNY TEZAURUSZ-MODELL FAJLAGOS RELÁCIÓ-MENNYISÉGÉNEK / r / d /

BEMUTATÁSA**

Kőzet Munkaügy Munkabér f a j l a g o s reláciő- _ „

mennyiség / k / 3*36 2'67 2'82

A táblázat a d a t a i e tanulmány összehasonlító vizsgálatai számára á t ­ d o l g o z o t t értékek, m i v e l a z idézett e r e d e t i közleményekben l e i r t f o ­ galom-gyűjtemények egyirányú /nem kölcsönös/ relációkat i s t a r t a l ­ maznak, s az összehasonlítás érdekében e z e k e t l e v o n t u k a m o d e l l e k t e l j e s reláció-mennyiségéből, a hányad-értékeket p e d i g megfelelően módosítottuk.

Az összehasonlítás kedvéért átszámított a d a t o k .

^9

(10)

MOLNÁR I . : Számítástechnikai t e z a u r u s z

8. B Z . táblázat A TEZAURUSZ EGY DESZKRIPTORA KAPCSOLATAINAK MEGOSZLÁSA

KAPC SO LAT-TÍPUSOK SZERINT

k a p c s o l a t —

t l p u e egység

rh 1 , 8 1

ra 0,33

rp 0 , 2 1

r 2,35

Hasonlításul b e m u t a t j u k a referencia-források megfelelő megosz­

lási a d a t a l t / g . s z . táblázat/.

3 . a z . táblázat NÉHüNY TEZAURUSZ-MODELL EGY DESZKRIPTÓRÁRA JUTÓ FAJLAGOS KAPCSOLAT-MENNYISÉGÉNEK MEGOSZLÁSA KAPCSOLAT-TÍPUSOK SZERINT

r e f e r e n c i a ­

m o d e l l rh ra rp

Kőzet 1,97 0,63 0,76

Munkaügy 1,90 0,35 0,42

Munkabér 1,95 0 , 4 1 0,46

Az összehasonlítás n e m c s a k a z t m u t a t j a meg, h o g y a t e z a u r u s z l é ­ n y e g e s e n kevésbé f e j l e t t reláció-hálőzattal r e n d e l k e z i k , m i n t a bemu­

t a t o t t referenciák, hanem a z t i s m e g m u t a t j a , h o g y elsősorban a p r e f e - renciális relációk száma s z o r u l szaporításra. E d d i g i t a p a s z t a l a t a i n k alapján u g y véljük, h o g y a megfelelően k i f e j l e s z t e t t t e z a u r u s z n a k r a

é s r p értéke 0,5 é s 1,0 között változhat, az a d o t t szakterület s p e ­ c i f i k u s adottságai s z e r i n t , de n e m i g e n m a r a d h a t 0,5 a l a t t . Ez a meg­

jegyzés t a p a s z t a l a t i természetű, bár s z á m o B e d d i g i elemzés támasztja alá. Egyértelmű a z o n b a n az i s , h o g y a vizsgált t e z a u r u s z m é g a g y a ­ k o r l a t i felhasználás előtt áll, a m i kétségkívül gyarapító hatással l e s z a preferenciái!s és a f f l n i t i v relációk számára.

(11)

TMT 21.ári. 2.szám 1974.február

3. A SZERKEZET MÉLYSÉGI TAGOZÓDÁSÁNAK VIZSGÁLATA

A kapcsolat-hálózat áttekintő elemzése után - a t e z a u r u s z h i e r a r ­ c h i k u s indexének elemzése alapján - vizsgáljuk meg a t e z a u r u s z - s z e r k e ­ z e t mélységi tagozódását. A fogalom-állomány megoszlását a z e g y e s h i ­ e r a r c h i a - s z i n t e k s z e r i n t a 1 0 . s z . táblázat, i l l e t v e - e g y r e f e r e n c i a - forrással összevetve - az l . s z . ábra m u t a t j a b e .

1 0 . s z . táblázat A TEZAURUSZ FOGALOM-ÁLLOMÁNYÁNAK iEGÖSZLÁSA

HIERARCHIA-SZINTEK SZERINT

h i e r a r c h i a ­

s z i n t egység i

1 . 197 8,4

2. 944 40,2

3. 838 35,7

4. 293 12,5

5. 63 2,7

6. 12 0,5

1-6. 2347 1 0 0 , 0

Az l . s z , ábrán p o n t o z o t t v o n a l l a l b e m u t a t o t t referenciaforrás jellegzetességei jó megegyezést m u t a t n a k a tezauruszéival - e g y h i ­ erarchia-lépcső eltolással. M i n t a z t a t e z a u r u s z bevezetője i s k i f e j ­ t i , a tezauruszból - i n d o k o l t a n - hiányzik az egyértelmű, felső g e n e ­ r i k u s összefonódás / a m i t a referencia-forrás 1 . h i e r a r c h i a - s z i n t j e t a r t a l m a z / . Ebből a szempontból J o b b n a k k e l l Ítélnünk a t e z a u r u s z struktúráját, m i n t a felhasznált referenciákét. E g y i k legjellemzőbb pozitív tulajdonsága a t e z a u r u s z n a k éppen a z , h o g y v i s z o n y l a g n a g y ­ számú / 1 9 7 / f o g a l o m található a z 1 . /csoportképző d e s z k r i p t o r o k a t tartalmazó/ h i e r a r c h i a - s z i n t e n . Ez a jellegzetesség hangsúlyosan mu­

t a t j a be a l a z a h i e r a r c h i k u s bontás - i g e n h e l y e s - szemléletmódját, i l l e t v e a t e z a u r u s z bevezetőjében k i f e j t e t t szerkesztési a l a p e l v meg­

valósulását .

Az ábra tanúsága és a 1 0 . s z . táblázat a d a t a i s z e r i n t , a t e z a u ­ r u s z g e r i n c e / a fogalom-állomány 3/4 részénél t ö b b / a 2 - 3 , h i e r a r c h i a - s z i n t e k e n található. Az ábra egyébként Jól közelíti a z u n . n o r m á l - e l - osslési görbét, a m i t különböző t e z a u r u s z o k esetében egyaránt j e l l e m ­ zőnek találtunk a f o g a l m i eloszlás g r a f i k u s ábrázolásában.

91

(12)

KC'Lüó I . : Számítástechnikai t e z a u r u s z

1 . I I . ábra

A T E Z A U R U S Z F O G A L M A I N A K S Z Ó R Ó D Á S A H I E R A R C H I A - S Z I N T E K S Z E R I N T

Tezauruszról lévén szó, mégpedig o l y a n tezauruszról, a m e l y a r r a a célra készült, h o g y inforaációfeltáró, -tároló és -kereső r e n d s z e ­ r e k eszközévé váljék, a f o g a l m a k h i e r a r c h i k u s tagolása k i f e j e z e t t e n a felhasználási s z e m p o n t kiemelésével - és ezért: o l y k o r a szigorú tudománylogikai megfontolások háttérbe szorításával - történt. E z z e l a szemléletmóddal a z o n b a n m i n d e n o l y a n információs s z a k e m b e r n e k e g y e t k e l l e n e értenie, a k i az információkezelés m i n d e n n a p o s g y a k o r l a ­ tában é l . Ez a szemléletmód o l y a n "önkényes" megoldásokat kiván meg, a m e l y e k lényegesen n e h e z e b b munkát o k o z n a k , m i n t a legszigorúbb t u d o ­ mánylogikai osztályozási e l v e k alkalmazása. A t e z a u r u s z a f o g a l m i r e n d világa, de nem a merevségé, hanem a d i n a m i k u s , a változásra m i n -

(13)

I M I 21.évi. 2.azám 1974.f e b r u á r

d i g kész és a l k a l m a s rendé. Találóan f e j e z i k i e z t a szemléletmódot M e p h i s t o t e l e s e g y m o n d a t a GOETHE Faust-jában / f i / :

" G r a u , t e u r e r F r e u n d , i 3 t a l l e r h e o r i e , u n d grün des L e b e n s golöner 3aum."

/"Szürke, Öcsém, m i n d e n teória, a s z élet aranyfújt) zöld."/

A f e n t i e k során a t e z a u r u s z s t a t i k a i elemzésének néhány f o n t o s irányát követtük a megállapítottuk a kialakított fogalom-állomány éa reláció-hálózat néhány s z e r k e z e t i és mennyiségi Jellemzőjét. Világo­

s a n látjuk a z o n b a n , h o g y a t e z a u r u s z g y a k o r l a t i használhatóságát, a fogalom-állomány célszerű méretét és szükséges - horizontális és v e r ­ tikális - tagolását m a j d c s a k a g y a k o r l a t i kísérletek a d a t a i r a a l a p o ­

z o t t d i n a m i k a i elemzés eredményei határozhatják meg, s indíthatják e l a használati s z e m p o n t kiemelésével megcélzott o p t i m u m felé.

#

Az elenzéshez felhasznált és idézett s z a k i r o d a l o m

/ ! / Számítástechnikai f o g a l m a k t e z a u r u s z a . S z e r k . : S c h i f f E r v i n , tí?.

1 9 7 3 . OUKDK, 396 p .

/ 2 / SCHIFF E r v i n : M a g y a r nyelvű számítástechnikai t e z a u r u s z . I . ^ T J. 1 , 2 0 . k . 1 1 - 1 2 . s z . 1973. n o v . - d e c . p . 7 8 5 - S 0 9 .

/ 3 / MOLNAH I m r e ; Újszerű t e z a u r u s z - s z e r k e z e t kíalaicit&sa. = TMT,19.k.

3 - s z . 1972.márc. p . 1 4 9 - 1 6 9 .

/ 4 / liOLHAH I m r e : Az információs s z a k t e z a u r u s z f o g a l m a , r e n d s z e r e és felépítése, különös t e k i n t e t t e l az építésügyi ágazati s z a k t e z a u ­ r u s z kialakítására. Bp. 1 9 7 3 . £ T E . 392 p .

/ 5 / MOLMAfi I m r e : Az információkezelés f o g a l o m r e n d s z e r e . Bp. 1 9 7 3 . Zözgazd. és J o g i k i a d ó . 2 1 8 p .

/ 6 / GOETHE, J.W.: F a u s t . G e s a m t a u s g a b e . L e i p z i g , é.n. I n a e l v e r l , 573 p , T e i l 1 . 19o p . / m a g y a r r a Sárközi György forditása/

*

93

(14)

JcOLNAR I . : Számitásteohnikai t e z a u r u s z

MOLNÁR. I . : T h e s a u r u s on o o m p u t e r t e c h n i q u . e s i n Hungárián.Part TT_

C o m p a r a t i v e s t a t i c a n a l v s i s o f t h e t h e s a u r u s

The "Számítástechnikai F o g a l m a k T e z a u r u s z a " / T h e s a u r u s o n Comput­

e r T e c h n i q u e s / i s examíned, a s t a t i c a l a n a l y s i s o f d e s c r i p t o r i n t e r - r e l a t i o n s h i p s a n d o f s t r u c t u r a l d e p t h i s g i v e n i n 3 p a r t s :

1 . I n t h e o o u r s e o f t h e v o r d - s t o c k a n a l y s i s t h e f o l l o v ; i n g s a r e i l l u s t r a t e d j q u a n t l t a t i v e i n d i c a t o r s o f t h e f u n c t i o n a l d i s t r i b u t i o n ; v a l u e o f t h e r e d u n d a n c y f a c t o r /R/ r e f e r r i n g t o s y n o n i m e - a m p l e n e s s ; i n d e x o f t h e levél o f w o r d compílation / L / r e f e r r i n g t o c h a r a c t e r l s - t i c s o f d e s c r i p t o r - c o m p l e x i t i e s . T h e s e c h a r a c t e r i s t i c s compareá w i t h t h e c o n c e r n i n g d a t a o f somé t h e s a u r u s m o d e l s p r o v e t h a t t h e T h e s a u r u s c o n s i s t s o f r e l a t i v e l y f e w n o n - d e s c r i p t o r s u r r o u n d i n g s , h o w e v e r , i t i s a c o l l e c t i o n w i t h s u i t a b l e s t r u c t u r a l levél.

2. D e s c r i p t o r i n t e r - r e l a t i o n s h i p s a r e a n a l y z e d . I n t h e m e a n t i m e b a s i c t y p e s o f i n t e r - r e l a t i o n s h i p s / h i e r a r c h i c a l , a f f i n i t i v e a n d p r e - f e r e n t i a l / a n d t h e l r q u a n t i t a t i v e d i v i s i o n i s s t a t e d . S p e c i f i c r e l a - t i o n v a l u e /'&./ p e r d e s c r i p t o r e x p r e s s i n g t h e s t a g e o f i n t e r - r e l a t i o n ­ s h i p s d e v e l o p m e n t as m e l l a s t h e s t r u c t u r e o f t h e v a r i o u s c o n n e c t i o n s a r e alsó e x a m i n e d .

Paramétere r e g i s t e r e d a r e alsó c o m p a r e d w i t h r e f e r e n c e d a t a . 3. As t o t h e s t r u c t u r a l d e p t h i t i s f o u n d t h a t t h e T h e s a u r u s c o n s i s t s o f 6 h i e r a r c h i c a l l e v e l s , t h i s s t r u c t u r e p r o v e s t h e a p p l i c a ¬ t i o n o f t h e weak h i e r a r c h i c a l p r i n c i p l e . The d i s p e r s i o n o f t e r m s w i t h i n t h e s e l e v e l s i s i n c o n g r u e n c e v - i t h t h e normál d i s p e r s i o n d i a ­

gram, The s t a t i c a l a n a l y s i s i s t o be c o n t i n u e d l a t e r b y a d i n a m i c one a d o p t i n g c h a r a c t e r i s t i c s f r o m t h e u s e o f t h e T h e s a u r u s .

MOJIHAP. H. : T e a a y p y o n o S H q g c j i H T e j i b a o a T O X T T K K O H B B e n r e p c K O u

flauKe. q a o T b I I . C p a B H H T ej t . m f i c r a T H t e o K t í R a H a j B a T e a a y p y o a

B O T a T t e s T p e x l a c T H X j a e T O f l C T a T H i e o x t i H a H S J i H 3 c a o a a p H o r o s a n a c a , o e r s cesaeR w e a a y n o B A T a a i i K H r a n x e rjiyŐHHHofi c t p y K T y p a T e ­ a a y p y o a n o B H » m c a a T e j ! b H o t l r e x ü H K e .

1 . B x o z e ananH3a w r o B a p H o r o a a n a c a s s m H C j i H K i T O f l c j i e a y B n i i e B e j m i K H H :

- K O J i s o e c T B e H T r a e n o K S 3 a T e a H í y n K i j K O H a í b H o r o p a c n p e a e j i e n i u r n o H a ¬

- s e j i s i H n a í a K T o p a p e n y w r a m i H i f ( T. e . o T H o n e m t e i s o j t a n e i e c K p s n - r o p o o K < r a c a y H e c K p a n r o p o B ) , x a p a x T e p n a H p y» n a a "ÖorafCTao" r e - a a y p y c a B O B H O H U K S X ;

(15)

TMT 21.évi. 2.ezám 1974.február

- B e a n v K H a , x a p a K T e p H 3 H p y i ) i n a í r y p o B a n b W I O X H O C T B noHüTHfi ( r. e . a e - a a i n n a , p a B H a j i o r K O m e n B » u n c i a B c e x n e p M y T H p o B a H H H X s a p H a n n K K

B O B X n O H R T K Í ) .

C p a B H H B Q H n o^ y ^ e H H H e a afané c a a n m i i i K i p y n t r T 8 3 a y p y o o B y T B e p - x í a e T o s , I T O aaHHHfl T e s a y p y o oöjianaeT o p a B H B T e a b n o Hatío^LmoS O K P S C T -

H O C T t n R S J i e o K p H n T o p o B , n o B w e e r J t o c T a T O i n o B U O O K H H y p o a e H b C J I O X K O O T H n o n a T« t .

2. B x o a e a n a j i B a a o e r a OBUseft B K T O C I S O T C S :

- K o j n i a c T í e H R o e p a c n- p e i e- n e m i e O Ű H O B H H X T I U O B O B g s e f t ( r . e. i i e p a p - i B i e c K H i , a $ $ H H R T R 8 H H X a p e í- e p e a n H a i b i w x ) j

- s e j i H i H H a , x a p a K T e p H 3 H p y » m a J ! p a 3 B K T O O T b o e r n o a s t s e f l n p a B H a n O T - R o m e H i m i n c i a a c e x e s ő s e i t K v i r o j i y B c e x a e c K p r o i r o p o B .

H o a y i e n m j e * a n n n e c p a a m i B a n T c j i c HMerommiHOJi.

3. B x o n e a H a J i ü 3 a rayŐHSHoB O T p y K T y p u B a s o H s e T O f l , I T O T e a a y p y c x a - p a K T e p H a B p y e r a f l 6 y p o s K J i u n j r e p a p x m r , a H e p a p x H i e c K H e C B U S H y o T a - n o B J i e r a n o n p H H U H i i y T S X n a a K B a e u o i l "cjiaCoií H e p a p z a n " . P a o n p e z e - j i a H i t e nORüTitfi i i e u i y O T n e j i b r r a i i H y p o B a n u s a a o c T a T O * i H O f t n é p e c o a - a a n a e T c o a n o f l O T o p o n u o íyHKUHefl H O p i i a x b R o r o p a c n p e a e j i e H i i H , o a p y r o f l O T o p o n u c p a c n p e n . e j i a T e j i b H H M B : ocoöaHHOOTAMI i p y r n x i i o i e a e f l . nocJie c r a T H i e o K o r o a t r a j i H a a i o n o n o j i e z o B a T t a JtKHaiiK- i e o i c a f t a H a - j i z af B K O T o p O M H O J I X H H Ö H T b y ^ T e H H H n o K a. - 3 a T e . i n r e s a y p y c a , n o a y - M P H H u a a x o a e e r o H 0 n o j n. 3 o s a H H » .

jiOLKAR. I . i R e c h e n t e c h n i a c h e r T h e s a u r u s i n u n g a r i s c h e r S p r a c h e .

I I . V e r g l e i c f a e n d e s t a t i s c h e A n a l y a e d e s T h e s a u r u s "

Ea w i r d d e r " T h e s a u r u s r e c h e n t e c h n i s c h e r B e g r i f f e " e i n e r s t a t i - s c h e n A n a l y a e s e i n e s B e g r i f f s b e s t a n d e a , dea R e l a t i o n s n e t z e s d e r Be- g r i f f e u n d a e i n e r T i e f e n s t r u k r t u r , i n d i e f o l g e n d e n d r e i T e i l e geglíe- d e r t , u n t e r z o g e n :

1 . I m L a u f e d e r A n a l y a e dea B e g r i f f s b e s t a n d e a w e r d e n d i e o u a n t i - t a t i v e n K e n n z i f f e r n d e r f u n k t i o n e l l e n Y e r t e l l u n g , d e r V.'ert d e a a u f d e n Synonyménreichtum h i n v . e i s e n d e n H e d u n d a n z f a k t o r s /R/ / á . h . Q u o t i -

95

(16)

MOLMAR I . : Számítástechnikai t e z a u r u s z

e n t a u s den l m T h e s a u r u s e n t h a l t e n e n H i c h t d e s k r i p t o r e n u n d D e s k r i p - t o r e n / , s o w i e d i e Messziírer des a u x d i e Komplexitát d e r D e s f c r i p t o r e n h i n w e i a e n d e n B e g r i f f s o r g a n l s a t l o n s n i v e a u s / ! / / d . h . Verháltnis d e r p e r m u t i e r t e n u n d d e r n i c h t - p e r m u t i e r t e n Ausdrücke/ f e e t g e s t e l l t . D i e - ee K e n n d a t e n w e r d e n d e n einschlágan Angaben e l n i g e r T h e a a u r u s m o d e l l e gegenübergestellt u n d a u f g r u n d d e r e r h a l t e n e n V e r t e w i r d d e r T h e s a u - r u s a l s e i n e Sammlung m i t e i n e r g e r i n g e n H i c h t d e s k r i p t o r e n u m g e b u n g k l a s s i f i z i e r t , d i e J e d o c h e i n e n t s p r e c h e n d e s B e g r i f f s o r g a n i s a t i o n a - n i v e a u b e s i t z t .

2. B e i d e r U n t e r s u c h u n g dee R e l a t i o n s n e t z e s w i r d d i e q u a n t i t s t i - v e V e r t e i l u n g d e r g r u n d l e g e n d e n / h l e r a r c h i s c h e n , a f f i n i t i v e n u n d p r a - f e r e n t i e l l e n / R e l a t i o n e t y p e n n a c h g e n i e s e n u n d es w i r d d e r a u f den E n t w i c l c l u n g 3 8 t a n d d e s R e l a t i o n s n e t z e s h i n w e i s e n d e , für e i n e n D e a k r i p - t o r b e r e c h n e t e s p e z i f i a c h e R e l a t i o n a w e r t / k / , bzw. a e l n e G l i e d e r u n g j e n a o h d e n R e l a t i o n e n v e r s c h i e d e n e r T y p e n f e s t g e s t e l l t .

D i e e r m i t t e l t e n Paraméter w u r d e n m i t d e n R e f e r e n z w e r t e n e b e n - f a l l s v e r g l i c h e n .

3. D i e U n t e r s u o h u n g d e r tiefenmássigen G l i e d e r u n g d e r S t r u k t u r z e i g t e , dase d e r T h e s a u r u s d u r c h eecha H i e r a r c h i e n i v e a u s c h a r a k t e r i - s i e r t w i r d u n d d i e s e G l i e d e r u n g b e w e i s t , d a s s s i c h d a s P r i n z i p d e r Bchv. a c h e n H i e r a r c h i e d u r c h s e t z t . D i e S t r e u u n g d e r B e g r i f f e j e n a o h den e i n z e l n e n N i v e a u s s t e h t i n g u t e r U b e r e i n s t i m m u n g m i t d e n S t r e u - u n g s c h a r a k t e r i s t i k e n d e s .vorgeführten R e f e r e n z m o d e l l s . D e r a t a t i s o h e n A n a l y s e s o l l s p a t e r u n t e r Anwendung d e r G e b r a u c h a k e n n w e r t e d e s T h e - s a u r u s e i n e d y n a m i s c h e A n a l y a e f o l g e n .

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A TANIT rendszer célja, hogy magyar nyelvű szövegek számítógépes nyelvészeti feldolgozásával dokumentumok összehasonlító elemzéséhez szükséges statisztikákat

Ezen belül elemeztük a hústenyészérték index és a kettős termelési index (KTI), valamint a küllemi bírálati eredmények (ráma, izmoltság, testalakulás) közötti

A TANIT rendszer célja, hogy magyar nyelvű szövegek számítógépes nyelvészeti feldolgozásával dokumentumok összehasonlító elemzéséhez szükséges statisztikákat

Közvetlenül tanul- mányozhatják tanítványaik produktumait, és tanításuk számára levonhatják a követ- keztetéseket (az értékelés mint visszajelentés).

A főnévi igenév alkalmazásának másik oka rend- szerelméleti: mivel a főnévi igenév fogalmába a befejezett, a beálló és a folyamatos alcsoportok is beletartoznak,

A vizuális tezaurusz, hasonlóan a már ismert, ha- gyományos társaihoz, ugyancsak strukturált szó- tár, amely a lexikai egységek közötti relációkat is tartalmazza.

Az ETO-jelzetekre vonatkozóan még nem készült magyar nemzeti adatcsere-formátum, alapul a USMARC formát for class ifi cation vehető [25], E formátum és az OWL közötti - itt

melyik kifejezésre, akkor ennek az legyen az eredménye, hogy az adott mutatószót, illetve a tezauruszablakban szereplő bármelyik lexikai egységet a program hozzárendeli