• Nem Talált Eredményt

ERIC DE GROLIER (1911)

In document OSZTÁLYOZÁSÉS INFORMÁCIÓKERESÉS (Pldal 161-200)

A nagyon speciális területeken az osztályozásnak különösen nagy a jelen-tõsége a kutatásban, a tervezésben: aki ilyen – fõképp a mûszaki – területen végez tudományos munkát, az tudja, hogy milyen nehéz az embernek kiismer-nie magát, ha nem rendelkezik korszerû, a kérdéses szak aktuális fejlõdésének megfelelõ osztályozással. Az osztályozás a szakágak problémáinak helyrajzi térképeként is felfogható, egyfajta útmutató ez, amely jelzi – még a kevéssé beavatottak számára is – az illetõ terület tudományos témáit. A gyakorlat iga-zolja ezt. Egy nemrég kikristályosodott fiatal szakterületen – ilyenbõl a mû-szaki élet területén sok van – egy saját osztályozás megalkotása a kutatómun-kát folytatók, a nemzetközi kapcsolatokban résztvevõ stb. tudósok közötti együttmûködés megszervezésének kulcskérdése. Ha van korszerûen kidolgo-zott osztályozásunk: ismételten új elõnyeit fedezzük fel, és ekkor már nehéz elképzelni, hogy volt olyan idõ, amikor nélkülöztük ezt az eszközt, amelynek a segítségével rendet tudunk tenni mindenféle munkában.

mértékben elõsegítette a kommunikációt az egyes osztályozási mûhelyek között.

Elsõ szemelvényünk ebbõl a mûvébõl való, benne James Whitney Perry (1907–1971) és Allen Kent (1921) szemantikai kódnak nevezett szerep-jelölõit mutatja be. Az amerikai Western Reserve University (WRU) mû-szaki dokumentációs rendszeréhez az ötvenes évek második felében ki-dolgozott szerepjelölõk (nevezik õket WRU kódoknak is) speciális szak-terület dokumentációs nyelvének szintaktikai relációit képviselték. Mivel Perryés Kentaz elsõk voltak, akik ténylegesen alkalmaztak ilyen reláci-ókat mûködõ rendszerben, rendkívül ismertekké váltak, nagyon sokat foglalkoztak velük. Ebben az idõszakban elméletileg mások is próbál-koztak a szintaxis megoldásával, velük a következõ szerzõ, Jean Martin Perreaultkapcsán foglalkozunk.

1963-ban az elsõ cranfieldi vizsgálatok módszerével részletesen tesztel-ték a szemantikai kódokat. Kiderült, hogy a viszonylag bonyolult rend-szer valamivel rosszabb hatásfokkal mûködött, mint egy olyan, tezau-ruszt használó osztályozó rendszer, melyben nem alkalmaztak semmifé-le szintaktikai relációt. 1971-ben a resemmifé-levanciavizsgálataival késõbb is-mertté vált T. Saracevic más feltételekkel megismételte a vizsgálatot és hasonló eredményre jutott.

Perryés Kentszemantikai kódjait késõbb már nem használták, a rendszer nemcsak túl bonyolult volt, de tele volt megoldatlanságokkal, fõleg, hogy a szintaktikai relációk összekeveredtek a szemantikai relációkkal. De mert az egyik elsõ kísérlet volt a deszkriptorláncon belüli szintaxis meg-oldására, s mivel olyanok mûve volt, akik az információkeresés történe-tében késõbb jelentõs szerepet játszottak, sokat elemezték és még többet emlegették a WRU–kódokat.

[Perry és Kent rendszerével a második kötetben Brian C. Vickery: Deszkrip-tor-nyelvek címû tanulmányában, továbbá William John Hutchinsis részle-tesen foglalkozik.]

A kódokat a hatvanas években William Goffmanés társai megpróbálták továbbfejleszteni, de újabb alkalmazásukra nem került sor. Egy részüket azonban késõbb egy ideig felhasználták az EJC (Engineering Joint Coun-cil) tezaurusz deszkriptoraival végzett osztályozáshoz.

A vegyészmérnök Perrya második kötetben szereplõ Hans Peter Luhnnal együtt az IBM dokumentációs osztályán dolgozott, majd 1955-tõl a Wes-tern Reserve University dokumentációs és kommunikációs központját ve-zette. A végzettségére nézve szintén vegyész Allen Kentkésõbbi munkás-ságával a második kötetben foglalkozunk, itt csak annyit jegyzünk meg, hogy 1968-tól kezdve az Encyclopedia of Library and Information Science mára 59 kötetes kiadványának szerkesztõje.

A dokumentumok osztályozására és jelzetelésére használt általános fogalmak és osztályok

(kategóriák) vizsgálata

10

262 Az Amerikai Fémipari Társaság és J. W. Perry munkássága11 Bár James W. Perrynek és a Western Reserve Universityn mûködõ cso-portjának munkássága túlmutat az American Society for Metals (Amerikai Fémipari Társaság, a továbbiakban ASM) keretein, tanulmányunkban mégis ez utóbbival foglalkozunk, ami a kódolási módszereket illeti, mert számunk-ra ez most a legérdekesebb.

A. G. Guy és A. H. Geisler (mindketten: General Electric Company) egyik cikkét követõen 1948 õszén az ASM és a Special Libraries Association (Szakkönyvtárak Egyesülete, SLA) munkatársaiból vegyes bizottság alakult a fémipari dokumentumok osztályozási problémáinak tanulmányozására. Ez a bizottság dolgozta ki azt a peremlyukkártyás keresési rendszeren alapuló ún.

ASM–SLA osztályozást, amely 1950-ben jelent meg nemzetközi érdeklõdést kiváltva.

A minket jelenleg érdeklõ szempontból az ASM–SLA osztályozásnak nin-csenek különösebben fontos vonásai: specialisták készítették specialisták szá-mára. Három részbõl áll: folyamatok és tulajdonságok mutatója, anyagmutató, attribútum mutató (common variable index – általános változók mutatója).

Az elsõ mutató elnevezése egyébként elég rossz, mivel a folyamatok (B–L), a struktúrák(M–N), a tulajdonságok és vizsgálatok(P–Q) osztályain kívül tartalmaz általános (például A: higiénia és biztonság, kutatásszerve-zés…), alapanyag (B: ásványok bányászattal és feldolgozással együtt), fel-ügyelet és ellenõrzés(S), fémek felhasználása(T) osztályokat is, és egy ösz-szetett osztályt a korróziószámára (R), amelyhez a korrózió mechanizmusa, a korróziós tényezõk, a korróziógátló eljárások és vizsgálatok is tartoznak, vala-mint egy „járulékos” osztály (U) a fizika, kémia, matematikastb. számára. Az olasz kiadásban ezt a részt „Módszerek” elnevezéssel látták el, de ez se nagyon felel meg a tartalomnak.

Az anyagmutató négy csoportra oszlik: fõbb kémiai elemek (és ezek öt-vözetei), egyéb elemek (és ezek ötöt-vözetei), az anyagok tulajdonságaik és fel-használásuk szerint csoportosítva, fémipari termékek.

10 Étude sur les catégories générales applicables aux classifications et codifications doc-umentaires / Eric de Grolier. – Paris : UNESCO, 1962. 248 p.1

11 262 L’American Society for Metals et les travaix de J. W. Perry. In: Étude sur les caté-gories générales applicables aux classifications et codifications documentaires, p. 111–126.

Az attribútum mutató a berendezéseket és eljárásokat, a folyamatokat be-folyásoló tényezõket (alacsony vagy magas hõmérséklet, nyomás stb.), a ter-mékek formáját, az öntödét, a hibákat tartalmazza. Ezen kívül felosztották a dokumentumok formája, nyelve és helye szerint.

Az a peremlyukkártyás rendszer, amelynek igényeihez a kódrendszer al-kalmazkodik, csak 10 000-nél kevesebb dokumentum esetén mûködik megfe-lelõen, és az ASM hamarosan rákényszerült, hogy megfelelõbb eszközöket keressen. E célból 1955-ben öt évre szóló, 75.000 dolláros kutatási megálla-podást kötött a Western Reserve University dokumentációs és kommunikáci-ós kutatási központjával, amelynek célja „a tényfeltárás” volt.

A Western Reserve University Jesse H. Shera kezdeményezésére 1955-ben alakult dokumentációs és kommunikációs kutatási központját 1960 szep-temberéig gyakorlatilag James W. Perry vezette, aki már 1947 óta a gépi do-kumentumkeresés módszerének lelkes híve volt, és az Amerikai Kémiai Tár-saság peremlyukkártya bizottságában elnökösködött.

Perrynekés munkatársainak 1954-tõl kezdõdõen cikksorozata jelent meg az American Documentation-ben, amelyet azután 1956-ban kiegészítettek és kötetbe foglaltak.

E tanulmányok legérdekesebb újdonsága olyan kódolási módszer volt, melyben az összetett kifejezéseket szemantikai elemzéssel „egyszerû” kifeje-zésekkel fejezték ki. Ezt a módszert Allen Kentés M. M. Berrymár 1952 jú-niusában ismertette a Massachusetts Institute of Technology gépesített infor-mációkeresési szimpóziumán. E célból sokféle forrásból hatalmas mennyisé-gû, kb. 30 000 szakkifejezést gyûjtöttek össze. Ezek közül 7000-et elemeztek.

Ezeket öt általános osztályba, illetve az egyes kifejezéseket tartalmazó terület szerint öt kategóriába – kémia, fizika, mechanika, biológia, tudomány és tech-nika általában – sorolták tulajdonságaik szerint vagy aszerint a fogalom sze-rint, amelyre vonatkoznak (folyamatok; gépek, készülékek, berendezések;

anyagok, nyersanyagok; jellemzõk; elvont fogalmak).

A kulcsfejezet kötetükben a gépi irodalomkeresésrõl szóló XI. fejezet: „A gépi keresõnyelvek szerkesztése”, amely elõször csak a könyvben jelent meg (72–90. o.) és a szemantikai tényezõkre bontás módszerét tartalmazta. Valójá-ban a módszert magát nem tekinthetjük újnak. Legalább Leibnizignyúlik visz-sza, aki 1666-tól („De arte combinatoria”) mindvégig, sõt talán már az elõtt is ennek az alkalmazásán dolgozott. A dokumentációs szakemberek közül Cordonnier 1943-ban újra felfedezte és elég világosan megfogalmazta a mód-szert, Pages pedig 1948-ban hosszan és behatóan vizsgálta ugyanezeket a problémákat. Az Egyesült Államokban azonos volt ezzel az az eljárás, amit úgy fejeztek ki, hogy „a deszkriptorok egymásba kapcsolódó csoportjai, amelyek a fogalmak struktúráját tükrözik” („interlocking sets of descriptors delineating the idea structure”); ezt Mooers 1951-ben, majd 1955-ben ismertette, de már 1948-tól alkalmazta a gyakorlatban. Ennek az eljárásnak egy másik változatát

úgy fejezték ki, hogy „tárgy jellemzése elemek vagy azonossági kritériumok egy csoportjával („characterizing a topic by a set of identifying elements or cri-teria”), amelyet Luhnmutatott be 1951-ben. Ezeket az elõzményeket nem azért említjük meg, hogy kicsinyítsük a különbözõ kutatók vagy kutatócsoportok munkáját, akik leggyakrabban teljesen õszintén hiszik, hogy „új módszert” ta-láltak, hanem, hogy arra ösztönözzük õket, hogy egyik vagy másik „kizáróla-gos” módszer magasztalása helyett lássák be: mindegyik hasonló alapelvek szerint mûködik, bármi is legyen a különbség (amely néha nagyon is másodla-gos) a használt kódolási módszer vagy a számítógép típusa között.

Az alkalmazott kódalkotás alapja sem volt újdonság: a Luhn által 1953-ban javasolt 3 vagy 4 betûs önmagukat egymástól elkülönítõ kódszavak („self-demarcating code words”) technikáját használták, némi módosítással.

Van viszont Perry, Kentés Berrymódszerének néhány olyan sajátos vo-nása, amelyeket érdemes közelebbrõl megvizsgálnunk.

1. A különbség a szemantikai12és a szintaktikai összefüggések között: az elõbbit változó betû jelzi (a második betû) a szemantikai tényezõt ki-fejezõ 4-betûs kódszóban, az utóbbiak pedig 3-betûs speciális kódsza-vakhoz kapcsolódnak.

Elég nehéz világosan megérteni a két összefüggés közötti különbséget.

A szerzõk szemantikainak nevezik az összességükben a gépi nyelvet al-kotó fogalmak közötti összefüggéseket. Ezek száma elvben nagyon nagy le-het (ahány fogalompár alkotható a gépi nyelv fogalmai között). Közülük csak a lényegeseket alkalmazzák gyakorlati megfontolásokat tartva szem elõtt: a

„legfontosabb az összefüggések hatékonysága a kiválasztási mûveletek defi-niálásában és irányításában”. A cél, hogy megfelelõ módon elkülönítsék azo-kat a dokumentumoazo-kat, amelyek adott probléma vagy információkeresés szempontjából érdekesek azoktól, amelyek érdektelenek.

Ami a szintaktikaiösszefüggéseket illeti, Perry, Kentés Berryazokat „a megfigyelt összefüggéseket” nevezi így, „amelyek mint tapasztalati tények vagy mint elméleti levezetések következményei szerepelnek a dokumentu-mokban”. Hozzáteszik, hogy „adott összefüggést, amikor elõször figyelték meg és regisztrálták, úgy kell tekinteni, mint empirikus természetû, tehát szin-taktikai jellegû összefüggést, a továbbiakban azonban ugyanez a reláció egy új fogalom definiálásának az alapja lehet, és ekkor a kérdéses összefüggést szemantikai természetûnek foghatjuk fel”.

12 Az angol szakirodalomban inkább az „analitikus relációk” kifejezés fordul elõ, olykor

„báziskapcsolatok”. A nyelvészetben „paradigmatikus összefüggésekrõl” beszélnek. A 60-as évek orosz szakirodalmában az „értelmi összefüggések” kifejezést is használták. Minden eset-ben szövegfüggetlen, a fogalmak, ill. a szavak között eleve meglévõ összefüggésekrõl van szó.

A szemantikai összefüggéseknél használt jelkészlet teljesen különbözik és elkülönül attól, amit a szintaktikai összefüggéseknél használunk. A szintak-tikai összefüggések definícióját vizsgálva, mindenekelõtt meg kell jegyez-nünk, hogy kidolgozásukat a cél elérésére irányuló hatékonysági szempontok vezérelték: amikor automatákat alkalmazunk a keresési és kiválasztási operá-ciók végrehajtására a legelõnyösebbnek bizonyuljanak.

Figyelembe véve ezt az utolsó mondatot, az összefüggéseknek ebben az egyrészt „szemantikaiakra”, másrészt „szintaktikaiakra” való felosztásában nem annyira a tudományos megfigyelésen alapuló tényeket, mint inkább adott keresõrendszer számára alkotott jelalkotási módszerrel szemben támasztott kö-vetelmények érvényesítését kell látnunk. Nem hisszük, hogy ez a szétválasztás általában érvényesnek bizonyulna az információkeresés céljait szolgáló „közös kódnyelvre”, és más szerzõk nem is vették át.

Ez az állítás csak Perryés Kent „szemantikai” kódjainak összefüg-gésében tekinthetõ érvényesnek. Egyébként – általában – az infor-mációkeresõ (vagy dokumentációs) nyelvekben a szemantikai és a szintaktikai relációkat nagyon is megkülönböztetik. Az elsõ esetben a fogalmak közötti inherens szemantikai összefüggésekrõl (analitikus relációkról) van szó, a második esetben pedig olyan összefüggé-sekrõl, melyekbe a fogalmak kerülnek, amikor velük adott dokumen-tum tartalmát (tárgyát) reprezentálják. Ha a dokumendokumen-tum tartalmát a „szerszámgép-gyártás, Magyarország, 19. század” deszkriptorlánc írja le, akkor a „szerszámgép-gyártás” és „Magyarország” deszkrip-torok között ebben a láncban a „helye” szintaktikai reláció áll fenn.

Szemantikai reláció viszont, hogy a „szerszámgép-gyártás” a „gép-gyártás” egyik fajtája. Ez utóbbi reláció a deszkriptorláncban nincs is explicit formában kifejezve. Rejtetten, mint a „szerszámgép-gyár-tás” fogalmának inherens tartalma, mégis jelen van. Ez akkor derül ki, ha valaki a „szerszámgép-gyártás” deszkriptorral keresve nem ta-lál elég információt. Ekkor – adott esetben – a „gépgyártás” deszk-riptorral kereshet tovább a siker reményében.

Perry és Kent itt tárgyalt kódszavai – a szerepjelölõk – ugyan a

„szemantikai” jelzõvel vonultak be a szakirodalomba, valójában azonban szõröstül-bõröstül szintaktikai és nem szemantikai reláció-kat képviselnek. Szemantikai relációreláció-kat csak a késõbb még tárgyalt A, E, U, O stb. jelû összefüggések képviselnek.

2. A kódszavakat arra használják, hogy átalakítsák a dokumentumok

„távirati stílusú” referátumait „kódolt” referátumokká (encoded ab-stracts), a keresõ igényeinek megfelelõen feltárva a dokumentum min-den lényeges adatát, a numerikusakat is. E célból a referátumot

külön-álló állításokra (statements) kell bontani, azután pedig mondatokra, hogy különválasszák a végsõ, kódolt referátum egyes részeit, oly mó-don, hogy elkerüljük a zavarokat, amelyeket a gép a fogalmak hibás összekapcsolásával okozhatna (cross talk – áthallás). Ez speciális írás-jelek segítségével történik. Többek között van az & jel, amely „külön-leges jelzés”, azaz olyan fogalom (geográfia, kémiai elem) kezdetét vagy végét jelzi, amelyet nem a normál kódnyelv szerint kódoltak (a szerepe hasonló kicsit Pages „szemantikai prefixumának” a szerepé-hez); van továbbá egy másik jel, amely mennyiségi tulajdonságokat vagy szerzõ nevét, vagy pedig a dokumentum utalását jelöli.

3. Korlátozott mértékben használnak hierarchikus osztályozást: egyrészt a földrajzi helyeknél, 3 vagy 4 hierarchia szinttel (kontinens vagy kontinens része, régió, nép, város), másrészt az olyan objektum- vagy fogalomosztályoknál, amelyeket egy vagy több kódszó jelöl, de ame-lyek tizedesjelölések segítségével enumeratív osztályokra bonthatók.

1958-ban Perry és Kent publikálta a szemantikai kódszótárt (Semantic Code Dictionaryt), amelyet a „Machine Literature Searching” olvasói türel-metlenül vártak. A „kódolt referátumok” módszerét itt sokkal részletesebben kifejtették az 5. fejezetben, amelyet „Procedures for preparation of abstracts for encoding” (Kódolásra szánt referátumok készítése) címen Jessica Melton írt. A fejlécben szereplõ „Metallurgical abstracts for encoding” (Kódolásra szánt fémipari referátumok) cím azonban pontosabban elárulja, hogy az ASM számára végzett kutatásokról van szó. Részletesen leírja ezek készítési mód-ját, amelyet a „Machine Literature Searching”-hez képest kis mértékben mó-dosítottak.

A szintaktikai és szemantikai összefüggések közötti különbségtétel eltûnt ebbõl a fejezetbõl, legalábbis abban a formában, amelyben 1956-ban bemutat-ták, „elméleti” igazolásával egyetemben. Ami a szintaktikai összefüggéseket illeti, ezekrõl egyszerûen csak annyit mondanak, hogy történjék hatékony (információ)keresés a technológia jelenlegi fejlettsége mellett elképzelhetõ olcsó elektronikus berendezés segítségével. Megkövetelik, hogy a dokumen-tumok tartalmának lényeges vonásait explicite és következetesen jelöljék. Kü-lönösen az relációknak kell azonos formában megjelenniük, bármilyen eltérõ formában szerepeljenek is az írott köznyelvben. E célból többé-kevésbé önké-nyesen definiáltak bizonyos összefüggéseket, amelyek a kohászattal kapcso-latos dokumentumokban található információ fontos vonásainak a rögzítése-kor a dokumentumok azonosítása érdekében a legjelentõsebbek. Ezeket az in-formációkeresésben a szakterületen belül hasznos összefüggéseket egy-egy kódszó jelöli. Olyan kódszavakról van szó, melyek a gépi keresésben szintak-tikai szerepet játszanak, és ezért szerepjelölõknek (role indicator) nevezik õket. Teljes egészében közöljük ezeket a szerepjelölõket, mert úgy gondoljuk,

jól mutatja Perryiskolájának empirizmusát. Az „összefüggések” kiválasztásá-nál pusztán „operációs” megfontolásokat vettek tekintetbe, bizonyos tényle-gesen beszerezhetõ olcsó berendezéseknek és a speciális kódolás függvényé-ben,amely a legelõnyösebbnek tûnt. Ebben a szakaszban nem, csak egy má-sikban szerepel a „szintaktikai összefüggés” kifejezés. Ismét hangsúlyozzák ezek önkényes jellegét. A szerepjelölõkbõl szám szerint már nem 12 van, ahogy az 1956-os könyvben szerepelt (igaz, hogy példaként), hanem 4 kate-góriába csoportosítva (anyagok, tulajdonságok, folyamatok, körülmények) 23, ezen kívül van még egy vegyes kategória is. A szerzõk kijelentik, hogy ez nem osztályozási kísérlet, hacsak nem a szó legtágabb értelmében. A jelensé-geknek és fogalmaknak ilyen módon való csoportosítása pusztán kényelmes tapasztalati módszer annak elkerülésére, hogy a véletlen eljárás, amellyel a re-ferátumok mondatai íródnak vagy adott referátum részletessége következet-lenségekhez vezessen a hatalmas katalógus távirati stílusban készült referátu-mainál.

Itt következik a 23 szerepjelölõ [szerepindikátor, role indicator] (mindig a szakkifejezés elé kerülnek, úgy jelölik az adott kifejezés szerepét) (az anyag, tulajdonság, folyamatés állapotmeghatározása a szerepjelölõk után található):13

1. Anyagok szerepjelölõi

KOV anyag, amelynek a tulajdonságait ismertetik,

KEJ folyamatnak alávetett anyag (az anyag lehet tárgy, például kor-róziónak kitett tankhajó, a folyamat lehet szellemi tevékenység, amelynek a tárgy alá van vetve vagy elméleti tevékenység), KUJ összetevõ: a fent említett anyag alkotórésze, vagy annak

tovább-osztott része, amelyet a kutatás céljaira kell elkülöníteni. (Például a „fémbevonás” egy cinkkel bevont rézcsõ esetében.)

KQJ eszköz (hatóanyag vagy szerszám a folyamat, kipróbálási eljárás vagy funkció megvalósítására),

KWJ termék (folyamat anyagi terméke, kémiai analízisnél kimutatott vagy meghatározott anyag vagy közbensõ termék; ez utóbbi esetben KWJ szerepjelölõ KEJ vagy KAJ szerepjelölõvel párosul),

KAJ kiindulási anyag (folyamatnak vagy gyártásnak alávetve, amikor a gyártott termék a legérdekesebb – kohászatban kevésbé használt, al-kalmazása valószínûleg a szerves szintézisek területén jelentõsebb),

13 Nyelvészeti szempontból kötetünkben William J. Hutchins foglalkozik részletesen a WRU kódokkal (a szerk.).

KAD gép vagy berendezés, amelynek a leírása és (vagy) a funkciója a referátum fõ tárgya vagy jelentõs része,

KAG gép vagy berendezés része.

2. Tulajdonságok szerepjelölõi

KWV anyag és/vagy összetevõinek olyan adott, eleve meglévõ tulaj-donsága, amelyet nem a dokumentumon belül leírt meghatáro-zás eredményeként kapunk,

KUP meghatározott/eredményezett tulajdonság: jellemzõ, mérték, ér-ték, arány stb., amelynek a meghatározása, vagy pedig a folya-mat, amelynek az eredményeképpen létrejön, a dokumentum tartalma,

KAP olyan tulajdonság, amelyet egy másik, KAL szerepjelölõvel je-lölt tényezõ befolyásol, vagy függ attól, vagy azzal együtt, illet-ve annak függvényében változik.

3. Folyamatok szerepjelölõi

KAM folyamat, amelyet az elõzõekben említett anyagon hajtanak vég-re, vizsgálati, megfigyelési vagy számítási eljárás, amelyet arra használnak, hogy a fenti anyag megfigyelt vagy elméleti tulaj-donságát meghatározzák, korábban említett gép vagy berende-zés funkciója, folyamat, amely az anyagban zajlik le bizonyos feltételek esetén,

KXM negatív folyamat, folyamat hiánya: folyamat vagy funkció, amely nem következik be.

4. Állapotok, körülmények szerepjelölõi

KAH olyan környezeti vagy a folyamatot kísérõ feltétel, körülmény vagy tényezõ, amely befolyásolhatja a folyamatot vagy szüksé-ges lehet ahhoz, hogy a folyamat lejátszódjék.

5. Vegyes szerepjelölõk

KAL befolyásoló tényezõ: anyag, folyamat stb., amely egy KAP sze-repjelölõvel jelzett tulajdonságot befolyásol,

KIS hely, ahol a folyamat lezajlik, akár az anyag belsejében, akár azon kívül,

KWB irány, amelybõl mozgás végbemegy, KWC irány, amely felé mozgás végbemegy,

(a szerzõk megjegyzik, hogy a gyakorlatban ezeket a szerepjelö-lõket keveset használjuk, mert általában egyéb szintaktikai ösz-szefüggések használhatók, amelyek az információkeresés tár-gyaként kézenfekvõbbek, akkor is, ha az egész részeként bennük foglaltatik az irány fogalma.)

KAB ismeretterület: tudományos vagy mûszaki szakterület vagy el-mélet neve,

KIT idõ: dátum, idõpont vagy idõtartam, KIG földrajzi hely (ország),

KIB érintett szervezet,

KEP érintett személy vagy személyek csoportja, mint dolgozók, ve-zetõség, ha ezek fontos szempontok az elemzett anyagoknál.

Ez a 23 – a fémipar igényeihez szabott – szerepjelölõ késõbb még kiegé-szült 9 továbbival:

KXJ cselekvõ személy vagy szervezet (késõbbiekben jelzett folya-matra ható tényezõ),

KFB szervezetek kategóriája (szervezetek 24 típusát határozták meg, például: repülés, autózás, …, ellátás, kormányszerv, kormány-szervezet, …, kutatás, hajóépítés, kohászat, közlekedés), KIP helyzet (a szervezeten belül), az adott személy rangja vagy címe, KES alárendelt szervezet (fióküzem, minisztériumi osztály), amikor a

felsõbb szerv nevét szintén megemlítik,

KIN ügyfél: személy, szerv vagy szervek osztálya, amelyért tevé-kenykedik egy másik személy, szerv vagy szervek osztálya, KOJ információs forrás: személy, szerv stb., ahonnan a cikkben

talál-ható információ nagy része származik (lehet, hogy ugyanaz, mint KXJ),

KUG a társaságnak vagy más ilyen szervnek vagy egyének egy cso-portjának a megadott helye, ha a következõ szó elõtt KIG áll, KAV adott mennyiség: ár, érték, kapacitás, bér, termelés, fogyasztás

és számszerûen megadott analógiák,

KAC a cikk típusa (ezt követi egy másik betû, amely azt jelzi, hogy na-pi hírrõl, kommünikérõl, értekezésrõl, elõirányzatról, vélemény-nyilvánításról, beszámolóról vagy általános tanulmányról van szó).

Ezen felül hét fent említett szerepjelölõnek kissé más értelmezést kellett adni: KIB az érintett szervezet lett (megkülönböztetve KXJ-tõl); KEP

külön-álló személyt vagy személyek egy osztályát jelenti, de már nem „egyének szervezetét” (ami a KIB lett) és az érintett személyt, mivel KXJ a cselekvõ személy; KIG (melyet készítettek KUG-gal), KWC és KWB a szervezet vagy ország neve elé kerülnek, hogy jelezzék a tevékenység mint adás, vétel, im-portálás, exim-portálás, oktatás stb. irányát; KAB terület, amelybe a cikk tartozik, kiegészítõ betûvel együtt használják, amely más szempontból is jelzi a kérdé-ses területet (új alkalmazás, ár vagy gazdasági körülmény változása, a munkát érintõ kérdések, új berendezések, termelés, rendeletek és találmányok, kutatás vagy elmélet); KIT, az idõpontot is újradefiniálták, beletartozik az az idõtar-tam is, amelyre az elõrejelzést megadják.

Kétségkívül célszerû definiálni, milyen értelemben használják a szerzõk a különbözõ „kategóriákat”:

anyag

1. anyagi objektum vagy eszköz,

2. anyagi objektum részei, amelyeknél kémiai összetétel megadható, 3. az anyag elemi részecskéi (speciális értelemben, mert

beletartoz-nak mind az atomok, mind a molekulák),

4. az energia különbözõ típusai és formái mint elektromos energia, ultrahang, napenergia.

tulajdonság

1. az anyag mérhetõ fizikai, kémiai vagy mechanikai tulajdonsága, 2. egy anyag értéke, mértéke, aránya vagy teljesítménye (kapacitása), 3. egy anyag olyan felbontása, amelyre nem adható meg kémiai

összetétel (lásd feljebb anyagok 2.).

folyamat

1. változás vagy hatás, amelynek egy anyag alá van vetve, vagy amelyet annak kell létrehoznia,

2. technika vagy módszer (mûködés vagy elmélet), amellyel anya-got kezelnek,

3. gép vagy berendezés funkciója.

állapot, körülmény

Lásd a KAH meghatározását. A KAL használható állapotra, körül-ményre vonatkozó kifejezéshez csatlakoztatva is, bár a szerepjelölõk jegyzékében az 5. (vegyes) csoportban szerepel.

A szerepjelölõk e négy kategóriáján kívül Rees egy ötödiket is felvesz: a szervezetekre és személyekre jellemzõ összefüggéseket: KXJ, KIB, KEP, KEB, KIP, KES, KIN, KOJ, KWC és KWB.

A „szemantikai összefüggéseket” 1958-ban nem definiálták valami szi-gorúan, csak analógia segítségével. Alkalmazásuk a sémi nyelvek nyelvtani összefüggéseket kifejezõ infixumaihoz hasonló. Az értelmezést példák vilá-gítják meg. 10 infixum áll a rendelkezésünkre, amelyeket „változó” betû (a második) jelöl a négybetûs „szemantikai tényezõt” jelentõ szavak belsejében, a másik három pedig a szótõ szerepét játssza.

betû összefüggés használat [mai neve/jelölése]

A fajtája egy eleme annak az osztálynak, ame-lyet a szemantikai tényezõ jelöl (pi-ros – szín)

generikus, A/F

E tartalmazás abból összetett dolog, amelyet a sze-mantikai tényezõ jelöl (gyémánt – szénmolekula)

partitív, P/T

I hozzátartozás ami az összetevõje annak, amelyet a szemantikai tényezõ jelöl (szárny – madár)

partitív, P/T

O összesség ami több olyan osztályból tevõdik össze, amelyet a szemantikai ténye-zõ jelöl (kõzet – kristály)

partitív, P/T

U eredmény, tárgy, cél ami létrehozza a tárgyat, vagy amit használnak a tevékenységnél, me-lyet a szemantikai tényezõ jelöl (hûtés – kocsonya)

rezultáns, E/R

(tárgya, termék) Q befolyás, hatás valami, ami felhasználja azt, ill. amit

meghatároz vagy befolyásol az, amelyet a szemantikai tényezõ jelöl (galvanizálás – villamosság)

rezultáns, E/R

(hatása) W eszköz,

megmunká-lás

ami azáltal készül, ill. ami arra hat, ill.

amelyre hat, melyet a szemantikai tényezõ jelöl (edzés – fém, olaj – nö-vény)

rezultáns, E/R

(instrumentális) X tagadás, negatív amit jelentõs szempontból jellemez

annak a hiánya, melyet a szemanti-kai tényezõ jelöl (korrózióálló – kor-rózió)

rokonság, X/X

(ellentéte) Y jellemzõ aminek egyik fontos jellemzõ vonása

az, amit a szemantikai tényezõ jelöl (mutáció – változás)

rokonság, X/X (tulajdonsága) Z hasonlóság, modell aminek vannak bizonyos hasonló

tu-lajdonságai, de nem azonos azzal, amelyet a szemantikai tényezõ jelöl (bálna – hal)

rokonság, X/X

(hasonlósága)

Ezek a relációk valóban nem szintaktikai, hanem szemantikai relá-ciók. Kritikájukkal Varga Dénes foglalkozott. Az alábbi kommentár tõle származik:

A meghatározásokban nagyon sok a pontatlanság, és sem elneve-zéseik, sem példáik nem mindig találóak. Egészen elhibázott dolog például az egész–rész relációt a gyémánt és a szénmolekula példá-jával illusztrálni. Ez inkább a „fajtája” (implikáció) reláció szemlélte-tése lehetne: a szénnek különbözõ kristályos módosulatai, megjele-nési formái a gyémánt, a grafit és a „közönséges” szén.

Legfõbb hiányossága, hogy nem használja ki az inverz relációk lé-tezését. Nyilvánvaló például, hogy a „tartalmazás” és a hozzátarto-zás” relációk egymás inverzei: az egész–rész, illetve a rész–egész relációnak felelnek meg. Hiányzik viszont a „fajtája” reláció inverze, holott nyilvánvaló, hogy a faj–nem reláción kívül a nem–faj reláció-nak is van szerepe az informatikában.

Az „eredmény, tárgy, cél” („produktum”) reláció inverze a rendszer-ben kétféle alakban is szerepel. Ennek tekinthetõ ugyanis a „befo-lyás, hatás” reláció (a villamosság egyik produktuma a galvanizálás, illetve a fémbevonat; a hûtés hatására jön létre a kocsonya), más-részt az „eszköz, megmunkálás”, fõleg, ha az olaj–növény példát te-kintjük (az olaj a növény produktuma). Ez a három reláció egyéb-ként a legátgondolatlanabb az egész rendszerben.

Nagyon problematikus az is, hogy az „összesség” és a „hasonlóság, modell” relációkat mennyire indokolt külön-külön használni. Az „ösz-szesség” összevonható a „tartalmazás” relációval, a „hasonlóság, modell” relációnak pedig a deszkriptorok viszonyában viszonylag nincs jelentõsége.14

Nem fogunk itt az összefüggés-táblázat részletes tárgyalásába, sem a szintaktikaiakkal, sem a szemantikaiakkal kapcsolatban, ahogy azok Perry–Kentkódolásában szerepelnek – az ilyesmi meghaladná jelen ismerte-tésünk kereteit. Mindössze néhány megjegyzésre szorítkozunk:

1. „Túldeterminált” nyelvrõl van szó, megalkotói „agyonszabályozott” esz-közt akartak létrehozni, amelyben az összefüggéseket inkább kétszer definiálják, mint egyszer. Ebbõl következõen ez a nyelv nehézkesebb, mint a köznyelv, amelyben sok a beleértett, de ki nem mondott összefüggés. Ez nyilvánvalóan szándékos, és azoknak a félreérthetõ pontoknak a kikerülését szolgálja, amelye-ket az alkalmazott program feltehetõen nem értelmezne helyesen. A rendszer mindazonáltal talán túlzott súlyt fektet a kódokra és ezek szimbolikájára.

14 Varga Dénes: Információs tezauruszok készítésének módszertana. – Budapest : OMKDK, 1969. – (A tudományos tájékoztatás elmélete és gyakorlata, 15. sz.) p. 33–35.

Vegyünk egy példát: tankhajó korrózióját. A P–K (Perry–Kent)kód ezt a fogalmat így fejezi ki:

,–KEJ.SAHP.003,–KAM.DATR.001

ami azt akarja jelenteni: „alávetveannak a folyamatnak, amely majd az itt következõkben lesz leírva:a hajók osztályának harmadik tagja (S–HP) – fo-lyamat, amely az elõzõleg említett objektumra hat: a rongálódás osztályának elsõ tagja (D–TR).

Az a tény, hogy a rongálódás a tankhajókra hat, és amit franciában a min-denre alkalmas „de” partikula fejez ki (angolban pedig simán az appozíció:

tanker corrosion), a P–Kkódban kétszeresen is ki van fejezve, elõször a KEJ, aztán a KAM által.

Másik példa: egy kovácsmûhely, amely gépkocsi- és repülõalkatrészeket gyárt:

,–KAD.CUNS.30X.MACH.003,–KAM.CUNS.030,–KAM.CUNS.014,–

KWJ.LAMN.028* HACL.002* SARR.001

ami azt jelenti: „a leírt gép: a gyártási osztály 30. mûveletét (kovácsolás) végzi és az így alkalmazott gépek osztályának 3. tagja – a fent említett gép funkciója:a gyártási tevékenység 30. mûveletét (kovácsolás) végzi, – a fent említett gép funkciója:a gyártási tevékenység 14. mûveletét (termelés) végzi – termék: az „elemek” (unit) osztályának 28. tagja (alkatrész, összetevõ), amelynek a jelentése a következõ: a jármûvek osztályának második tagja, amelynek jelentése a következõ:a repülõgépek osztályának az elsõ tagja. A két elõzõ példában a szemantikai összefüggéseket jelölõ – itt már nem feltüntetett – köznyelvi szavakat (melyek a referátumokban még csak távirati stílusban, nem pedig kódolva szerepelnek) azokkal a kód-kombinációkkal helyettesítet-tük, amelyek a szemantikai szótárban szerepelnek. Reméljük, nem követtünk el hibát a kód alkalmazásában, amely meglehetõsen bonyolult a „beavatatlan”

számára – a hangsúly a szerepjelölõkön van.

Aligha szükséges kiszámítani a P–K kód redundancia együtthatóját a fen-ti példákban: feltétlenül messze felette áll bármely természetes nyelv redun-dancia együtthatójának.

2. A „szemantikai összefüggések” a beszélt nyelv részei vagy az igeidõk közti különbségnek felelnek meg. Így szigetelni: SAPT.003, szigetelt:

SWPT.003, szigetelõ (jelen idejû melléknévi igenév – angolul: insulating) és szigetelés SUPT.003. De a szigetelõ (fõnév) már sokkal komplikáltabb:

SQPT.LWCT.PUTT.001, ami azt jelenti: felhasználva (Q) a szétválasztást (S–PT), és ezzel hatva (W) az elektromosságra (L–CT), ami egy védelmet (P–TT) hoz létre, és mindez az így alkotott osztály elsõ alosztálya (001).

A P–K (Perry–Kent)nyelv ebben az értelemben szótöveket jelölõ nyelv (magánhangzó-változással), azáltal, hogy a szemantikai relációkat úgy fejezi ki, mint a régi indoeurópai vagy sémi nyelvek; flektáló vagy fuzionáló azál-tal, hogy a szintaktikai összefüggéseket prefixumokkal reprezentálja, amelyek

közül mindegyik szigorúan kapcsolódik ahhoz a szóhoz, amely elõtte áll, és nincs semmi önálló érvénye. E két szempont alapján ez a nyelv nagyon távol áll a tiszta szintaktikai kapcsolattal rendelkezõ nyelvektõl, amilyen a kínai, és ezért meglepõ, hogy John L. Milton éppen ehhez hasonlítja a P–K kódot.

Bizonyos esetekben a beszéd részeinek megkülönböztetésére nem a szin-taktikai összefüggések szolgálnak, hanem bizonyos változások abban a másik fajta „ragozásban”, amelyet a kód minden egyes terminusához kapcsolt három tizedesjegy alkot. Így a RANG.004 (ahol R–NG az „lerendezés”, „helyzet” tõ, A pedig a „kategorikus” szintaktikai összefüggés) osztályt jelent, osztályozni annyi, mint RANG.005, osztályozás pedig RUNG.005 (ahol U a „produktív”

összefüggés). Néhányszor maguk az egymásnak megfelelõ igék és fõnevek is különbözõ tövek között oszlanak meg, így például szétválasztani SWPR.009 (S–PR = tisztítás), ehhez szétválasztó SUPR.028, de szétválasztás DUSM.007 (D–SM = részekre bontás, szétszedés, amit úgy adnak meg, mint „fizikai ob-jektumok fizikailag és erõ által végzett felbontását – physical and forcible tak-ing apart of physical objects).

Ideje, hogy megvizsgáljuk magát a szemantikai kódot. Jelenlegi állapo-tában, mint errõl Meltontól értesülünk, 214 szemantikai alaptényezõt tartal-maz. De ha megszámláljuk azokat, amelyeket az 1. táblázatban találunk, csak 213-at kapunk.

A kód ezen a listán a szótövek betûrendje szerint szerepel, akárcsak a

„Code-English Dictionary”-ban, amely megadja a szótövek szintaktikai ösz-szefüggéseik és tizedes osztásaik szerint alkotott kombinációit. Található egy táblázat, amely a szemantikai tényezõk által reprezentált generikus fogalmak általános osztályozását mutatja, ahol ezek „különbözõ rubrikákba tartoznak, hogy kapcsolataik összefüggéseikben váljanak láthatóvá. Nem törekedtünk arra, hogy logikai elemzést szolgáltassunk, és ugyanaz a tényezõ szerepelhet különbözõ kategóriákban”. Az osztályozás a következõ:

Általános fogalmak fogalmak összefüggések tulajdonságok

tevékenységi területek erõk

osztályozások (az összetétel, természet, használat stb.) Relációk

gazdasági fizikai

szociális (társadalmi alapfogalmak, a társadalomra ható fogalmak, a társadalomra ható folyamatok, a társadalomra ható tényezõk).

Állapotok

pszichológiai

cselekvést létrehozó és cselekvéssel együtt járó

fizikai (érezhetõ, észrevehetõ állapotok, feltételes állapotok, az álla-potokat jelzõ tulajdonságok)

Folyamatok fizikai általános

anyagi (változást létrehozó, konstruktív, destruktív) ipari és szakmai

Anyagok

általában (generalized substances) specifikus: szerves, szervetlen elõkészítés

Objektumok

általánosak (természetesek, termékek) speciálisak (természetesek, termékek)

Ami minket illet, ezt a rendszerezést nem találtuk különösen szellemes-nek, de kétségkívül minden ilyen „általános kategorizálás” ellen lázongunk, amely – úgy véljük – inkább a skolasztikára jellemzõ.

A különbözõ szemantikai tényezõk jelentõsége erõsen változik. Néhány-nak csak egész kis számú alosztálya és kombinációja van: így a C–RD „nyers-anyagoknak” csak két alosztálya és egy kombinációja van, R–LC „vallásnak”

egyetlen alosztálya és 4 kombinációja, ezzel szemben az M–CH „gépek/beren-dezések/mechanizmusok” foglalja el a 835–848. oldalt és a P–PR „fizikai tu-lajdonságok” 10 oldalt tesz ki.

Egy valami van, ami rögtön szembeszökik: a „ragozási alosztályok”

rendkívül nagy száma, amelyeket háromjegyû tizedesszámok jeleznek. Az R–PR „relatív terminus”-ból (olyan fogalmak, amelyeknek önmagukban nincs értelmük, csak valami mással kapcsolatban) négy oldalnyi van, 001-tõl kezdve 382-ig (kihagyásokkal), az angol kifejezések betûrendjében „abnor-mal”-tól „wilde”-ig (208), aztán pedig látható rend nélkül. Ezalatt az R–PR alatt az ember megtalál szinte mindent, amit akar: analóg, sötét, házi, pontos, életszínvonal, tiszta és tisztátlan, szintetikus, modulus, klasszikus, luxus stb.

Ez az R–PR kétségkívül határeset, azonban a P–PR „fizikai tulajdonsá-gok” alatt szintén találunk hosszú alfabetikus felsorolást (mindig háromjegyû tizedesszámokkal jelölve), amely 086-ig tart, C–PR „kémiai tulajdonságok”

alatt 053-ig, A D–CM „dokumentum” alatt 062-ig, 043-ig G–PR „általános

In document OSZTÁLYOZÁSÉS INFORMÁCIÓKERESÉS (Pldal 161-200)