A jelentés (szemi)-formális megközelítése

A FORMÁLIS NYELVI ELEMZÉS LEHETŐSÉGEI A SZÖVEGEK REPREZENTÁCIÓJÁBAN

4. A formalizálás lehetőségeiről

4.2. A jelentés (szemi)-formális megközelítése

Bármely szöveg jelentés-összefüggését általában egy vagy több fogalmi séma (tudáskeret, illetve forgatókönyv) elemei hozzák létre, amely elemek között valamiféle jelentéskapcsolat fedezhető fel. Az, hogy ezek a jelentéskapcsolatok milyen módon differenciálhatók, érdekes kérdés a formalizáló elemző megközelítés számára, főleg akkor, ha a cél az, hogy a szövegek tipológiája számára szolgáltassunk adalékot.

A jelentésleírás módszerének kutatásában lényeges mozzanat, hogy a nyelvi alakulatok szintaktikai szerveződésének reprezentációjával szemben a jelentésstruktúra reprezentációja nem kívánja meg a vizsgált

„tárgy” komplexitásának meghatározását (esetleges korlátozását). Ennek oka az, hogy az alább vázolni kívánt modell a jelentést mint lexikális sajátosságot kezeli függetlenül attól, hogy a szavak közötti jelentéskapcsolatok reprezentációjával egy- vagy többmondatnyi nyelvi alakulat jelentés-összefüggése tárható-e fel.

A tudáskeret-elemek közötti jelentéskapcsolatok formális reprezentációjának lehetőségét támasztja alá az a számítógépes elemzés, amely a tudáskeret elemei közötti távolság mérésével igazolja a szavak teljes vagy részleges szemantikai azonosságát, szorosabb vagy lazább jelentésbeli kapcsolatát. A távolság az egyes tudás-keret-elemek definícióiban kimutatható azonos jelentéskomponensek előfordulása alapján adható meg.

Ahhoz, hogy a kutatás szótár-alapja talán nem tűnik kielégítően adekvátnak, szükséges néhány gondolatot fűznöm: A kategoriális jelentésfelbontás köztudottan „előre gyártott” kategóriákkal, illetve ezek kombinációival operál, aminek eredményeképpen a jelentésleírások könnyen összevethetők, esetleg további, még elemibb kategóriákra bonthatók. A számítógépes formális jelentésvizsgálat számára tehát olyan adatbázis szolgálhat alapul, amely a jelentésexplikációkban meghatározott és állandó kategóriákat keres. (Olyan szótár azonban, amely a lexémák jelentését ilyen kategóriák formájában adja meg, máig nem készült; ha ugyan elméletileg elkészíthető). A „szótárírás” jelen állapotában – bár magyar nyelvű adatbázis még ilyen sem készült – legcélravezetőbbnek az tűnik, hogy a jelentésexplikációk állandó kategóriái a magyar nyelv fogalmi jelentésű lexémái legyenek, amelyek előfordulásainak kombinációiból szerveződnek az értelmező szótárak definíciószerű értelmezései.

Azt a látszatot azonban mindenképpen el szeretném kerülni, hogy az alább vázolandó jelentéselemzés valamely szótár elemei közötti jelentéskapcsolatok leírását célozza. A szótár annyiban központi tényező az elemzésben, amennyiben szavak előre gyártott (ezért bizonyos értelemben elvonatkoztatottnak, azaz objektívnek tekinthető), lehetségesnek gondolt kontextusoknak megfeleltetett jelentésdefinícióit adja. Ezek közül a jelentésdefiníciók közül választandók ki az elemzett szövegben releváns jelentések.

Mivel a kutatás jelenlegi feladata a (formális vagy félig-formális) szemantikai elemzés módszertani és elméleti hátterének megalapozása, az imént vázolt megoldás megfelelőnek tűnik. A szövegek jelentés-összefüggésének jellemzésére összpontosító elemzésekhez szövegspecifikus szótárak (adatbázisok) készí-tendők. A formális elemzés alapjaként használt szótár részletes bemutatása olvasható A tudáskeretek elemzése szaknyelvi szövegben. (A formalizálás lehetőségei) című tanulmányban (vö. Dobi–Kuki 2004), alább a közérthetőség kedvéért csupán néhány lényeges mozzanatot idézek, majd ezeket példákkal is illusztrálom.

(Néhány túlságosan szótárspecifikus észrevétel részletezésétől nem tudok eltekinteni, mivel ezek annak az elemző módszernek az alapjául szolgálnak, amellyel analóg módon aktuálisan elemzett szövegek szóanyaga is vizsgálható.)

„A számítógéppel végzett formális elemzés számára a szótár sajátos adatbázissá alakítandó, amelyben – a számítógépes program korpuszaként álló szótár nem tartalmazza az egyes szócikkek összes szavát, csak a fogalmi referenciájúakat, következésképpen a definíciók szóanyagából töröltük a névelőket, a névutókat, a kötőszókat, a tagadószókat, az esetleges módosítószókat vagy partikulákat, a névmásokat (névmási utalásokat),

valamint a példákat is (mivel ezek egyrészt „~” jel formájában tartalmazzák a címszót, másrészt a példa többi szavának viszonya az elemzett szöveg kontextusához, valamint a többi szócikk szóanyagához teljesen véletlenszerű). A felsoroltakon kívül töröltük a létigéket, a funkcióigéket, a féltartalmas igéket és ezek képzett formáit szintén jelentéstanilag részben motiválatlan használatuk miatt: pl.: magában foglaló (= rejtő), ezer évből álló (= ~et magában foglaló, felölelő stb.);

– az egyes szócikkek belső szerkezete eltér a Magyar értelmező szótár szócikkeiétől, miszerint bennük a címszó után egymást követik fölülről lefelé haladva a definícióban szereplő tartalmas szavak a definícióbeli sorrendjüknek megfelelően;

– a definícióban szereplő szóalakokat – ha ezek nem az adott szavak alapalakjai – úgy adom meg, hogy nem természetes nyelvi eszközökkel jelölöm

– az összetett szavakban az összetétel határát, többszörösen összetett szavakban az összetételek határait, – toldalékolt szavakban az abszolút, illetve a relatív szótő és a toldalék határát, minden toldalék esetében, mert bár köztudott, hogy a képző új szófajú, új jelentésű szót hozhat létre, az alapszó és a származékszó jelenté-se között szoros kapcsolat maradhat, amely a szövegösszefüggés szempontjából figyelembe veendő,

– az összetett szóbeli előtag és utótag határának jelölésére a „+”, a szótő és a toldalék határának jelölésére a

„/” jel szolgál; például: beszédhangok → beszéd+hang/ok; jelentésű → jelent/és/ű; ahol a toldalékolt forma töve eltér az alapalaktól, a tövet az alapalakra változtatom: neve → név/e” (Dobi–Kuki2004:129–130).

Ennek megfelelően a formális leírás egy explikációja például az alábbi módon képzelendő el. Az évezred lexéma adott szövegbeli jelentésének meghatározásából az alább látható „szócikk” jön létre: „évezred: Ezer évből álló időszak. | Ez mint az időszámításunk kezdetétől számított időegység. A 2. ~.” (Juhász József–Szőke István–O. Nagy Gábor–Kovalovszky Miklós (szerk.) 1975: 344).

S íme a szó kategoriális jelentésexplikációja: év+ezred ezer év/ből idő+szak

idő+számít/ás/unk kezdet/e/től idő+egység

A számítógépes elemzés tehát arra összpontosít, hogy az adott címszó jelentésexplikációjában előforduló autonóm jelentésű elemek bármelyike mely másik szóalak (ilyen formán elkészített) jelentésexplikációjában fordul elő.

Egy szöveg jelentés-összefüggését megteremtő elemek közötti jelentéskapcsolat különböző mértékű és eltérő típusú lehet.

A mérték a teljes jelentésazonosságtól az egészen távoli asszociáción alapuló jelentéskapcsolatig terjedhet.

A típus voltaképpen a mérték megjelenítése a jelentés-összefüggés – valódi korreferencialitástól a mezőösszefüggés lazább jelentéskapcsolatáig terjedő – palettáján. Ez a „skála” több – a szövegtani elemzés apparátusát rendszerező – antológiában felfedezhető, így (pusztán egyik példaként kiragadva) összehangolható a Szikszainé Nagy Irma által összegzett szemantikai összetartó eszközökkel: a korreferencialitás eszközeivel (teljes vagy variált ismétlés, szinonímia stb.), a mezőösszefüggés eszközeivel (felosztás, jelentésmező stb.), illetve az asszociatív jelentéskapcsolatokkal (pl. felsorolás).

A kettő tehát összefügg: a mérték formális adatokkal, jelen vizsgálatban számszerű távolsági mutatókkal jellemezhető, a formális adatok ugyanakkor a jelentés-összefüggést teremtő eszközök típusaihoz rendelhetők hozzá.

Mivel a formális modell működését terjedelmes tanulmány mutatja be az Officina Textologica 10. kötetében, ennek részletezésétől itt el kell tekintenem. Ahhoz azonban, hogy a jelentésreprezentáció gyakorlati alkalmazhatóságáról nagy vonalakban képet nyújthassak, a modell néhány alapelemének működését be kell mutatnom.

A formális reprezentáció a jelentés-összefüggés erősségét azzal jellemzi, hogy megadja az azonos tudáskeretbe tartozó szavak jelentésének a kapcsolatát: „A kapcsolat ebben az esetben azt jelenti, hogy a forrásnak a definíciójában, vagy a definícióban szereplő szavak definíciójában stb. a célként megjelölhető szavak fordulnak elő. A forrás és a cél távolságát a program lépésekben adja meg: a cél 1 lépésre van a

forrástól, ha a forrás definíciójában szerepel; 2 lépésre, ha a forrás definíciójában előforduló valamely szó vagy szavak definíciójában szerepel stb.” (Dobi–Kuki 2004: 132).

Jól illusztrálja ezt annak a szaknyelvi szövegrésznek az elemzése, „amelynek szótárából” az „évezred” példa is való.

Íme az elemzett szövegrészlet:

(7)

A nevek világa Előszó

Minden tulajdonnév végső soron köznévből származik. Így minden személynévnek és helynévnek volt eredetileg jelentése is. Mivel azonban a személynevek és helynevek rendszerint több évszázados vagy évezredes múltra tekintenek vissza, egy-egy helynév vagy személynév gyakran csak értelmetlen, puszta hangsor a mai magyar ember számára. Vezetékneveink csupán néhány száz évesek, ezért sok érthető közülük, mint Kovács, Nagy, Fazekas, Veres, Arany. Sokat viszont csak a szakember tud megfejteni, mint Bartók, Balla, Dékány, Gerencsér, Molnos, mert ma már elavult szavakból vagy tájszavakból keletkeztek.

Számos, nálunk is használatos név idegen nyelvből való, mint Novák, Hirt, Valentini. Keresztneveink nagy része héber, görög vagy latin eredetű, kisebb részük germán, szláv vagy török. Az eredeti magyar nevek száma elég csekély. A legtöbb ember nem maga választja meg a nevét. Vezetéknevét apjától örökli, keresztnevét rendszerint szülei határozzák meg. Esetleges ragadványnevét az a közösség ruházza rá, amelyben él. Nevét azonban hivatalosan is megváltoztathatja, egyesek (főleg művészek) pedig álnevet (művészi nevet) választanak maguknak.

A helyneveket rendszerint egy közösség adja, hogy a természetben könnyebben tájékozódhassék. Mivel a nagyobb vizeket, hegyeket már az ősi időkben elnevezte valamilyen emberi közösség, ezek a nevek pedig az évezredek folyamán egyik néptől a másikig öröklődtek, nem mindegyiknek a nevét tudjuk megfejteni, sőt gyakran azt sem tudjuk eldönteni, milyen nyelvű népcsoport nevezte el (pl. Duna, Tisza, Alpok).

Kálmán Béla A nevek világa című munkájának bevezető bekezdéseiben fellelhető név-tudáskeret szavainak a jelentés-összefüggését elemezve (a fent említett módszerrel) azt az eredményt kapjuk, hogy „az átlagos távolságmutató 10 tudáskeretelem-pár vizsgálata alapján 1,7” (Dobi–Kuki 2004: 134). A vizsgált szópárok: név – személynév, név – keresztnév, név – tulajdonnév, ragadványnév – keresztnév, ragadványnév – tulajdonnév, ragadványnév – személynév, vezetéknév – keresztnév, vezetéknév – személynév, vezetéknév – tulajdonnév, álnév – név.) Ez az adat azt jelenti tehát, hogy az elemzett tudáskereten belüli tartalmas szavak közötti jelentéskapcsolat igen erős: „a szavak átlagosan 1,7 lépés távolságra vannak egymástól, azaz leginkább egymás definíciójában vagy egy definíció elemeinek definícióiban fordulnak elő” (i. h.).

A távolságmutató mértéke összhangban áll azzal, hogy az elemzett szövegrész jelentés-összefüggését az igen szoros mezőösszefüggés, a felosztásviszony jellemzi. Az ennél szorosabb jelentésösszefüggés-típushoz (például az ismétlések vagy a szinonimák használatához) még alacsonyabb távolságmutató-érték tartozna. A távolabbi jelentéskapcsolat alapján működő asszociációs mező esetében a távolságmutató mértéke igen magas lenne (az asszociatív jelentéskapcsolatok esetleges véletlenszerűségét is érzékeltetve).

A formális jelentéselemzést itt ismertetett módon feltételezve két lényeges kérdésre választ kell találnunk: az egyik az, hogy a fenti jelentésfelbontásos elemzés milyen adalékul szolgál a szövegek jelentésszerkezetének a leírásához; a másik pedig az, hogy ezzel a módszerrel milyen szempontokból vizsgálható a szövegek jelentésszerkezete.

4.2.1. Hogyan járulhat hozzá a jelentésfelbontásos formális elemzés a szövegek jelentésszerkezetének leírásához?

A fentebb levezetett elemzés tanulságainak összegzéseképpen tehát valamely elemezni kívánt szöveg jelentés-összefüggését megteremtő szavak kiválasztása után ezeknek a komponenses elemzése végzendő el. Azaz:

szövegspecifikus tezaurusz állítandó össze, amelyben ezek a szavak szerepelnek explikációikkal együtt, ahol egy szó explikációja az adott szó jelentéskomponenseinek halmazaként értendő.

A formális elemzés ebben a fázisban azt vizsgálja, hogy mely szavak explikációjában vannak azonos jelentéskomponensek: hány közös jelentéskomponens, illetve milyen közös jelentéskomponensek. Sejthető,

hogy azoknak a szavaknak erősebb a jelentés-összefüggése, amelyek jelentésfelbontásában több az azonos jelentéskomponens. (Például a szóismétlés és a szinonimitás szükségszerűen azonos jelentéskomponensek jelenlétét feltételezi az explikációkban. Egy felosztás tagjai között például bizonyára szintén több azonos jelentéskomponenssel számolhatunk, de a teljes jelentésazonosságra jellemző megfeleltetés ezek esetében nem teljesülhet. Stb.) Ennek értelmében valamely elemzett szöveg jelentésbeli összefüggése a szöveg fogalmi sémáján belül az egyes elemek jelentéskapcsolata szorosságának, lazaságának mutatója révén jellemezhető.

4.2.2. Milyen szempontból vizsgálható a szövegek jelentésszerkezete a jelentésfelbontás módszerével?

1. Az egyes vizsgált szövegek jelentés-összefüggésének erőssége jellemezhető azzal, hogy milyen arányban fordul elő n, n-1 … 1, 0 közös jelentéskomponensű elem a szövegben.

2. A szöveg jelentésszerkezetének jellemzésében szolgálhat adalékul az, ha megvizsgáljuk az egymással szorosabb, illetve egymással kevésbé szoros jelentéskapcsolatban lévő elemek elhelyezkedését a szövegben.

Ezekkel megmutathatóvá válik egy szövegen belül a témaazonosság, a teljes vagy a részleges témaváltás (azaz résztémák bevezetése), vagy akár valamely korábbi téma visszatérése is.

Gyanítható, hogy a témaazonosság explicit fenntartására törekvő szöveg az egyes mikroszerkezeti egységekben vagy egy-egy makroszerkezeti egységben vagy akár a teljes szövegben visszatérő módon tartalmaz olyan elemeket, amelyek több jelentéskomponensükben megegyeznek, azaz jelentéskapcsolatuk távolsági mutatója alacsony. Ez jellemző például a fentebb idézett A nevek világa szövegből választott szövegrészletre. A szövegrészen végigvonulnak azok a – kövérrel kiemelt – tudáskeret-elemek, amelyek jelentésexplikációiban a név elem szinte kivétel nélkül előfordul, ami tehát azt jelenti, hogy a név és a kiemelt elemek távolsági mutatója igen alacsony (szoros jelentéskapcsolatra utal). Megtartva ezáltal a folyamatos témaazonosságot.

A teljes témaváltás jelenségével az függhet össze, ha egy szöveg újabb szerkezeti egységében nem fordulnak elő azonos jelentéskomponensekkel leírható elemek, illetőleg ezek előfordulása véletlenszerű.

Az újabb résztéma bevezetése (a jelentéskomponensek előfordulása szempontjából) a témaazonosság és a témaváltás közötti átmenetként képzelhető el.

Itt pusztán néhány példát mutattam arra nézve, miképpen járulhat hozzá a komponenses jelentésfelbontás bizonyos szövegjelenségek tipológiai vizsgálatához. Elméleti síkon tehát az gyanítható, hogy a szövegtipológiában is lehet létjogosultsága a formális – vagy bizonyos mértékben formalizált – jelentés-reprezentációnak. Ezen felbátorodva érdekesnek ígérkezik kicsit árfogóbban megvizsgálni, milyen típusok körvonalazására ad lehetőséget a formális megközelítés a szöveg szerveződésének egyes strukturális síkjain.

In document Szöveg és típus (Pldal 73-76)