• Nem Talált Eredményt

Koltai Kornélia

Egy 17. századi héber carmen bemutatása

3. A vizsgált adatok

Az elmúlt több mint száz év alatt sok eszperantó nyelvű nyelvi adat keletkezett, de csak az elmúlt húsz év technikai fejlődése tette lehetővé, hogy ezeket az adatokat átfogóan vizsgálhassuk. Az általam megvizsgált eszperantó nyelvi adatok forrásai:

1. egy reprezentatív szöveggyűjtemény (Tekstaro 2020);

2. az internetre válogatás és lektorálás nélkül felkerült milliós nagyságrendű adat-halmaz (Leipzig Corpora Collection 2012 = Lipcsei Korpusz);

3. egy egyetemi szintű eszperantó nyelvkönyv (Szerdahelyi 1989);

4. egy internetes eszperantó–magyar szótár (Horváth (szerk.) 2015);

5. az eszperantó normatív szótára (Plena Ilustrita Vortaro de Esperanto 2020).

3.1. Eszperantó nyelvű szöveggyűjtemény

Az interneten elérhető egy ellenőrzött minőségű eszperantó nyelvű szöveggyűjtemény (Tekstaro de Esperanto 2020). A vizsgálódásaimhoz ebből a szöveggyűjteményből vá-lasztottam ki öt művet. Ezek:

1. La malnova testamento ’Ótestamentum’

2. La nova testamento ’Újtestamentum’

3. Faraono ’A fáraó’

4. Kastelo de Prelongo ’A prelongi kastély’

5. Ombro sur interna pejzaĝo ’Árny a rejtett tájon’

A program felajánlja a választást, hogy megjelenítse a morfémahatárokat, az alábbi módon:3

2 A nyelv tervezésekor Zamenhofot a német (valójában a jiddis) és a lengyel vagy inkább talán az orosz nyelvi környezet befolyásolta. Doktori disszertációm készítésekor arra a felismerésre jutottam, hogy Zamenhof elgondolása egy közép-európai nyelvi szubsztrátumú, újlatin szupersztrátumú nyelvet eredményezett (Bujdosó 2004). Ennek illusztrálására egy későbbi dolgozatomban az európai közösség nyelveivel való hasonlóságát vizsgáltam a Zipf-együttható alapján (Bujdosó 2006). Az eszperantó a vizs-gált 21 nyelv között pontosan a középső helyet, a 11.-et foglalja el.

3 A morfémahatárok jelölésének ez a módja általánosan elfogadott az eszperantó szavak elemzésében.

55

En la komenc·o Di·o kre·is la ĉiel·o·n kaj la ter·o·n.4

’Kezdetben teremté Isten az eget és a földet.’ (Biblia, Mózes I. könyv: 1)

Zamenhof a san- ’egészség’ gyökkel szemléltette az eszperantóban szóképzési lehetősé-geket, összesen 52 származtatott szót felsorolva. Ezeket megvizsgáltam a szöveggyűjte-mény öt terjedelmes szövegében, és azt találtam, hogy a san 20 különböző, Zamenhof által felsorolt szóban fordul elő:

(1) mal·san·a (mn) ’beteg’

mal·san·ad·o ’betegeskedés’

mal·san·ec·o ’betegség’

mal·san·em·a ’beteges’

mal·san·et·a ’kissé beteg, gyengélkedő’

mal·san·i ’betegnek lenni’

mal·san·ig·a ’megbetegítő’

mal·san·iĝ·i ’megbetegedni’

mal·san·o ’betegség’

mal·san·ul·ej·o ’kórház’

mal·san·ul·in·o ’beteg nő’

mal·san·ul·o (fn) ’beteg’

re·san·ig·i ’meggyógyítani’

san·a ’egészséges’

san·e ’egészségesen’

san·ig·a ’gyógyító’

san·ig·i ’gyógyítani’

san·iĝ·i ’meggyógyulni’

san·o ’egészség’

san·ul·o ’egészséges ember’

Ugyancsak ebben az öt könyvben találtam további 11 san- gyököt tartalmazó származék-szót, amelyek nem szerepeltek Zamenhof listáján:

(2) ek·mal·san·is ’megbetegedett’

ek·re·san·iĝ·is ’kezdett felgyógyulni’

mal·san·aĵ·o ’beteges dolog’

mal·san·eg·a ’kóros’

mal·san·et·iĝ·as ’gyengélkedni kezdett’

ne·re·san·ig·ebl·a ’kigyógyíthatatlan’

ne·san·ig·ebl·a ’gyógyíthatatlan’

re·san·iĝ·i ’felépülni (betegségből)’

re·san·ig·it·o ’egészségét visszakapott személy’

san·ig·ad·o ’gyógyítás’

san·ig·ant·o ’gyógyító’

Az eszperantó morfológiai gazdagságát mutatja, hogy majdnem minden szó kombiná-lódhat előképzőkkel és utóképzőkkel,5 nemritkán ugyanabban a szóban. Az eszperantó szóalkotás gazdagságának további illusztrálására a (3) példasorban bemutatok néhány a viv- ’élet-’ gyökből létrehozott szót.

4 A mondatban szereplő szavak és morfémák: komenc-: a ’kezdet’ jelentésű főnév gyöke; Di-: az

’Isten’ jelentésű főnév gyöke; ĉiel-: az ’égbolt’ jelentésű főnév gyöke; ter-: a ’föld’ jelentésű főnév gyö-ke; kre-: az ’alkot’ jelentésű ige gyögyö-ke; en: ’-ban/-ben’ jelentésű elöljárószó; la: ’a/az’ (névelő); kaj: ’és’

(kötőszó); -o: főnévi kategóriavégződés; -n: tárgyeset; -is: a múlt idő jele.

5 Az előképzők és utóképzők Zamenhof anyanyelvében, az orosz nyelvben is széleskörűen jelen vannak.

(3) dum·viv·a (mn) ’örökös’

(jog) ’életfogytiglani’

long·e·viv·a ’hosszú életű’

ne·viv·i·pov·a ’életképtelen’

post·viv·ant·o (fn) ’túlélő’

re·viv·iĝ·o 1 (vall) ’feltámadás’

2 ’újjáéledés’

tra·viv·aĵ·o ’élmény’

viv·ig·i 1 ’éltet, életben tart’

2 ’élénkít’

viv·o·nask·a (áll) ’elevenszülő’

3.2. A Lipcsei Korpusz

A lipcsei egyetem informatikusai és nyelvészei, köztük az eszperantó körökben jól ismert Sabine Fiedler, korpuszfeldolgozó programot készítettek. Honlapjukon sok nyelvből vá-laszthatunk, az abház nyelvtől kezdve a csuvas nyelven át a zulu nyelvig, a magyart és az eszperantót is beleértve (Leipzig Corpora Collection 2012, vö. Quasthoff et al. 2014).

Az adott nyelvi korpuszt évenként bővítik különböző forrásokból, ezeket külön is le lehet hívni. Az „Esperanto. Mixed 2012” jelzésű korpuszból egy 250 ezer szavas, gyakorisági adatokat is tartalmazó, ábécésorrendbe rendezett adatbázist tanulmányoz-tam. A szavakat gyakoriságuk szerint osztályokba sorolták: a leggyakoribb szó jele a 0, míg a legritkább szavak a 20 jelzésű csoportba kerültek. A szavak tényleges gyakorisága azonban nincs megadva. A 2. táblázat az első 10 leggyakoribb szót mutatja meg a fenti korpuszban.

2. táblázat

Az első 10 leggyakoribb szó a Lipcsei Korpuszban

1 la ’a’ (névelő) 0

2 de ’birtoklás’ 1

3 kaj ’és’ 1

4 en ’-ban/ben’ 2

5 est·as ’van’ 2

6 al ’-hoz/-hez/-höz’ 3

7 La ’a’ (névelő) 3

8 ne ’nem’ 3

9 ke ’hogy’ 3

10 por ’célhatározó’ 3

A gépi feldolgozás külön kezeli a kis- és nagybetűket, ezért a szavak tényleges gyako-risági sorrendjét nem lehet megállapítani. A fenti adatbázisból további munkálatokkal előállíthatóak a morfémaszintű adatok. A 3. táblázat a későbbiekben (lásd 3.3. és 3.4.) egy eszperantó nyelvkönyvben (Szerdahelyi 1989) és egy internetes eszperantó szótár-ban (Horváth (szerk.) 2015) is vizsgált -ig-/iĝ- képzőkkel képzett leggyakoribb szavakat mutatja be.

57 3. táblázat

Az -ig-/iĝ- képzőkkel képzett leggyakoribb szavak, a gyakorisági mutatóval

far·iĝ·is ’elkészült’ 8

Figyelemreméltó, hogy az iĝ·is ’valamivé vált’, az al·iĝ·is ’csatlakozott’ és az ebl·ig·as

’lehetővé tesz’ szavak esetében nincsen gyökmorféma, hanem csak képzők és ragok.

A morfémák szerinti szövegvizsgálatot sokan fontosnak tartják, például Haupenthal (2009), aki 2009-es írásában egy konkrét példán mutatja be az eszperantó története során létrejött szóalakok morfémaszintű vizsgálatát.

3.3. Eszperantó nyelvkönyv

Az alábbi, 4. táblázat példái a képzők használatát szemléltetik a magyar és az eszperan-tó nyelvben. A táblázat (kisebb jelölésbeli változtatásokkal) Szerdahelyi István (1989) eszperantó nyelvkönyvének az -ig-/-iĝ- képzőpárra és magyar megfelelőire vonatkozó részlete.

4. táblázat

Az -ig-/-iĝ- képzőpár és az ezeknek megfelelő képzők a magyar nyelvben (Szerdahelyi 1989: 81−82)

-ul lezár

A műveltetést, illetve visszahatást megjelenítő -ig-/-iĝ- képzőpáros rendkívül fontos az eszperantóban. Ezeknek a képzőknek a használatával a mondatszerkesztési problémák leegyszerűsödnek (Szabó 1984). Elismert pedagógusok a nyelv tanításánál hangsúlyo-zottan ajánlják begyakoroltatásukat (Szanser 1988). Az eszperantóban még számos elő-képző és utóelő-képző található, de ezek kombinációs képessége kisebb, mint a bemutatott -ig-/-iĝ- párosé.

3.4. Internetes eszperantó–magyar szótár

Az eszperantó szóképzési lehetőségek további illusztrálásaképpen a Magyar Elektronikus Könyvtárban szabadon elérhető eszperantó–magyar szótárból6 (Horváth (szerk.) 2015) kigyűjtöttem két magyar szópár, a buk(ik) – buktat és a rejt – rejtőz(ik) igék eszperantó megfelelőinek származékait és ezek magyar jelentéseit. (Az első esetben az eszperantó ige alapformája fali, a második esetben kaŝi.) A szótárból kimásolt eszperantó szavakban a szokásos jelölésmóddal bejelöltem a morfémahatárokat is.

6 A szótárt használva találkozhatunk a legfrissebb magyar köznapi kifejezések eszperantósításával is, például teletinti ’rácsörög’. A szótár mind a két irányból kereshető.

59

(4) fal·akv·o (geo) ’zuhatag’

fal·foli·a (növ) ’lombhullató’

fal·krad·o (kat, ép) ’csapórács, kapurostély’

fal·lac·a ’holtfáradt’

akv·o·trans·fal·ig·il·o (víz) ’bukófal’

bat·fal·ig·i ’leüt’

paf·fal·ig·i ’lelő’

puŝ·fal·ig·i ’feldönt, fellök’

rul·fal·ig·i ’felbuktat’

(5) kaŝ·a ’rejtőzködő, rejtett, titkos’

kaŝ·ej·o ’rejtekhely’ (szín) kaŝloko

kaŝ·em·a ’rejtőzködő, titkolódzó, hallgatag’

kaŝ·il·o ’álca’

kaŝ·spekt·ant·o (pej) ’potyanéző’

kaŝ·vag·i ’bujdosik’

kaŝ·var·o (gazd, jog) ’dugáru, zugáru’

kaŝ·vest·o ’álruha’

kaŝ·vetur·ant·o ’potyautas’

kaŝ·iĝ·o ’rejtőzködés, bújócska’

mal·kaŝ·iĝ·i 1 ’előbukkan, előkerül’

2 ’feltárul, nyilvánosságra kerül,

kiderül, lelepleződik’

3.5. Eszperantó teljes illusztrált szótár

Az előzőleg bemutatott eszperantó–magyar szótár alapja az − interneten szintén elérhe-tő − eszperantó teljes illusztrált szótár (Plena Ilustrita Vortaro de Esperanto 2020). Az elfogadottsága egyetemleges, ahogyan ezt a hozzáférési címe (vortaro.net) is világosan mutatja. Ez azt jelenti, hogy ez a szótár a szótár. Közel száz év és több száz ember mun-kájának eredménye.

3.5.1. A szótár jellemzői

A szótár eszperantó gyökszavakat tartalmaz, piktogrammal utal ezek használati körére, definiálja őket, valamint példamondatokat és további magyarázatokat is ad hozzájuk. A szótárban rá lehet keresni a szavakat alkotó egyes morfémákra is.7 Két példa:

akvotransfaligilo. Akvobarilo sur aŭ super kiu superflua akvo povas transflui el kanalo aŭ baseno

’bukófal. Vízgát, amelyen vagy amely felett a felesleges víz átfolyhat a csatornából vagy a medencéből’

kaŝiĝo. Ago de tiu kiu sin kaŝas: ludi «kaŝiĝo» Z; la birdo serĉis por si kaŝiĝejon en malluma truo Z

rejtőzés. Aki elbújik: bújócskát játszani; a madár búvóhelyet keresett magának egy sötét lyukban’

Az élettan területéről származó szavak szócikkében a szótár sok esetben latinul is megad-ja a megfelelő kifejezést. Részlet egy szócikkből:

7 A szóösszetétel esetében a kérdéses morféma grafikai megjelenítése zöld színnel történik – ezt itt nem tudjuk érzékeltetni. A felső indexben szereplő z betű zamenhofi példamondatra utal.

hund/o Mamulo Canis lupus familiaris el la g. kaniso subordo de rabobestoj tre inteli-genta k fidela k tial uzata kiel dombesto ĉefe por gardado k ĉe ĉasado; por hundon dronigi oni nomas ĝin rabia z (oni ĉiam trovas pretekston por malutili malamaton).

’kutya Emlős a ragadozó alrend kutyafélék családjából; nagyon intelligens és hűséges, ezért háziállatként leginkább őrzésre és vadászatra használják; hogy elveszejtsék, veszettnek mondják a kutyát (az emberek mindig találnak indokot, hogy ártsanak annak, akit gyűlölnek).

A ’kutya’ jelentésű szó esetében Zamenhof a latin canis szón kívül választhatott volna még az alábbi (sorrendben lengyel, angol, francia, spanyol, jiddis és német) jelöltekből: pies, dog, chien, perro, הונט, Hund. Végül a jiddis és a német szó lett az eszperantó hundo szó kiindulása, és ezt a megoldást támogatta a speciális jelentésű angol hound ’kopó’ szó is.

3.5.2. A szótár korpuszának morfológiai jellemzői

Bár az online szótárban minden morfémára rá lehet keresni, szövegeket vizsgálva ez a módszer nagyon korlátozottan alkalmazható. Ezért a szavak morfémákra való bontásánál felhasználtam egy speciális elemző szofvert: az ESPSOF szóstatisztikai és szövegelemző szoftvercsomagot, amelyet Toon Witkam hozott létre (vö. Witkam 2007).

Az 1 001 832 szövegszó 1 857 776 morfémából tevődik össze; ez 39 658 egye-di morfémát jelent. Az alábbi, 5. táblázatban láthatjuk a morfémákat gyakorisági sor-rendben, a szón belüli pozícióik (1–8.) szerinti gyakoriságuk szerint, mivel a különböző morfémák nem egyforma eséllyel jelennek meg egy szón belül, annak az 1., 2. stb. pozí-ciójában. (Az 5–8. pozíciót összevontan szerepeltetem.) A teljes gyakoriságot az összes pozícióbeli gyakoriság összege adja ki. Az utolsó oszlop a morfémákra bontott korpusz aggregált lefedési százalékát mutatja. A táblázat adataiból láthatóvá válik, hogy vannak olyan morfémák, amelyek minden pozícióban megjelennek, és lényeges szerepet játsza-nak a szóalkotásban. Ilyen például az eddig is kiemelten tárgyalt -ig- és -iĝ- morféma.

5. táblázat

8 A morfémák (egyes esetekben morfémakombinációk) jelentése a táblázatban való előfordulási sorrendjükben: -o: főnévi kategóriavégződés, -a: melléknévi kategóriavégződés, la ’a/az’ (névelő), de:

birtokviszony, -oj: főnév többes száma, -i: főnévi igenévi kategóriavégződés, -as: jelen idő, -on: főnév tárgyesete, -aj: melléknév többes száma, -e: határozószói kategóriavégződés, en ’-ban/-ben’, kaj ’és’, -is:

múlt idő, al: ’-hoz/-hez-höz’, -ant-: jelen idejű cselekvő igenév, -an: melléknév tárgyesete, mal-: ellentét-képzés, -it-: múlt idejű szenvedő igenév, el: távolodás kifejezése, -est-: a létige gyöke, -ig-: műveltetés, -ojn: főnév többes száma tárgyesetben, aŭ: ’vagy’ (kötőszó), kiu ’aki’, -iĝ-: visszaható képző, -n: tárgy-eset, ne: ’nem’, kun: ’-val/-vel’, -ad-: gyakorító képző, por: célhatározói elöljárószó.

61

-oj 200 37 028 11 041 2 234 219 50 722 0,26

-i 4 351 25 485 11 796 2 506 80 44 218 0,29

-as 33 30 895 5 407 655 13 37 003 0,31

-on 31 29 095 6 256 1 441 151 36 974 0,33

-aj 49 18 804 10 377 3 017 317 32 564 0,35

-e 919 19694 7 050 1 363 132 29 158 0,36

en 19 888 787 685 139 21 499 0,37

kaj 18 611 9 18 620 0,38

-is 9 11 902 4 604 966 44 17 525 0,39

al 14 726 128 32 3 14 889 0,40

-ant- 10 11 311 2 961 339 18 14 639 0,41

-an 330 10 739 2 667 536 64 14 336 0,42

mal- 13 517 114 19 1 13 651 0,42

-it- 18 9 542 3 244 518 3 13 325 0,43

el 13 168 85 13 13 266 0,44

-est- 12 908 270 7 1 13 186 0,44

-ig- 129 9 361 2 899 129 7 12 525 0,45

-ojn 6 9 552 1 996 443 31 12 028 0,46

11 578 6 11 584 0,46

kiu 11 432 11 432 0,47

-iĝ- 436 7 733 2 843 97 5 11 114 0,48

-n 884 10 033 20 4 5 10 946 0,48

ne 10 251 21 3 3 10 278 0,49

kun 9 637 46 2 1 9 686 0,49

-ad- 27 7 662 1 643 269 12 9 613 0,50

por 9 188 2 4 9 194 0,50

A fenti 30 leggyakrabban használt morféma lefedi az adott korpusz 50%-át. Ha csak a kategóriavégződéseket (-a, -e, -i, -o), valamint a névszóragozás (-n, -aj, -an, -ajn, -oj, -on, -ojn) és az igeragozás (-as, -is, -os, -us, -u) toldalékait számoljuk, ezek 614 901 egységet tesznek ki. Ez az összes morféma 35%-át teszi ki – tehát ezek ismerete a nyelvtanulásban nagy könnyebbséget jelent.