• Nem Talált Eredményt

Az igekötős igék szintaxisa korpuszvezérelt megközelítésben

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az igekötős igék szintaxisa korpuszvezérelt megközelítésben"

Copied!
18
0
0

Teljes szövegt

(1)

AZ IGEKÖTŐS IGÉK SZINTAXISA KORPUSZVEZÉRELT MEGKÖZELÍTÉSBEN

Kalivoda Ágnes

Bevezetés

Tanulmányomban rendhagyó módon, korpuszvezérelt módszerrel vizsgálom az igekötős igék szintaktikai viselkedését. A korpuszvezéreltség Sass (2011:

15–16) alapján azt jelenti, hogy nem volt kiinduló hipotézisem, kizárólag korpuszadatok alapján fogalmaztam meg a következtetéseimet. Több mint 21,5 millió mondatban mértem ki a finit ige és a hozzá tartozó igekötő távol- ságát. Jelen tanulmány ennek a korpuszmérésnek az eredményeit és az ered- mények elméleti tanulságait ismerteti.

A kutatás mögött számítógépes nyelvészeti motiváció áll, a mérések az ANAGRAMMA gépi elemző számára készültek, l. Indig–Laki–Prószéky (2016). Az elemző balról jobbra haladva, szavanként – a szófaji annotációt is ismerve – dolgozza fel a mondatot. Egy ilyen modellben fontos tudni, hogy elvált igekötő esetén mire készüljön az elemző. Ha például beolvasott egy fi- nit igét, meddig szükséges várnia a posztverbális igekötőre, várhat-e egyálta- lán igekötőt a mondatban? Posztverbális igekötő esetén az elemző nem tud- hatja biztosan a vonzatkeretet, amíg az igekötőt be nem olvassa, vagy annak lehetőségét el nem veti.

A tanulmány három kérdés megválaszolására törekszik: 1) Milyen mon- dattípusokra, szerkezetekre jellemző az igekötő-ige, illetve ige-igekötő sor- rend, és milyen arányban szerepelnek a korpuszban a különféle szerkezetek?

2) Melyek a finit ige és a posztverbális igekötő távolságának lehetséges okai, és melyik közülük a legmeghatározóbb? 3) Mit mondanak a korpuszból nyert adatok a magyar igekötő-állomány összetételéről?

1. Módszertan

A korpuszmérést a Magyar Nemzeti Szövegtár bővített változatán (MNSZ2 2.0.3) végeztem. Ez a verzió írásjelek nélkül 785 millió szövegszót tartalmaz, találhatók benne sajtószövegek, szépirodalom, tudományos, személyes és hi- vatalos írások, beszélt szövegek átiratai, l. Oravecz–Váradi–Sass (2014).

A korpuszból lekértem minden olyan mondatot, amely igekötős finit igét tartalmaz: az igekötő lehetett preverbális (az igétől balra elvált vagy az igével egybeírt), illetve posztverbális. A hibás találatok szűrése után több mint 21,5

(2)

millió mondat maradt, amelyen tovább lehetett dolgozni. Az igekötők pozíci- óját automatikusan határoztam meg úgy, hogy a mondatokat egy számegye- nesre képeztem le, ahol az origó a finit ige volt. A negatív tartományba kerül- tek a preverbális, a pozitív tartományba a posztverbális igekötők (a módszer alapjához l. 1. ábra).

1. ábra: Az igekötők pozíciójának meghatározása a finit igéhez képest1 Az MNSZ2-n végzett méréseim során nem bíráltam felül a korpusz annotáci- óját, tehát az ott igekötőnek jelölt, a szakirodalom jelentős része szerint nem igekötő létre, észre szavak ugyanúgy bekerültek az elemzésbe, mint a ki, le, fel stb. Az igekötő-állomány meghatározásához lekértem az MNSZ2-ből min- den igekötős finit igét. Egy script elválasztotta az igekötőt a lemmától, és aszerint, hogy volt-e benne kötőjel, két halmazba rendezte az eredményeket:

egytagú és összetett igekötők halmazába.

A korpuszmérésben csak az egytagú igekötők szerepelnek (80 darab), a vizsgált 21,5 millió mondat pedig csak olyan igekötő+finit ige kombinációkat tartalmaz, ahol az igekötő és a finit ige egy tagmondaton belül szerepelnek, és összetartozásuk automatikus módszerrel eldönthető. Így például nem ré- szei a vizsgálatnak az olyan komplex szerkezetek, mint a fölérendelt tagmon- datba kiemelt igekötők (pl. el kell, hogy mondjam), valamint az infinitívuszos szerkezetekben szereplő „gazdátlan igekötők” (pl. elképzelni bármit el lehet).

2. Problémák

A korpuszmérés megvalósítását nehezítette az igekötők gyakran hibás gépi annotációja, valamint egy elméleti jellegű probléma: egyáltalán mely szava- kat soroljuk az igekötők csoportjába?

1 A -1 pozícióban csak akkor jelenik meg egytagú igekötő, ha a mondat írója hibásan gépelte a szót (pl. agyonverte helyett agyon verte), vagy ha a finit ige segédigei szerepet tölt be a mondat- ban, és az igekötő valamilyen igenévhez tartozik. Emiatt a -1 pozíció nem része a kiértékelésnek.

-2 -1 0 +1 +2 elolvas

el sem olvas olvas el olvas már el

(3)

2.1. Technikai nehézségek

A módszertani fejezetben utaltam rá, hogy szűrni kellett a hibás találatokat, amely meglehetősen összetett feladat volt.2 Egyrészt meg kellett találni az olyan mondatokat, ahol valójában igenévé az igekötő (ez nem triviális akkor, ha elvileg mindkét igével állhatna, pl. a verni el nem mentek esetében el+ver és el+megy is létező kombináció). Másrészt fel kellett ismerni a téves szófaji címkéket. Az automatikus szófaji egyértelműsítésben komoly hibaforrást je- lentenek a homográf szavak és az igekötők esetében kiugróan magas a té- vesztések aránya. Három esetben kaphatnak hibás szófaji címkét:

1) Elírások automatikus elemzésekor. Ilyen a felesleges szóköz (pl. meg nézett), ékezetek hiánya (pl. fél → fel) vagy internetes szövegekben gyakori rövidítések (pl. megláttam → +láttam).

2) Ha az igekötő más nyelvek szavaival homográf. Gyakori eset, hogy az angol be létige, a spanyol el és a francia le határozott névelők igekötőként je- lennek meg a korpuszban.

3) Ha az igekötőnek homonim párja van a magyarban. Pl. akkor csak lámpát kell vennem meg rácsot, az mennyibe fog kerülni és ki fogja rá adni a pénzt – a meg és ki mindkét példában (tévesen) igekötőként annotáltak. A leg- több igekötő átfedésben van egy hozzá közel álló szófajjal. Ilyenek az idió- marészből kialakult igekötők (pl. tönkre), amelyek sokszor esetragos főnév- ként annotáltak, valamint az olyanok, amelyek határozószóként, névutóként is funkcionálnak (pl. együtt). Számos ilyen szó igekötői státuszáról megoszlik a szakirodalom véleménye, a bizonytalanságot az annotáció következetlensé- ge is tükrözi.

2.2. Az igekötő-állomány meghatározásának nehézségei

Komlósy (1992: 495–497) táblázata jól mutatja a bizonytalanságot abban a kérdésben, hogy mely szavak sorolhatók az igekötők közé. 90 szót listáz, amely esélyes az igekötői címre, és látható, hogy egyes források mennyire el- térően vélekednek ezekről a szavakról. Ahogy Komlósy is megfogalmazza, néhol még egy forráson belül sem követhető nyomon a besorolás logikája.

Forgács (2005: 11) szakirodalmi áttekintése két kritériumot talál közösnek az egyes szerzőknél:

1. Az igekötő produktív, új igék hozhatók létre vele. Ez indokolja azt, hogy a tönkre a legtöbb forrásban igekötő (tönkre|megy, -tesz, -vág, -zúz, -ver stb. igék alkothatók vele), míg a cserben-t nem szokás annak tekinteni (csak a cserbenhagy igében fordul elő).

2 A probléma és a kísérleti jellegű megoldások részletesebb ismertetéséhez l. Kalivoda (2016).

(4)

2. A szemantikailag transzparens szavakat, ahol az igekötős ige jelentése nem több, mint az igekötő és az ige külön-külön vett jelentései, általában ki- zárják az igekötő-kategóriából. Így például a haza szót nem tekinti igekötő- nek J. Soltész (1959: 15), valamint Kiefer–Ladányi (2000) sem. Forgács ezt bírálja, arra hivatkozva, hogy a haza- előtag egyrészt nagyon produktív, más- részt átvitt értelmű használata is van (hazavág ’elront, megöl’, hazabeszél

’saját maga vagy a magához közel állók érdemeit hangoztatja’).

Számos szakirodalom mutat be teszteket, amelyek dönthetnek egy-egy szó igekötő-voltáról.3 Forgács (2005) a – hagyományosnak mondható – szük- séges és elégséges feltételek megállapítása helyett más szemléletet javasol.

Szerinte a prágai iskola centrum–periféria modelljét volna célszerű alkalmaz- ni az igekötők esetében. A centrumban olyan szavak állnak, amelyek minden kétséget kizáróan igekötők, a periféria felé haladva csökken az „igekötőség”

erőssége. Az igekötők eredetét, nyelvtörténeti útját szem előtt tartva határoz- za meg az egyes szakaszokat. Ilyen prototípus-elméleti megközelítést alkal- maz Kerekes (2011) is.

Ahogy a későbbiekben látni fogjuk, a jelen kutatás ezt az elképzelést, te- hát a lehetséges igekötők skálán való elhelyezését támasztja alá.

3. Preverbális igekötők

Az igekötők kanonikus helye a közvetlenül preverbális pozíció. Az igétől el- vált preverbális igekötőket intuitívan is jóval ritkábbnak vélhetjük, mert a magyar mondatok bal perifériáján az összetevők elrendeződése sokkal meg- szorítottabb, mint az ige utáni mondatszakaszban.

3.1. A preverbális igekötők pozíció szerinti eloszlása

A korpuszadatokban szélsőértéknek az igekötő -4-es pozíciója bizonyult, vagyis az igekötők és a finit ige között legfeljebb három másik szó állt.

1. táblázat: Lehetséges igekötő pozíciók a finit ige bal oldalán

-4 -3 -2 0

db 6 91 102768 13715093

% - - 0,74 99,26

3 Az igekötő-állomány meghatározásáról bővebben l. Pais (1959), Jakab (1976), Kiefer–Ladányi (2000).

(5)

Az 1. táblázatban látható, hogy a közvetlenül preverbális helyzetű igekötők aránya kiemelkedően magas: több mint 13,7 millió találattal a 0 pozíció fedi le a preverbális esetek 99,26%-át. A következő olyan pozíció, ahol a finit igé- hez tartozó igekötő állhat, a -2. Ide is-szerkezet (1a) vagy annak tagadása (1b, 1c), tagadó felszólítás, tiltás (1d) vagy tagadás (1e) esetén kerül az igekötő. A korpusz mondataiban az is, sem, se, ne, nem szavak választották el egymástól az igekötőt és a finit igét.

(1) a. 10-12 óra között le is zárják a teret.

b. Pedig még ki sem próbáltam.

c. Vissza se gyere!

d. Aztán fel ne fázz!

e. Egy 15 milliós terepjáróval be nem mennék a fák közé.

Amíg -2-ben több mint 102 ezer igekötőt lehetett találni, -3 pozícióban csak 91 szerepelt. Ezekről elmondható, hogy a közbeeső két szó egyike a fentebb bemutatott, öt elemű halmazból való: nem is, már nem, még nem, soha nem, ugyan nem, sem nagyon, sem igen, se nagyon, biztosan nem, valóban nem...

Az MNSZ2-ben két olyan példa volt, amely az általánosításon kívül esik:

(2) a. Le csak azért taszították mert Jézus áldozata a keresztfán megmentette a világegyetemet a további megkísértéstől [...]

b. Le a számokkal írjunk képleteket.4

A legszélső, -4 pozícióra mindössze hat példa akadt a korpuszban, és a (3e) kivételével mindegyik esetében kétséges, hogy a haza és vissza szavak igekö- tők vagy határozószók.

(3) a. Mentünk baška vodára nyaralni elég körülményesen haza is elég körülményesen jöttünk [...]

b. Nem tervezek itt maradni, de haza is csak látogatni megyek ezentúl.

c. Elcsörömpöl s vissza már egyre ritkábban fordítja a rudat...

d. [...] folyvást előretör vissza az istennek se nézne [...]

e. Viszont vissza most már nem szívhatja szavát!

f. A lapos papucscsónakkal ment, de vissza már nem egyedül érke- zett a vendéglőtől [...]

Ahogy az igekötő-állomány meghatározási nehézségeinél szó volt róla, a haza a szemantikai átlátszósága miatt több szakirodalomban kimarad az

4 A kontextus alapján valószínű, hogy itt egyszerű vesszőhibáról van szó, és a szerző szándéka ez lehetett: Le a számokkal, írjunk képleteket. Az ilyen típusú hibák kiszűrése egyelőre nem megol- dott, és valószínűleg nem is sikerül általánosan jó megoldást találni rá.

(6)

igekötők listájából. Ezekben a példákban valóban felfogható hangsúlyos ha- tározószóként is. A vissza jellemzően bekerül az igekötő-kategóriába.

3.2. Igekötő-ige szórendű mondatok

A közvetlenül preverbális igekötőt tartalmazó mondatok körülbelül5 93%-át semleges mondatok alkotják, amelyeknek ez a szórend az egyik alapvető is- mérve.6 Alberti (2006: 37–38) három nyelvészeti terület irányából közelíti meg a semleges mondat fogalmát. Szemantikai szempontból a semleges mon- dat „jelentése pusztán a lexikai jelentéstényezőkből áll össze, nincsen szerke- zeti többletjelentés, vagy óvatosabban fogalmazva a szerkezetből adódó több- letjelentés minimális”. Hangtanilag semleges intonáció jellemzi, vagyis a mondatban a tartalmas szavak az alapértelmezett kezdőszótagi hangsúlyukat viselik, a grammatikai funkciószavak hangsúlytalanok. Pragmatikai szem- pontból a semleges mondatban bizonyos szavak előfeltevést hordozó elemek,

„a szórendi és intonációs sajátosságok nem hoznak további előfeltevéseket”.

A nem-semleges mondatban ezzel szemben a hangsúly eloszlása nem egyenletes, és speciális jelentéstöbbletet hordoz, amely szerkezetileg is meg- jelenhet, l. Alberti (2006: 54). Ekkor sokkal inkább az ige-igekötő szórend jellemző, de találunk nem-semleges mondattípust közvetlenül preverbális igekötővel is. Ilyen az eldöntendő kérdés (a 0 pozíció kb. 6,4%-át alkotja) és az igei fókuszt tartalmazó mondat.7

A felszólító mondatok egy stilisztikailag jelölt típusára is az igekötő-ige szórend jellemző. Ezek gyakran erős érzelmi többletet fejeznek ki (pl. Elhall- gass végre!, Eltakarodjatok a szemem elől!). Összesen 4547 példát találunk erre a 0 pozíció adataiban, ez 0,03%-nak felel meg.

A -2 pozíció esetén is-szerkezetek, tiltó és tagadó mondatok jelennek meg, ahogy az előző alfejezetben láthattuk. A -3 és -4 pozícióban általában kontrasztív topik szerepű szavak állnak, vö. É. Kiss (2003: 6), amelyek eseté- ben kérdéses és nem is feltétlenül eldönthető, hogy határozószók vagy való- ban igekötők.

5 A mondattípusok meghatározása automatikus módszerrel, reguláris kifejezések használatával történt, amelyek a mondattípustól függően az ige morfológiai annotációjára, ritkábban szóalakra és/vagy szótőre illeszkedtek. Az automatizáltság miatt csak körülbelüli értékekről beszélhetünk.

6 Létezik „fordított”, ige-igekötő sorrend semleges mondatban is, l. a Peredy (2011) által prezen- táló mondatnak nevezett szerkezetek. Pl. Akkor töszik föl az aszalóra, füstölik meg, vágod hilin- kára [szelet], s eszed meg. (csángó nyelvjárási adat). Ilyen típusú mondatokat nem találtam az MNSZ2-ben.

7 Ennek a gyakorisága automatikus módszerrel nem állapítható meg (valószínűleg a semleges mondatoknál látható kb. 93%-ot csökkentené 1-2%-kal).

(7)

4. Posztverbális igekötők

Az igekötő gyakran elmozdul a privilegizált, közvetlenül ige előtti pozíciójá- ból például tagadás, felszólítás vagy más összetevő fókuszba emelése esetén.

Érdekes adat, hogy +1 pozíciójú igekötőt több mint 7,5 millió mondatban ta- lálunk az MNSZ2-ben, ez a 0 pozíció kétharmada, azaz figyelemre méltóan gyakori.

4.1. A posztverbális igekötők pozíció szerinti eloszlása

A 2. táblázat mutatja azt a tendenciát, hogy az igekötők jóval nagyobb inter- vallumon helyezkedhetnek el a finit ige utáni mondatszakaszban, mint az ige előtt, de a +1 pozíció az esetek 97,98%-át lefedi.

2. táblázat: Lehetséges igekötő-pozíciók a finit ige jobb oldalán

+1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 db 7527308 163993 5126 1193 267 101 27 5 3 2 1

% 97,98 2,13 0,07 0,02 - - - -

A (4a-k) példasor egy-egy mondattal illusztrál minden lehetséges pozíciót:

(4) a.Ennek nyomán 17 megyében nyújtottak be felülvizsgálati kérel- met a Legfelsőbb Bírósághoz. +1

b. – Heverj csak el te is nyugodtan – mondta Pilátus. +2

c.Akkor hogy függenek itt most össze a szándékok és a bekövetkező események? +3

d. Én mindenesetre Dancsó úrral értek ebben a dologban egyet. +4 e. Háromszor veri ezt kenden Lúdas Matyi vissza! +5

f. Azért mentem egy kicsit a popzene felé el, mert szeretem a nívós, könnyed, jó popzenét, ami abszolút mindig keveredik a jazzal. +6 g. Tehát ezért függnek ezek a folyamatok egymással nagyon szorosan

össze és ezért adtuk ezt a nagyon provokatív címet a kötetnek. +7 h. Miért jár egy olyan kicsi magyar falunak ezer hektár vissza, a

sokkal nagyobbaknak meg alig valami, vagy éppen semmi? +8 i. Azt mondják, száz napból tizenöt-húszban sodor a szél dögszagot

a sárvári ATEV üzem felől ki az országútra. +9

j. Kerestem tehát az okát annak, hogy miért teszi megannyi egyébként oly sikeresnek látszó ember saját magát szántszándékkal tönkre. +10 k. 27 gyereket vitt egy feltehetően részeg buszsofőr Szentesen még

csütörtökön egy sportrendezvény után vissza az iskolába. +11

(8)

A (4i) és (4k) példákban egy helyhatározó áll közvetlenül az igekötő előtt, il- letve után, így felmerülhet az a probléma, hogy az igekötő sokkal inkább a helyhatározóhoz, mintsem a finit igéhez kötődik. További példákhoz l. Alber- ti (2006: 50).

4.2. Ige-igekötő szórendű mondatok

Az ige-igekötő szórendű mondatok – a 6-os lábjegyzetben említett, nagyon ritka példák kivételével – nem-semlegesek. Alberti (2006)-ot alapul véve a je- len fejezet csak olyan nem-semleges mondattípusokat sorol föl, amelyekre az igekötő-ige sorrend felcserélődése jellemző, és viszonylag jól megoldható volt a mondattípus számítógépes azonosítása. Nyolc kategóriát különítek el, amelyek a következők:

1. Mondat- és mondatrésztagadások (beleértve a beágyazott tagadó monda- tokat is). Számítógépesen ez nagyon jól formalizálható kategória. Átlagosan 15,7%-ban fordul elő a posztverbális igekötők korpuszában.

2. Felszólító mondatok (ide értve a beágyazott felszólítást is). Ez könnyen kereshető annak köszönhetően, hogy az imperatívusz morfológiailag is jelölt.

Alberti (2006: 73) amellett érvel, hogy a felszólítás az aspektustól független, tehát progresszívben is kifejezhetünk felszólítást. Erre a következő példát hozza: Épp másszunk fel a bordásfalra, amikor belép a tanár! Kétségtelenül grammatikus szerkezet, de az MNSZ2-ben nincs példa hasonlóra. A felszólító mondatok gyakoriak, átlagosan 10,5%-ban szerepelnek az egyes pozíciókon.

3. Óhajtó mondatok, amelyekben a mondatszerkezet „egy reménytelenebb alapállást tükröz” (Imrényi 2011: 97) azzal kapcsolatban, hogy a kívánt ese- mény bekövetkezhet-e. Pl. Csak hívna már fel! Ezt a feltételes mód és a csak együttes jelenléte esetén lehetett automatikusan kiszűrni.

4. Tiltó mondatok. Ezt a kategóriát csak a könnyű számítógépes kereshető- sége miatt emeltem ki külön. Imrényi (2011) szavaival: ez egy operátorláncot tartalmazó szerkezet, egy tagadó és felszólító operátor-projekció épül egy- másra. Pozíciónként átlagosan 2,3%-ban jelenik meg.

5. Kérdőszavas (kiegészítendő) kérdések és felkiáltó mondatok. Ezek nyelvészeti szempontból teljesen különváló kategóriák – jellegzetesen eltérő intonációs mintával –, de az írott nyelvi korpuszban egyformák. A kérdő-

(9)

illetve felkiáltójel természetesen segíthet a megkülönböztetésben (pl. Milyen későn kelt fel! ↔ Milyen későn kelt fel?), de csak akkor, ha nem egy másik mondatba ágyazott kérdésről vagy felkiáltásról van szó.

6. Progresszív aspektusú mondatok, ahol azon van a hangsúly, hogy éppen történt az adott cselekvés. Ezt a következő mintával lehetett részlegesen kiszűr- ni: ’épp|éppen + kijelentő módú ige’ vagy ’kijelentő módú ige + épp|éppen’. A +1 pozíció esetén 191, +2 esetén 3 progresszív mondatot lehetett találni. Né- hány példa:

(5) a. Verik le a képet!

b. Rakom ki szőttesruhába, zászlórongyba, emlékiratba csomagolva ajándék könyveim s fegyvereim.

7. Egzisztenciális mondatok, vö. É. Kiss (1992). A speciális jelentéstöbble- tük az, hogy valamely esemény már legalább egyszer előfordult. Részleges automatikus azonosítását a ’mondatkezdet + kijelentő módú ige + már’ minta teszi lehetővé. A korpuszban nagyon ritka szerkezet. Néhány példa:

(6) a.Rúgott már meg ló?

b.Veszítettem már két saját könyvet el, igen, de még nem találta meg senki sem.

c. Kaptak már így el csoportokat, akik ebből élnek?

8. Szerkezeti fókuszt tartalmazó mondatok. Ez gyakoriságát tekintve ki- emelkedő, számítógépes azonosíthatóságát tekintve a legproblémásabb mon- dattípus, mivel gyakorlatilag bármilyen szófajú szó fókuszba kerülhet. A ku- tatás jelen szakaszában minden olyan posztverbális igekötőt tartalmazó mon- datot, amelyet a reguláris kifejezések az előző 7 kategória egyikébe sem tud- nak besorolni, fókuszos mondatnak tekintek.

Az egyes mondattípusok arányát a posztverbális korpuszban a 2. ábra szemlélteti. Természetesen itt csak közelítő értékekről beszélhetünk. Érdekes, hogy a +1 pozíciójú igekötők korpuszában a kérdő és/vagy felkiáltó monda- tok csak 0,6%-ban vannak jelen, míg +6 pozíció esetén már a mondatok 15,6%-át, +7 esetében pedig 33,3%-át teszik ki (fontos viszont az is, hogy itt már sokkal kevesebb vizsgálható mondat állt rendelkezésre). Ezekben a mon- dattípusokban gyakoriak az ige és az igekötő közé beszúrt diskurzuspartiku- lák és indulatszók.

(10)

2. ábra: Ige-igekötő szórendű mondatok aránya az egyes pozícióknál8 4.3. Jellemzően posztverbális igekötővel álló igék

A korpuszvezérelt vizsgálat felszínre hozta az igekötős igék egy olyan cso- portját, amelynél az igekötő jellemzően posztverbális. Ennél a mérésnél olyan igéket vettem figyelembe, amelyek legalább 1000-szer fordultak elő az MNSZ2-ben, és az igekötő minimum 60%-kal gyakrabban állt az ige után, mint előtt (a mérésbe természetesen a 0 pozíció is beleszámított). A 3. táblá- zat tíz kimagasló találatot tartalmaz.

3. táblázat: Igék, amelyek jellemzően posztverbális igekötővel állnak (a százalékjel a posztverbális igekötők arányát jelenti az adott ige esetén)

Ige % Ige %

1. dolgoz fel 98,6 6. helyezkedik el 90,8

2. tevődik össze 97,7 7. folytat tovább 90,7

3. engedhet meg 96 8. könyvelhet el 90,7

4. áll hozzá 92,6 9. indul ki 89,6

5. ér el 90,8 10. ítél meg 88,9

8 A progresszív és egzisztenciális mondatok 1% alatti gyakoriságúak, ezért nem szerepelnek az ábrán.

(11)

A 3. táblázat igéi között találunk hangsúlykerülő igéket (pl. tevődik össze, he- lyezkedik el), emellett sok esetben gyakori mondatsémáról van szó, amelyben az adott igekötős igét használjuk (pl. jól/rosszul áll hozzá, abból indul ki).

4.4. Ige-igekötő távolságok és lehetséges okaik

A 2. táblázat tanúsága szerint a posztverbális igekötők 99,9%-ban közvetle- nül vagy egy szónyi távolságban követik a finit igét. Ennek a pszicholing- visztikai magyarázata elsősorban a távolsági hatásban keresendő, miszerint

„minél nagyobb a távolság a szöveg alkotóelemei között, annál nagyobb a hiba lehetősége és annál kapacitásigényesebb az összekapcsolás” (Németh (2001: 94)). Alberti (2006: 82) is hasonló gondolatot fogalmaz meg: „Fontos forrása azonban a jelentés-kalkulációnak a lexikonból hozott jelentés is, amit viszont nehezebben felismerhetővé tesz például az, ha az igekötő(szerűen vi- selkedő elem) eltávolodik az igetőtől.”

Az igekötők szerepet játszanak az ige irányította mondatfeldolgozásban, argumentumok keresésében, l. Pléh (1998: 133–135), ezért intuitíven is szá- mítani lehetett rá, hogy az ige elhangzása után minél előbb meg kell érkeznie az igekötőnek, amely módosítja az ige jelentését. Különösen igaz ez a meg, ki, be, fel, le, el igekötőkre, amelyek nagyon sok igével kombinálhatók. A tes- tesebb, részben idiomatikus igekötők (pl. agyon, tönkre, ketté) kevesebb igé- vel állhatnak, az elhangzott kontextusból rendszerint kiszámítható, hogy ezek az igekötők fognak még elhangzani. Ezek távolabb kerülhetnek az igétől (a tönkre, ahogy a (4j) példában láttuk, +10 pozícióban is előfordul.)

Fontos lenne magyarázatot adni az adatok 0,1%-ára is, tehát azokra, ame- lyekben az ige és az igekötő között kettő vagy több szó áll. Két szempontból9 elemzem a korpusz adatait:

1) A meta-adatok, főként írott és beszélt nyelvi oppozíció, valamint a stí- lusregiszter alapján.

2) Fonológiai szempontból, amelyet a szavak hosszának kimérésével le- hetett megvalósítani.

Írott és beszélt nyelvi stílus. A szóbeli megnyilatkozások alapvetően terve- zetlenek, spontának az írásbeliekhez képest, így szintaktikailag kevésbé sza- batosak, vö. Goody (1987: 258–289). Ezért arra számítunk, hogy a szélsőbb pozíciós igekötőt tartalmazó mondatok többsége eredetileg szóban hangzott

9 Érdemes lenne szemantikai szempontból is megvizsgálni a posztverbális igekötős igéket, mert intuitívan az is szerepet játszhat az igekötő eltávolodásának mértékében, hogy szemantikailag mennyire transzparens az adott igekötős ige. Ennek megvalósítása szisztematikusan, számító- gépes módszerekkel egyelőre túl nagy vállalkozásnak tűnt.

(12)

el. Az MNSZ2 meta-adatai segítségével viszonylag egyszerűen lehetett auto- matikus vizsgálatot végezni azzal kapcsolatban, hogy melyik igekötői pozíci- óra milyen szövegtípus jellemző. A szövegtípusra vonatkozó adatokat a kö- vetkező kategóriákba rendeztem:

1) Írott nyelvi: sajtó, személyes (ezek jellemzően internetes blogok és fó- rumhozzászólások), tudományos, szépirodalom (külön a próza és a vers), hi- vatalos (többnyire jogszabályok).

2) Beszélt nyelvi: rádióban elhangzott szöveg, felszólalás. A 3. ábra azt mutatja be, hogy az egyes pozícióknál milyen arányban reprezentáltak az írott, illetve beszélt nyelvi szövegek.

3. ábra: Írott és beszélt nyelvi szövegek százalékos aránya pozíciónként Az adatok értelmezéséhez tudni kell, hogy a teljes MNSZ2-ben a beszélt nyelvi adat nagyon kevés, vö. Oravecz és mtsai (2014): a rádiós szövegek a teljes szövegállomány 5,4%-át alkotják, és ha a hivatalos szövegek felét szó- ban elhangzottnak tekintjük, a végeredmény akkor sem több 9,4%-nál. A +1 pozíció szövegtípus szerinti megoszlása még nem tér el nagyban a teljes MNSZ2-től: lényegesen több írott szöveg a forrása (83,55%), mint beszélt nyelvi (16,45%). A beszélt nyelvi szövegek aránya viszont folyamatosan nő:

minél távolabbi igekötő-pozíciót vizsgálunk, annál valószínűbb, hogy szóban hangzott el a forrásmondat. A +7 pozíciónál már a mondatok kétharmada szó- beli, egyharmada írott szövegből származik. Alább a (7a-c) mondatrészek or- szággyűlési felszólalásban, a (7d-f) példák rádióműsorban hangzottak el:

(7) a. tette a minisztérium ezt a pályázati felhívást közzé b. került talán ebben a jogharmonizációs folyamatban elő c. támasztom ezt a tőlem talán szokatlan megfogalmazást alá d. dobja valakinek az egyéniségét a hullámhegyre fel

%

(13)

e. merül ez a kérdés ilyen sarkallatosan föl

f. járulhatott Ön szerint ehhez a szörnyű tetthez hozzá

Az írásbeli szövegek esetében a szépirodalom mutat monoton növekedő ten- denciát: míg +1 pozícióban a mondatok 6,32%-a származik irodalmi műből, +6 pozíció esetén ez az érték már 51,72%. Azt mondhatjuk tehát, hogy a szö- vegtípus és a posztverbális igekötő lehetséges eltávolodása összefüggenek:

szerkesztetlen, főleg szóban elhangzott szöveg, valamint művészien szerkesz- tett irodalmi szövegek esetén valószínűbb, hogy az igekötő eltávolodik a finit igétől.

Fonológiai tényezők. Otto Behaghel német nyelvész a Deutsche Syntax ne- gyedik kötetében öt törvényt – pontosabban tendenciát – fogalmazott meg, amelyekkel magyarázatot kívánt adni a szavak és frázisok mondatbeli elhe- lyezkedésére. A tendenciák Behaghel (1932: 4–8) alapján röviden a követke- zők:

1. Az értelmükben szorosan összetartozó összetevők a mondatban is egy- más mellett állnak (pl. sehr schön ’nagyon szép’).

2. Az új vagy fontosabb információ később hangzik el, mint ami kevésbé fontos vagy már ismert.

3. A megkülönböztető megelőzi a megkülönböztetettet (pl. a határozószó megelőzi a melléknevet, melléknévi igenevet, amelyre vonatkozik).

4. A rövidebb összetevő megelőzi a hosszabbat, ha ezt szintaktikai szabály nem gátolja.10

5. A hangsúlyos és hangsúlytalan szavak jellemzően váltakozva követik egymást (pl. ein lieber alter Freund ’egy kedves, régi barát’ a németben hangsúlytalan–hangsúlyos–hangsúlytalan–hangsúlyos sémát követ.)

É. Kiss (2007) amellett érvel, hogy a 4. tendencia – a növekvő összetevők törvénye – a magyarban az ige utáni mondatszakaszra érvényes, az ige utáni, alapvetően szabad szórendet befolyásolja az, ha az igét követő összetevők fo- nológiailag különböző súlyúak. Ezt többek között a (8) példával szemlélteti.

Az ideális sorrend a (8)-ban finit ige után az ’igekötő, határozó, tárgy’, egyéb kombinációk legalábbis szokatlanul hangzanának.

(8) János sértette meg nagyon Éva nagyapját.

10 Ezt a jelenséget Pā ini, a 4. században élt szanszkrit grammatikus is felismerte, a szakiroda - lomban Pā ini törvényeként is hivatkoznak rá, vö. Cooper–Ross (1975: 71), O’Connor (1978: 97–99). Ő a szanszkrit szóösszetételek vonatkozásában figyelte meg azt a tendenciát, hogy két összetételi tag közül jellemzően a rövidebb kerül előrébb.

(14)

A bemutatott tendencia jól látszik a posztverbális igekötőt tartalmazó monda- tok esetében. A mérést a következőképp végeztem el: Az olyan mondatokban, amelyek +1, +2 és +3 pozícióban tartalmaztak igekötőt, kimértem az ige után álló három szó hosszát (karakterszámban), és átlagoltam az egyes pozíciók hossz-értékeit. Az eredményeket a 4. táblázat foglalja össze.

4. táblázat: A növekvő összetevők törvénye – számokban Igekötő

helye Szavak átlaghossza

(+1-től +3-ig) Gyakoriság

(%) A finit ige és az igekötő közt álló gyakori szavak

+1 2,8 4,1 4,9 97,98 ∅

+2 3,0 3,2 4,5 2,13 -e, is, már, csak, még ...

+3 3,3 5,2 4,1 0,07 egy kicsit, én is, -e majd … A nagyon gyakori (97,98 százalékos), +1 pozíciójú igekötőt tartalmazó mon- datokban az igekötő átlagosan 2,8 karakter hosszú, az ezt követő szavak 4,1, majd 4,9 hosszúak. A növekvő összetevők törvénye a +2 pozíciós igekötők esetében is érvényes: az átlagosan 3,2 hosszú igekötőt annál valamivel rövi- debb szó (3,0) előzi meg, és lényegesen hosszabb követi (4,5). A tendencia +3 pozíciós igekötők esetén már érvényét veszti: az átlagosan 4,1 hosszúságú igekötőt nála hosszabb szó előzi meg. Fontos észrevennünk, hogy ez a hely- zet csak nagyon kevés mondatban áll fenn, a +3 pozíciós igekötők a posztver- bális eseteknek mindössze 0,07 százalékát alkotják.

Igazolható tehát, hogy a magyarban az ige utáni szabad szórend esetén a fonológia hat a szintaxisra, és az egyes mondatösszetevők sorrendjét befolyá- solja a fonológiai súlyuk.

5. Új szempont a centrum-periféria modellhez

A 2. fejezetben láthattuk, milyen nehézségeket okoz az igekötő-állomány meghatározása, és szó volt arról, hogy egy ilyen elmosódott határokkal bíró kategóriát célszerűbb lehet egy prototipikussági skálán értelmezni. Forgács (2005) nyelvtörténeti szempontból határozza meg az igekötők centrum és pe- riféria csoportjait. A centrumban a prototipikus igekötők állnak, amelyek grammatikalizált, ősi igekötők (a csoport legtipikusabb példája a meg, amely már irányjelölő funkcióval sem bír). A külsőbb körökben az olyan szavak áll- nak, amelyek még kevésbé haladtak előre az igekötővé válás útján, nehezen különíthetők el egyes névutóktól, határozószóktól (pl. haza, vissza). Kerekes (2011) Forgácshoz hasonlóan az igekötőség fokozatossága mellett érvel. E

(15)

két megközelítéshez szolgáltatnak újabb szempontot az itt bemutatott kor- puszmérések.

A finit igéhez képest elfoglalt helyük alapján kirajzolódtak az igekötők különböző csoportjai, amelyek közül az igéhez legközelebbi halmazt (cent- rum) valamint a legtávolabbit mutatja be a 4. ábra.11

4. ábra: Az igekötők centrum–periféria modellje a finit igéhez viszonyított pozíció szerint.

Az előjeles számok a pozíciót jelzik, az alattuk láthatók pedig azt, hogy mi- lyen arányban (%) képviselteti magát az igekötőcsoport az adott pozícióban.

A centrum tagjait a meg, ki, be, le, fel, föl, át, rá, el alkotják. Esetükben azt találjuk, hogy vannak ugyan szélsőbb előfordulásaik, de ezek egy-két példára korlátozódnak. Közös bennük az is, hogy ezek a leggyakoribb igekötők, a je- lenlétük mégis szinte csak a preverbális pozícióra és a +1-re szorítkozik. Az eloszlásukat tekintve is összetartanak: 58%-ban közvetlenül preverbálisan, 40%-ban közvetlenül posztverbálisan állnak.

Az igétől legtávolabb az össze, haza, oda, ide, tönkre, vissza igekötők ke- rülhetnek. Az eloszlásuk szintén nagy hasonlóságot mutat: a közvetlenül pre- verbális pozíció 64, a közvetlenül posztverbális 31 százalékot tesz ki.12 A ka- pott eredmények egy egész más szempont alapján nagyon hasonló centrum–

periféria elrendezést mutatnak, mint a nyelvtörténeti alapú skálázás.

11 Mind a 80 igekötő részletes adatait l. Kalivoda (2016: 37–38).

12 Kivételt képez az ide, amely főleg felszólító mondatokban fordul elő, emiatt a +1 pozíciója 56,8%-os.

meg ki be le fel föl át rá el -3 -2 0 +1 +2 +6

0,6 58 40 0,9

össze haza oda ide tönkre vissza

-4 -3 -2 0 +1 +2 +3 +4 +11 0,2 1,6 64 31 2,5 0,4 0,1

(16)

Összegzés

A korpuszvezérelt módszerű kutatás elméleti és gyakorlati szempontból is hasznosnak bizonyult. Elméleti téren a posztverbális igekötők disztribúciója hozott újdonságot. Egyrészt láttuk, hogy szóbeli közlésekben jobban eltávo- lodik az igétől az igekötője, mint szerkesztett, írott szövegekben. Másrészt számszerűsíteni lehetett azt, hogy a növekvő összetevők törvénye mennyire érvényes a magyar mondatok posztverbális szakaszára. A kutatás új szempon- tot valósított meg az igekötők prototípus-elméleti vizsgálatában.

A korpuszmérés eredményei hozzájárultak az ANAGRAMMA elemző VFRAME keresőeljárásának kialakításához, amely az ige vonzatkeretének egyértelműsítését végzi, l. Indig–Vadász (2016), Vadász–Kalivoda–Indig (2017). Az igekötős igék gyakorisági adatai pedig a MANÓCSKA integrált igei vonzatkeret adatbázis részét képezik, l. Indig (2017)13.

Hivatkozások

Alberti Gábor 2006. A magyar mondattan elmélete és gyakorlata generatív megközelítésben III. A háttérelmélet. Pécs, Pécsi Tudományegyetem.

Behaghel, Otto 1932. Deutsche Syntax IV. Heidelberg, Carl Winters.

Cooper, William E. – Ross, John Robert 1975. World order. In Robin E. Grossman – L. James San – Timothy J. Vance (eds.) Papers from the Parasession on Functionalism. Illinois, Chicago, Chicago Linguistic Society, 63–111.

É. Kiss Katalin 1992. Az egyszerű mondat szerkezete. In Kiefer Ferenc (szerk.) Strukturális magyar nyelvtan. I. Mondattan. Budapest, Akadémiai Kiadó, 74–160.

É. Kiss Katalin 2003. Mondattan. In É. Kiss Katalin – Kiefer Ferenc – Siptár Péter (szerk.) Új magyar nyelvtan. Budapest, Osiris Kiadó, 1–126.

É. Kiss Katalin 2007. Az ige utáni szabad szórend magyarázata. Nyelvtudományi Közlemények 104: 124–152.

Forgács Tamás 2005. Grammatikalizálódás az igekötők körében. In Oszkó Beatrix – Sipos Mária (szerk.) Uráli grammatizáló. Budapesti Uráli Műhely 4, Budapest, MTA Nyelvtudományi Intézet, 88–116.

Goody, Jack 1987. The Interface Between the Written and the Oral. Cambridge, Cambridge University Press.

Imrényi András 2011. A magyar mondat viszonyhálózati modellje. Ph.D. disszertáció, Budapest, Eötvös Loránd Tudományegyetem, Bölcsészettudományi Kar.

Indig Balázs – Laki László – Prószéky Gábor 2016. Mozaik nyelvmodell az AnaGramma elemzőhöz. In Tanács Attila – Varga Viktor – Vincze Veronika (szerk.) XII. Magyar Számítógépes Nyelvészeti Konferencia. Szeged, 2016. 01. 21- 22., 260–270.

13 Az adatbázis a következő erőforrásokat használja: Sass–Váradi–Pajzs–Kiss (2010), Sass (2015), Kornai–Nemeskey–Recski (2016), Kalivoda (2016).

(17)

Indig Balázs – Vadász Noémi 2016. Window in Human Parsing – How Far can a Preverb Go? Tenth International Conference on Natural Language Proceedings (HrTAL2016). Dubrovnik, Horvátország, 2016. 09. 29-30. Elfogadva, nyomtatás alatt.

Indig Balázs 2017. Manócska – integrált igei vonzatkeret adatbázis. Elérhető:

https://github.com/ppke-nlpg/manocska.

Jakab István 1976. A magyar igekötők állományi vizsgálata. Nyelvtudományi Értekezések 91, Budapest, Akadémiai Kiadó.

J. Soltész Katalin 1959. Az ősi magyar igekötők. Budapest, Akadémiai Kiadó.

Kalivoda Ágnes 2016. A magyar igei komplexumok vizsgálata. Mesterszakos szakdolgozat. Budapest, Pázmány Péter Katolikus Egyetem, Bölcsészet- és Társadalomtudományi Kar.

Kerekes Judit 2011. Az igekötők meghatározásának problémái. In Gécseg Zsuzsanna (szerk.) LingDok 10. Nyelvészdoktoranduszok dolgozatai. Szeged, JATEPress, 109–130.

Kiefer Ferenc – Ladányi Mária 2000. Az igekötők. In Kiefer Ferenc (szerk.) Strukturális magyar nyelvtan. III. Morfológia. Budapest, Akadémiai Kiadó, 453–

518.

Komlósy András 1992. Régensek és vonzatok. In Kiefer Ferenc (szerk.) Strukturális magyar nyelvtan. I. Mondattan. Budapest, Akadémiai Kiadó, 299–527.

Kornai András – Nemeskey Dávid Márk – Recski Gábor 2016. Detecting optional arguments of verbs. Proceedings of the 10th International Conference on Language Resources and Evaluation (LREC 2016).

Németh Dezső 2001. A munkamemória szerepe a mondatmegértésben. In Pléh Csaba – Lukács Ágnes (szerk.) A magyar morfológia pszicholingvisztikája. Budapest, BIP – Osiris, 83–118.

O’Connor, Michael Patrick 1978. Hebrew Verse Structure, Volume 1. Indiana, Winona Lake, Eisenbrauns.

Oravecz Csaba – Váradi Tamás – Sass Bálint 2014. The Hungarian Gigaword Corpus.

Proceedings of LREC 2014, 1719–1723.

Pais Dezső 1959. Az igekötők mivoltához és keletkezéséhez. Magyar Nyelv 55: 181–

184.

Peredy Márta 2011. Az ige-igekötő sorrend a Jókai-kódexben. In Bakró-Nagy Marianne – Forgács Tamás (szerk.) A nyelvtörténeti kutatások újabb eredményei VI. Szeged, Szegedi Tudományegyetem Magyar Nyelvészeti Tanszék, 181–197.

Pléh Csaba 1998. A mondatmegértés a magyar nyelvben. Pszicholingvisztikai kísérletek és modellek. Budapest, Osiris Kiadó.

Sass Bálint – Váradi Tamás – Pajzs Júlia – Kiss Margit 2010. Magyar igei szerkezetek – A leggyakoribb vonzatok és szókapcsolatok szótára. Budapest, Tinta Kiadó.

Sass Bálint 2011. Igei szerkezetek gyakorisági szótára – egy automatikus lexikai kinyerő eljárás és alkalmazása. Ph.D. disszertáció, Budapest, Pázmány Péter Katolikus Egyetem, Információs Technológiai és Bionikai Kar.

(18)

Sass Bálint 2015. 28 millió szintaktikailag elemzett mondat és 500000 igei szerkezet.

In Tanács Attila – Varga Viktor – Vincze Veronika (szerk.) XI. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2015). Szeged, JATEPress, 303–

308.

Vadász Noémi – Kalivoda Ágnes – Indig Balázs 2017. Ablak által világosan – Vonzatkeret-egyértelműsítés az igekötők és az infinitívuszi vonzatok segítségével.

XIII. Magyar Számítógépes Nyelvészeti Konferencia (MSZNY2017). Szeged, 2017.

01. 26-27., Szeged, Szegedi Tudományegyetem, 3–12.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Három, utcára néző ablak előtt egy másfél méteres füves kertcsík húzódott, utána egy drótkerítés, a járda, aztán két-három méter (leginkább sáros) terület, majd

A mágikus realista kifejezés magában foglalja a műfaj egyik legáltalánosabb körben elfogadott definícióját, a mágikus és a realista elemek egymás mellettiségét,

Nuclear Training Reactor of the Technical University Budapest Received February 8. Presented by Dir. In the practice one uses a discrete interval description of the

így lesz a sárvarjúból sárkány, mások anélkül hogy egyáltalán ismernék ezt a teremtményt disszertációt írnak mondjuk a sárvarjú mint haszonállat címmel,

Én ugyan meg vagyok felőle győződve, hogy ti előbb jöttetek e gondolatra, mint én azt leírtam s e percz- ben már tanakodtok is róla, hogy minő

wegs ein W erk der jetzigen Regierung sei, und wir verdanken dieselbe vielmehr der vergangenen. Bei einer Regierung zahlt die gute Gesinnung als solche gar

ábra: Támadások befejezésének eloszlása pozíció szerint 6:6 elleni játékban (2016 Olimpia)1. ábra: A támadások befejezésének eloszlása pozíció szerint 7:6 elleni

Azokon az órákon azonban, ahol a nyelvtanár többnyire a célnyelvet használja, a diákok nyelvhasználata nem feltétlenül hasonló, ugyanis nem minden tanár várja el,