• Nem Talált Eredményt

Az igei szerkezetek annotálásának első fázisa

A lírai személyjelölés konstrukcióinak annotálási elveiről *

4. Az igei szerkezetek annotálásának első fázisa

Az annotációs séma kialakítása során – szem előtt tartva, hogy az annotátorok egyszerre csak néhány jelenség annotálására tudnak figyelni – meghatároztuk az igei szerkezetek annotálásának az első, kevésbé részletes fázisát, amelyet az annotá-lás további, a már meglévő annotációkat kiegészítő fázisai követnek. Az annotáannotá-lás első fázisában annotáltuk a próbakorpuszban előforduló igéket, amelyek a függő-ségi fák gyökércsomópontjaiként jelennek meg, valamint az igei bővítményeket, a segédigéket, az igekötőket és a vokatívuszokat, az alább részletezett módon.

4.1. Az ige + bővítmény kapcsolatok annotálása

Az igéket Core címkével látjuk el, a bővítmények pedig Arg címkét kapnak. Az igé-ket akkor is ellátjuk Core címkével, ha nincsen bővítményük. Bővítményként annotáljuk az igék vonzatait, valamint a főnévként megjelenő szabad határozókat, az ige esetleges egyéb bővítményeit nem címkézzük.4 Például a mód-, állapot- vagy időhatározók jellemzően nem főnévként jelennek meg, és nem is vonzatai az igének, így ezeket az esetek nagy részében nem kell annotálni. A bővítmény előtt álló jelzőt vagy névelőt nem annotáljuk a bővítmény részeként. Az igét a bő-vítményekkel egy, az ige Core címkéjétől a bővítmény Arg címkéje felé mutató nyíllal kötjük össze, amely tr (trajektor) vagy lm (landmark) címkét kap. A tra-jektor a kognitív nyelvtan terminológiájában az igével kifejezett folyamatnak a figyelem középpontjában álló, általában ágens tematikus szerepű, többnyire alanyként megjelenő szereplője, a landmarkok pedig az ige által kifejezett folya-mat további, általában nem ágens tefolya-matikus szerepű, a mondatban többnyire tárgyként vagy határozóként megjelenő szereplői és körülményei. Mivel a szavak morfoszintaktikai tulajdonságait automatikusan elemezzük, a névszói bővítmé-nyek esetének vagy számának a kézi annotálása nem szükséges (ugyanakkor szükséges az automatikus annotációk kézi ellenőrzése).

4 Ennek a tanulmánynak és magának a kutatásnak sem célja a vonzatok és a szabad határozók elkülönítésének az elméleti tisztázása. Mindazonáltal az annotálás sikeres kivitelezése érdekében a jövőben az annotációs sémát finomítani kell olyan, az annotálás során alkalmazható „praktikus”

szempontokkal, amelyek az annotátort segítik a két kategória megkülönböztetésében.

de nem felelnek, úgy felelnek,

Core Core

Fülembe mégősmagyar dal rivall ,

Arg lm Arg tr Core

bAbszélbenbabmécsesedbellobbanb

Arg lmArg tr Core

Ha egy igéhez több azonos szerepű bővítmény tartozik, akkor azokat külön címkézzük fel, és külön kötjük hozzá az igéhez.

bhogybóvjonbkarja,böleb,btérde.b

Core tr Argtr tr Arg Arg

Főnév + névutó szerkezetek esetén a szerkezethez egy Arg címkét rendelünk, és azt egy egységként kötjük az igéhez.

Szikrát vet fogam közt a szó – –

Arg lm Core lm Argtr Arg

Ha ugyanaz a bővítmény egy tagmondaton belül több igének is az alárendelt tagja, akkor a bővítmény Arg címkéjét mindegyik igéhez hozzákötjük.

bAbzenebszóljon,bszálljonbazbéjen át,b

Arg tr Coretr Core lm Arg

Főige és főnévi igenév által alkotott szerkezetek esetében a főnévi igenevet az ige bővítményeként annotáljuk, ugyanolyan módon, mint a többi bővítményt.

A főnévi igenév esetleges bővítményeit már nem annotáljuk.

mi meg mesélni kezdtünk róla:

Arg trArg lm Core

4.2. A segédigés szerkezetek és az igekötők annotálása

Segédige és főnévi igenév által alkotott szerkezetek esetében a főnévi igenév kapja a Core címkét, a segédige pedig Aux címkét kap. A főnévi igenevet egy, a Core címkétől az Aux címkére mutató nyíllal kötjük össze a segédigével, a viszony az aux címkét kapja. A segédige + főnévi igenév által alkotott szerkezetek bővítményeit is mind a főnévi igenévhez kötjük. Bár a kognitív nyelvészeti szakirodalom hangsú-lyozza, hogy a segédige és a főnévi igenév egy jelentéstani egységet alkot (Tolcsvai Nagy 2009), és a két tag között nem feltétlenül érdemes alaptag és alárendelt tag viszonyt feltételezni, az annotációs sémában követett függőségi megközelítésből adódóan mégis dönteni kellett, hogy a szerkezet melyik tagját tekintjük alaptag-nak. Az annotálás első fázisának a kialakítása során praktikussági okokból arra törekedtünk, hogy minden annotált szerkezet esetében a gyökércsomóponthoz (ez a Core elem) közvetlenül hozzá legyen kötve minden más elem, vagyis nem szerettünk volna például segédigefőnévi igenévbővítmény típusú, kettőnél több tagú láncokat kapni.5 Az ilyen, háromtagú láncok elkerülése érdekében a fő-névi igenevet tettük meg a szerkezet gyökércsomópontjának, mivel a segédige + főnévi igenév szerkezetet kidolgozó bővítmények általában szorosabb jelentéstani kapcsolatban állnak a főnévi igenévvel, mint a segédigével (ezt formálisabb meg-közelítésben úgy lehetne megfogalmazni, hogy a bővítmények esetében inkább a főnévi igenév szelekciós megkötései érvényesülnek).

Érdekelni nem tudnának ők

Core aux tr Aux Arg

És látni fogjuk a kelőnapot,

Core aux Auxlm Arg

tanulni sem kell , tudjuk ezt rég:

Core aux Aux Core lm Arg

A magukban álló, azaz nem egy ige vonzataként vagy segédigés szerkezetben megjelenő főnévi igeneveket is Core címkével annotáljuk, a hozzájuk tartozó

5 A kettőnél több tagú láncok megnehezítik az annotációk lekérdezését, valamint az exportált annotációk szkripttel történő formátumátalakítását. Emellett feltételezhetően az annotátornak is egyszerűbb a dolga, ha nem kell háromtagú láncokat annotálni. Ugyanakkor, ahogyan az a kö-vetkező részben látható lesz, a birtokos szerkezetek annotálása során már nem tudtuk elkerülni a háromelemű láncok kialakítását.

bővítményeket pedig az igei szerkezetek bővítményeivel megegyező módon kötjük a főnévi igenév Core címkéjéhez.

eltűnni és feküdni holtan.

Core Core

látni az ablakon át,

Core lm Arg

Úgyszintén annotáljuk az elváló igekötőket, hiszen az ige az igekötőjével egy szemantikai egységet alkot. Az elváló igekötők a Prev címkét kapják, az ige és az igekötő közötti viszony pedig a prev címkét. Az elváló igekötőket csak akkor annotáljuk külön, ha az nem követi közvetlenül az igét. Ha közvetlenül követi, akkor az igével együtt megkapja a Core címkét.

bMegyekbhozzád,bmegbnembállokbénb.b

Core lm Arg Prev prev Core tr Arg

Csavard fel a szőnyeget még ma éjjel,

Core lm Arg

4.3. A vokatívuszok annotálása

Általában ugyancsak az igéhez kötve annotáljuk a vokatívuszokat (megszólításo-kat), annak ellenére, hogy szintaktikailag a vokatívusz valójában nem bővítménye az igének. Szemantikailag ugyanakkor a vokatívuszok többnyire az ige valamelyik argumentumát (kognitív nyelvészeti terminológiában sematikus figuráját, lásd Tolcsvai Nagy 2017b: 310–352) részletezik, teszik még kidolgozottabbá, így logi-kusnak tűnt a vokatívuszoknak az igei szerkezetek részeként történő annotálása.

A vokatívusz a Voc címkét kapja, amelyet az ige Core címkéjéhez kötünk egy, a Core címkétől a Voc címke felé mutató nyíllal. A viszony a tr vagy lm címkét kapja, attól függően, hogy a vokatívusz trajektor vagy landmark szerepű szereplő-re vonatkozik-e. Ha a szerkezetben szeszereplő-repel a vokatívusszal koszereplő-refeszereplő-rens bővítmény, akkor annak Arg címkéjét is hozzákötjük a vokatívusz Voc címkéjéhez, a viszony pedig a cor (coreference) címkét kapja. A vokatívuszok annotálásakor nemcsak a főneveket, hanem mindig a teljes megszólító szerkezetet annotáljuk az esetleges

jelzőkkel és indulatszavakkal együtt. Ennek a megoldásnak egyik hozadéka, hogy a megszólító szerkezetek belső felépítése is vizsgálhatóvá válik.

Pajtás, dalolj hát, mondd utánam:

Voc tr Coretr Core lm Arg

b„Hogybhívnakbtéged,bszép, öreg Úr,b

Core lm Arglm cor Voc

Előfordulhatnak olyan esetek, amikor a vokatívusz nem egy ige kidolgozott vagy implicit bővítményeként megjelenő szereplőre utal. Ilyenkor is felcímkézzük a vokatívuszt, de azt nem kötjük semmihez.

b"Édes fiacskám,begybkisbsajtotbennék",b

Voc Arg lm Core

Ó, jaj, barátság, és jaj, szerelem!

Voc

4.4. Elliptikus szerkezetek annotálása

Lírai szövegekben gyakran fordulnak elő elliptikus mondatok, azaz olyan bővít-ményszerkezetek, amelyeknek az alaptagjaként megjelenő igéje egy korábbi (vagy ritkábban későbbi) igei szerkezetben jelenik csak meg. Amint azt már jeleztük, az elliptikus mondatokat nem egészítjük ki a hiányzó igével. Az ilyen szerkeze-tek annotálása során a két vagy több bővítményszerkezettel rendelkező igéhez hozzárendelünk egy újabb Core címkét, és ehhez kötjük hozzá az elliptikus szer-kezetben szereplő bővítményeket. Az elliptikus szerkezet Core címkéje esetében egy omitted elnevezésű jelölőnégyzet kipipálásával jelezzük, hogy az annotált bővítményszerkezetben az ige csak implicit módon van jelen.

jóhírt vár , szép asszonyi szót , szabad emberi sorsot,

Arg CoreCoreCore

Arg Arg

lm lm lm

Ugyanilyen elliptikus szerkezetekként kezeljük a konvencionális hasonlatokat, azaz a mint kötőszóval bevezetett, hasonlítást kifejező szerkezeteket is.

és szőtte álmát, mint színes fonált:

CoreCore

Arg Arg

lm lm

Bizonyos esetekben az igéhez tartozó második, elliptikus bővítményszerkezetnek nemcsak az igei összetevője, hanem egy vagy több bővítménye is csupán az igéhez tartozó első bővítményszerkezetben jelenik meg. Ilyenkor nemcsak az igéhez rendelünk hozzá egy második Core címkét, hanem a második bővítményszer-kezetben implicit módon megjelenő bővítmény(ek)hez is hozzárendelünk egy második Arg címkét, amelyet az explicit bővítményekkel megegyező módon kötünk hozzá a Core címkéhez, azzal a különbséggel, hogy az Arg címkénél is kipipáljuk az omitted jelölőnégyzetet.

Milyős bút zokog a vérnek a fény,

Földnek az ég , elemnek az elem?

Arg Arg Arg

Core Core Core

Arg Arg

lmlm lm

lm tr lmlmtrtr

Arg Arg Arg Arg

lm tr lm tr

Amennyiben egy segédige + főnévi igenév szerkezetnek van további elliptikus bővítményszerkezete, akkor a főnévi igenév és a segédige is kap egy további Core, illetve Aux címkét (illetve kipipáljuk az omitted jelölőnégyzetet), és a fő-névi igenév Core címkéjéhez kötjük hozzá az elliptikus szerkezet bővítményeit.

Erre az esetre nem volt példa a próbakorpuszban.