• Nem Talált Eredményt

Szavak, morfémák és alakjuk

Szónak nevezzük a nyelv azon elemét, melyet írott szö-vegben egybeírunk (az ABC betőit, számjegyeket és esetleg kötıjelet felhasználva). Szóalaknak nevezzük ezek írásban megjelenı karakterlánc-formáját.

A magyar nyelv úgynevezett agglutináló nyelv, ami azt jelenti, hogy a szótıhöz több rétegben végzıdések tapadhatnak, és néhány elıtag is kapcsolódhat a szóhoz.

Ezenkívül a szóösszetétel is lényeges szóalkotási mód.

A szó funkcionális részekbıl áll, melyeket morfémáknak nevezünk (szótövek, képzık, ragok, jelek). Egy adott funkciót megvalósító morfémának több különbözı alakja lehet. A magyar nyelvben egy szó tehát nem más, mint egy morfémasorozat (de a morfémák nem kapcsolódhatnak tetszı -legesen egymáshoz).

A szavak különbözı szempontokból osztályokba sorolhatók (lásd késıbb: szófajok, ragozási típusok). A toldalékok (elıtagok) egyrészt a szavak jelentését változtatják meg, másrészt a szavakat egyik szóosztályból a másikba viszik át. A morfológia feladata leírni azt, hogy egy szó milyen morfémasorozattal állítható elı. A generatív leírás célja megmutatni azt, hogyan kell egy szóalakot elıállítani.

Az analitikus modell feladata: hogyan lehet egy szóalak-ból a benne szereplı morfémákat megtalálni. Mivel több morféma sorozat ugyanazt a szóalakot eredményezheti, eze-ket mind meg kell találnunk.

Mivel szoros kapcsolat van a szavak osztályai és a lehetséges morfémasorozatok között, ezért a morfológia a szavak osztályozásával is foglakozik, de csak a mor-fológia szempontjából. A szóosztályok szintaktikai és szemantikai tulajdonságait más fejezetben tárgyaljuk.

Szóelemzés

A szóelemzés célja, hogy megállapítsa azt, milyen szótıbıl és milyen toldalékolással (és elıtagokkal), esetleg milyen szóösszetétellel jött létre az adott szó (pl. legelemibb:

leg-elem-i-bb). Egyes nyelvekben, mint például az angolban, ahol a toldalékolás és elıtagok alkalmazása szegényes, a szóelemzés gyakorlatilag egy szótár alkalmas kiépítésével megoldható. Nem így a magyarban, ahol a toldalékolt szó is kaphat toldalékot. (Ilyen esetekben relatív szótırıl beszélhetünk.) A toldalékok szekvenciája eléggé kötött.

A toldalékok (elıtagok) is osztályokba sorolhatók aszerint, hogy milyen szóosztályokra alkalmazhatók, és milyen szóosz-tályba kerül az új szó. A különbözı toldalékoknak lehet azonos az alakjuk (pl. kutyá-nak, lát-nak). Egyes tolda-lékok módosíthatják a relatív szótövet (tıváltozatok, hasonulások). Ennek alapján négy feladatot kell megoldani:

- A toldalékok (elıtagok) levágása.

- A toldalékolás következtében végbement tıváltozások

"visszacsinálása".

- A toldalékok és szóosztályok egyeztetésének ellenırzése.

- A szótövek szófajának és a toldalékok szerepének meghatározása.

Bár a négy funkció szétválasztható, a megoldás során összefonódnak, egymást kiegészítik.

Morfológiai szeletelı

A morfológiai elemzı modul a természetes nyelvi elemzı rendszer szerves része. Célja az írott szavak morfémákra való bontása a további (szintaktikai, szemantikai) elem-zést megelızıen. Mivel a teljes nyelvi rendszer inter-aktív ember-gép kapcsolat részére készül, a válaszidık rövidsége érdekében lényeges az elemzı nagy sebessége.

A rendszer az általunk köznyelvinek tartott alakokkal foglalkozik, és nem foglalkozik régies, vagy tájnyelvi alakokkal, de alkalmas bıvítésre, szőkítésre, módosításra is, ha ilyenre lenne szükség. A kidolgozott módszer alkalmas gyors elemzı elıállítására morfológiai szabályok alapján, akár más agglutinatív nyelvek esetén is.

Elvi modell

A morfológia a következı hat fogalommal operál: ABC, Szóosztályok, Tıváltozások, Tıtár, Elıtagtár, Toldaléktár.

ABC: a nyelvre jellemzı. (Az ABC rendezettsége számunkra nem lényeges.)

Szóosztályok: a szavak csoportosítása szófaj, hangrend,

Tıtár: tartalmazza az összes használható szó tövét, je-lölve, mely szóosztályba tartozik.

Toldaléktár: tartalmazza az összes használható tolda-lékot, jelölve, hogy milyen osztályú szóra (szófajra, hangrendre stb.) alkalmazható, milyen osztályú szófajt állít elı, és milyen jellegő tıváltozást idézhet elı.

Elıtagtár: tartalmazza az összes használható elıtagot jelölve, hogy milyen osztályú szóra (szófajra, hangrendre stb.) alkalmazható, és milyen osztályú szófajt állít elı. (A magyar nyelv elıtagjai nem okoznak tıváltozást, és minden elıtagnak egy alakja van.)

Tıváltozások: bizonyos szótövek bizonyos toldalékok esetén megváltoznak. Ilyen változástípusok a magánhangzó kiesések, betoldások, rövidülések, nyúlások, hasonulások (ide sorolható az is, amikor nem a tı, hanem a toldalék módosul) stb. Ezek a változások a magyar nyelvben mindig a (relatív) szótı utolsó egy-két betőjét érinti a szom-szédos morfémák függvényében.

Toldalékolás: egy adott (relatív) szótıre alkalmazható egy toldalék, ha a (relatív) szótı szóosztálya megegyezik a toldalék alkalmazhatósági szóosztályával. Ekkor elıször végrehajtjuk a tövön a toldalékhoz tartozó tıváltozást, majd az így kapott módosított tı után főzzük a toldalékot, és eredményül a toldalék által elıírt szóosztályba tartozó szót kapunk. Tehát például a pörög igére alkalmazható az -ı jelen idejő melléknévi igenévi képzı (és nem alkalmazható az -ó), mert az -ı magas hangrendő igékre alkalmazható.

Mielıtt az igetıhöz hozzáfőznénk a toldalékot, végre kell hajtani a magánhangzó-kiesés tıtranszformációt: pörg-ı. Az így kapott szó egy magas hangrendő melléknév lesz.

Az elıtag alkalmazása: a fentihez hasonlóan definiálható.

Elemzés: Az elemzés feladata, hogy egy adott szóról meg-állapítsa, milyen szótıbıl, milyen toldalékolási (elıtag) szekvencia, esetleg milyen szóösszetétel segítségével jöhet létre. Könnyen belátható, hogy mivel a magyar nyelvben a toldalékolás többnyire növeli a szó hosszát, és csak néhány olyan lépés jöhet egymás után, ami a szó hosszát válto-zatlanul hagyja (üres toldalék vagy hangzókiesés miatt), így egy szóalaknak nem lehet végtelen sok felbontása morféma sorozatokra. Ha tehát egy lehetséges szótıbıl kiindulva sorban elıállítjuk az összes olyan morféma sorozatot, ami nem hosszabb, mint a szóalak, akkor ezek között ott lesz a szó összes lehetséges felbontása. Hasonlóan, ha egy szóról levag-dossuk a lehetséges toldalékokat, és közben visszacsináljuk a tımódosulásokat, elıbb-utóbb megtaláljuk a szó lehetséges abszolút tövét vagy töveit. Mivel az egyes toldalékolási lépesek véges automatával leírhatók, így az elemzés egy véges automatával véges lépesben elvégezhetı.