GÉPI FORDÍTÁS ALKALMAZÁSA A FELIRATOZÁSBAN

Lindsay Bywood, Panayota Georgakopoulou és Th ierry Etchegoyhen

5. GÉPI FORDÍTÁS ALKALMAZÁSA A FELIRATOZÁSBAN

Az MT használata során számos tényező befolyásolja a fordítási munkafolyamat ter-melékenységének növekedését vagy csökkenését, például a forrásnyelvi szöveg típusa, a nyelvpár, a gépi fordítás minősége és a fordító utószerkesztési jártassága. Ily módon tehát érdemes az említett tényezőket vagy a közöttük lévő összefüggéseket részlete-sebben megvizsgálni, hogy ezáltal jobban megértsük, mit is jelent valójában a gépi for-dítás a feliratozó iparág számára.

5.1. Erősségek és korlátok

A gépi fordítás minőségét, tágabb értelemben véve az utószerkesztési munkálatok mennyiségét és végső soron a termelékenység növekedését is leginkább a forrásnyelvi szöveg típusa befolyásolja. Még a természetben előforduló nyelvekkel viszonylag ha-tékonyan boldoguló, statisztikailag gyakorlott gépi fordítómotorokkal rendelkező gépi fordítási eszközöknek is kihívást jelentenek a nagy számú, jellemzően audiovizuális szövegekben (azon belül is különösen az élőben rögzített vagy szövegkönyv nélküli műsorokban) előforduló nyelvtani hibákat tartalmazó forrásnyelvi szövegek.

A gépi fordítás minőségét befolyásoló következő tényező az adott nyelvpár. A sta-tisztikai gépi fordítás általában sikeresebben működik a rokon nyelvpárok, mint a spa-nyol vagy a portugál esetében, amelyeknél a morfoszintaktikai hasonlóságok elősegítik a fordítási ekvivalencia egyszerű megalkotását. Ezzel szemben a nyelvtanilag egymás-tól eltérő nyelveknél – vegyük például a morfológiai ragozás vagy a szórend esetét – a gépi fordítás jellemzően gyengébb minőségű. A 4. ábra az első SUMAT-értékelésben részt vevő nyelvpárok eredményeinek változatosságát szemlélteti.

Az ábrán látható eredmények utószerkesztett fájlokból származnak, és a követke-ző három mérési mutatón alapul: a feliratozók által meghatározott általános (skálá-zott) értékelés, az MT értékelésében a szabvány mérési mutatók egyikének számító BLEU (BiLingual Evaluation Understudy) (Papineni, Roukos, Ward és Zhu 2002) és a Lev5, amely azt vizsgálja, hogy hány gépi fordítással készített felirat igényel maxi-mum öt darab karakterszintű szerkesztést a referenciafordítási minőség elérése érde-kében (Volk 2008: 10). Az ábrán a nyelvpárok gépi fordításra kifejtett hatását láthatjuk.

Az angolról németre történő fordítás közismerten nehéz feladat a gépi fordítóprog-ramok számára, különösen az esetek jelölése, a szórend és a szóösszetételek tekin-tetében. Az értékelés eredményei megerősítették az említett nyelvpárral kapcsolatos nehézségeket, ebben az irányban a fordítások ugyanis rendszeresen alulteljesítettek a SUMAT-vizsgálatokon a többi nyelvpárhoz képest. A spanyolról angolra történő for-dítás esete viszont egészen meglepő, ez a nyelvpár kapta ugyanis a legmagasabb pont-számokat az automatizált mérési mutatókat illetően a rendszerek értékelése során. Az értékelés második szakaszának negatív eredménye az értékeléshez felhasznált

beme-neti fájlok hatását mutatja, a szokatlan eredményhez a rögtönzött, nagy mennyiségű kihívást jelentő forrásnyelvi szöveg vezethetett. A szerb–szlovén nyelvpár kapcsán az eredmények meglepően jónak mondhatók a gépi fordítási rendszerek betanításához felhasznált kis mennyiségű adatot tekintve, ez pedig jól szemlélteti a rokon nyelvek kö-zötti fordítás hatását, és mutatja a statisztikai gépi fordítás által elérhető minőségszin-teket a csekély számú erőforrással rendelkező nyelvpárok esetében.

4. ábra. Humán és automatizált mérési mutatók nyelvpárok szerint

Érdemes megjegyezni, hogy az automatizált mérési mutatók nem feltétlenül a legalkalmasabbak az MT-kimenet minőségének mérésére az utószerkesztés kontextusában. Az ilyen mérési mutatók ugyanis tágabb értelemben a gépi fordítás kimenete és a humán referenciafordítások közötti különbségek mennyiségét mérik, nem jelölik azonban a sajátos hibák és hibatípusok javítására irányuló különböző erőfeszítéseket. A nyitott feliratozási doménen belül például egy félrefordított, nevet tartalmazó fordítási egység javítása (például egy szereplő teljes neve, lásd például Sherry Baker, szó szerint fordítva) fárasztóbb lehet, mint egy szórendi vagy egyezte-téssel kapcsolatos hiba korrekciója, az utószerkesztőnek ugyanis az elsőként említett esetben a forrásnyelvet is ellenőriznie kell, hogy értelmezni tudja a tulajdonnév fordí-tásával érthetetlenné vált fordítási kimenetet. Hasonlóképpen a könnyen

helyrehoz-hatónak vélt fordítási hibák is lehetnek nagyon munkaigényesek az utószerkesztők számára, még akkor is, ha ezek a hibák gyakran az automatizált fordítási mechaniz-mus összetett melléktermékei. Utóbbira tipikus példa a forrásszövegekben található szavak kihagyása a kimeneti fordításból.

5.2. Utószerkesztés

Ahogy azt a korábbiakban már tárgyaltuk, a gépi fordítás jelenleg nem része a felira-tozási gyakorlatnak, és az MT sikeres integrálása a feliratozás munkafolyamatába szá-mos, többek között az MT-kimenet utószerkesztésével kapcsolatos tényezőtől függ.

Néhány tényezőt, amely bizonyítottan hatással van az MT fordítási munkafolya-matokba történő sikeres integrációjára, kis túlzással még a logisztika égisze alá is cso-portosíthatunk. Más kísérletekkel megegyezően a SUMAT kísérleti tanulmányának (Bywood, Georgakopoulou, Volk és Fishel 2012) keretében lezajlott kezdeti termelé-kenységi értékelésből is az a megállapítás született, hogy az utószerkesztési feladatot megelőző gondos és átfogó előkészület, valamint az alapos eligazítás és a számos kér-dés feltevésére biztosított lehetőség pozitív hatással van az utószerkesztők feladatmeg-értésére; továbbá úgy tűnt, mindez az utószerkesztés gyorsaságával is összefüggésben áll. A termelékenység növekedését ily módon pszichológiai tényezők is befolyásolhat-ják, például az utószerkesztői visszajelzések fontosságának elismerése és a gépi fordí-tás technológiájának jelenlegi korlátairól folytatott kommunikáció. A SUMAT-projekt értékelési kampányai során összegyűjtött visszajelzések között ismétlődő megállapí-tásként szerepelt, hogy minél nagyobb gyakorlatra és tapasztalatra tettek szert a fel-iratozók a tipikus gépi fordítási hibákat illetően, annál könnyebbé vált fokozatosan az utószerkesztés is. Ezek a visszajelzések javaslatokat is tartalmaztak a tipikus, egyszerű hibák (például hibás szórend vagy kis kezdőbetű) optimális kijavításához alkalmazott felhasználói felület konﬁ gurálására vonatkozóan.

A fordítási tapasztalatot tekinthetjük a második tényezőnek, kutatások alapján ugyanis a kevésbé tapasztalt, ezáltal lassúbb fordítók vélhetően nagyobb termelé-kenységnövekedést érhetnek el, mint tapasztaltabb kollégáik (Federico, Cattelan és Trombetti 2012). Érdemes az értékelésben részt vevő feliratozók profiljait egyenként megvizsgálni a tapasztalathoz, gyorsasághoz és munkamódhoz kapcsolódó tendenciák beazonosítása céljából. A SUMAT-projekt kezdeti tapasztalatai azt a megállapítást tá-masztják alá, miszerint a különösen gyors feliratozók hajlamosabbak elégedetlenked-ni vagy kételkedelégedetlenked-ni az utószerkesztésben, mivel úgy vélik, hogy lassítja őket. Federico, Cattelan és Trombetti (2012) feltételezik továbbá, hogy a felhasználói felület is hatás-sal lehet az egyéni termelékenységnövekedésre, ez a tényező pedig alapos vizsgálódást kíván.

A SUMAT-projekt értékelésének kérdőívei alapján megállapítható, hogy a gyenge minőségű gépi fordítás kognitív terhe jelentősen meghatározta az utószerkesztést vég-zők szerkesztés során átélt tapasztalatait. Mint azt már korábban említettük, a projekt értékelésének utolsó szakaszában összevetettük a SUMAT utószerkesztőinek

termelé-kenységét a gyenge minőségű MT-kimenetektől automatikusan megtisztított fájlok-kal. Jóllehet a szabadon választható formájú visszajelzés a szűrt fájlok utószerkesztési tapasztalatait tekintve vegyes volt, ebben a konkrét kísérletben sokkal nagyobb ter-melékenység volt megﬁ gyelhető a „rossz” MT kiszűrése nyomán. Különösen érdekes lenne további tanulmányokban vizsgálni ezeket az eredményeket, az MT-kimenet kü-lönböző mértékű szűrésének hatásaira helyezve a hangsúlyt.

Végül elmondhatjuk, hogy a gépi fordítás működésének és korlátainak jobb meg-értése általában magát a folyamatot is megkönnyítette. Az utószerkesztők már az ér-tékelés korai szakaszában frusztrációval és csalódottan fogadták a felmerülő hibákat a gépi fordítómotor teljesítményére vonatkozó (néha irreális) elvárásaik miatt, valamint a hibák humán lektor általi gördülékeny javításával kapcsolatos ismereteikre alapoz-va. Miután az utószerkesztőkkel ismertettük az MT működését és korlátait, sikerült kiküszöbölni az imént említett megjegyzéseket, így azokat tények és valóban hasznos visszajelzések váltották fel, kiemelve a gépi fordítómotor működésének átalakítására vonatkozó ismétlődő hibákat, illetve konkrét javaslatokat. Az oktatás és a megértés hozzájárul a felismeréshez, miszerint a gépi fordítás valójában nem fenyegetés, hanem hasznos eszköz, ahogy ez az utószerkesztők visszajelzéseiből is kiderül: „Az ebben az epizódban találhatókhoz hasonló, rövidebb és egyszerűbb mondatok esetében véle-ményem szerint egy kész fordítással elég sok időt meg lehet spórolni” és „sok helyes és használható rögzített kifejezéssel találkoztam”. A jelentős javításokon átesett esz-közöket a feliratozók rendelkezésére lehet bocsátani, lehetséges fordításokat és egye-zéseket kínálva a korábban lefordított szövegek alapján, ily módon kiküszöbölhetők az ismétlődő és időigényes műveletek. Az említett munkafolyamatot a hagyományos szöveglokalizációs iparban ma már sikerrel használják, a fordítók pedig – a rendelke-zésre álló adatok szerint – örömmel használják az MT-t mindennapos munkájuk so-rán (Guerberof Arenas 2013).

In document Robin Edina – Varga Dóra Ágnes (szerk.): Fordítástudomány – fordításban (Pldal 95-98)