• Nem Talált Eredményt

Az automatikus beszédfelismerés és gépi fordítás megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Az automatikus beszédfelismerés és gépi fordítás megtekintése"

Copied!
4
0
0

Teljes szövegt

(1)

651.838.4

AZ AUTOMATIKUS BESZÉDFELISMERÉS ÉS A GÉPI FORDÍTÁS Kiefer Ferenc

A gépi forditás kettős értelemben k o m p l e x tudomány: egyrészt megvalósításához több határtudomány eredményeire v a n szükség,másrészt eredményei több határtudomány számára értékesek. A gépi forditás meg­

valósításához nyelvészeti és m a t e m a t i k a i alapkutatásokra,továbbá mű­

s z a k i jellegű a l k a l m a z o t t kutatásokra v a n szükség. E z e k a kutatások a z o n b a n nemcsak a gépi forditás számára hasznosíthatók, hanem s z i n ­ t e mindenütt, a h o l gép és ember együttműködésére v a n szükség. így e z e k a munkák az automatizálás f o n t o s láncszemét alkotják.

A gépi forditás hasznosításáról l e h e t n e k viták, h i s z e n v i s z o n y ­ l a g még n a g y o n k e v e s e t t u d u n k a nyelvről és a fordításról. De a gépi forditás előkészítésével k a p c s o l a t o s eredményeknek felhasználásáról más területen máris t u d u n k . így például m i n d a nyelvészeti, m i n d a m a t e m a t i k a i alapkutatások eredményei felhasználhatók a gépi a d a t f e l ­ dolgozásban, a z információ visszanyerésben, szótárak össszeállitásá- b a n , fordításelméletben, beszédfelismerésben.

E c i k k keretén belül c s a k az a u t o m a t i k u s beszédfelismerés kér­

désével kívánunk f o g l a l k o z n i . Ez a kérdés nemcsak a f e n t vázolt m ó ­ d o n kapcsolódik a gépi fordításhoz, hanem közvetlenül i s . T u d n i i l ­ l i k már évek óta kísérleteznek úgynevezett tolmácsgéppel, o l y a n gép­

p e l tehát, a m e l y a beszédet a u t o m a t i k u s a n f e l i s m e r i , regisztrálja és lefordítja, m a j d outputként a z i d e g e n megfelelőt a d j a . P e r s z e e n n e k megvalósítása távolról sem c s a k pénzkérdés, m i n t a h o g y a n a z t e g y i k n a p i l a p u n k állította, h i s z e n n a g y o n s o k alapvető problémát még e d d i g egyáltalán nem sikerült m e g o l d a n i . Még hosszú évek munkájára v a n szükség a h h o z , h o g y a g y a k o r l a t i megvalósítással k o m o l y a n f o g l a l k o z ­ n i l e h e s s e n .

M i i s az a u t o m a t i k u s beszédfelismerés? A beszédfelismerés f o l y a ­ m a t a lényegében a b b a n áll, h o g y a gép a hang-hullámokat átalakítja

jelekké, a m e l y e k n y e l v i egységeknek f e l e l n e k meg. A felismerés p o n ­ tossága a hibák számával mérhető. Más szóval, a géptől a z t követel­

jük, hogy ahányszor u g y a n a z a hanghullám j e l e n t k e z i k , m i n d a n n y i s z o r u g y a n a z a j e l s z e r e p e l j e n outputként. Ha ez nem következik b e , a gép hibát követ e l .

290

(2)

K2EPEB r.: Gépi forditás

O l y a n gép konstruálása, a m e l y tetszőleges n y e l v e n beszélőnek a beszédét felismerné, mégha lehetséges l e n n e i s , nagyon komplikált és h a t a l m a s méretű l e n n e , még a k k o r i s , h a a z e l e k t r o n i k u s számológépek m a i szintjén g o n d o l k o z u n k . A f e l a d a t o t tehát csökkenteni k e l l . Még­

p e d i g a géptől c s a k a z t szokták megkövetelni, hogy c s a k egy-két b e ­ szélőnek a beszédét i s m e r j e f e l , sőt még a beszédre / v a g y i s a r r a , hogy a beszélő m i t m o n d j o n / i s s z o k t a k különböző megszorítást t e n n i .

A beszéd felismerésének két módját ismerjük. A k e z d e t i kísérle­

teknél kizárólag a z úgynevezett a k u s z t i k a i f e l i s m e ­ r é s t alkalmazták. Ez a z t j e l e n t i , h o g y a gép tulajdonképpen c s a k a k u s z t i k a i mutatókat hasonlít össze. Az összehasonlításhoz c s a k a b e ­ jövő a k u s z t i k a i j e l e t és a tárolt a k u s z t i k a i j e l e k e t v e h e t i f i g y e l e m ­ be. A B e l l Társaság / B e l l Telephoné L a b o r a t o r i e s / kutatói /DAVIS, BIDDULPH, BALASHEK és DUDLEY/ számokkal végeztek kisérletet, a számo­

k a t egy beszélő e j t e t t e k i és az elért pontosság /pusztán a k u s z t i k a i felismerésnél/ 97 #-os v o l t . A második kisérletet OLSON és BELAB. v é ­ g e z t e , mégpedig 10 egyszótagu . a n g o l szóval, m e l y e k e t szintén e g y b e ­ szélő e j t e t t k i . Az elért pontosság 98 #-os v o l t . Bármilyen biztatók v o l t a k i s e z e k az eredmények, h a m a r o s a n kiderült, h o g y a szótár meg­

kétszerezésével a nehézségek exponenciálisan nőnek. Y i s z o n t már e z e k i s v e z e t t e k g y a k o r l a t i l a g felhasználható eredményhez: telefonhívás e l v i l e g m o s t már számok beolvasásával i s lehetségessé vált.

A további kutatások az a k u s z t i k a i felismerést n y e l v i felismerés­

s e l egészítették k i . S z a v a k h e l y e t t fonémák felismerésére törekedtek, h i s z e n h a a gép képes e g y n y e l v bármely fonémáját tetszőleges környe­

z e t b e n f e l i s m e r n i /természetesen kielégítő pontossággal/, a k k o r a s z a v a k felismerése már nem f o g lényeges többlet-munkát j e l e n t e n i . FRY a l o n d o n i U n i v e r s i t y C o l l e g e - b e n u j módszert d o l g o z o t t k i a b e ­ szédfelismerésre, a m e l y a f e n t i meggondoláson a l a p s z i k . Megjegyzendő, hogy FRY segítőtársa m a t e m a t i k a i és műszaki oldalról a magyar szárma­

zású P.DÉNES v o l t .

A gép 13 a n g o l fonéma felismerésére v o l t képes, u g y a n a k k o r a z o n ­ ban m i n d e n o l y a n a n g o l sző felismerésére i s , a m e l y n e k fonémái a 13 a d o t t fonéma között v a n n a k . A fonéma-felismerés pontossága 60 #-os v o l t . Látszólag ez a pontosság s o k k a l k i s e b b , m i n t a f e n t e n l i t e t t szó-felismerés pontossága. Ha a z o n b a n t e k i n t e t b e vesszük, h o g y a 13 fonéma az a n g o l fonémarendszer l/3-át a l k o t j a , m i g v i s z o n t a 10 szó az a n g o l szókincsnek a l i g 0 , 0 0 1 #-át, a k k o r a f e n t i pontosság egyál­

talán nem megvetendő.

Ez a pontosság tovább növelhető két irányú mődszerfejlesztéssel.

Egyrészt az a k u s z t i k a i felismerést k e l l j a v i t a n i . WIREN és STÜBBS j a ­ v a s l a t a s z e r i n t nem elég J g y- e g y a k u s z t i k a i tulajdonságra c s a k " i g e n - nem"-mel válaszolni. A bináris módszer nem v e z e t h e t kielégítő e r e d ­ ményhez. Az a k u s z t i k a i tulajdonságokat /éppúgy m i n t a fonémák t u l a j ­ donságait/ kétdimenziós mátrixban k e l l m e g a d n i . Más szóval e z a z t

j e l e n t i , hogy e g y - e g y a k u s z t i k a i j e l több a k u s z t i k a i alaptulajdonság­

nak i s " e l e g e t t e h e t " egyidőben. A s z e r i n t , h o g y hány alaptulajdonság­

nak t e s z e l e g e t , más és más valószínűséggel reprezentál e g y a d o t t f o ­ némát. Ehhez a z e l v h e z járul még a j e l e k időtartamának és intenzitá­

sának figyelembevétele.

291

(3)

TMT 1965.áprili8 XII.évf. 4.szám

A másik kiegészítés nyelvészeti természetű. Ebben FRY és munka­

társai a beszéd emberi megértésének folyamatát modellálták. E z a z t j e l e n t i , hogy a beszédet halló ember a h a n g o k a t fonémánként i s m e r i f e l / a z a z osztályozza, más szóval, f e l i s m e r i , hogy a z e l h a n g z o t t

"hang" anyanyelvének fonémája/. A fonémákból m e g a l k o t j a azután a mor fámákat, a morfémákból a s z a v a k a t és a szavakból a mondatokat. A z a z m i n d e n " s z i n t e n " b i z o n y o s megszorítások alkalmazhatók a fonémákra.

E z e k a megszorítások s e g i t i k a z embert i s a hibák kiküszöbölésére.

Ezért v a n a z , hogy s o k s z o r a hibásan beszélőt i s megértjük. Sőt a t a p a s z t a l a t a z t m u t a t j a , hogy a legtöbb h i b a kiküszöbölése n y e l v i

"meggondolások" alapján megy végbe, nem p e d i g a k u s z t i k a i a l a p o n . K í ­ sérleti tény, hogy h a egy a n g o l anyanyelvű egyén a n y e l v i közlés 50#

át i s m e r i c s a k f e l a fonémák szempontjából p o n t o s a n , a k k o r i s megér­

t i a közlést. Az a u t o m a t i k u s beszédfelismerésben i s e z t a f o l y a m a t o t k e l l , amennyire l e h e t , f i g y e l e m b e v e n n i .

FRY és munkatársai a z a k u s z t i k a i felismerést először c s a k foné­

ma diagramm-statisztikával egészítették k i és máris jobb eredményhez j u t o t t a k . A k u s z t i k a i u t o n s z a v a k a t c s a k 24 Í>-oe pontossággal t u d t a k f e l i s m e r n i , a f e n t i kiegészítéssel a pontosság 44 %-OB v o l t .

A fonéma-pár, fonéma-hármas s t b . s t a t i s z t i k a i vizsgálata már c s a k azért i s f o n t o s , mert b i z o n y o s kombinációkat t e l j e s e n kizár,má­

s o k a t p e d i g valószínűségük s z e r i n t r a n g s o r o l j a . így például magyar­

ban nem f o r d u l h a t elő három mássalhangzó egymásután, vagy nem f o r d u l h a t elő / h a a szóösszetételt f i g y e l m e n kívül h a g y j u k / a z s c s kettős s . i . t .

A modern számítógépek lehetővé t e s z i k a z t , hogy h a t a l m a s mennyi ségü információt tároljunk. így például a s z a v a k fonéma-sorokként tá rolhatők a gépben, a szófelismerés tehát i l y módon egyszerűen, v i s z - szavezethető fonémafelismerésre. A széfelismeréstől a z o n b a n még h o s z s z u u t v e z e t a mondatfelismerésig. Ha a gép s z a v a k egymásutánját i s ­ m e r i f e l , még nem i s m e r i f e l magát a mondatot. /Tehát nem i s t u d j a lefordítani./ Ezért a z e d d i g i e k e n kivül még g r a m m a t i k a i információ­

k a t i s k e l l a gépnek tárolnia. Mégpedig valószínűleg predikciók f o r ­ májában. Más szóval, a gépnek magának k e l l a szó-sor és a s z a v a k r a vonatkozó információk /tehát például, hogy e z és e z a sző főnév,hím­

nemű s t b . / , továbbá a g r a m m a t i k a i predikciók / a z a z a z o k n a k a szabá­

l y o k n a k a z összessége, amely megmondja, hogy b i z o n y o s s z a v a k m i l y e n g r a m m a t i k a i l a g megengedhető nagyobb egységet a l k o t h a t n a k / felhaszná­

lásával a mondatot rekonstruálnia.

Tulajdonképpen i t t már p o n t o s a n átvehetők a z o k a módszerek,ame­

l y e k e t a gépi forditás k i d o l g o z o t t . Az a k u s z t i k a i felismerésen t u l mindaz, a m i t felhasználunk, már gépi analízis, ugy ahogyan a z t a g é ­ p i fordításnál alkalmazzák. És i t t k a n y a r o d h a t u n k v i s s z a e r e d e t i gondolatmenetűnkhöz: a gépi forditás eredményei számos más területen használhatók. Még a d l - , t r i t e t r a g r a m m s t b . statisztikákra I s szük­

ség l e h e t a gépi fordításnál, illetőleg annak előkészítésénél. Külö­

nösen áll e z o l y a n n y e l v e k r e m i n t a magyar, amely tehát végződések­

ben i g e n gazdag, tehát nem m i n d i g egyszerű eldönteni, hogy hogyan építsünk f e l a magyar n y e l v r e egy-egy részalgoritmust. E h h e z s o k s z o r tudnunk k e l l v a l a m i t azokról a k i s e b b egységekről i s , amelyekből a magyar szókincs felépül.

292

(4)

KXEFEB r . s Gépi forditás

BIBLIOGRÁFIA

DAVIS,K.H., BIDDUIPH.R., and BALASHEK,S., A u t o m a t i c r e c o g n i t i o n o f s p o k e n d i g i t a , i n Communication Theory /W.Jackson, e d . / pp. 433-441, Academic P r e s s , Hew T o r k , 1956.

DERES,P., MATBE»S,M.V., Spoken d i g i t r e c o g n l t l e n u o i n g t i m e f r e q u e n c y p a t t e r n m a t c h i n g , J.Acoust.Soc.Amer., 1960. l l . s z . 1 4 5 0 ¬ 1455.p. -

DODLEY,H., BATASHEK,S., A u t o m a t i c r e c o g n i t i o n o f p h o n e t i c p a t t e r n s i n s p e e c h , J.Acoust.Soc.Amer., 1958. 6.sz« 721-732.p.

PBY,D.B., DÉNES,P., On p r e s e n t i n g t h e o u t p u t o f a a e c h a n i c a l s p e e c h r e c o g n i z e r , J.Acoust.Soc.Amer. 1957. 3 . s z . 364-367.p.

PBY,D.B., DÉNES,P., The s o l u t i o n o f somé f u n d a m e n t a l p r o b l e m s i n a e - c h a n i c a l s p e e c h r e c o g n i t i o n , Language and S p e e c h , v o l 1/

p a r t 1 - 1 9 5 8 . j a n - m a r c h , 35-58.p.

FRY.D.B., DÉNES,P., An a n a l o g u e o f t h e s p e e c h r e c o g n i t i o n p r o c e s s , m e c h a n i z a t i o n o f Thought P r o c e s s e s : N a t i o n a l P h y s i c a l L a b o r a t o r y Symposium No.10, 275-283.p. London, H.M. S t a - t i o n a r y O f f i c e , 1959.

OLSON.H.F., BELAR,H., P h o n e t i c t y p e w r i t e r , J.Acoust.Soc.Amer., 1956.

6 . s z . 1072-1081.p.

STEVENS,E.N., Towarda a model f o r s p e e c h r e c o g n i t i o n , JU.coust.3oOc Amer., 1960. l . s z . 47-55.p.

T I E E N , J . , STUBBS.H.L., E l e c t r o n i c b i n a r y s e l e c t i o n s y s t e m f o r phone- me c l a s s i f i c a t i o n , S.Acoust.Soc.Amer., 1956. 6.82. 1 0 8 2 ¬ 1091.p.

ooo 000

KIEPER.P.: Automatic Speech Recognition and Machlne T r a n a l a t i o n

The preeent paper deals with d i f f e r e n t aspects of automatlc speech recoc- n i t i o n . I l r s t , automatlc epeech recognition was c a r r i e d out s o l e l y on acoostie b a i i s . However, t h l s approach turnéd out to be u n s a t l s f a c t o r y . I t Beérned r e a - son&ble to complement the methodacoustlc by a l i n g u i a t i c one. The l i n g u i s t l c Information used i n automatlc speech recognition c o n s i a t s of d i f f e r e n t phonaae s t a t i s t i c a and on the other hand, of grammátical Information of v a r i o u s k i n d s . The grammatlcal Information allowed f o r i n automatlc speech r e c o g n i t i o n linké up with eome r e s u l t s obtained i n the a e c h a n i c a l a n a l y a i a of t e x t s w e l l known i n machlne t r a o D l a t i o n . I n t h l a way, automatlc speech r e c o g n i t i o n may p r o f i — tably make use of the d i f f e r e n t msthods developed w l t h i a the l n T e s t i g a t i e n s oa aechanical a n a l y a i a .

« 0 «

293

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

mok gépi fordítása. Előnye, hogy a gépi program egyszerűbb az általánosan használt gépi fordításénál, és csak néhány szerkezet használatára korlátozódik. A fordítás

A mérnöki irányzat szerint a gépi fordítás a szöveg egymás után következő, a kis egységektől a nagyobb egységek felé haladó gépi leírása, amelynek minden lépését

tatlanabbá válnak, különösen a tudományos és műszaki forditás

Az 5 amerikai szaklap orosz nyelvű kiadásban a Posta Központi Hírlapíródén keresztül megrendelhető

az IDÜ munkatársa tájékoztatta a résztvevőket azokról a Bzámitőgépea indexelési kísérletekről, amelyeket az IBII végez.. A Bzöveget 10 mp-ig

Snnek felismerése két következménnyel járt: egyrészt a kutatások kizárólag bizonyos szakterületek szövegeinek vizsgálatára korlátozódtak, másrészt még

és A.D.. a fordításhoz szükséges sző betoldása. Az átlagos ezőhoeszuságot 7-8 betűnek véve, ez kb. Ae első angol-orosz forditást egy BESZM számológép végezte, amelyet

/2/ VARSA Dénes; Mi az igazság a gépi fordítás körülT THT 20.k.. /3/ TA3NÓCZI Lóránt: Még egyszer a