• Nem Talált Eredményt

A gépi (mondat) analízis néhány kérdéséről megtekintése

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A gépi (mondat) analízis néhány kérdéséről megtekintése"

Copied!
6
0
0

Teljes szövegt

(1)

6 5 1 . 9 2 6 . 0 1 1

A GÉPI / M O N D A T / A N A L I Z I S NÉHÁNY KÉRDÉSÉRŐL Ábrahám Sámuel

N a p j a i n k e g y i k l e g f o n t o s a b b tudományága a z i n f o r m á c i ó f e l d o l g o z á s é s v i s s z a n y e r é s elmélete és g y a k o r l a t a . M o d e r n tudományunk és technikánk m i n d n a g y o b b és n a g y o b b mennyiségű információ feldolgozását és visszanyerését igényli éspe­

d i g meghatározott, legtöbbször rövid időn belül. E z e k n e k az igények­

nek a kielégítésére az e m b e r i erő egyedül már nem elégséges. Ezért égető sürgősséggel merül f e l az információ feldolgozás és v i s s z a n y e ­ rés g é p e s í t é s é n e k problémája, v a g y i s különböző gépek felhasználása az információ feldolgozás és visszanyerés folyamatában.

A f o l y a m a t r a engedélyezett idő határozza meg, h o g y m e c h a n i k u s v a g y e l e k t r o n i k u s gépek használata a legcélszerűbb, és egyáltalán nem k e l l a r r a törekedni, h o g y m i n d e n e g y e s e s e t b e n függetlenül a z a d o t t körül­

ményektől, m i n d e n t a l e g g y o r s a b b e l e k t r o n i k u s gépekre b i z z u n k . M i n d ­ a m e l l e t t , h o g y elméletileg az egész f o l y a m a t egységes gépesitése tű­

n i k optimálisnak, g y a k o r l a t i l a g e g y megfelelő ember-gép r e n d s z e r k i ­ dolgozása / e z leginkább talán a gépi forditás esetében látszik/ a legkedvezőbb megoldás.

M i v e l h o g y a m a i társadalomban az információ l e g n a g y o b b része természetes n y e l v e k segítségével rögzítődik, a z információ f e l d o l g o ­ zás és visszanyerés / e g y i k / l e g f o n t o s a b b része a természetes n y e l v e ­ ken i r t /ritkán: k i e j t e t t / szövegek feldolgozása. Ezért a j e l e n t a ­ nulmányban c s a k a természetes n y e l v e k e n i r t szövegek g é p i f e l ­ dolgozásával f o g l a l k o z u n k , p o n t o s a b b a n a z i l y e n szövegekből k a p o t t információ gépi visszanyerésének e g y e s kérdéseivel. A k a p c s o l a t b a n levő mondatok / = szövegek/ gépi feldolgozásának kérdései c s a k a legutóbbi időben kerültek az érdeklődés középpontjába, m e r t a z e g y ­ szerűbb kérdés, a m o n d a t o k gépi feldolgozása sem n y e r t még elégsé­

ges megoldást.

A m o n d a t o k gépi feldolgozása elméletileg egyenlő a m o n d a t o k formális feldolgozásának fogalmával. A formális feldolgozást már p o n t o s a n meg l e h e t határozni: e g y feldolgozás formális, h a c s a k a m o n d a t o t alkotó j e l e k formáját és m o n d a t o n belüli sorrendjét v e s z i t e k i n t e t b e / e z t és c s a k e z t t u d j a a gép érzékelni/. Hangsúlyoznunk k e l l , h o g y formális feldolgozás révén / m i n d a m e l l e t t , h o g y határai mindinkább tágulnak/ l e h e t e t l e n a m o n d a t b a n t a r t a l m a z o t t t e l j e s i n ­ formációt v i s s z a n y e r n i , /A következőkben a "mondat formális f e l d o l ­ gozása a benne tartalmazandó információ visszanyerésének céljából"

(2)

ÁBRAHÁM S.: Gépi analízis

kifejezés h e l y e t t a "mondat formális analízise" kifejezést használ­

j u k , és a m i k o r e z nem v e z e t h e t félreértéshez, a "formális" szót e l ­ h a g y j u k . /

Az utóbbi idők kutatásai a r r a u t a l n a k , hogy a formális analízis könnyebben megvalósítható, h a először e g y o l y a n /formális/ r e n d s z e r t

épitünk f e l , a m e l y előállitja /generálja/ a m o n d a t o k a t , és utólag

" f o r d i t j u k " meg e z t a r e n d s z e r t . Ezért észlelhetjük n a p j a i n k b a n a g e ­ neratív r e n d s z e r e k / g e n e r a t i v grammatikák/ iránti n a g y érdeklődést.

E z e k n e k a grammatikáknak a szerkesztését és tanulmányozását N.CHOHSKY / l / indította e l , / é s f o l y t a t j a számottevő eredménnyel./

CHOMSEY s z e r i n t e g y g e n e r a t i v m o d e l l / m o s t már v i l á ­ g o s , h o g y a "grammatika"szó használata nem t e l j e s e n i n d o k o l t / e g y o l y a n formális utasitás-rendszer / d e v i c e / , a m e l y a z a d o t t n y e l v ö s z - s z e s m o n d a t a i t / é s c s a k a z o k a t / állitja elő, mégpedig u g y , h o g y a g e ­ nerálás mikéntje alapján már egyértelműen meghatározhatjuk a / g e n e - ' rált/ m o n d a t összes formális tulajdonságait. E z t u g y i s m o n d h a t j u k , h o g y a generálás folyamatában m i n d e n m o n d a t h o z e z a z utasitás-rend­

s z e r adekvát a n a l i z i s t k a p c s o l j o n . Természetesen a f e n t i elgondolás c s a k a k k o r válik ténylegesen meghatározássá, h a p o n t o s a n m e g f o g a l ­ mazzuk, m i t értünk "formális utasitás-rendszer"-en, és m e l y e k a mon­

d a t "összes" formális tulajdonságai. Az elsőt megtehetjük. Formális utasitás-rendszer a l a t t e g y G = / V , £ , F/ hármast értünk, a h o l V e g y véges szótár, a m e l y véges számú szimbólumot t a r t a l m a z . 2 e g y részhal- maza V-nek. P p e d i g e g y véges h a l n i a z , a m e l y / f , y / k e t t e s e k e t t a r t a l - maz, a h o l ^ . V a V-ben t a r t a l m a z o t t szimbólumok s o r o z a t a i . Az P-be tartozó k e t t e s e k e t törvényeknek nevezzük. Egy i l y e n utasitás-rend- s z e r a következőképpen generál:

A z t m o n d j u k , h o g y (Ti - r e alkalmazható a f k / = / ? < , * * / / törvény, h a / « /0" t o l y a n szimbólumok s o r o z a t a , a m e l y e k V e l e m e i , /£>/ (?V t a r - t a l m a z z a ^ és / c / teljesül e g y a d o t t Cfc feltétel. Ha / a / , / b / , / c / teljesül, a k k o r f ^ / e g y s z e r i / alkalmazása 6~i - r e abból áll, h o g y l e - írjuk a 6"j szimbólum s o r o z a t o t , a m e l y ^ -tői c s a k a n n y i b a n különbö­

z i k , h o g y ö~ - b a n / a z első/^íV h e l y e t t V *- t i r t u n k . Ebben az e s e t b e n a z t m o n d j u k , h o g y ő"< /közvetlenül/ generálja - t . Terminális d e r i - vációnak e g y o l y a n ö"< ... s o r o z a t o t nevezünk, a m e l y b e n /&/ 6Y g e n e ­ rálja 5"^ M - e t / m i n d e n 'M-i é - r e / , / b / £Tt eleme É - n a k és / c / 6~Vi nem generál s e m m i t . C i v- t m o n d a t n a k , és a m o n d a t o k halmazát, ÍG-t, a G utasitás-rendszer által generált n y e l v n e k nevezzük.

Egyszerű példája a m a g y a r n y e l v k i s részét generáló m o d e l l n e k a következő:

Gm : V = ( s , HP, VP, A, K, a z , a, ember, könyvet, f e l v e s z i )

/!/

/ 2 / / 3 /

/S, NP VP/

/NP, A N/

/VP, V NP/ Ocönyvet,'

/ V A , f e l v e s z i / .

(3)

TMT 1965.március III.évi. 3.s z á m

Mielőtt v a l a m i t i s generálnánk e z z e l a m o d e l l e l , két m e g j e g y ­ zést k e l l tennünk. A { ] zárójel a z t j e l e n t i , h o g y az e g y i k v a g y a másik szimbólumot választjuk k i , a C4 / v a g y C5/ - b e n m e g f o g a l m a z o t t feltételek s z e r i n t . A feltételeket / C 4 , C 5 / célszerű a törvények l e ­ írásánál hozzájuk k a p c s o l n i . /Az /!/, /Z/, / 3 / , / 6 / törvények a l k a l ­ mazása n i n c s s e m m i l y e n feltételhez k ö t v e . /

Ha C4 és C5-öt megfelelően f o g a l m a z z u k meg, a k k o r Gm a követke­

zőképpen generál e g y m a g y a r m o n d a t o t /két szimbólum-sorozat közé Ír­

j u k az a l k a l m a z o t t törvény számát/.

S

/!/,

NP VP / 2 / , A N VP / 3 / , A N V NP / / , A N V A N A / , Az N V A N / 5 / , a z ember V A N / 6 / , az ember f e l v e s z i A N / 5 / ,

az ember f e l v e s z i a könyvet / 4 / , a z e m b e r f e l v e s z i a k ö n y v e t .

S o k k a l n e h e z e b b a f e l a d a t ' . m k , h a a z "összes formális t u l a j d o n ­ ságok" fogalmát a k a r j u k p o n t o s a n meghatározni. Általában e z t a f o g a l ­ mat c s a k magyarázzák, az a d o t t n y e l v e t beszélő egyének " n y e l v i intuí­

ció jávai", / a m e l y f o g a l o m u g y a n c s a k n i n c s meghatározva/.

Az F-ben t a r t a l m a z o t t törvények és a hozzájuk k a p c s o l t Cjj felté­

t e l e k formájának különféle meghatározásával különböző g e n e r a t i v mo- d . l l e k e t k a p u n k . Közülük érdemlegesek az úgynevezett

/ l / K o n t e x t u s m e n t e s m o n d a t s z e r k e z e t m o d e l l j e ,

/Z/ K o n t e x t u s t t e k i n t e t b e vevő m o n d a t s z e r k e z e t m o d e l l j e , / 3 / Transzformációs m o d e l l , /z/

Meg k e l l jegyeznünk, h o g y m i g a z / l / és /z/ m o d e l l e k esetében s i k e ­ rült p o n t o s a n meghatározni a törvények és feltételek formáját, a transzformációs m o d e l l esetében e z t még kielégitő módon elérni nem sikerült.

A j e l e n tanulmány értelmében részünkre különösen f o n t o s a z , h o g y a m o d e l l ne c s a k generálja az a d o t t természetes n y e l v e t , / v a g y i s g e ­ n e r a t i v e r e j e l e g y e n / , hanem h o g y a generálás f o l y a m a t a m i n d e n e g y e s m o n d a t h o z e g y megfelelő a n a l i z i s t i s k a p c s o l j o n / v a g y i s e x p l i k a t i v e r e j e i s l e g y e n / .

Az / ! / és / 2 / - e s m o d e l l e k b e n m i n d e n generált m o n d a t h o z e g y c i m - kével ellátott ágrajzot / l a b e l l e d - t r e e , P - m a r k e r / k a p c s o l u n k u g y , h o g y a terminális deriváció t a g j a i t s o r r e n d b e n egymás alá i r j u k és v o n a l l a l kötjük össze a z o k a t a szimbólumokat /két egymásután követ­

kező s o r b a n / , a m e l y e k együtt e g y f k törvényt a l k o t n a k . A f e n t i példa esetében,

a z e m b e r f e l v e s z i a k ö n y v e t - m o n d a t n a k a következő P - m a r k e r f e l e l meg

(4)

ÁBRAHÁM S.: Gépi a n a l i z i s

CHOMSKY-nak sikerült k i m u t a t n i , h o g y a z / l / és /Z/ m o d e l l e k / a f e n t i megfogalmazásokhan/ még h a generálják i s a z a d o t t természetes n y e l v e t / e z e d d i g nem sikerült e z t a kérdést t e l j e s e n tisztázni/ a z általuk b i z t o s i t o t t a n a l i z i s nem adekvát. Ezért a z e g y e t l e n h e l y e s m o d e l l n e k a transzformációs m o d e l l t t e k i n t i k , a m e l y n e k e g y része e g y /z/ t i p u s u m o d e l l . Ebben a m o d e l l b e n először véges számú u n . m a g m o n d a t o t / p o n t o s a b b a n majdnem m o n d a t o t / generálnak, a m e l y e k ­ ből k i i n d u l v a generálják az összes többi m o n d a t o k a t . Ebben a m o d e l l ­ b e n e g y mondat a n a l i z i s e , h a magmondatról v a n szó, e g y cimkével ellá­

t o t t ágrajz, h a nem magmondatról v a n szó, a k k o r több cimkével ellá­

t o t t ágrajz / a m e l y e k között v a n n a k a generálásnál felhasznált magmon­

d a t o k cimkével ellátott égrajzai/.

I d e j e , h o g y áttérjünk a f e n t i m o d e l l e k "megfordítása" lehetősé­

g e i n e k tanulmányozáséra. Az / l / és /Z/ m o d e l l e k e t meg l e h e t f o g a l m a z ­ n i m i n t fél-asszociativ-rendszerek, és e z e n a z a l a p o n m i n d e n e g y e s i l y e n m o d e l l n e k egyértelműen meg l e h e t f e l e l t e t n i e g y Markov-féle normál a l g o r i t m u s t . / 3 / A Markov-féle normál a l g o r i t m u s o k a t p e d i g könnyű " m e g f o r d i t a n i " : M i n d e n e g y e s (X Markov-féle normál a l g o r i t m u s esetében f e l l e h e t épiteni / b i z o n y o s feltételek m e l l e t t egyértelmű­

e n / e g y o l y a n <X Markov-féle normál a l g o r i t m u s t , h o g y h a Ct/S/ = R, a k k o r 6K/R/ * P. A probléma részletezését 1 . : / i / és / 5 / - b e n . M i v e l a Markov-féle normál a l g o r i t m u s o k gépileg megvalósíthatók, a f e n t i m o d e l l e k esetében a gépi a n a l i z i s t e l j e s egészében elvégezhető.

A m i n t már e m i i t e t t e m , a z / l / és / 2 / t i p u s u m o d e l l e k , CHOMSKY megfogalmazásában, nem megfelelőek a természetes n y e l v e k leírására, a transzformációs m o d e l l , /amelyről feltételezhetjük, h o g y m e g f e l e ­ lő/ p e d i g s a j n o s még n i n c s formális szempontból kielégítően m e g f o ­ g a l m a z v a , i g y "megfordításuk" kérdését még c s a k f e l sem l e h e t v e t n i . Ebből a helyzetből három kiút lehetséges.

CHOMSKY és követői a z o n fáradoznak, h o g y a transzformációs mo­

d e l l e g y formális szempontból kielégitő meghatározását adják. E z e k f o n t o s , és szerintünk eredménnyel kecsegtető munkálatok, de e d d i g végleges eredmények még nem születtek.

A kutatók e g y k i s e b b c s o p o r t j a u j a b b f a j t a m o d e l l e k e t próbál felépíteni, a m e l y e k eredményesebbek l e s z n e k m i n d a z / l / és /z/-sa típusnál, /A Z e d d i g i eredmények v i s z o n y a a transzformációs g r a m m a t i ­ kákhoz n i n c s tisztázva./ K o r a i l e n n e még eredményekről beszélni.

Szerintünk e g y h a r m a d i k u t i s járható. T u l erősnek tűnik

(5)

TMT 1965.március XII.évf. 3.szán

CHOMSKY-nak a z a követelménye, hogy e g y g e n e r a t i v m o d e l l ugy l e g y e n felépítve, hogy már a generálás alapján a d j a k i a megfelelő analí­

z i s t . Ha e z t . a két követelményt, a generálás és a megfelelő a n a l i z i s felépítésének követelményét, szétválasztjuk, a k k o r a z előttünk álló f e l a d a t megoldhatóvá válik. E d d i g sikerült bebizonyítani, hogy h a a d ­ v a v a n egy transzformációs grammatika / a z e d d i g i megfogalmazások ér­

telmében/, a k k o r f e l l e h e t épiteni egy v e l e g e n e r a t i v e k v i v a l e n s , v a g y i s egy p o n t o s a n u g y a n a z t a n y e l v e t generáló, / 2 / - e s t i p u s u gram­

matikát.

Ebben a grammatikában u j a b b formális müveletek bevezetésével m i n d e n e g y e s , már generált mondathoz egy o l y a n analízist l e h e t k a p ­ c s o l n i , amely egyenértékű a transzformációs grammatikában k a p o t t a n a ­ lízissel. E z t a z u j m o d e l l t / / 2 / - e s t i p u s u grammatika + u j a n a l i z i s r e n d s z e r / már meg l e h e t f o g a l m a z n i m i n t Markov-féle normál a l g o r i t ­ must, és ebből következően meg l e h e t " f o r d i t a n i " .

Az i l y e n újfajta, általunk g e n e r a t i v - a n a l i t i k u s - n a k n e v e z e t t mo­

d e l l e k elméletén és g y a k o r l a t i kérdésein K I E F E R F e r e n c tudományos munkatárssal együtt d o l g o z u n k a Magyar Tudományos Akadémia Számítás­

t e c h n i k a i Központja keretében, és a z eredményekről a közeljövőben részletesen beszámolunk.

c F b

BIBLIOGRÁFIA

/ l / CHOMSKY,5.: S y n t a c t i c S t r u c t u r e s . The Hague, 1 9 6 3 . Monton and Co.

118 p .

/ 2 / KIEFER F . : M a t e m a t i k a i nyelvészet. Bp. 1 9 6 4 . OMKDK 1 7 9 p.

/ 3 / MARKOV.A.A.: Teória a l g o r i f m o v . T r u d i . mat. i n s t . AH SSR, X I I I , Moszkva, 1 9 6 4 . AH SSR 375 P.

/^/ ÁBRAHÁM,S.: A f o r m a i s t u d y o f g e n e r a t i v e grammars 1, C o m p u t a t i o - n a l l i n g u i s t i c e / B u d a p e s t / 1964, I I . s z . 5-21.p.

/ 5 / ÁBRAHÁM,S.: A f o r m a i s t u d y o f g e n e r a t i v e grammars 2. C o m p u t a t i o - n a l l i n g u i s t i c s / B u d a p e s t / 1 9 6 5 . I V . s z . /nyomás a l a t t /

oOOo

(6)

ÁBRAHÁM S.: Gépi a n a l i z i s

Dl.< A 6 p a x a M

H e K O T o p a e s o n p o c a K a m u H H o r o a H a a a a a / n p ej ^ o g e H U M /

3 C T a T h e p a c c M a T p u s a i o T c H M S B e c T H h i e flo c w x n o p t i e T o f l L i $ o p - i i a . i b H o r o S H a a u s a / r p a § a n e c K i i M 3 o ő p a K e H H H x / n p e s J i o x e H n ü B p a i í K a x n o p o K f l a s c i i i x r p a u u a T H K . H o c n e y K a a a H i i H a e j o c T a T K o s 3 T n x u e T o j o s , n o K a 3 H B a 3 0 T C H , t i T o O H M B H T e K a o T ; i 3 / C J U T J I K O M C H. i b H o r o / T p e í o s a H M H , I T O Ö H a H a j m 3 5HJI n o M O C T B D i i iicKjiio^ M T e ^ b H o o o ö o c H O B a H H S n p o u. e c - c e n o p o s w e m i H n p a M o a c e H M . B c r a O T O T O T O. T p e Ő o B a H H H o T K a a a T b c n , T O r o p o s K s a o i A y z ; rpatóinaTMKy M O S H O ^ o n o j i H i i T b C K C T S M O M onpeae.neHMÍí TaKKM OŐpaSOM, --IToSh; ySOB.leTBOp:.lT8.7IbHHÍí $ o p K a j B H H Ü aHSUÍIS C T a j I n o j i H o c T b i o o c y i r e c T B M K . T a K a a p a ó o T a npoBOflUTCH B p a u x a x 3UVACJI-A- T e j i b H o r o u e H T p a B A H . Bo-iee n o f l p o ö H o H O B H I Í Í M e T o n 6 y ^ e T : i 3 j i o a e H B

őyflymeü C T a T b e .

ÁBRAHÁM.S.: Somé g u e a t l o n a o f t h e m e c h a n i c a l a n a l y a i a o f a e n t e n c e a

I n t h e p r e s e n t p a p e r m e t h o d s o f f o r m a i l a n g u a g e a n a l y s i s / w i t h i n g e n e r a t i v e g r a m m a r s / a r e p r e s e n t e d . A f t e r d i s c u s s i n g t h e i r s h o r t - c o m i n g a , i t i s shown t h a t l a t t e r a r e d u e t o t h e / t o s t r o n g / r e a t r i c - t i o n t h a t t h e a n a i y a i s 3 h o u l d be b a a e d a o l e l y o n t h e way t h e a e n - t e n c e haa b e e n g e n e r a t e d . I f we d o n o t r e s p e c t t h i a r e s t r i c t i o n , g e ­ n e r a t i v e grammar c a n be c o m p l e t e d b y a c o n c e p t u a l m a c h i n e r y ao t h a t a d e q u a t e f o r m a i a n a l y a i s . b e c o m e a p o s a i b l e e v e n o n t h e b a s e o f l o w e r - t y p e g e n e r a t i v e grammara- S t u d i e a o n a u c h s y a t e m a a r e o a r r i e d o u t a t t h e C o m p u t i n g C e n t r e o f t h e Hungárián Academy o f S c i e n c e a , a n d w i l l be r e p o r t e d i n a f u t u r e p a p e r i n more d e t a i l .

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Ezek az ideológu- sok elismerik azt, hogy Marx és Engels »jogosa n kelt ki« a liberaliz- mus ellen, de nagyot és »végzeteset« tévedtek, amikor nem az

Ebből azt az érde- kes következtetést vonhatjuk le, hogy Wittgenstein számára a mondat igazsága csak a kép és az eredeti izomorfiájának speciális esete, míg a hamis mondat

A beruházások statisztikájának feladata az, hogy az álló—alapok bővü- lését szemléltesse. Alapvetően vizsgálnia kell a beruházások terjedelmet,

A minisztériumok statisztikai munkáját a Központi Statisztikai Hivatal által biztositott és ellenőrzött egységek rendszerben kell megszer 'vezni.. Az ebbe illeszkedő munkálatokat

Ahelyett, hogy a kerületi felügyelőket az erdőtelepek faanyag- felvásárlási ésilkiszállítási elsődleges számviteli okmányainak ellenőrzésére és arra utasították

tése előtt azonban számítások útján meg kell határozni azt, hogy a statisztikai adatszolgáltatás keretében begyűjtött mutatók milyen módon (nagy— vagy kö-

Amíg a tudományos kutatás eredményeinek gyakorlati alkalmazása hosszú évtizedek után valósult meg — sokszor nem is a felfedezőik életében —, a tudomány lényegében

és A.D.. a fordításhoz szükséges sző betoldása. Az átlagos ezőhoeszuságot 7-8 betűnek véve, ez kb. Ae első angol-orosz forditást egy BESZM számológép végezte, amelyet