• Nem Talált Eredményt

Mesterséges intelligencia I

N/A
N/A
Protected

Academic year: 2022

Ossza meg "Mesterséges intelligencia I"

Copied!
23
0
0

Teljes szövegt

(1)

Mesterséges intelligencia I

13. Előadás

(2)

Néhány probléma:

- Hogyan fordítanánk angolra?

- Hogyan érthetnénk meg egy rövid törénetet?

- Miként lehetne kigyűjteni az MTI hírekből a cégek egyesítéséről szólókat?

- Hogyan kezdenénk egy (magyarul kimondott) számokat felismerő program fejlesztéséhez?

(3)

Két nagyobb terület

Természetes-nyelv feldolgozás,

folyamatban levő projektek

Beszédfeldolgozás,

folyamatban levő projektek

(4)

Nyelvfeldogozás

Nagyon sok elektronikusan hozzáférhető szöveg (például a MEK, a Magyar Nemzeti Szövegtár),

sokféle formátum

Első lépés: szegmentálás

(eredmény: tagolt szöveg, mondatok, szavak, tokenek). Legfontosabb problémák

(5)

Morfo-szintaktikai elemzés (morfológia-alaktan).

Lexikon.

A magyar agglutináló (toldalékoló) nyelv, amelyben a szótőhöz

képzőket,

ragokat illeszthetünk

(az angolban szinte nincsenek ragok).

Feladat: szótövek+illesztések meghatározása.

Különböző kódrendszerek, általában fix pozíciókkal (MSD - ablak: Ncsn főnév, köznév, egyes szám,

alanyeset). 1984.

(6)

Egyértelműsítés: az előző címkézési eljárás nem egyértelmű - szótár, toldalékok.

Szeged korpusznál (1 millió szó) 52% többértelmű.

Hogyan válasszuk ki a megfelelő jelentést?

Kézzel, pontosan elemzett minta

tanuló eljárások.

Bayes döntés,

Markov láncok,

szabályok alkalmazása.

Legjobb eredmények: 3-4 % hiba marad.

(7)

Más nyelveknél is szükség van erre az

előfeldolgozásra, például angolban a Brown korpusz (1961) az első elkészült nagy anyag.

A szövegben további jelek kellenek - speciális formátumok: XML (Extensible Markup

Language, 1998), SGML (Standard Generalized

…) a leggyakoribb standard fogalmak. HTML.

(8)

Szintaxis (mondattan)

Kezdés: főnévi szerkezetek kijelölése (NP, noun phrase).

Pl. egy nagy piros ház

(főnév + balról jelzős szerkezet és determináns).

Névszói szerkezetek. Melléknevek, számnevek, névmások.

Igei vonzáskeretek

(magyar igéknek 0, 1, 2, 3, 4 bővítménye lehet).

(9)

Teljes szintaktikus elemzés.

Mondatfa. mondat(Láttam tárgy(fn-csoport(egyigei-csop(tárgy(fn- csoport(hordó tokaji)t) hordó tokaji)t).

Általában szabályokat keresünk, azokat próbáljuk alkalmazni morfológiailag már egyértelműsített szövegen.

Chomsky: generatív grammatikák.

Alulról felfelé, felülről lefelé elemzés.

(10)

A mondatok jelentése: atomi jelentések,

kombinálási szabályok. Montague nyelvtanok.

Szematika (jelentéstan). Fogalmi hálók, wordnet. Keretek.

A Szeged korpusz szintaktikai feldolgozása.

Gazdasági hírek szemantikus feldolgozása.

(11)

Vissza: tudásábrázolás

Szabályalakú rendszerek: ha A akkor B alakú mondatok.

Példa: nyolcas kirakós játék.

Előre haladó (adatvezérelt).

Visszafelé haladó (célvezérelt).

(12)

Szemantikus (vagy asszociatív) hálók

Formálisan címkézett irányított gráfok, ahol

a gráfok csúcsai fogalmakat vagy objektumokat reprezentálnak,

az élek pedig a közöttük meglevő viszonyok, kapcsolatok

tagja (eleme) (instance of),

ekvivalens (is equivalent of),

tulajdonságú (has property of, színe, mérete),

részosztálya (subclass of),

ez egy (típusa) (is a ),

részhalmaza (has part of).

(13)
(14)

Nincs szabványos szintaxis, szemantika.

Példa.

A szemantikus háló felépítése.

Öröklődés.

Előnyök (explicit és tömör ábrázolás),

hátrányok (nagy méretnél nehéz áttekinteni, nehéz szabványosítani a keresést).

Következtetések a szemantikus hálón: tényháló, célháló.

Kivételek és ellentmondások kezelése, prioritások.

(15)

(Tudás)keret (frame): valamely fogalom vagy objektum strukturált modellje.

A tulajdonságokat (attribútumokat) a keret rekeszei vagy bejegyzései nevezik meg

szemantikus háló továbbfejlesztése

(érték megadása, alapértelmezése, forrása, a változáskor végrehajtandó eljárások (démonok))

Keretnyelv.

Példa.

(16)

Lényegesnek tűnő különbség a szemantikus hálókhoz képest: formális leírás létezik (keretnyelv).

Valójában nem sok eltérés.

Legegyszerűbb: a szemantikus háló átírása az adott keretnyelvre.

Példa.

Osztályok (legfelső szint) és példányok.

Öröklődés.

(17)

Attribútumok megadása relációkkal.

Bejegyzések:

domain (ért. tart.),

range (ért. készl.),

constraint (megszorítás az értkészl-re),

default (alapértelmezés),

inverse,

inheritance.

Gráfos ábrázolás mellett további lehetőségek, például űrlappal (adatbázissal).

(18)

Előnyök: esemény-vezérelt végrehajtás (démonok), világos, áttekinthető szerkezet,

deklaratív és

procedurális ismeretek

együttes ábrázolása lehetséges.

Hátrányok:

prototípustól való eltérés, bővítés nehéz lehet.

(19)

Beszédfelismerés

Fonéma: a legkisebb olyan részlet, amiben két szó eltérhet egymástól (gép-kép).

- fonetikai változatosság - akusztikai változatosság

- beszélők közötti változatosság

- adott beszélő esetén levő változatosság

(20)

Beszédértelmezés szintjei

fonetika

fonológia

morfológia (lexika)

szintaktika

szemantika

pragmatika

(21)

Felismerők csoportosítása

beszédjel minősége

beszéd módja

Beszélőfüggőség

szótár mérete

nyelvi kötöttség foka

(22)

Általános struktúra

Előfeldolgozás

Szegmentálás

Címkézés

lexikális elemzés (szótár)

nyelvi elemzés (szintaxis)

szemantikai elemzés

(23)

Szegedi alkalmazások

számjegyek felismerése

halláskárosult gyerekek tanítása

beszédszintézis

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A rezolúció hatékonyságának növelése: rezolúciós stratégiák, szélességi keresés, támogató halmaz startégiája, lineáris input stratégia, ősre korlátozott

 ha h’ = h, akkor az optimumot keresnénk az optimális úton lenne a legkisebb szám..  nem

 tegyük fel, hogy valamilyen betegség a népesség 0.005-nél fordul elő.  van egy tesztünk, amelyik a

Nagyon kicsi a valószínűsége tehát annak, hogy János is és Mária is telefonált, volt is riasztás, de nem volt sem földrengés, sem betörés.... (rekurzívan végzem

 Ha ugyanaz a formula előfordul az implikáció jel mindkét oldalán (azaz valamelyik Ai és Bj megegyezik), akkor a teljes formula érvényes.  Ha a formulában

 Döntési fa: minden csúcsban két- vagy többértékű döntés.?. Hogyan építsünk fel egy

A többi csoport, mint például az elidegeníthetetlen tulajdon, a műveltetés, illetve számos tárgy nél- küli dativusos szerkezet nem fér bele a lexikai dativusok csoportjába,

A két csoport közötti eltérésnek az okát egyrészt abban látom, hogy a német (A) csoport L2-t tekintve homogén, vagyis mind- annyian angolt tanulnak első idegen nyelvként, míg