• Nem Talált Eredményt

MASZEKER: szemantikus kereső program

N/A
N/A
Protected

Academic year: 2022

Ossza meg "MASZEKER: szemantikus kereső program"

Copied!
3
0
0

Teljes szövegt

(1)

302 IX. Magyar Számítógépes Nyelvészeti Konferencia

MASZEKER: szemantikus kereső program

Hussami Péter1

1Alkalmazott Logikai Laboratórium 1022 Budapest, Hankóczy j. u. 7

hussami@all.hu

Az Alkalmazott Logikai Laboratórium és a Szegedi Tudományegyetem Informatikai Tanszékcsoportja, valamint Könyvtár- és Humán Információtudományi Tanszéke egy, a Nemzeti Fejlesztési Ügynökség által támogatott közös projektet (TECH_08_A2/2- 2008-0092) fejezett be 2012-ben. A projekt célja olyan, új elveken alapuló, integrált információ-visszakereső rendszer kifejlesztése volt, amely a keresést végző felhaszná- ló szemantikai kompetenciáját az eddigieknél nagyobb mértékben kiaknázva teszi lehetővé a természetes nyelvi dokumentumtárakban (szövegekben) történő valóban tartalmi keresést. Egyszerűen szólva: a felhasználó jól formált frázisokkal, mondatok- kal specifikálhatja, milyen tartalmú dokumentumokat keres. A rendszer áttekintő architektúrája az 1. ábrán látható.

1. ábra. A MASZEKER rendszer áttekintő architektúrája.

Az ábrának megfelelően a releváns dokumentumok keresése a következő lépések- ből áll:

1.) a felhasználó egy kontrollált nyelven adja meg a keresőkifejezést,

(2)

Szeged, 2013. január 7–8. 303

2.) a rendszer szintaktikus és szemantikus elemzést végezve előállítja a kereső- kifejezés jelentésreprezentációját,

3.) szavak szerinti kereséssel előszűri az archívumot,

4.) végül azokra a szövegszegmensekre, amelyekben a szavak szerinti keresés ta- lálatai vannak, illeszti a keresőkifejezés jelentésreprezentációját.

Az MSzNy VII konferencián tartott előadáson [1] ismertetésre kerültek a fenti ele- mek megvalósítására vonatkozó elméleti alapelvek, elsősorban a szemantikus repre- zentáció felépítése mint sarokkő köré szervezve. Az MSzNy VIII konferencián tartott bemutatón [2] a rendszer első változatát mutattuk be, amely főnévi csoportokon mint keresőkifejezéseken működött. Idén a teljes, jól formált főnévi csoportokon és monda- tokon működő rendszert kívánjuk bemutatni. Ugyanezen a konferencián egy előadás [3] számol be a rendszer alapjául szolgáló technológiáról.

A demóban az archívumot szabadalmi leírások főigénypontjaiból összeállított do- kumentumgyűjtemény alkotja1. A keresőkifejezés több mondatból, ill. főnévi kifeje- zésből állhat, kontrollált angol nyelven megfogalmazva. A megszorítások az egyér- telműséget biztosítják, a tipikusan nehezen egyértelműsíthető fordulatokat akartuk kizárni. Legfontosabb korlátozások (a teljes definíció [4]-ben hozzáférhető):

 csak kijelentő módú, jelen idejű mondatok használhatók,

 tiltott a mellérendelő mellékmondat (viszont a mondatok AND, OR kapcsolóval kapcsolhatóak, zárójelezhetőek),

 tiltott az alárendelő mellékmondatok bármiféle lerövidítése (pl. igeneves utómódosítók),

 az alárendelő mellékmondatnak a „which” vonatkozó névmással kell kezdődnie, és ennek a közvetlenül megelőző főnévi csoport fejére kell vonatkoznia,

 tiltottak az igeneves előmódosítók,

 felsorolás, koordináció csak főnévi csoportok közt megengedett, ezeket a felhasználónak jelölnie kell.

A felhasználói interfész segíti, és a morfoszintaktikai elemzés eredménye alapján ellenőrzi a szabályok betartását. Mivel a teljes szabályrendszer nem ellenőrizhető, a generált jelentésreprezentáció grafikusan bemutattatik – ha szükséges, a felhasználó módosíthatja a keresőkifejezést. Ez a megjelenítés segíti egyértelműsíteni az egyes szavak jelentésének megállapítását is, mivel ha több frame/synset van egy csomópont- hoz rendelve, akkor a felhasználó választhatja a megfelelőt.

A rendszer a keresőkifejezéshez illő frázisokat keres az igénypontok szövegében, és az eredményt a grafikus interfészen megmutatja, kiemelve azokat a szavakat, ame- lyek olyan frázist alkotnak, melyet a keresőkifejezés egy szegmenséhez hasonlónak talált. Míg a keresőkifejezés feldolgozásánál maximálisan törekszünk a pontos jelen- tésreprezentációra, a keresés fázisában az aktuális szövegrészlet vizsgálatánál csak azt ellenőrizzük, hogy jelentheti-e a keresőkifejezés valamely frázisát.

1 A projekt egyik kiemelt felhasználási területe a szabadalmi keresés, s a prototípust

„gyógyhatású készítmények és kozmetikai szerek” témaköréből származó szabadalmakon mutatjuk be.

(3)

304 IX. Magyar Számítógépes Nyelvészeti Konferencia

Köszönetnyilvánítás

A fejlesztés az NFÜ által finanszírozott, MASZEKER kódnevű, TECH_08_A2/2- 2008-0092 számú projekt keretében valósult meg.

Hivatkozások

1. Szőts M., Csirik J., Gergely T., Karvalics L.: MASZEKER: projekt szemantikus kereső technológia kidolgozására In_ Tanács A., Vincze V. (szerk.): MSzNy 2010 – VII Magyar Számítógépes Nyelvészeti Konferencia. Szegedi Tudományegyetem, Szeged (2010) 159–

167

2. Hussami P.: MASZEKER: szemantikus kereső program In: Tanács A., Vincze V. (szerk.):

MSzNy 2011 – VIII Magyar Számítógépes Nyelvészeti Konferencia. Szegedi Tudomány- egyetem, Szeged (2011) 321–322

3. Szőts M., Simonyi A.: Frame-szemantikára alapozott információ-visszakereső rendszer In:

Tanács A., Vincze V. (szerk.): IX. Magyar Számítógépes Nyelvészeti Konferencia. Szegedi Tudományegyetem, Szeged (2013) 275–285

4. A kontrollált nyelv definíciója http://www.maszeker.hu/?page=download

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

A fiatalok (20–30 évesek, más kutatásban 25–35 évesek) és az idősek (65–90 évesek, más kutatásban 55–92 évesek) beszédprodukciójának az összevetése során egyes

A vándorlás sebességét befolyásoló legalapvetőbb fizikai összefüggések ismerete rendkívül fontos annak megértéséhez, hogy az egyes konkrét elektroforézis

(Véleményem szerint egy hosszú testű, kosfejű lovat nem ábrázolnak rövid testűnek és homorú orrúnak pusztán egy uralkodói stílusváltás miatt, vagyis valóban

Az akciókutatás korai időszakában megindult társadalmi tanuláshoz képest a szervezeti tanulás lényege, hogy a szervezet tagjainak olyan társas tanulása zajlik, ami nem

Az olyan tartalmak, amelyek ugyan számos vita tárgyát képezik, de a multikulturális pedagógia alapvető alkotóelemei, mint például a kölcsönösség, az interakció, a

A pszichológusokat megosztja a kérdés, hogy a személyiség örökölt vagy tanult elemei mennyire dominán- sak, és hogy ez utóbbi elemek szülői, nevelői, vagy inkább

Nagy József, Józsa Krisztián, Vidákovich Tibor és Fazekasné Fenyvesi Margit (2004): Az elemi alapkész- ségek fejlődése 4–8 éves életkorban. Mozaik

A kötet második egysége, Virtuális oktatás címmel a VE környezetek oktatási felhasználhatóságával kapcso- latos lehetőségeket és problémákat boncolgatja, azon belül is a