VII. Magyar Számítógépes Nyelvészeti Konferencia
MSZNY 2010
Szerkesztette:
Tanács Attila Vincze Veronika
Szeged, 2010. december 2-3.
http://www.inf.u-szeged.hu/mszny2010
ISBN: 978-963-306-075-9
Szerkesztette: Tanács Attila és Vincze Veronika {tanacs, vinczev}@inf.u-szeged.hu
Felels kiadó: Szegedi Tudományegyetem, Informatikai Tanszékcsoport 6720 Szeged, Árpád tér 2.
Nyomtatta: Planet Corp. Szolgáltató Kft.
6771 Szeged, Makai út 4.
Szeged, 2010. november
A konferenciakötet megjelenését az NKTH a TECH_08_A2/2-2008-0092 (MASZEKER) azonosítójú projekt keretében támogatta.
Elszó
2010. december 2-3-én hetedik alkalommal rendezzük meg a Magyar Számítógépes Nyelvészeti Konferenciát. Örömömre szolgál, hogy a rendezvény – az elz évek hagyományaihoz hasonlóan – fokozott érdekldést váltott ki az ország nyelv- és be- szédtechnológiai szakembereinek körében. A konferencia f célja továbbra is a nyelv- és beszédtechnológia területén végzett legújabb, illetve folyamatban lev kutatási eredményeinek ismertetése és megvitatása, továbbá az esemény lehetséget biztosít különféle hallgatói projektek, illetve ipari alkalmazások bemutatására is.
Idén a konferenciafelhívásra szép számban beérkezett tudományos eladások közül a programbizottság 46-ot fogadott el, így 32 eladás és 14 poszter-, illetve laptopos bemutató gazdagítja a konferencia programját.
Nagy örömet jelent számomra az is, hogy az idei konferencián – külön szekció kere- tében – kiemelt figyelmet szentelünk a szemantikus keresés terén elért eredmények- nek. A számítógépes nyelvészet egyik legintenzívebben kutatott területéhez kapcso- lódik a MASZEKER projekt, melynek keretében a Nemzeti Kutatási és Technológiai Hivatal is támogatja a rendezvényt. A projekt részleteirl több eladásból, poszterbl és laptopos bemutatóból is informálódhat az érdekld közönség.
Az eddigi alkalmakhoz hasonlóan idén is tervezzük a „Legjobb Ifjú Kutatói Díj”
odaítélését, mellyel a fiatal korosztály tagjait kívánjuk ösztönözni arra, hogy kiemel- ked eredményekkel járuljanak hozzá a magyarországi nyelv- és beszédtechnológiai kutatásokhoz. A díjat az MTA Számítástechnikai és Automatizálási Kutatóintézete ajánlotta fel az idei évben.
Szeretnék köszönetet mondani a programbizottságnak: Vámos Tibor programbizott- sági elnöknek, valamint Alberti Gábor, Gordos Géza, László János, Prószéky Gábor és Váradi Tamás programbizottsági tagoknak. Szeretném továbbá megköszönni a rendezbizottság (Alexin Zoltán, Almási Attila, Vincze Veronika) és a kötetszerkesz- tk (Tanács Attila, Vincze Veronika) munkáját is.
Csirik János, a rendezbizottság elnöke Szeged, 2010. november
vi
III.Szemantika
Vonzatkeretlistákhelyettpolaritásoshatáslánccsaládok–avagyaeALISV
függvénye...113 AlbertiGábor,KiliánImre
Személynévegyértelmsítésamagyarweben...127 NagyT.István,FarkasRichárd
AMagyarWordNetfelhasználhatóságalexikálisjelentésegyértelmsítésben...137 KutiJudit,DarjaFišer
Ametaforikusnyelvhasználatkorpuszalapúelemzése...145 BabarczyAnna,BenczeIldikó,FeketeIstván,SimonEszter
IV.(Szemantikus)keresés
MASZEKER:projektszemantikuskerestechnológiakidolgozására...159 SztsMiklós,CsirikJános,GergelyTamás,KarvalicsLászló
Nyelvészetiproblémákaszabadalmakfeldolgozásában...168 VinczeVeronika,NagyÁgoston,KlauszÁgnes,AlmásiAttila,KissMárton
Vonzatkeretekvizsgálataorvostudományitárgyú,angolnyelvszabadalmi
szövegeken...180 KlauszÁgnes,VinczeVeronika,NagyÁgoston,AlmásiAttila
Egyvertikálisnyelvikereskészítése...190 OroszGyörgy
V.Beszédtechnológia
Környezetfüggetlenéssztochasztikusnyelvtanokösszehasonlításatöbbnyelv gépibeszédfelismerésifeladatban...203 MozsolicsTamás,TarjánBalázs,MihajlikPéter,FegyóTibor
Magyarnyelvnagyszótárasbeszédfelismerésifeladatokadatelégtelenségi
problémáinakcsökkentésenyelvimodellinterpolációalkalmazásával...216 TarjánBalázs,MihajlikPéter
Kulcsszókeresésikísérletekhangzóhíranyagokonbeszédhangalapúfelismerési technikákkal...224 GosztolyaGábor,TóthLászló
Szótagokautomatikusosztályozásaspontánbeszédbenspektrálisésprozódiai jellemzkalapján...236 BekeAndrás,SzaszákGyörgy
Bizonytalanságotjelölkifejezésekéshatókörükazonosításatermészetesnyelvi szövegekben:aCoNLL2010versenytapasztalatai...354 FarkasRichárd,VinczeVeronika,MóraGyörgy,CsirikJános,SzarvasGyörgy
Szemantikusannotációklétrehozásaawebennyelvtechnológiaieszközök
támogatásával...358 HéderMihály
MelléknevekszkszemantikaiosztályainakdetekciójaaMagyarNemzeti
Szövegtárbanjelentésegyértelmsítéscéljából...360 HéjaEnik,TakácsDávid
EgynyelvészetiUIMAfolyamatakéziannotálástólazeredmények
megjelenítéséig...362 KissMárton,NagyÁgoston
AMASZEKERfelhasználóifelületénekkialakítása...365 MinkóMihály
Bnügyinévelemfelismerés...366 MolnárGáborJózsef,KojedzinszkyTamás,FarkasRichárd
Igeiigenevekproblémájaszámítógépesnyelvészetiszempontból...371 NádasdiPéter
Terminológiakivonatolásfrancianyelvszabadalmakleírásaibólkülönböz
módszereksegítségével...375 NagyÁgoston
SzótáralapúkémiaiNEfelismerrendszer...379 NyilasSándor,NémethGábor,AlmásiAttila
Lényegkiemelmódszerekösszehasonlításaközlekedésizajbantörtén
beszédfelismeréscéljából...384 SárosiGellért,ToblerZoltán,MihajlikPéter,FegyóTibor
ValósidejszövegosztályozásaWikipediaszolgálatában...389 SoltIllés,HéderMihály,TikkDomonkos
AHG1treebank:anyelvtanírástólazonlinekonkordanciáig...391 TóthÁgoston
Szerziindex,névmutató...395
Tartalomjegyzék
I.Információkinyerés
Panaszlevelekszerkezeténekgépifelismerése...3 BártháziEszter,HéderMihály
OpinHu:onlineszövegektöbbnyelvvéleményelemzése...14 MiháltzMárton
VideókhozkapcsolódókiegészítinformációktöbbnyelvkereséseaWikipédia segítségével...24 GyarmatiÁgnes,GarethJ.F.Jones
DBPediamagyarnyelvszövegekelemzéséhez...26 NémethBottyán,VándorTamás
Kontextualizáltnévelemfelismerésésrelációkinyeréskórházizárójelentésekben..35 SoltIllés,SzidarovszkyP.Ferenc,TikkDomonkos
Kulcsszókinyerésmagyarnyelvtudományospublikációkból...47 BerendGábor,FarkasRichárd
Bibliográfiaihivatkozásokautomatikuskinyerése...56 VáradiTamás,PintérTibor,MittelholczIván,PeredyMárta
II.Párhuzamoskorpuszok
Statisztikaiéshibridmódszerekpárhuzamoskorpuszokfeldolgozására...69 LakiLászlóJános,PrószékyGábor
Többszavaskifejezésekkezeléseapárhuzamoskorpuszokraépülszótárkészítési módszertanban...80 HéjaEnik,SassBálint
FéligkompozicionálisszerkezetekaSzegedParalellangol–magyarpárhuzamos korpuszban...91 VinczeVeronika,FelvégiZsuzsanna,R.TóthKrisztina
Párhuzamosigeiszerkezetekközvetlenkinyerésepárhuzamoskorpuszból...102 SassBálint
Spontánbeszédbenrejlnemverbálishangjelenségek–érzelmek,hanggesztusok –vizsgálata...249 VicsiKlára,SztahóDávid,KissGábor,CziraAnita
Érzelmekautomatikusosztályozásaspontánbeszédben...261 SztahóDávid,ImreViktor,VicsiKlára
VI.Morfológia,korpusz
Ismeretlenkifejezésekésaszófajiegyértelmsítés...275 ZsibritaJános,VinczeVeronika,FarkasRichárd
Obiugormorfológiaielemzkéskorpuszok...284 FejesLászló,NovákAttila
Amagyarfrazeológiaiadatbázislétrehozásaésazebblgeneráltszinonim
frazémaszótármunkálatai...292 BárdosiVilmos,KissGábor
NyelvtechnológiaimódszerekaBudapestiSzociolingvisztikaiInterjúlexikaiés szintaktikaivizsgálatában...300 VáradiTamás,PeredyMárta,OraveczCsaba
VII.Gépitanulás
Szótáralapúnévelemfelismerésszóhatárainakjavításagépitanulásimódszerrel..317 MóraGyörgy,FarkasRichárd
Klaszterekhelyettprototípusok...325 KálmánLászló,RungAndrás
Fnévicsoportokazonosításaszabályalapúéshibridmódszerekkel...333 RecskiGábor
VIII.Poszterek,laptoposbemutatók
Onlinemorfológiaielemzkésszóalakgenerátorokkisebburálinyelvekhez...345 BakróNagy Marianne, Endrédy István, Fejes László, Novák Attila, Oszkó Beatrix,PrószékyGábor,SzeverényiSándor,VárnaiZsuzsa,WagnerNagyBeáta MSDKRharmonizációaSzegedTreebank2.5ben...349 FarkasRichárd,SzerediDániel,VargaDániel,VinczeVeronika