• Nem Talált Eredményt

Információs Rendszerek Tanszék

N/A
N/A
Protected

Academic year: 2023

Ossza meg "Információs Rendszerek Tanszék"

Copied!
9
0
0

Teljes szövegt

(1)

Az Információs Rendszerek Tanszék által

a TÁMOP 4.2.1/B-09/1/KMR-2010-0003. pályázat keretében 2011-re meghirdetett

szakdolgozati, diploma-, TDK témák és leírásuk

1. Amőba-összekapcsolás implementációja és vizualizációja (BSc)...2

2. Metainformációk csatolása webes galériákhoz (BSc)...2

3. A hozzáférési jogosultság hatékony ellenőrzésének megvalósítása XML adatbázisok lekérdezésénél (BSc)...3

4. WordNet ontológia feldolgozása fogalmi rangsorok előállítására (BSC)...3

5. WordNet ontológia grafikus megjelenítése (BSC)...4

6. Relációs stílusú XML-lekérdezés-feldolgozó rendszer készítése (MSc)...4

7. XML adatok anonim módon történő tárolása és lekérdezése decentralizált peer-to-peer hálózatokban (MSc)...5

8. Játék ontológiák (MSc)...5

9. XML megszorítások transzformálása relációs adatbázis kulcsaivá (MSc)...6

10. Átjárhatóság biztosítása XML és relációs adatbázisok között (MSc)...6

11. Szerkezeti rekurzió implementálása (MSc)...7

12. XML Schema megszorítások ellenőrzése, XPath kifejezések szimulációja szerkezeti rekurziók segítségével (MSc)...7

13. SPARQL lekérdezések optimalizációja (TDK vagy MSc)...8

14. Multimédia ontológiák építési elveinek összehasonlító elemzése (MSc)...8

Jelentkezni lehet a kiss@inf.elte.hu címen.

A témák részletesebb leírása a http://people.inf.elte.hu/kiss/ oldalon található.

2010. október 18.

(2)

1. Amőba-összekapcsolás implementációja és vizualizációja (BSc)

A dolgozat célja az amőba-összekapcsolás [1] algoritmusának implementálása XML adatbázisokon.

Az amőba-összekapcsolás lényege, hogy például egy (elem1, elem2, …, elemn) alakú lekérdezéshez megadjuk egy adott XML fájl azon csomópont-n-eseit, amelynek nevei megegyeznek a lekérdezésben szereplőkkel, és tagjai amőba-kapcsolatban állnak egymással, azaz az n darab elem között van egy olyan, amelyik az n-es összes többi tagjának őse. A programnak támogatnia kell az elemek egyszerű XPath-kifejezésekkel való megadását, és az azokra vonatkozó egyszerű szűrőfeltételeket és összehasonlító operátorokat.

Az amőba-összekapcsolás jelentőségét az adja, hogy képes az XML adatokban levő strukturális eltérések ellenére megragadni az XML adatelemek között fennálló logikai kapcsolatokat, és a lekérdezéseket valamennyire függetleníteni tudja az adatok tényleges XML reprezentációjától.

A dolgozat része egy vizualizációs szoftver is, amely képes egyszerűbb XML fájlok megjelenítésére, amőba-összekapcsolást tartalmazó kifejezések feldolgozására és az eredmény grafikus megjelenítésére.

Az amőba-összekapcsolás két módszerrel kerül implementálásra, egy brute-force és egy okosabb, optimalizált változatban.

Irodalom:

1. Taro L. Saito and ShinichiMorishita: AmoebaJoin: Overcoming Structural Fluctuations in XML Data (2006)

2. Metainformációk csatolása webes galériákhoz (BSc)

A dolgozat célja egy adatbázis-alapú webes alkalmazás kifejlesztése, amely lehetőséget biztosít RDF metaadatokkal (is) ellátott képgalériák készítésére és kezelésére.

Az alkalmazásnak képesnek kell lennie a hagyományos galériafunkciók végrehajtására (galéria létrehozása, képek elhelyezése, képnézegetési funkciók, stb.). Az alapfunkciókon túlmenően a rendszernek képesnek kell lennie arra, hogy a galériákhoz, illetve a bennük szereplő képekhez különféle metainformációkat kapcsoljunk RDF leírások formájában, majd ezek között lehetőség legyen keresések végrehajtására is.

Irodalom

1. Szeredi Péter, Lukácsy Gergely, Benkő Tamás: A szemantikus világháló elmélete és gyakorlata Typotex, Budapest, 2005.

2. http://www.w3.org/RDF/

3. http://www.w3.org/TR/rdf-sparql-query/

(3)

3. A hozzáférési jogosultság hatékony ellenőrzésének megvalósítása XML adatbázisok lekérdezésénél (BSc)

A dolgozat célja XML dokumentum formájában tárolt adatbázisok hozzáférési jogosultságának ellenőrzésére egy hatékony eljárás megvalósítása.

XML dokumentumokban tárolt adatokhoz való hozzáférés jogosultságát előfordulás szinten definiáljuk, megadjuk, hogy ki, milyen elemekhez, milyen célból (read, write, update stb.) férhet hozzá. A hozzáférési jogosultság ellenőrzését a lekérdezés folyamatába építve, az XML dokumentum hierarchikus szerkezetét kihasználva hatékony ellenőrzést érhetünk el, sőt, a hozzáférésre nem jogosult elemeknek a keresésből való korai kihagyásával a keresés hatékonysága is növekszik. El kell készíteni a hozzáférési jogosultságot definiáló adatoknak a keresés folyamatához jól illeszkedő tárolását, valamint a keresési folyamatban dinamikusan újraértékelt hozzáférést ellenőrző kritériumokat (dinamikus predikátum) létrehozó eljárásokat, amelyeket a lekérdezési tervbe kell beépíteni.

Irodalom:

[1] Jae-Gil Lee, Kyu-Young Whang, Wook-Shin Han, Il-Yeol Song: The dynamic predicate:

integrating access control with query processing in XML databases The VLDB Journal

Volume 16 , Issue 3 (July 2007) Pages: 371 – 387

4. WordNet ontológia feldolgozása fogalmi rangsorok előállítására (BSC)

A dolgozat célja egy olyan alkalmazás készítése, amely WordNet ontológia használatával megvalósítja az [1] cikkben részletezett fogalmi-rangsor előállítási algoritmusokat.

A WordNet ontológiában az angol nyelv fogalmainak ontológiai leírására található. Bizonyos alkalmazások – például multimédiás anyagok visszakeresése – esetén hasznos lehet, ha az ontológia használatával vissza tudjuk adni azokat a fogalmakat, amelyek az általunk keresett fogalomhoz valamilyen értelemben a legjobban illeszkednek.

Az alkalmazást úgy kell kialakítani, hogy az ontológia által tartalmazott bármely fogalom esetén visszaadja egy előre meghatározott fogalomhalmaz rangsorát az [1] cikkben leírt algoritmusok alapján.

Irodalom:

1. Hauff, C. and Aly, R.B.N. and Hiemstra, D. (2007) The Effectiveness of Concept Based Search for Video Retrieval.

2. http://wordnet.princeton.edu/

(4)

5. WordNet ontológia grafikus megjelenítése (BSC)

A dolgozat célja egy olyan alkalmazás fejlesztése, amely a WordNet ontológia részleteit képes grafikusan megjeleníteni.

A WordNet ontológiában az angol nyelv fogalmainak ontológiai leírására található. Egy ontológia gráffal is ábrázolható úgy, hogy gráf csúcsai az ontológia fogalmait, éleit pedig az ezen csomópontok közötti kapcsolatokat reprezentálják. A WordNet ontológiában a szinonim fogalmakat úgynevezett synset-ek sorolják be, amelyek a gráf csomópontjaiként képzelhetőek el. A synset-ek között előre meghatározott nyelvtani kapcsolatok lehetnek, amelyeket a gráf éleinek képzelhetünk el.

Az alkalmazás készítése során a WordNet ontológia egy részletét kell megjeleníteni grafikusan úgy, hogy egy megadott fogalom kapcsolatait legyen képes megjeleníteni megadott mélységig.

Irodalom:

1. http://wordnet.princeton.edu/

6. Relációs stílusú XML-lekérdezés-feldolgozó rendszer készítése (MSc)

A dolgozat célja egy relációs stílusú XML-lekérdezéseket támogató rendszer létrehozása. A rendszer lényege, hogy elabsztraháljon az XML adatmodelltől, amelyben ugyanazoknak az adatoknak többféle reprezentációja lehetséges, és egy egységes lekérdező-felületet adjon a felhasználók kezébe.

A rendszer része az úgynevezett amőba-összekapcsolás [1], amely fontos szerepet játszik a lekérdezőnyelvnek az XML reprezentációtól való függetlenítésében. Az amőba-összekapcsolás azonban önmagában még nem elég, ahhoz, hogy korrekt eredmények szülessenek, szükség van az XML relációk fogalmára, valamint az elemek közötti funkcionális függőségek figyelembevételére [2]. A funkcionális függőségek teszik lehetővé, hogy csak azok az elem-n-esek kerüljenek bele az eredménybe, amelyek tényleg kapcsolatban vannak egymással.

A lekérdezőnyelvnek támogatnia kell a kiválasztás/szelekció, vetítés/projekció és amőba- összekapcsolás műveleteket.

A dolgozat kitér a rendszer gyakorlati alkalmazhatóságára vonatkozó megfontolásokra, a széles körű alkalmazhatóságot gátló tényezőkre (például arra, hogy az XML alapú információs rendszerekben szokásos lekérdezések milyen arányban írhatók meg a dolgozat alapját képező relációs rendszerben), és javaslatokat tesz a hiányosságok kiküszöbölésére. A megoldási javaslatokat proof-of- concept jellegű prototípussal támasztja alá.

Irodalom:

1. Taro L. Saito and ShinichiMorishita: AmoebaJoin: OvercomingStructuralFluctuationsin XML Data (2006)

2. Saito, Taro L. and Morishita, Shinichi: Relational-style XML query (SIGMOD ’08: Proceedings of the 2008 ACM SIGMODinternationalconferenceon Management of data)

(5)

7. XML adatok anonim módon történő tárolása és lekérdezése decentralizált peer-to-peer hálózatokban (MSc)

A dolgozat célja azon lehetőségek vizsgálata, hogy hogyan lehetséges elosztott, központi adminisztráció nélküli peer-to-peer rendszerekben XML adatokat elhelyezni és azokra irányuló lekérdezéseket megfogalmazni és kiértékelni.

A dolgozat része egy olyan rendszerterv készítése, amely az elvégzett vizsgálatok eredményeit felhasználva minél magasabb fokú anonimitást biztosít. A rendszertervből egy, a rendszer működésének lényegét szemléltető prototípus is készül, amely lehetőséget biztosít XML adatok bevitelére és egy egyszerű lekérdezőnyelv segítségével történő lekérdezésére.

A dolgozatban megvizsgálásra kerül, hogy a rendszer hogyan reagál az elosztott adatbázis csomópontjainak véletlenszerű kiesésére, illetve szisztematikus támadásokra, valamint hogyan védhető meg a nem magát a rendszert, hanem a rendszeren belül a felhasználók anonimitását érő támadások ellen, azaz az adatokat a rendszerben elhelyező, illetve az adatokat lekérdezni kívánó peerek kilétének felfedését célzó támadásokkal szemben.

A dolgozat részét képezi annak elméleti vizsgálata is, hogy az XML adatmodell használata esetén – összehasonlítva például az elosztott relációs adatbázis-rendszerekkel, illetve a kulcsszó alapú lekérdezéseket támogató rendszerekkel – milyen előnyei és hátrányai vannak, ha egy anonimitást célzó elosztott adatbázisrendszer XML-t használ adatmodellként, mennyire ortogonális a választott adatmodell a rendszer teljesítménye, az implementáció bonyolultsága, az elérhető anonimitás mértéke és a rendszer biztonsága szempontjából.

Javasolt keresési kulcsszavak: p2p, anonimity, privacy, xml

8. Játék ontológiák (MSc)

A dolgozat célja olyan projektek megismerése cikkek segítségével, amelyek játékok felépítésével, jellemzőivel, ezek elemzésével és kategorizálásával foglalkoznak. A rendelkezésre álló ismeretek egy része ontológiákkal kerül kategorizálásra, leírásra.

A dolgozat írójának feladata az ontológiák alaptulajdonságainak megismerése, majd ezt követően néhány – játékok adatait feldolgozó – ontológia áttekintése, a különbségek és hasonlóságok összefoglalása.

Irodalom

1. Szeredi Péter, Lukácsy Gergely, Benkő Tamás: A szemantikus világháló elmélete és gyakorlata Typotex, Budapest, 2005.

2. GOP – Game Ontology Project: http://www.gameontology.org/index.php/Main_Page

3. Doo-kyung Park, Tae-bok Yoon, Kyo-hyun Park, Jee-hyong Lee, Keon-myung Lee : Implementation of an Interactive NPC Based on Game Ontology and Game Community Q/A Bulletin Board, Lecture Notes in Computer Science, 2007, Volume 4431/2007, 441-449

(6)

9. XML megszorítások transzformálása relációs adatbázis kulcsaivá (MSc)

A dolgozat célja XML dokumentum formájában tárolt adatbázisok relációs adatbázisba való konvertálásának egy fontos lépését, az XML megszorítások RelDB kulcsokká való transzformálását elvégző algoritmusok implementálása. Egy XML adatbázis relációs adatbázissá való transzformálásánál a relációs séma finomításához azokat a megszorításokat akarjuk felhasználni, amelyek a kiindulási XML adatbázis megszorításaiból származtathatóak. Ezek megtalálásához két algoritmus megvalósításával juthatunk el.

Az első algoritmus ellenőrzi, hogy XML kulcsok egy adott halmaza implikál-e egy szintén megadott funkcionális függőséget a transzformált relációs adatbázisban. Ezt a funkcionális függőséget az XML kulcsokból származtatott funkcionális függőségnek nevezzük. A második algoritmus az XML kulcsok egy adott halmazához elkészíti a származtatott funkcionális függőségek minimális lefedését.

Irodalom:

[1] Susan Davidson, Wenfei Fan, Carmem Hara :Propagating XML constraints to relations

Journal of Computer and System Sciences Volume 73, Issue 3 (May, 2007) Pages 316-361

10. Átjárhatóság biztosítása XML és relációs adatbázisok között (MSc)

A dolgozat célja XML és relációs adatbázisok lekérdezéseinek transzformálása egymásba úgy, hogy a transzformált lekérdezés lényegében azonos eredményt hozzon. Az XML adatbázisoknál XQERY-t, a RelDB-nél SQL-t használunk.

Azért, hogy egységesen hivatkozhassunk a különböző sémákban azonos logikai funkciót betöltő építőelemekre, a következő fogalmakat definiáljuk:

-

az érték építőelemek a sémának azon részei, amelyek közvetlenül jelenítenek meg adatokat;

-

a kollekciós építőelemek adatok egy homogén szerkezetű halmazát ábrázolják;

-

a struktúra építőelemek két kollekciót kapcsolnak össze.

A megvalósítandó eljárás elemzi a megadott kérdést, osztályozza az input kérdés építőelemeit, megkeresi és kiszűri a többszörös leképezéseket, majd kialakítja az output lekérdezést az egyes építőelemek konvertálásával. Az eljárásnak mindkét irányban (SQL  XQUERY, XQUERY SQL) működnie kell.

Irodalom:

(7)

[1] Chang, Ya-Hui Lee, Chia-Zhen: Representing Multiple Mappings between XML and Relational

Schemas for Bi-directional Query Translation Advances in Data and Web Management

Lecture Notes in Computer Science, 2009, ISSUE 5446, pp. 100-112 Springer Berlin /

11. Szerkezeti rekurzió implementálása (MSc)

A szerkezeti rekurzió gráfok bejárására, illetve a bejárás által új gráfok készítésére használható formális eszköz. Feltételekkel és regiszterekkel kiterjesztett változatában alkalmas az XPath és az XSLT XML fákat bejáró műveleteinek, lehetőségeinek szimulálására, emellett az XML Schema által megadott szerkezeti előírások ellenőrzésére. Használatával tehát ugyanazzal eszközzel megoldható az XML dokumentumok validálása valamint lekérdezése, sőt, segítségével az XML Schema megszorításai beleépíthetők a lekérdezésbe, így a végrehajtás idő lényegesen megrövidülhet. Előfordulhat például, hogy egy XPath kifejezéssel cd-k és dvd-k bizonyos tulajdonságait szeretnénk kigyűjteni, ám a dokumentumra vonatkozó XML Schema alapján dvd elemek nem is szerepelhetnek a dokumentumban. Ha fenti kifejezés kiértékelésénél ezt figyelembe tudjuk venni, nyilvánvalóan időt spórolhatunk meg.

A szakdolgozatban a szerkezeti rekurziók feltételekkel és regiszterekkel kiterjesztett változatát kellene implementálni. Az implementáción túl meg kellene vizsgálni, lehet-e javítani a szerkezeti rekurziók megvalósítását megadó algoritmusokon, illetve léteznek-e speciális esetek, amikor hatékonyabb módszer használható az általános helyett.

A programot emellett az XML dokumentumok tárolását is meg kellene oldani, hiszen a már létező technológiákban az elemeket XPath, SAX stb. kifejezésekkel érhetjük el, a szerkezeti rekurziókkal viszont pont ezeket szeretnénk majd modellezni.

12. XML Schema megszorítások ellenőrzése, XPath kifejezések szimulációja szerkezeti rekurziók segítségével (MSc)

A szerkezeti rekurzió gráfok bejárására, illetve a bejárás által új gráfok készítésére használható formális eszköz. Feltételekkel és regiszterekkel kiterjesztett változatában alkalmas az XPath és az XSLT XML fákat bejáró műveleteinek, lehetőségeinek szimulálására, emellett az XML Schema által megadott szerkezeti előírások ellenőrzésére. Használatával tehát ugyanazzal eszközzel megoldható az XML dokumentumok validálása valamint lekérdezése, sőt, segítségével az XML Schema megszorításai beleépíthetők a lekérdezésbe, így a végrehajtás idő lényegesen megrövidülhet. Előfordulhat például, hogy egy XPath kifejezéssel cd-k és dvd-k bizonyos tulajdonságait szeretnénk kigyűjteni, ám a dokumentumra vonatkozó XML Schema alapján dvd elemek nem is szerepelhetnek a dokumentumban. Ha fenti kifejezés kiértékelésénél ezt figyelembe tudjuk venni, nyilvánvalóan időt spórolhatunk meg.

(8)

A szakdolgozatban az XML Schema megszorítások szerkezeti rekurzióval való ellenőrzését, XPath kifejezések szerkezeti rekurzióval történő megvalósítását kellene implementálni, különös tekintettel a korábban említett optimalizálási lehetőségekre. (a szakdolgozat feltételezi az előbbi szakdolgozatot)

13. SPARQL lekérdezések optimalizációja (TDK vagy MSc)

A SPARQL az RDF adatok lekérdezésére kifejlesztett nyelv, amelyet a W3C szemantikus webbel foglalkozó munkacsoportja dolgozott ki szabványként. A szemantikus web mögött az az elképzelés húzódik meg, hogy az interneten tárolt adatokat jelentéssel is felruházzuk, megkönnyítve ezzel például a világhálón történő keresést. A mostani keresőrendszerek általában a találatokat a keresőszavakkal való alaki egyezés alapján adják meg. Ezzel szemben egy “szemantikus webkereső” a kétütemű keresőkifejezésre nem csupán azokat az oldalakat sorolná fel, ahol ez a szó ténylegesen szerepel, hanem a találatok között szerepelne néhány Trabanttal, Wartburggal foglalkozó honlap – anélkül, hogy a kétütemű szó szerepelne ott −, esetleg pár kép az előbbi autómárkák némely nemes képviselőjéről.

Az RDF segítségével a világunk, legfőképpen az internet világának szereplőiről fogalmazhatunk meg állításokat tehát, a SPARQL használatával pedig ezen leírások között kutatva szerezhetjük meg a számunkra fontos információt, vagy vonhatunk le következtetéseket.

A SPARQL lekérdezések mögött, az SQL és relációs algebra viszonyához hasonlóan, egy algebra húzódik meg. Az itt felismert műveleti ekvivalenciák pedig ugyanúgy felhasználhatók a lekérdezések optimalizálására, mint az SQL kérdések esetében. Például a szelekciót ebben az esetben is jó, minél hamarabb végrehajtani csökkentve ezzel a válasz kiszámítása során cipelt közbülső adatok méretét.

Ez a világ azonban valamennyivel bonyolultabb, és sokkal kevésbé kidolgozott, mint a relációs adatbáziskezelő rendszerek lekérdezés optimalizációs technológiái.

Kezdetnek egy SPARQL lekérdezéseket a neki megfelelő algebrába átíró programot kellene elkészíteni, ami aztán a lehetséges optimalizációs átalakításokat is végrehajtaná. Itt is előfordulhat azonban, hogy több jónak tűnő lekérdezésterv is kínálkozik. A relációs adatbáziskezelő rendszerek ilyenkor költségfüggvényekre alapuló becslésekkel próbálják meg kiválasztani a legjobb megoldást. A SPARQL esetében azonban egyáltalán nem világos még, hogy mik is lehetnének ezek a költségfüggvények − hogy csupán egyetlen lehetőség szerepeljen itt sok kérdés közül, ami az előbbi implementáció elkészítése után meg lehetne vizsgálni.

14. Multimédia ontológiák építési elveinek összehasonlító elemzése (MSc)

A dolgozat célja megvizsgálni, hogy a multimédia ontológiák készítése során milyen módszereket alkalmaznak.

Manapság egy jelentős kutatási terület a multimédia anyagok keresési hatékonyságának növelése.

A hatékonyság növelésének egyik módszere az, hogy a keresés során kihasználják a fogalmak közötti

(9)

szemantikai kapcsolatokat. A szemantikai viszonyok leírásának egy elterjedt módszere az ontológiák alkalmazása. A multimédiás ontológiák építése is eltérő módszerekkel történhet.

A dolgozat készítése során ezen módszereket kell megvizsgálni és elemezni a módszerekben fellelhető hasonlóságokat és különbségeket.

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

Kivonat: Az MTA SZTAKI Elosztott rendszerek Osztálya által fejlesztett KOPI Online Plágiumkereső és Információs Portál egy egyedülálló, nyílt szolgáltatás az

A Z és már az alfa generáció (az 1996–2010 között és a 2010 után születet- tek) mindennapjainak is szerves részét képezi a digitális technológia használata,

Komplement aktiváció vizsgálata invazív koronária beavatkozás során stabil angina pektoris esetén, összehasonlítva akut ST-elevációs miokardiális

Do not agree(1), Fully agree(2), Handles information on orders, sales, prices, assets, overdue payment, well(3), We have up-to-date information about inventory(4), Our

2.3.2.7 Az MH éves eszközpótlási terv az MH éves híradó-informatikai beszerzési terv részét képezi, és tartalmazza az MH híradó-informatikai

2.3.2.7 Az MH éves eszközpótlási terv az MH éves hír- adó-informatikai beszerzési terv részét képezi, és tartal- mazza az MH híradó-informatikai rendszerek

mítógépes információs rendszerek számára lehetővé teszi a bolgár adatbevitelt; a számítógépes rendsze­.. rek hatékony kidolgozása és használata érdekében

Ezen a struktúrán belül a szerveződésnek két más típusát vehetjük észre... Beszámolók,