• Nem Talált Eredményt

Kombinált rendszer megtérülése

4. A MÓDSZER ALKALMAZHATÓSÁGA

Az egyes cellákra számolt statisztikák térbeli eloszlása alapján jól azonosíthatóak azok a helyek, ahol nem megfelelő a konvergencia. Ez az információ az adott modell felépítésének ismerete alapján segíthet az okok feltárásában. A problémás helyek ismeretében az adott cellákra kiíratott „idősor” szintén hasznos eszköz lehet az okok azonosításában.

Csak a statisztikák figyelembe vételével, az összetett okok miatt, nem egyértelműen azonosítható, hogy melyik stressz csomag okozza a konvergencia problémát, de a két jellemző eset, vagyis az oszcilláció és a nagyon lassú konvergencia egyértelműen elkülöníthető.

A cellakonverziók gyakorisága, frekvenciája egyértelműen jelezhetik, ha a cellák kiszáradása és újra nedvesedése okozta problémára gyanakodhatunk. A közeli cellákban a változások átlaga ezt alátámaszthatja. Az előjelváltások nagy gyakorisága oszcillációra utal.

Ez a kimagasló átlagok mellett szintén fontos támpont lehet a hiba megtalálásában.

A módszer alkalmazható permanens és tranziens esetre is. A statisztikák számításánál lehetőség van arra, hogy az első néhány iteráció során kapott értéket ne vegyük figyelembe.

Ez akkor lehet hasznos, ha permanens esetben a kezdeti vízszint (vagy emelkedési magasság) értékek jelentősen eltérnek a végső vízszintektől. Ezek az ugrás szerű változások általában az

115

első néhány iteráció során megtörténnek és a további iterációkban csak kisebb változások várhatóak, amiben már az oszcilláció lehet a domináns. Ugyanúgy tranziens esetben is célszerű lehet az első néhány iteráció során kapott értéket figyelmen kívül hagyni.

Abból adódóan, hogy a fő függvények (tárolás és számítás) a külső megoldó ciklusban kerülnek meghívásra, a módszer használt megoldó algoritmustól (csomagtól) függetlenül használható. Az eredmények azonban a megoldó csomagtól és annak beállításától függően eltérőek lesznek.

A módszerben számolt statisztikák egyike se ad közvetlen információt a konvergencia meglétére vagy sebességére. A módszer kiegészíthető további, a konvergencia jellegét tükröző statisztikával. Ezekkel szemben is követelmény a rekurzív számíthatóság. Erre a célra alkalmas lehet egy olyan súlyozott átlag számítása, ahol a súlyok az iteráció számától függően (pl. exponenciálisan, 1-eshez nagyon közeli kitevőkkel) növekednek és/vagy csökkennek.

Ebben az esetben a súlyok számítása során tekintettel kell lenni a lebegőpontos számok ábrázolásának korlátaira.

ÖSSZEGZÉS

A numerikus szivárgáshidraulikai modellezés során előfordulhatnak olyan esetek, amikor a rendelkezésre álló megoldó algoritmusok nem járnak sikerrel. Már egészen egyszerű esetben is nem lineáris hatások vagy egyéb okok miatt körülményessé válthat a megoldás. Iteratív megoldás esetében az egyes lépések során kapott köztes eredmények figyelembe vételén alapuló módszer segítséget nyújthat a probléma okainak megtalálásában. A bemutatott módszer beépíthető a modellezés eszköztárába.

FELHASZNÁLT IRODALOM

[1] Harbaugh, A. W.: MODFLOW-2005, The U.S. Geological Survey modular ground-water model — the Ground-Water Flow Process. U.S. Geological Survey Techniques and Methods 6–A16, 2005

[2] McDonald, M.G., Harbaugh, A.W., Orr, B.R., Ackerman, D.J.: A method of converting no-flow cells to variable-head cells for the U.S. Geological Survey modular finite-difference ground-water flow model. U.S. Geological Survey Open-File Report 91–536, 1992, 99 p.

[3] Niswonger, R. G., Panday, S., Ibaraki, M.: MODFLOW-NWT, A Newton formulation for MODFLOW-2005. U.S. Geological Survey Techniques and Methods 6–A37, 2011, 44 p.

[4] Osiensky J. L., Williams R. E.: Potential Inaccuracies in MODFLOW Simulations Involving the SIP and SSOR Methods for Matrix Solution. Groundwater 35 (2), 1997, 229 – 232 old.

[5] Mehl, S.: Use of Picard and Newton Iteration for Solving Nonlinear Ground Water Flow Equations. Groundwater 44 (4), 2006, pp 583 – 594

[6] Naff, R. L., Banta, E.R.: The U.S. Geological Survey modular ground-water model—

PCGN: A preconditioned conjugate gradient solver with improved nonlinear control.

U.S. Geological Survey Open-File Report 2008 – 1331, 2008, 35 p.

[7] Biesel, H. R.: Recursive calculation of the standard deviation with increased accuracy.

Chromatographia 10 (4), 1977, pp 173-175

116

GÉPI TANULÁST SEGÍTŐ FÜGGVÉNYKÖNYVTÁRAK ÁTTEKINTÉSE REVIEW OF MACHINE LEARNING TOOLBOXES

FÜVESI Viktor1, KONYHA József2

1Ph.D., tudományos munkatárs, fuvesi@afki.hu

2tudományos segédmunkatárs, konyha@afki.hu

1,2Miskolci Egyetem, Alkalmazott Földtudományi Kutatóintézet,

1,2Műszerfejlesztési és Informatikai Osztály

Kivonat: Ebben a cikkben a gépi tanulási módszerek, azon belül is mesterséges neurális hálózatok, modellezését és szimulációját segítő függvénykönyvtárak rövid áttekintését szeretnénk megtenni. Mivel a szóba jöhető csomagok listája igen hosszú, ki szeretnénk emelni azokat a gyűjteményeket, amelyek lehetőséget biztosítanak a számítógépben található grafikus vezérlő számítási kapacitásának kiaknázására, valamint ingyenesen használhatók. Az áttekintés során két programozási nyelvet és környezetet is érintünk. Rövid példákkal be is mutatjuk a szélesebb felhasználó táborral rendelkező szoftvercsomagok használatát és összehasonlítjuk azok képességeit is.

Kulcsszavak: gépi tanulás, neurális hálózat, függvény könyvtár, mátrix szorzás, összehasonlítás

Abstract: In this article a brief overview is given about toolboxes of machine learning, which give some help for the modelling and simulation of neural networks. The list of the potential packages are real long, so we will highlight the libraries, which provide the opportunity to use calculation power of the graphics controller of the computer and open source. During the overview two programming languages and environment will be respected. Using short examples the application of function libraries with wider user camp will be introduced and their features will be compared.

Keywords: machine learning, neural network, toolbox, matrix multiplication, comparison

1. BEVEZETÉS

Számos olyan probléma létezik, amely megoldása a hagyományos matematikai módszerek segítségével nehézkes, számításigényes feladat, de az ember könnyedén megbirkózik a problémával. Az ilyen esetekben alkalmazhatóak a mesterséges intelligencia területéhez tartozó módszerek. A mesterséges intelligencia egyik alapkövét képezi a gépi tanulási eljárások [1], amelyek az új körülményekhez való adaptálódáshoz, mintázatok felismeréséhez és általánosításhoz kapcsolódó feladatokat megoldani képes módszereket gyűjti magába [2].

A szóba jöhető problémák a következő öt nagyobb csoportba sorolhatók: osztályozási és regressziós feladatok, klaszterezés, eloszlás becslés problémája és dimenzió csökkentés.

Osztályozási feladatok során, ha az általánosabb többosztályos problémára gondolunk, minden tanító pont az N osztály valamelyikéhez tartozik. A cél egy olyan függvény előállítása, amely új adatpont esetén pontosan megjósolja az új pont osztályát [3]. Egy jó példa lehet erre a kézzel írt számjegyek felismerése. A regressziós feladat nagyon hasonló az osztályozási problémához, de itt az előállítandó függvény egy közelítést ad az új pontra. Erre lehet példa egy motor sebesség profiljának becslése vagy a tőzsde változásainak előrejelzése [4]. Az előbbi két probléma a felügyelt tanulás (supervised learning) témakörébe tartozik [5]. A felügyelet nélküli tanulásra (unsupervised learning) példa a dimenzió csökkentés és a klaszterezés feladatai. Ezekben az esetekben kiindulásképpen azok a jelöletlen adatpontok állnak rendelkezésre, amelyekben mintákat szeretnénk felismerni, de semmilyen közvetlen információnk nincs a megoldásra vonatkozóan. A dimenzió csökkentés

117

során, egy magasabb leképezésű adathalmaznak az alacsonyabb leképezéssel bíró, transzformált változatát keressük úgy, hogy az adatban rejlő, felhasználás szempontjából fontos, információk ne sérüljenek [6]. Ezt a módszert lehet használni, adattömörítéshez, zajszűréshez, de adatok struktúrájának feltáráshoz is [6]. A klaszterezés során az adatokban rejlő belső struktúrákat kell felismerni, csoportokba kell sorolni az adatokat. Erre lehet példa a szociális hálózatban található, azonos preferenciával rendelkező adatok csoportosítása [7].

Utoljára maradt az eloszlás becslés, ahol azt próbáljuk megmondani, hogy egy új adatpont a korábbiakhoz illeszkedik-e vagy sem. Ezt a módszert újdonság detektáláshoz lehet felhasználni [8].

A gépi tanulás problémájának áttekintése után nézzük meg milyen függvénycsomagok állnak a felhasználó rendelkezésére, ha ezzel a területtel kíván foglakozni. Az áttekintésben különös figyelmet szentelünk a neurális hálózatok alkalmazásának lehetőségének és a számítógépben található grafikus kártyák (GPU) általános számításokra való felhasználására.