2 Úthálózati elemek térképezése
2.2 Útszakaszok és úthálózat térképezése
2.2.2 Hálózati szemléletmód alkalmazása utak detektálása során
Az irodalomban bemutatott útszakasz detektálási megoldások némelyike a nagyobb geometriai és topológiai pontosság érdekében az egyes megtalált és felismert szakaszokat hálózatokká igyekezett alakítani. Ezeknek a filozófiája szorosabban kötődik az utak hálózati szerepéhez. A képfeldolgozási technikákat ötvözni lehet olyan számítási módszerekkel, amelyek kifejezetten struktúrákba szerveződő elemeket képesek kinyerni vagy azok közül bizonyosakat kiválasztva lehet magukat a struktúrákat felismerni. Az úthálózatok kapcsán ilyen eszköznek tekinthetjük a számítógépes látás témakörében használt Hough- és Radon-transzformációkat.
A Radon-transzformáció (RT) x és y képkoordinátákra felírható függvény integráltranszformációja, amely tetszőleges θ elforgatás mellett kapható új képkoordinátákat szolgáltatja a következők szerint:
A gyakorlatban az integrálás helyett összegzést végeznek, ahol a lényeges paraméterek a θ szög és x’ felbon-tása. A transzformáció eredménye, az ún. sinogram felületnek is tekinthető, amelynek lokális maximumhelyei a nagyobb megbízhatóságú vonalas képtartalmat (pl. utakat) jelentik. Ezeknek a lokális maximumoknak az automatikus kiválasztása után végzett inverz Radon-transzformáció (IRT) visszatérést biztosít az intenzitás térre. A transzformáció és inverze működését tekintve analóg a Fourier-transzformációval (FT) illetve annak inverzével (IFT), nevezetesen a Fourier-térben végzett kiválasztás után történő inverz transzformáció már csak a kiemelendő objektumféleséget szolgáltatja. (A Fourier-transzformációhoz kötődő szoros kapcsolatot az orvosi gyakorlatban a tomográfiai felvételek feldolgozásában ki is használják.)
A Radon-transzformáció ismert tulajdonsága az, hogy forgatásinvariáns. Ennek igazolására saját példa lát-ható a 2.6. ábrán (Tóth & Barsi, 2005).
a) az eredeti útkereszteződés éleinek képe b) az a) ábra Radon-tere
c) -90°-kal történt elforgatás d) a c) ábra Radon-tere
e) +180°-kal történt elforgatás f) az e) ábra Radon-tere
2.6. ábra: Forgatásinvariáns jelleg kimutatása háromágú útkereszteződés példáján keresztül. A Radon-térben a két út mindkét széléhez tartozó él jelentkezik a négy markáns csomópontban a hasonló sinogram-mintázat mellett
A 2.7. a ábrán a budapesti agglomerációban található Maglód település pókhálószerű utcahálózatának sinog-ramja látható. Az RT előtt a nyers űrfelvételt bikubikus interpolációval 5 m-es felbontásra újramintavételez-tem, majd az utcák intenzitástartományára fókuszált küszöböléssel bináris képpé alakítottam és cirkuláris átlagoló szűrővel simítottam. A vörös árnyalatú helyek jelentik a lokális csomósodásokat, amelyeket küsz-öböléssel kiválasztva, majd az IRT elvégzésével azok az eredeti 61 cm terepi geometriai felbontású Quick-bird űrfelvételre rajzolva megmutatják a település szerkezetének főbb elemeit (2.7. b ábra).
a) Az űrfelvétel Radon-transzformáltja b) A legnagyobb intenzitású metszéspontból visszanyert egyenesek képe az eredeti űrfelvételen
2.7. ábra: Maglód űrfelvételén a főbb utak detektálása Radon-transzformációval
A Radon-transzformációval végzett kísérletek alapján megállapítható, hogy út- és utcahálózatra alapozott városszerkezeti elemzés ilyen megoldással végezhető (Arpad Barsi, 2011). A módszer hátránya, hogy a Ra-don-transzformációból kizárólag egyenesek képe kapható meg, így összetett hálózat esetében az utak egye-nes szakaszai detektálhatók ily módon. A bonyolult töréspontokból álló úthálózat, továbbá az ívelt útszaka-szok a megoldás révén nem térképezhetők. Ennek ellenére a szabályos jelleggel kialakított területek útinfra-struktúrája (pl. amerikai nagyvárosok) számára a módszer alkalmazható.
Összetett hálózat kezelésére ezért másik MI-módszert vizsgáltam meg. Fritzke 1995-ben közzétett egy cik-ket, amelyben növekvő neurális gáz (growing neuron gas – GNG) algoritmusát adja meg topológiával rendel-kező adatokra (Fritzke, 1995). A módszer adaptációja digitális képeken leképződött úthálózat esetében ezért reményteli volt. Az eredeti algoritmus tetszőleges mennyiségű n-dimenziós adatponttal működik. A kompe-titív Hebb-tanulási szabályt alkalmazó módszer számítási csomópontokból és azok közötti élekből definiált gráfon működik (Fritzke, 1998). Az élek egységsúlyúak, csupán a topológia definiálásához van rájuk szükség.
Az eljárás során az élekhez életkort, a csomópontokhoz hibaértéket rendelünk. Az egyes iterációs lépésekben ezek módosításra kerülnek.
Az implementált eljárás a következő lépéseket tartalmazta:
(1) két kezdeti neuron pozíciójának (súlyvektorának) felvétele (wa és wb), a neuron közötti összekötöttséggel (Aa,b)
(2) a legközelebbi s1 és második legközelebbi s2 csomópont kiválasztása Eukli-deszi távolságnorma szerint
(3) s1 éleihez tartozó kor megnövelése
(4) ws1 csomóponti pozíció és ξ adatponti pozíció közötti hiba négyzetének kiszámítása:
2
,1 1
s ws ,
ugyanez minden csomópontra is kiszámításra kerül
(5) s1 és minden kapcsolódó n szomszédjának mozgatása ξ adatpont felé εb és εn
As ), annak életkorának megnövelése; ha nem létezik az él, annak létrehozása
(7) minden amax-nál idősebb él törlése; ha diszjunkt pont keletkezik, akkor annak törlése is
(8) minden λ lépésben
a. a legnagyobb hibájú q csomópont kiválasztása
b. q legnagyobb hibájú kapcsolódó f szomszédjának kiválasztása c. r új csomópont létrehozása q és f közé: wr
wqwf
2 1
d. rq és rf élek létrehozása, qf él törlése
e. q és f csomópontok hibájának csökkentése α tényezővel f. r hibájának beállítása q új hibaértékére
(9) minden csomópont hibájának csökkentése d tényezővel
(10) az iteráció befejezése a maximális lépésszám elérésekor vagy vissza a 2.
lépésre
Az eljárás futtatásához színes ortofotón előkészítő képfeldolgozó lépéseket végeztem. Először az RGB-sávokban egyszerű intenzitás alapú küszöbölést végeztem az utakat alkotó pixelek kiválogatásához. A három sávon belül a küszöböknek megfelelő pixeleken HSV színtérre tértem át, majd az árnyalatcsatornán végzett
küszöbölésre erózióval simítottam a bináris képet. Az adatpontok számának csökkentése érdekében minta-vételeztem az eredményképet, majd a pixelek x és y pozícióiból létrehoztam a kétdimenziós adatpontok halmazát.
A növekvő neurális gáz algoritmust a következő paraméterezés mellett lefuttattam az adathalmazra:
2.3. táblázat: Útdetektálási GNG paraméterkészlete
Paraméter Érték
Maximális neuronszám 200
Maximális iterációszám 80000
Neuron beszúrási arány (λ) 100
Hibacsökkentési tényező (d) 0.0005
A győztes súlymódosítási tényezője (b) 0.005 A győztes kapcsolódó szomszédainak súlymódosítási
tényezője (n)
0.0006
Maximális éléletkor (amax) 50
Hibacsökkentési tényező új csomópont létrejöttekor (α) 0.5
A beállításokkal elvégzett elemzés eredménye a 2.8. ábrán látható (Barsi, 2008).
2.8. ábra: Növekvő neurális gáz (GNG) segítségével azonosított utcahálózat 0.2 m-es terepi geometriai felbontású légi-fényképen
A növekvő neurális gáz eljárása tehát minél jobb illesztés esetén egyre nagyobb súlyt rendel a csomópon-tokhoz. A megoldás a kapcsolatok létrehozásával és megszüntetésével dinamikusan kezeli a neurális gázt, ugyanakkor a hálózat mérete szabályozható. Szerencsés, hogy a számítás elkezdéséhez nincs szükség előzetes helyadatokra, az iteráció során önszerveződő módon alakul ki a hálózat.