Vonalkódok és természetes vizuális azonos´ıtók felismerése valós id˝oben

(1)

felismer´ ese val´ os id˝ oben

Katona Melinda és Nyúl László Szegedi Tudományegyetem

Képfeldolgozás és Szám´ıtógépes Grafika Tanszék {mkatona, nyul}@inf.u-szeged.hu

Absztrakt. Az automatikus azonos´ıtás egyik legfontosabb és széles kör- ben alkalmazott eleme a vizuális kódokkal történ˝o azonos´ıtás, mely a kereskedelmi folyamatoknak szinte elválaszthatatlan része (pl. UPC vo- nalkódok), és a mobil kommunikációnak köszönhet˝oen a hétköznapi élet- ben is egyre elterjedtebb (pl. QR kódokba ágyazott webc´ımek és le´ırások).

A különböz˝o szimbólumokkal megjelen´ıtett azonos´ıtók teszik lehet˝ové a gépek számára az elektronikus leolvasást, ami nagyban seg´ıti és gyors´ıtja az információ áramlását pl. a bolti pénztáraknál, raktári átvételnél, nagy sebesség˝u feldolgozási helyeken pl. futószalagokon. Ismertetünk egy új, saját fejlesztés˝u algoritmust 1D-s kódok detektálására, valamint egy má- sik új, saját eljárást QR kódok megtalálására. Bemutatásra kerül egy konkrét gyakorlati azonos´ıtási probléma megoldására kidolgozott saját eljárás is.

1. Bevezet´ es

A vonalkódos azonos´ıtás széles körben elterjedt a mindennapi életünkben és számos eljárás létezik azok gyors és megb´ızható azonos´ıtására. A kódok loka- lizálására, az alkotó komponensek poz´ıcióinak és jellemz˝oinek meghatározásá- ra a legtöbb eljárás automatikus képszegmentálási technikát alkalmaz. Jelen közleményünkben mesterséges és természetes kódok szegmentálásával is foglal- kozunk.

A vonalkódok az emberek számára nem olvashatók, ezt az erre alkalmas dekódoló eszközök valós´ıtják meg. A vonalkódok leggyakoribb felhasználási te- rülete a kereskedelem, például az áruk csomagolásán, amely lehet˝ové teszi az

´

aru adatainak, úgy mint a gyártó ország, a gyári szám és a termék cikkszáma gyors azonos´ıtását. A jelekkel megjelen´ıtett azonos´ıtó számok teszik lehet˝ové a gépek számára az elektronikus leolvasást, ami nagyban seg´ıti és gyors´ıtja az információ áramlását. A különböz˝o vonalkódt´ıpusok sajátos jellemz˝okkel rendelkeznek, melyek seg´ıtik a lokalizálásukat. Az 1. ábra a f˝obb 1D-s és 2D-s kódokat szemlélteti.

A vonalkód lokalizáló eljárások meg´ıtélésének két f˝o szempontja a sebesség

´

es a hatékonyság. Ipari környezetben a hatékonyság kritikus tényez˝o, egy-egy hibás detektálásnak komoly költségvonzatai lehetnek. A feldolgozási sebesség a detektor jóságának másodlagos elvárt összetev˝oje. Mobil készülékek esetében

(2)

1. ábra: F˝obb vonalkód t´ıpusok (balról jobbra). Fels˝o sor (1D kódok): Code39, Cod- abar, Code128, UPC-A; Középs˝o sor (1D kódok): UPC-E, EAN-13, EAN-8, I2of5; Alsó sor (2D kódok): Codablock, PDF417, Data Matrix, QR.

a hatékonyság kevésbé kritikus azóta, amióta a felhasználó és a telefon inter- akcióban vannak egymással, és ´ıgy újabb és újabb felvételek kész´ıthet˝ok a de- tektálni k´ıvánt kódról. Ez esetben egy gyors procedúra a k´ıvánatos. Számtalan technika létezik a vonalkódok digitális képekr˝ol való lokalizálására és dekódolá- sára a vonalszkennelést˝ol [1, 7] a morfológiai megközel´ıtéseken keresztül [2–5] a konvex burkon át [6] egészen a waveletekig [12].

2. Algoritmusok

A digitális képek min˝osége manapság kevésbé kifogásolható, bár készülnek gyen- ge min˝oség˝u felvételek is. A min˝oségromlás oka pl. lehet maga a digitalizáló eszköz, illetve a környezet okozta nehézségek. Mindezek miatt gyakran szükséges a feldolgozás els˝o lépéseként a kép min˝oségének jav´ıtása a konkrét elemzés el˝ott.

2.1. 1D vonalkódok detektálása mintaillesztéssel

Ebben a fejezetben bemutatjuk egy új, saját fejlesztés˝u algoritmusunkat 1D-s vonalkódok lokalizálására. Az algoritmus alapjául a mintaillesztés szolgál. Az eljárást összefoglaló folyamatábra a 2. ábrán látható, a fontosabb lépések rész- eredményeit pedig a 3. ábra illusztrálja.

Az újramintavételezést követ˝oen a kapott RGB képet L*a*b* sz´ıntérbe kon- vertáljuk. A kés˝obbi feldolgozásban már csak az L* (fényesség) csatornát hasz- náljuk és az ´ıgy kapott többszint˝u képpel dolgozunk. A bemenetként kapott képek nem ideálisak, emiatt a képet éles´ıtjük (3(b) ábra).

A detektálás folyamata bináris képek elemzésére épül, ezért az éles´ıtett képet egy globális küszöbértéket meghatározva binarizáltuk (3 (c) ábra). A képek min˝oségét zaj is ronthatja. A binarizált képen ezek kisz˝urésére el˝obb méret alapú küszöbölést, majd az objektumok téglalapalakúságát is vizsgáltunk. A

(3)

2. ábra:A vonalkód lokalizáló eljárás folyamata

mintaillesztéshez el˝okész´ıtett képet a 3(d) ábra illusztrálja. Annak analógiájára, hogy a kód sávjai párhuzamosak, az illesztéshez használt minta is két párhuza- mos fekete sávot tartalmaz.

A sablonillesztéshez a bemeneti szürkeárnyalatos kép és az illesztend˝o minta Fourier térben vett képét felhasználva ezeknek pontonkénti szorzata határozza meg az illeszkedés mértékét. A mintát 170^◦-ig 10^◦-onként tekintve és mindezek

¨

osszegezett eredményét vettük figyelembe a további feldolgozásban, tehát

17

X

i=0

F F T(I)×F F T(Ri∗T), (1)

ahol Iaz input kép,Ri (05i517) az aktuális forgatómátrix, T az illesztend˝o képet jelöli, F F T-vel pedig a gyors Fourier transzformációt jelöljük. Mivel a használt minta szimmetrikus, elegend˝o csak a [0^◦,180^◦) tartományban vizsgálni a minta illeszkedését. A kapott összegképet az átlaggal küszöböltük, majd az ´ıgy kapott objektumok középpontjainak koordinátáit eltároltuk.

Az egy klaszterbe tartozó pontok jól elkülönülnek, ´ıgy a megadott képre távolságtérképet számoltunk (3(e) ábra). Annak meghatározására, hogy az adott objektum területén az eredeti képen vonalkód helyezkedik-e el, el˝obb az eltárolt illesztésb˝ol ered˝o középpontokat háttérpontokként definiáltuk újra a küszöbölt képen (3(g) ábra). A priori ismeretként szolgált, hogy egy vonalkód legalább

(4)

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

(j) (k) (l)

3. ábra:Az 1D vonalkód detektálására javasolt módszer köztes lépései. (a) input kép, (b) éles´ıtés után, (c) binarizálás, (d) téglalap alakúság vizsgálat, (e) távolságtérkép, (f) küszöbölt távolságtérkép, (g) illesztett pontok az objektumokban, (h) lyukak szerinti küszöbölés, (i) a (d) eredményképe dilatáció után, (j) a (h) utáni illeszked˝o objektumok az (i) képen, (k) morfológiai nyitás, (l) detektált kódok

nyolc sávból áll, ezért csak azon objektumokat tartjuk meg, melyek legalább ennyi háttérpontot tartalmaztak. Ennek a sz˝urésnek az eredményét láthatjuk a 3(h) ábrán.

A következ˝o lépésben az eredeti kép binarizált változatán, amit már korábban megadtunk, egy négyzet alakú, 2x2-es méret˝u szerkeszt˝oelemmel nyitást alka-

(5)

lmaztunk. Erre a lépésre azért volt szükség és azért ilyen kicsi szerkeszt˝oelemmel, hogy az összetartozó régiók valóban összeérjenek, de hamis szegmensek ne olvad- janak össze. A 3(i) ábra szemlélteti ezt a lépést. A meglév˝o háttérpontok ko- ordinátáit felhasználva a dilatált képen csak azon objektumokat tartottuk meg, melyeknek az adott koordinátapontján objektumpont helyezkedett el (3(j) ábra).

A kapott eredményképen az egyes vonalkódot alkotó sávok jól elkülön´ıthet˝ok.

Ahhoz, hogy ezek egy egységként jelenjenek meg, morfológiai nyitást alkalmaztunk négyzet alakú szerkeszt˝oelemmel, melynek méretét annak függvényében határoztuk meg, hogy mekkora volt az egyes objektumokban a sávok közötti maximális távolság. Ezáltal biztos´ıtott, hogy minden vonalkódot alkotó sáv egy

¨

onálló régiót alkosson. Ezt szemlélteti a 3(k) ábra.

2.2. QR kódok detektálására javasolt módszer

A következ˝okben bemutatjuk egy új, saját fejlesztés˝u eljárásunkat a 2-dimenziós QR kódok detektálására. Az eljárás f˝obb lépéseit összefoglaló folyamatábra a 4 ábrán, a f˝obb lépések részeredményei pedig a 5. ábrán láthatók.

4. ábra:A QR kódok detektálásának folyamata

Az újramintavételezést és a kvantálást követ˝oen a többszint˝u képen lokális sz˝urést végeztünk, melyben az adott pixelpoz´ıció 3×3-as környezetében az intenzitásértékek szórása adja a sz˝urt képen az adott pixel értékét. Ezek az

´

ertékek [0,1] intervallumba normáltak (5(b) ábra). Ebb˝ol egyszer˝u küszöbölési technikával bináris képet áll´ıtottunk el˝o (5(c) ábra). A küszöbértéket az inter- vallum felénél határoztuk meg. A kapott bináris képet felhasználva az eredeti szürkeárnyalatos képen minden olyan pixel intenzitásértékét 0-ra módos´ıtottuk, ahol a bináris képen objektumpontot találtunk(5(d) ábra) seg´ıtve ezzel a további feldolgozást.

(6)

(a) (b) (c)

(d) (e) (f)

(g) (h) (i)

5. ábra: A javasolt módszer köztes lépései. (a) input kép, (b) elválasztó vonal kira- jzolása, (c) binarizálás, (d) intenzitásértékek módos´ıtása, (e) morfológiai nyitás, (f) küszöbölt LoG sz˝urt kép, (g) postprocesszálás, (h)-(i) eredménykép

Azért, hogy intenzitásértékben egy jól meghatározott környezetben a pixel-

´

ertékek minimális vagy maximális szürkeségi értéket vegyenek fel, és ezáltal el˝oseg´ıtsék az összetartozó szegmensek szegmentálását, többszint˝u morfológiai nyitást végeztünk. Az ´ıgy kapott képen a QR kód terület jól láthatóan elkülö- n´ıthet˝o, ahogy a 5(e) ábrán is látható. A következ˝o lépésben egy LoG (Laplacian of Gaussian) sz˝urést hajtottunk végre, amit egy küszöbölés követett, mivel a fel- dolgozás kés˝obbi lépéseiben már bináris képpel dolgoztunk tovább (5(f) ábra).

A nem szorosan összetartozó szegmensek elválasztása céljából egy kisebb szerkeszt˝oelemmel morfológiai eróziót hajtottunk végre (5(f) ábra).

A további m˝uveletek sorozata felfogható egyfajta utófeldolgozásnak. Minden olyan objektumpontot megtartottunk a sz˝urt képb˝ol, ahol a különböz˝o jellemz˝ok vizsgálata után kapott kép is objektumpontot tartalmazott. A 5(g) ábra il- lusztrálja ennek a m˝uveletnek az eredményét.

Az (1) formulát alkalmazva, majd az ott le´ırt küszöbölést felhasználva kisz˝ur- tük a valósnak vélt vonalkód területeket. QR kódok esetében nem szimmetrikus sablont használtunk, de elegend˝o volt az 1D-s esethez hasonlóan egy sablonnak az elforgatottjait vizsgálni. A 5(h) és 5(i) ábra a kapott eredményképeket mutatja.

(7)

3. Ki´ ert´ ekel´ es

Ebben a fejezetben a bemutatott saját algoritmusok, valamint a szakirodalom- ban közölt eljárások hatékonyságát vetjük össze adott jellemz˝ok mellett. A ké- s˝obbiekben az egyes algoritmusokra való hivatkozáshoz bet˝uszavakat vezettünk be, melyek a következõk: LINB (Lin és Lin alapvet˝o képm˝uveleteket használó eljárása) [8], LINM (Lin és Lin futáshosszok szám´ıtásán alapuló eljárása) [9], OHBUCHI (Ohbuchi et al. lokális küszöbölésen alapuló eljárása) [10] valamint Saját1D és SajátQR az általunk kidolgozott új algoritmusok 1D-s ill QR kódok detektálására. A [5] cikkben közölt algoritmusunk hatékonyságát is vizsgáltuk, a Saját1D bet˝uszó alatt 2012 évszámmal jelezve.

3.1. Teszthalmaz, tesztkörnyezet, implementáció

Digitálisan tesztképeket generáltunk a 1. ábrán bemutatott 1D-s vonalkódt´ıpu- sokat alapul véve. Mindehhez elegend˝o volt a különböz˝o kódokból egyet-egyet kiválasztani. A tesztképek egy darab vonalkódot tartalmaznak és különféle tor- z´ıtásokkal terheltek.

A generált képeink a következ˝o tulajdonságokkal rendelkeznek: a képeket 15^◦-onként elforgattunk 0^◦-tól 180^◦-ig, Gauss elmosást alkalmaztunk 3×3- as szerkeszt˝oelemmel és 6 különböz˝o σ-val, valamint addit´ıv zajt is adtunk a képekhez 10%-os léptékkel a 0% és 50% közötti intervallumban. Összegezve tehát 8 különféle t´ıpusú vonalkódból 12 orientációban, 6 különböz˝o sim´ıtású Gauss sz˝ur˝ovel és 6 eltér˝o mérték˝u addit´ıv zajjal terhelve, perspekt´ıv torzulással,

¨

osszesen közel 15 000 képet generáltunk. További 4220 vonalkódot tartalmazó valós életbeli képet is felhasználtunk a The WWU Muenster adatbázisból. Ezen képeken semmiféle manipulációt nem hajtottunk végre, de eleve torz´ıtásokkal terheltek, nem ideálisak. A 6. ábrán látható néhány különböz˝o torz´ıtással terhelt generált és valós tesztkép.

6. ábra: Generált minta 1D tesztképek különböz˝o torz´ıtások mellett, valamint valós példák

(8)

A QR kód detektáló algoritmusok kiértékeléséhez meglév˝o képi adatbázisokat használtunk. Egy közel 1400 valós tesztképb˝ol álló adatbázis [11], valamint 10 000 szintetikus tesztkép állt a rendelkezésünkre. A 7. ábrán szintetikus és valós képek láthatók a teszthalmazokból.

7. ábra:Valós és szintetikus QR kódokat tartalmazó tesztképek

3.2. Metrik´ak

Az algoritmusok hatékonyságának mérésére a Jaccard-féle hasonlósági együttha- tót vettük alapul, ahol a tényleges és a detektált kódrégiók befoglaló téglalapjá- nak átfedését vizsgáltuk. Azon egyedek fognak true pozit´ıv példának megfelelni, tehát valós kódterületnek bizonyulni, melyeknél a detektált objektum legalább 90%-ban fedésben áll az el˝ore meghatározott területtel. Minden olyan objektu- mot hamis pozit´ıv példának tekintünk, mely detektált, de ennél kisebb, vagy egyáltalán nincs fedésben semmilyen vonalkód területtel. Hamis negat´ıv példák lesznek azok, melyek ugyan vonalkód területek, de az algoritmus nem detektálta

˝

oket. Az eredmények ismeretében megállap´ıtható, hogy az összes vizsgált algoritmus hatékonyan képes vonalkód detektálásra.

Korábban eml´ıtettük, hogy a generált tesztképek különböz˝o mérték˝u hozzá- adott zajt, sim´ıtást, elforgatást, nyújtást, illetve perspekt´ıv torzulást tartalmaznak. Az elforgatás, nyújtás, perspekt´ıv torzulás nem érinti az egész képet, csak a vonalkódot. A tapasztalat azt mutatta, hogy az eljárások az elforgatásra, nyújtásra, és perspekt´ıv torzulásra invariánsak, ezért a továbbiakban csak a zaj

´

es a sim´ıtás jellemz˝ok hatását vizsgáljuk.

(9)

3.3. Eredm´enyek

Az 1D vonalkód detektáló eljárások összehasonl´ıtásának eredményeit a 1. táblá- zatban, m´ıg a futási id˝oket a 2. táblázatban foglaltuk össze, a szintetikus és a valós képhalmazokra lebontva. Megállap´ıtható, hogy mindegyik vizsgált eljárás gyorsan képes detektálni a vonalkód szegmenseket és a sebességbeli szórás sem számottev˝o.

A QR kódokat detektáló eljárások összehasonl´ıtásának eredményeit a 3. táb- lázat, m´ıg a futási id˝oket a 4. táblázat mutatja. Az 1D-s esethez képest az algoritmusok kisebb hatékonysággal képesek detektálni a k´ıvánt területet, ugyanakkor még ez az eredmény is elfogadható. Látható a 3. táblázatban, hogy közel ugyan- akkora hatékonysággal képesek a valós tesztképeket detektálni, mint a szin- tetikusakat. OHBUCHI algoritmusa láthatóan nagyon gyors, ugyanakkor el- mondható, hogy ennek a gyorsaságnak az ára (nem meglep˝o módon) a hatékonyság csökkenése.

Az eredményekb˝ol látszik, hogy az összehasonl´ıtásban szerepeltetett mindegyik (különböz˝o alapelven m˝uköd˝o) vonalkód detektáló algoritmus hatékony, de a javasolt új módszereink mutatták a legnagyobb hatékonyságot.

4. K´ epfeldolgoz´ o elj´ ar´ as egy hibrid vizu´ alis k´ od felismer´ es´ ere

Egy olyan lehetséges hibrid vizuális kódot mutatunk be, melyben egy jól definiált mesterséges azonos´ıtó (egy QR kód) és egy mesterséges úton el˝oáll´ıtott (szórt részecskék alkotta) természetes mintázat jelenik meg egy közös képtérben. A továbbiakban ezen hibrid azonos´ıtóra az NFI (Natural Feature Identifier) bet˝u- szóval hivatkozunk.

A mesterséges és természetes azonos´ıtó kombinációjával adott c´ımke közepén egy megadott méret˝u standard QR kód helyezkedik el, mely releváns adatot kódol. A QR kód környezetében véletlenszer˝uen szétszórt glitterek helyezked- nek el, egy meghatározott vastagságú és sz´ın˝u keretben. A glitterek száma, sz´ıne, mérete, alakja, poz´ıciója nem kötött, tekinthet˝ok random mintáknak is. A 8. ábrán látható ezekre néhány példa.

A c´ımkék nyomdai úton készülnek és felhelyezés után roncsolódás nélkül nem távol´ıthatók el. A nyomdai m˝uveletsor egy lépésében a c´ımkékr˝ol referenciakép készül ideális fényviszonyok és kamerapoz´ıció alkalmazásával.

A feladat mobil eszközzel fényképezett biztonsági c´ımkék adott részén vélet- lenszer˝uen elhelyezked˝o részecskék helyének meghatározása alapján a c´ımkével megjelölt objektumok azonos´ıtásának támogatása. Az algoritmusnak átlagos mo- bilkészülékkel készült képeken kell dolgoznia, mely torz´ıtásokat tartalmazhat.

Elvárás továbbá, hogy egy kép feldolgozása valamint a kód ellen˝orzése mobil eszközön is rövid id˝o alatt (<1.5 s) elvégezhet˝o legyen.

Az alapprobléma három lépésre bontható: képalkotás, képfeldolgozás, azono- s´ıtás. A képalkotás, vagyis az NFI c´ımkér˝ol történ˝o fénykép kész´ıtése a mobil eszköz standard beép´ıtett funkcióival elvégezhet˝o. A képfeldolgozás rész végzi a

(10)

1. táblázat:Az algoritmusok hatékonysága (H), lefedettsége (L), valamint pontossága (P) (százalékban) valós és szintetikus 1D kódot tartalmazó tesztképeken

LIN Saj´at1D

LINB LINM 2012 2014

H P L H P L H P L H P L

szintetikus88.597.3 99.879.0 100 94.099.9 95.897.499.6 98.9 val´os 93.868.9 93.888.167.6 88.294.490.2 94.497.098.1 97.0

2. táblázat:Az algoritmusok futási ideje (átlag (sec)±szórás)

LIN Saj´at1D

LINB LINM 2012 2014

szintetikus 0.724±0.214 0.974±0.148 0.023±0.010 0.625±0.150 val´os 0.981±0.281 0.795±0.726 0.259±0.335 0.683±0.283

3. táblázat:Az algoritmusok hatékonysága (H), lefedettsége (L), valamint pontossága (P) (százalékban) valós és szintetikus QR kódot tartalmazó tesztképeken

OHBUCHI LINM Saj´atQR

H P L H P L H P L

szintetikus87.3100.0 83.788.993.4 94.989.599.9 89.5 val´os 83.6 95.0 87.584.594.0 89.389.095.7 92.6

4. táblázat:Az egyes eljárások futási ideje (átlag (sec)±szórás)

OHBUCHI LINM Saj´atQR

szintetikus 0.011±0.007 1.004±0.073 0.267±0.023 val´os 0.237±2.225 1.225±0.809 0.419±1.346

(11)

8. ábra:Mintaképek az NFI c´ımkék protot´ıpusára különféle torz´ıtások mellett

nyers fényképeken a c´ımke területének megtalálását, a c´ımke részét képez˝o QR kód detektálását, az NFI régió behatárolását, a glitterek detektálását, továbbá a glitterekhez a képb˝ol kinyerhet˝o le´ırók meghatározását. Az azonos´ıtás, hiteles´ıtés a képfeldolgozó fázisból kapott le´ıró adatsorok alapján végzi el az aktuális képen látható c´ımke összevetését a referencia adatokkal. E lépés végén kaphatunk egy egyszer˝u igen/nem döntést, vagy valami megb´ızhatósági értéket arra vonat- kozóan, hogy az adott c´ımke eredeti (hiteles) vagy sem. Ebben a cikkben a képfeldolgozási feladatra szor´ıtkozunk.

4.1. A felismerés képfeldolgozási szakasza

A c´ımke specifikációjától függ˝oen különböz˝o képfeldolgozási megközel´ıtések kép- zelhet˝oek el. A mi megközel´ıtésünk fontosabb lépései az alábbiak:

1. QR kód helyzetének és orientációjának meghatározása

2. A glittereket tartalmazó zóna behatárolása és glitterek detektálása 3. Jellemz˝ok kinyerése

A QR kód elég jellegzetes mintázat (a kódolt tartalomtól függetlenül), ezért ennek detektálása közvetlenül is történhet a teljes képen. Mivel szükségtelennek bizonyult az eredeti (viszonylag nagy felbontású) képméret használata, ezért el˝oször újramintavételezzük a képet, ´ıgy lényegesen redukálva a feldolgozandó képpontok számát és ezzel a feldolgozási id˝ot. Egy alkalmas méretnek a 450 pixel széles felbontást választottuk (a kép magassága pedig az aktuális képaránynak megfelel˝oen alakul, hiszen a kamerák eltér˝o arányokkal dolgozhatnak).

Ezt követ˝oen a kapott RGB képet L*a*b* sz´ıntérbe konvertáljuk. A kés˝obbi feldolgozásban már csak az L* (fényesség) csatornát használjuk. A tapasztala- tok azt mutatták, hogy az RGB kép csatornáinak súlyozott összegével kapott

(12)

szürkeárnyalatos képnél, illetve a HSV sz´ıntérkonverziónál hatékonyabbnak bizonyult a L* csatorna használata. Az input képek nem ideálisak, adott esetben különféle torz´ıtásokkal terheltek, ezért valamiféle képjav´ıtó m˝uvelet elvégzése ajánlatos. A QR kód lokalizálásának további lépéseit az 1. algoritmus foglalja

¨

ossze. Azáltal, hogy meghatároztunk a QR kód helyzetét, az orientációja is meghatározhatóvá vált. A helymeghatározás köztes eredményképei a 9. ábrán láthatók.

1. algoritmus. QR kód helyzetének meghatározása 1. lépésKontraszt széthúzás

2. l´ep´esfmo:=f◦se1

3. lépésLoG sz˝urés 4. lépésfme :=fmo se2

5. l´ep´esfor minden komponensdo

if f˝oátló hossza > thresha and köralakúság< threshc

then

Lehetséges QR kód terület else

Nem vonalkód terület, elvetjük endif

endfor

6. l´ep´esf_me :=f_me⊕se₃

Az ´ıgy kapott képen meghatároztuk az objektum sarokpontjait, majd a kapott koordinátapontokat használtuk fel a rektifikált kép el˝oáll´ıtásához. Erre amiatt van szükség, hogy összehasonl´ıthatóvá válhassanak a kés˝obbiekben az input kép glittereinek jellemz˝oi a referencia adatbázisbeliekkel. A rektifikálás során a képet úgy transzformáljuk, hogy a QR kód valóban négyzet alakú területként jelentkezzen, mintha a kamera pontosan a c´ımke s´ıkjára mer˝oleges irányból kész´ıtette volna a felvételt, ráadásul úgy, hogy a kép sorai és oszlopai párhu- zamosak a QR kód f˝o irányaival.

Ahhoz, hogy a vizsgált kép ténylegesen összemérhet˝o legyen a referencia

´

ertékekkel, szükséges meghatározni a QR kód orientációját, vagyis, hogy a képen található QR kód hogyan helyezkedik el a tárolt poz´ıcióhoz képest. Annak meg- adásához, hogy a tekintett QR kód, illetve glitterzóna milyen mértékben van elforgatva, feltételezzük, hogy a referencia adatbázisbeli QR kód a szokásos irányultsággal rendelkezik (a 3 f˝o lokátor minta a fels˝o és baloldali sarkokban van). Az elforgatási szög megállap´ıtása is több lépésben történik. A QR kód referenciapontjainak szegmentálását a 2. algoritmus ismerteti.

(13)

9. ábra:A QR kód lokalizáció köztes eredményképei (sorfolytonosan): input kép, kon- trasztszéthúzást követ˝oen, morfológiai nyitás eredménye, LoG sz˝urés, küszöbölt LoG sz˝urt kép, nem összefügg˝o területek szétválasztása erózióval, köralakúság szerinti, illetve f˝oátló szerinti küszöbölés

2. algoritmus. Referencia négyzetek poz´ıcióinak megadása 1. lépésAdapt´ıv küszöbölés

2. lépésfcomp :=f⁻¹ 3. lépésLyukfeltöltés

4. lépésEuklideszi távolságtérkép szám´ıtása 5. lépésfmc := fcomp•se1

6. l´ep´esfor i:= 0, . . . , Mdo for j:= 0, . . . , N do

if fmc(i, j)> mina

then

f_mc(i, j)←1 else

f_mc(i, j)←0 endif

endfor endfor

(14)

A kapott eredmény tartalmazhat nem valós kód objektumokat is. Ezek kisz˝u- résére megalkottunk egy feltételrendszert. Mivel csak a kód területét vizsgáljuk,

´ıgy több prior információ is adott. A kritériumok megadásánál az egyes szegmensek középpontjait tekintettük. Elegend˝o azon területeket megtartani, melyek x, y koordinátái maximális vagy minimális értékeket vesznek fel a többi cen- troid viszonylatában, illetve ahol ha az x, y párok közül az egyik minimális, akkor a másik maximális. Mindezek után már csak a fennmaradó objektumok középpontjait tekintjük és ezek egymáshoz viszony´ıtott helyzetének vizsgálata megmutatja, hogy mely sarkokban található négyzet, amib˝ol megkapható a QR kód orientációja. A folyamat lépései láthatóak a 10. ábrán.

10. ábra:A QR kód orientációját meghatározó lépések

A QR kód helyzetének meghatározását követ˝oen az NFI zóna megtalálása a feladat. A specifikáció alapján adottak a QR kódot tartalmazó négyzet és a küls˝o négyzet oldalainak valós méretei (milliméterben). Ebb˝ol a képen detektált QR régió méretének ismeretében egyszer˝u szám´ıtással meghatározható az NFI zóna területe a képen. A kés˝obbi azonos´ıtáshoz szükséges még az NFI zóna középpontjának meghatározása a referencia koordináta rendszer megadásához.

A képfeldolgozást igényl˝o feladatok utolsó lépése a behatárolt NFI zóna területén elhelyezked˝o glitterek detektálása. Ezt adapt´ıv küszöböléssel végezzük a képen. A tévesen detektált objektumok különféle alaki jellemz˝ok alapján kisz˝urhet˝ok. Jelen algoritmusunk terület és köralakúság alapján tovább sz˝uk´ıtette a lehetséges valós glitterek számát. A folyamatot a 11. ábra szemlélteti.

4.2. Azonos´ıt´as

A képekb˝ol kinyerhet˝o információ lehet˝ové teszi, hogy a pontok páros´ıtásához jellemz˝ok széles palettája álljon a rendelkezésre. A glittereket tartalmazó zóna koordinátázását mindkét irányban a [-1.0, 1.0] intervallumban határozzuk meg, a koordinátarendszer origója pedig a QR kódmez˝o (és egyben az NFI zóna)

(15)

11. ábra:Glitterek szegmentálásának lépései

középpontja. Ebben a koordinátarendszerben keresünk a vizsgált c´ımkén de- tektált glitterekhez párokat a referencia képen talált glitterek között és a képb˝ol kinyert jellemz˝ok alapján egy alkalmasan választott hasonlósági mérték alapján tudunk dönteni az NFI kód elfogadásáról vagy elutas´ıtásáról.

5. Osszefoglal´ ¨ as

Ismertettük két új, saját fejlesztés˝u algoritmust, egyet 1D vonalkódok felis- merésére, m´ıg a másikat a 2D QR kódokra. Ezeket összehasonl´ıtottuk szakiro- dalmi algoritmusokkal, melyek között volt univerzális is (ami 1D és 2D kódt´ıpu- sokat is hatékonyan detektál) és olyanok is, amelyek 1D vagy 2D kódt´ıpusokra specializáltak. Az eljárások pontosságának és futási idejének vizsgálatára létre- hoztunk egy közel 15 000 és egy 10 000 tesztképet magában foglaló adatbázist. Az eredmények azt igazolják, hogy az új, bemutatott algoritmusaink hatékonysága mindkét kódt´ıpus esetében jobb, mint az összehasonl´ıtásban szerepl˝o szakiro- dalmi módszereké úgy ideális, mint torz´ıtásokkal terhelt képek esetén is. A futási id˝ok alapján jól látszik, hogy módszereinkhez valós idej˝u implementációk is kész´ıthet˝ok. Bemutattuk továbbá a vonalkódok és természetes azonos´ıtók egy gyakorlati alkalmazását is, és vázoltuk algoritmusunkat egy lehetséges hibrid vizuális kód felismerésére.

K¨ osz¨ onetnyilv´ an´ıt´ as

Az NFI azonos´ıtók felismerésével kapcsolatos kutatást az InterSoft Hungary Ltd.-n belüli R&D projekt finansz´ırozta és minden kereskedelmi célú jog a tá- mogató céget illeti.

A kutatás részben a T ÁMOP 4.2.4.A/2-11-1-2012-0001 azonos´ıtó számú Nem- zeti Kiválóság Program - Hazai hallgatói, illetve kutatói személyi támogatást biztos´ıtó rendszer kidolgozása és m˝uködtetése országos program c´ım˝u kiemelt projekt keretében zajlott. A publikációt a T ÁMOP-4.2.2.A-11/1/KONV-2012- 0073 azonos´ıtó számú Telemedicina fókuszú kutatások Orvosi, Matematikai és

(16)

Informatikai tudományterületeken (TOMI) c´ım˝u projekt támogatta. A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinansz´ırozásával valósul meg.

Irodalom

1. Robert Adelmann. Toolkit for bar code recognition and resolving on camera. In Phones - Jump Starting the Internet of Things. In: Informatik 2006 workshop on Mobile and Embedded Interactive Systems, 2006.

2. Péter Bodnár and László G. Nyúl. Efficient barcode detection with texture analysis.

In Signal Processing, Pattern Recognition, and Applications, Proceedings of the Ninth IASTED International Conference on, pages 51–57, 2012.

3. Péter Bodnár and László G. Nyúl. Improving barcode detection with combina- tion of simple detectors. InSignal Image Technology and Internet Based Systems (SITIS), 2012 Eighth International Conference on, pages 300–306, 2012.

4. Melinda Katona and László G. Nyúl. A novel method for accurate and efficient barcode detection with morphological operations. InSignal Image Technology and Internet Based Systems (SITIS), 2012 Eighth International Conference on, pages 307–314, 2012.

5. Melinda Katona and László G. Nyúl. Efficient 1D and 2D barcode detection using mathematical morphology. In Mathematical Morphology and Its Applications to Signal and Image Processing, volume 7883 ofLecture Notes in Computer Science, pages 464–475. 2013.

6. Suran Kong. QR code image correction based on corner detection and convex hull algorithm. Journal of Multimedia, 8:662–668, 2013.

7. Jian-Hua Li, Yiwen Wang, Yi Chen, Meng Zhang, Guo-Cheng Wang, and Ping Li.

Morphological segmentation of 2-D barcode gray scale image. JCP, 8:2461–2468, 2013.

8. Daw-Tung Lin and Chin-Lin Lin. Multi-symbology and multiple 1D/2D barcodes extraction framework. In Proceedings of the 17th International Conference on Advances in Multimedia Modeling - Volume Part II, pages 401–410, 2011.

9. Daw-Tung Lin and Chin-Lin Lin. Automatic location for multi-symbology and multiple 1D and 2D barcodes.Journal of Marine Science and Technology, 21:663–

668, 2013.

10. Eisaku Ohbuchi, Hiroshi Hanaizumi, and Lim Ah Hock. Barcode readers using the camera device in mobile phones. In Proceedings of the 2004 International Conference on Cyberworlds, CW ’04, pages 260–265, 2004.

11. Gábor Sörös and Christian Flörkemeier. Blur-resistant joint 1D and 2D barcode localization for smartphones. InProceedings of the 12th International Conference on Mobile and Ubiquitous Multimedia, pages 11:1 – 11:8, 2013.

12. Steffen Wachenfeld, Sebastian Terlunen, and Xiaoyi Jiang. Robust recognition of 1-D barcodes using camera phones. InPattern Recognition, 2008. ICPR 2008. 19th International Conference on, pages 1–4, 2008.