• Nem Talált Eredményt

Algoritmusok gr´ afok ´ es hipergr´ afok klaszterez´ es´ ere

In document Algoritmikus modellek (Pldal 74-77)

5.4.1. S´ ulyozott gr´ afok

Itt az MD norm´alt modularit´as m´atrix

1≥ |µ1| ≥ |µ2| ≥ · · · ≥ |µn|= 0

cs¨okken˝o abszol´ut ´ert´ek˝u saj´at´ert´ekei alapj´an klaszterez¨unk. A klaszterek k sz´am´at egy olyan pozit´ıv eg´esznek v´alasztjuk, melyre szignifik´ans r´es tapasztalhat´o µk−1 ´es µk k¨ozt (ha ilyen nincs, akkor legyen k egy viszonylag kis sz´am, esetleg k = 2 vagy k = 3, ha szeml´eletesen szeretn´enk megjelen´ıteni a klasztereket 2- vagy 3-dimenzi´os ´abr´akon).

Speci´alisan, ha a k −1 legnagyobb abszol´ut ´ert´ek˝u saj´at´ert´ek mind poz´ıt´ıv, akkor olyan klaszterekre sz´am´ıthatunk, melyeken bel¨ul nagy, a klaszterek k¨ozt pedig kicsi az

´

els˝ur˝us´eg. Az ellenkez˝o esetben, ha a k−1 legnagyobb abszol´ut ´ert´ek˝u saj´at´ert´ek mind negat´ıv, akkor olyan klaszterekre sz´am´ıthatunk, melyeken bel¨ul kicsi, a klaszterek k¨ozt pedig nagy az ´els˝ur˝us´eg. Az ´altal´anos esetben pedig csak olyan klaszterekre sz´ am´ıtha-tunk, melyekben mind a klasztereken bel¨ul, mind a klaszterek k¨ozt homog´en az ´els˝ur˝us´eg,

´

es a klaszterp´arok k¨ozti diszkrepancia (a t´erfogat regularit´as konstansa) kicsi.

Az algoritmus pszeudok´odja a k¨ovetkez˝o: Input: Az n×n-es W m´atrix ´es a klasz-terek sz´ama (k), amir˝ol el˝ozetesen t´aj´ekoz´odunk.

1. Kisz´amoljuk adfoksz´am-vektort, aDfoksz´am-m´atrixot ´es azMD =D−1/2WD−1/2

√ d√

dT norm´alt modularit´as m´atrixot.

2. Kisz´amoljuk ennek k−1 legnagyobb abszol´ut ´ert´ek˝u s aj´at´ert´ek´et ´es az azokhoz tartoz´o u1, . . . ,uk−1 saj´atvektorokat.

3. Meghat´arozzuk a cs´ucsok r1, . . . ,rn∈Rk−1 reprezent´ansait, mint a D−1/2u1, . . . ,D−1/2uk−1

m´atrix sorvektorait.

4. A s´ulyozott k-k¨oz´epelj´ar´assal azr1, . . . ,rn pontokat k klaszterbe soroljuk.

Output: a cs´ucsok ennek megfelel˝o V1, . . . , Vk klaszterei.

Nagym´eret˝u m´atrixok struktur´alis saj´at´ert´ekeinek meghat´aroz´as´ara gyors k¨ozel´ıt˝o elj´ar´asok l´eteznek, l. [33, 36]. Az fentiekben haszn´alt s´ulyozott k-k¨oz´ep elj´ar´as pszeu-dok´odja pedig a k¨ovetkez˝o. Input: a v´eges dimenzi´os r1, . . . ,rn pontok ´es a d1, . . . , dn pozit´ıv s´ulyok.

• Inicializ´al´as: V1, . . . , Vk a pontok kezdeti klaszterei.

• Az iter´aci´o:

1. Kisz´amoljuk a klaszter-k¨oz´eppontokat:

ci = 1 Vol(Vi)

X

j∈Vi

djrj, i= 1, . . . , k.

2. ´Athelyezz¨uk a pontokat a klaszterek k´ozt: rj abba aViklaszterbe ker¨ul, melyre krj − cik = min`krj − c`k. (Ha ez t¨obb indexre is teljes¨ul, a legkisebbet v´alsaztjuk.)

Az ´uj klaszterekkel megism´etelj¨uk az 1-2 l´ep´eseket konvergenci´aig (am´ıg a pontok stabiliz´al´odnak a klaszterekben).

Output: a pontok V1, . . . , Vk klaszterei.

Megjegyezz´uk, hogy n´eha eleve metrikus t´erbeli adatpontokat szeretn´enk klasztere-s´ıteni. Ilyenkor is alkalmazhatjuk a fenti, gr´afokra vonatkoz´o m´odszert ´ugy, hogy az xi pontokat egy gr´af cs´ucsainak tekintj´uk, ´es a pontok p´aronk´enti t´avols´agai alapj´an meghat´arozunk azok wij hasonl´os´agait, melyeket a W ´els´uly m´atrix elemei lesznek. A

4.4. Fejezet ¨otletet ad ahhoz, hogy reproduk´al´o mag´u Hilbert-t´er technik´akkal hogyan lehet ezt megval´os´ıtani. Gyakran az ´un. Gauss magf¨uggv´enyt haszn´aljuk, mellyel

wij =KGauss(xi,xj) =e

kxi−xjk2 2 ,

aholσ >0 param´eter, l. [60]. A m´odszert k´epfelismer´esre is alkalmazz´ak, amikoris a pon-tok pixeleknek felelnek meg, koordin´at´aik pedig nem csak a pixel t´erbeli elhelyezked´es´ere jellemz˝oek, hanem azok sz´ın´ere, text´ur´aj´ara, stb., l. [78].

5.4.2. Hipergr´ afok k´ etszempont´ u klaszterez´ ese

Mint´aul a v1, v2, . . . , vn bin´aris (0–1) v´altoz´okra tett e1, e2, . . . , em megfigyel´esek szol-g´alnak (n m). Ezek a H = (V, E) hipergr´afot alkotj´ak, ahol V = {v1, v2, . . . , vn}

´

es E = {e1, e2, . . . , em}, I(v ∈ e) pedig 1 vagy 0 aszerint, hogy az e objektumon a v tulajdons´agot megfigyelt´ek-e vagy sem.

Legyen E0 ⊂ E egy r´eszminta, amely a H0 = (V, E0) hipergr´afot gener´alja. Jel¨olje 0 = λ1(H0)≤ λ2(H0)≤ · · · ≤λn(H0) aH0 hipergr´af Laplace m´atrix´anak spektrum´at ´es az n×n-es X(H0) m´atrix tartalmazza soraiban a hozz´ajuk tartaz´o teljes ortonorm´alt saj´atvektorrendszert. Az 5.4. Reprezent´aci´os T´etel szerint b´armely d eg´eszre (1 ≤ d ≤ n) a d×n-es Xd(H0) m´atrix, amely X(H0) els˝o d sor´at tartalmazza, a H0 hipergr´af optim´alis d-dimenzi´os reprezent´aci´oj´at adja. Az E0-beli ´elek ¨osszvarianci´aja ebben a reprezent´aci´oban

L(Xd(H0)) = X

e∈E0

L(e,Xd(H0)) =

d

X

j=1

λj(H0).

A H0 hipergr´af be´agyaz´as´anak k¨olts´eg´et a K(H0) := min

d∈{1,...,n}[c2n−d+L(Xd(H0))]

c´elf¨uggv´ennyel defini´aljuk, ahol ackonstanst el˝ore v´alasztjuk meg (a probl´ema m´eret´enek megfelel˝oen), ´es a c2n−d tag a t´uls´agosan nagy dimenzi´okat b¨unteti (az ´elek ¨ osszvarian-ci´aj´at kifejez˝oL(Xd(H0)) tag – ´epp ellenkez˝oleg – a dimenzi´o n¨ovel´es´evel cs¨okkenthet˝o).

A minimumot ad´o d dimenzi´ot az E0 ´el-klaszter dimenzi´oj´anak nevezz¨uk.

Jel¨oljeS azE ´elhalmaz ¨osszes lehets´eges part´ıci´oit. Keress¨uk azt azS ∈ S part´ıci´ot, melyre a K = P

i

K(Hi) c´elf¨uggv´eny minim´alis, ahol Hi = (V, Ei). Most v´alasszunk ´es r¨ogz´ıts¨unk egykeg´eszet (1≤k≤n). Defini´alunk egy iter´aci´ot, amely a fenti c´elf¨uggv´eny egy relat´ıv minimum´ahoz vezet, ha csak az Sk-val jel¨olt k-part´ıci´ok k¨or´eben keress¨uk a minimumot. Legyen teh´at (E1, . . . , Ek) ∈ Sk az E ´elhalmaz egy k-part´ıci´oja. Az el˝oz˝o jel¨ol´eseket alkalmazva az induk´alt Hi = (V, Ei), (i= 1, . . . , k) r´esz-hipergr´afokra a

Qdi(Hi) :=c2n−di+L(Xd

i(Hi)), (i= 1, . . . , k)

jel¨ol´eseket bevezetve, a Q=

k

P

i=1

Qdi(Hi) k¨olts´egf¨uggv´enyt fogjuk minimaliz´alni a Sk-beli part´ıci´ok ´es a d1, . . . , dk dimenzi´ok k¨or´eben.

A minimumot keres˝o iter´aci´o a k¨ovetkez˝o l´ep´esekb˝ol ´all:

0. Kiindul´asul tekintj¨uk az E ´elhalmaz tetsz˝oleges E1, . . . , Ek part´ıci´oj´at (egy ilyet nyerhet¨unk pl. a k-k¨oz´ep m´odszerrel.

1. Az E1, . . . , Ek klasztereket r¨ogz´ıtve: meghat´arozzuk a Hi = (V, Ei) hipergr´afok Laplace m´atrixainak spektr´alfelbont´as´at. Ezut´an Qdi(Hi)-t a di dimenzi´oban mi-nimaliz´aljuk (mindeni-re k¨ul¨on). Mivel 1 ≤di ≤neg´esz, ez egy diszkr´et minimali-z´al´asi feladat. Jel¨oljedi a minimumot ad´o (nem felt´etlen¨ul egy´ertelm˝u) dimenzi´ot, amellyel teh´at

Qd

i(Hi) =c2n−di +

di

X

j=1

λj(Hi) (i= 1, . . . , k).

2. Most a di-dimenzi´okat r¨ogz´ıtve az objektumokat ´atsoroljuk a klaszterek k¨ozt: az e objektumot abba azEiklaszterbe helyezz¨uk, amelyben a hozz´a tartoz´oL(e,Xd

i(Hi)) variancia minim´alis (ha t¨obb klaszterre is minim´alis, akkor vegy¨uk a legkisebb ilyen i-t). Az objektumok ´ıgy nyert ´uj klaszteres´ıt´es´et E1, . . . , Ek-gal jel¨olve, ezekkel megism´etelj¨uk az 1. ´es 2. l´ep´eseket, am´ıg csak Qcs¨okkenthet˝o.

Trivi´alis, hogy a fenti l´ep´esek Q ´ert´ek´et cs¨okkentik, s mivel az objektumok sz´ama v´eges, az algoritmus v´eges l´ep´esben Qrelat´ıv minimum´ahoz vezet.

Bevezethetn´enk egy k-ban minimaliz´al´o l´ep´est is, ´ıgy azonban az algoritmus nagyon hosszadalmas lenne. Ink´abb v´egigcsin´aljuk n´eh´any kiv´alasztott k-ra (pl. a k-k¨oz´ep el-j´ar´ast lefuttatva kaphatunk k-ra ¨otletet), ´es ¨osszehasonl´ıtjuk a minimumk´ent kapott Q

´

ert´ekeket.

Az iter´aci´o sor´an ki¨ur¨ulhetnek, ´es ´altal´aban ki is ¨ur¨ulnek ´el-klaszterek. k ´ert´eke term´eszetesen ezzel cs¨okken. A Hi = (V, Ei) hipergr´afok ´altal´aban nem ¨osszef¨ugg˝oek, hanem tartalmaznak izol´alt cs´ucsokat, melyeket t¨obb 0 saj´at´ert´ek megl´ete jelez. Jel¨olje Vi a nem izol´alt cs´ucsok halmaz´at. Ekkor ∪ki=1Vi = V, de a V1, . . . , Vk rendszer nem felt´etlen¨ul diszjunkt. Ezek a diszjunkt ´el-klaszterekre jellemz˝o tulajdons´ag-asszoci´aci´okat tartalmazz´ak.

In document Algoritmikus modellek (Pldal 74-77)