TÁRSADALMI ÉS GAZDASÁGI HÁLÓZATOK MODELLEZÉSE 5. ELŐADÁS: A SZTOCHASZTIKUS BLOKK MODELL
TÁMOP-4.1.1.F-14/1/KONV-2015-0006
London András
Magas szint¶ struktúrális mintázatok feltárása
Hálózatokban megjelen® mintázatok modellezése és vizsgálata
−→ véletlen generatív modellek
P(G|θ) θ kódolja a mintázatot,P(G|θ) pedig a feltételes valószín¶sége, hogy Ggráf tartalmazza azt
Visszafele irány (inference): adott Gvalós vagy szintetikus hálózat, határozzuk meg a legvalószín¶bb θ-t, amivel ez a hálózat generálódik
ábra 1:
Miért jó?
Explicit generálhatunk adott hálózatokat (nem egy algoritmus) Strukturával kapcsolatos hipotézisek ellen®rzése
Modellek jóságának ellen®rzése (mennire közelíti a modell a valóságot?)
Hiányzó minták vagy jöv®beli strukturák feltárása
A 80-as években jelent meg szociológia témájú folyóiratban:
Holland, Laskey, and Leinhardt, Stochastic blockmodels: First steps. Social Networks, 5(2), 109137 (1983)
Gyakran használják: gépi tanulás, komplex rendszerek vizsgálata, statisztikus zika
Léteznek általánosításai irányított és súlyozott gráfokra is
Modell deníció
Az SBM egyszer¶en egyθ= (k, z, M) hármas, ahol
1 k acsoportok (közösségek/ pont osztályok) számaa hálózatban
2 z egynhosszú vektor, aholzi megadja, hogy az ipont melyik csoportba tartozik
3 M egy k×kblokk mátrix, aholMuv megadja annak a valószín¶ségét, hogy egy ucsoportbeli és egy v csoportbeli pont kapcsollódik egymáshoz
Megj: el®szörk-t kell xálni, továbbá az azonos csoportban lév® pontok sztochasztikusan ekvivalensek
Hálózat generálása SBM-mel
1 Adott(k, z, M) hármas
2 Minden i, j pontpárra dobunk egy érmét: Mzi,zj valószín¶séggel behúzzuk (i, j) élt, 1−Mzi,zj-vel nem Szemben aG(n, p)-vel aminek két paramétere van, ésG(n,k)-val aminek1 +n, azSBM-nek1 +n+ k2
paramétere van=⇒ Lehet®séget ad rengeteg különféle hálózat generálására
A véletlen gráf
AG(n, p) az SBM egy speciális esete:
k= 1, azaz egy csoport van M ≡p
Mzi,zj =p, mivelzi =zj minden pontpárra
ábra 2: A blokkmátrix és a realizált gráf (Forrás: Aaron Clauset, Network Analysis and Modelling course)
Hálózat közösségszerkezettel
ábra 3: Gráf közösségszerkezettel (Forrás: Aaron Clauset, Network Analysis and Modelling course)
Mag-periféria szerkezet
ábra 4: Gráf mag-periféria szerkezettel (Forrás: Aaron Clauset, Network Analysis and Modelling course)
Maximum likelihood
Adott egy (valós) hálózat mi az a blokkmodell, ami legjobban közelíti ezt a struktúrát?
Likelihood:
L(G|M, z) = Y
(i,j)∈E
Mzi,zj Y
(i,j)/∈E
1−Mzi,zj
=⇒Válasszuk M-et és z-t úgy, hogy ezmaximális legyen
Egy példa
Legyen
Nu pontok száma az ucsoportban (blokkban) Nuv =NuNv lehetséges élek számau és v között
Euv élek száma (meggyelés)u és v között=⇒ becslésünk az élvalószín¶ségre: Mˆuv=Euv/Nuv
A likelihood függvényünk így L(G|M, z)Y
u,v
MuvEuv(1−Muv)Nuv−Euv =
=Y
u,v
Euv Nuv
Euv
1−Euv Nuv
Nuv−Euv
Vegyük a logaritmusát, fejtsük ki és a kapott kifejezést amicsak z-t®l függ maximalizáljuk