A fehérjehálózatok vizsgálatának matematikai módszereiről
Grolmusz Vince
matematikus egyetemi tanár Köszönet: Iván Gábor
ELTE Matematikai Intézet PIT Bioinformatikai Csoport &
URATIM Kft.
Néhány vélemény szerint:
• A jelenlegi egy-egy fehérjét vagy egy receptort tekintő vagy támadó terápiás eljárásokból túl sok új eredményt nem lehet kihozni.
• Sok betegség komplex, sok biokémiai folyamatot érint, sok fehérjével van kapcsolatban.
• Pl. depresszió: nem felelős érte egyetlen fehérje.
Molekuláris mechanizmus nincs felderítve, marker sincs.
Több fehérje együttes hatását kell nézni!
• Rendszerbiológia,
• Proteomika,
• (metabolomika, genomika, stb.)
Vigyázat! Nagy veszélye van annak, hogy (nem túl értelmes) általánosságokat mondjunk.
Karl Popper: Az az állítás tudományos, amelyet elvileg lehetne cáfolni.
Pl. “Nehéz az élet!” “Minden mindennel összefügg”
nem tudományos állítások. “Az Antarktisz jégtömege növekszik” tudományos állítás (pontosabban: mikor, mihez képest…)
Proteomikai technikák széles körű elterjedése Hatalmas mennyiségű mérési adat és fehérjehálózat
Az eredmények „kézzel”, „ránézéssel” nem értékelhetők ki
Gyors, hibatűrő, biológiailag verifikált kiértékelési eljárásokra van szükség
Hálózatok = gráfok
• Matematikailag a hálózatok gráfok.
• Gráf: G(V,E) V: csúcsok, E élek halmaza
• Gráfelmélet: magyar matematikusok igen sokat tettek benne: Kőnig Dénes, Kőnig Gyula, Egervári Jenő, Turán Pál, Erdős Pál, Rényi Alfréd, Lovász László, ….
• Milyen problémák lehetnek itt?
• Legrövidebb út-leghosszabb út;
színezések, párosítások, stb.
Gráfokról - 1
• Gráfok és hipergráfok:
Mindkettő egy pár: G(V,E), illetve H(V,E).
V: csúcsok (pl. városok, fehérjék, pontok a síkon, emberek)
E: gráfnál: minden él egy csúcspár vagy
egyetlen csúcs (neve: hurokél). Két csúcs között lehet több él is (multigráf,
többszörös él). Ha nincs hurokél és
többszörös él, akkor a gráf egyszerű.
Gráfokról -2
• Hipergráf: E elemei részhalmazai a V-nek, nem csak egy vagy kételeműek lehetnek.
• Nézzük most csak az egyszerű gráfokat:
• Az egy csúcshoz illeszkedő élek száma a csúcs fokszáma: d(v).
•
v2 Vd(v)=2|E|
(egy társaságban az emberek ismerősei
számának összege mindig páros szám)
Gráfokról - 3
• Egy gráf páros, ha a csúcsai két osztályba
oszthatók úgy, hogy csak köztük menjenek élek.
• Ezek elég egyszerű gráfok. A hipergráfok meg elég bonyolultak. Mégis: Minden hipergráf
megadható páros gráffal!
• Gráf csúcsszínezése: úgy akarjuk kiszínezni a csúcsokat, hogy a szomszédos csúcsok
különböző színűek legyenek. Egy G gráf kiszínezéséhez minimálisan (G) szín kell.
Gráfokról -4
• Összefüggőség, komponensek, fák
Egy gráf összefüggő, ha minden csúcsából
(éleken) el tudunk jutni minden más csúcsba.
Séta: egymás után következő élek tetszőleges sorozata
Út: csúcs-és élismétlődés nélküli séta
Kör: Ha egy út kezdő-és végpontját egy éllel összekötjük, kört kapunk (és minden kör előáll
így).
Gráfokról -5
• Összefüggő gráfnak egy komponense van, nemösszefüggőnek több.
• Komponens: maximális összefüggő részgráf.
• Gráfok bejárása:
– szélességi (BFS) – mélységi (DFS)
Fák
• Fa: körmentes összefüggő gráf.
• (nem hagyható ki belőle él, ha nem akarjuk, hogy szétessen)
• Minden n csúcsú fának pontosan n-1 éle van (de elég sok n csúcsú fa van) (Biz.
indukcióval)
• Ha egy fához hozzáveszünk egy élet,
pontosan egy kör lesz benne.
Gráfok ábrázolása
• Matematikailag:
– Adjacencia mátrix – Incidencia mátrix – Él-lista
Irányított gráfok
• Az élek nyilak, irányításuk is van.
• Ki-fok, meg be-fok is van. Ki-fokok
összege= a be-fokok összegével (=az élszámmal).
• Metabolikus gráfok leírására is jók
Itt és most nagy hálózatokban a fontos csúcsok megtalálására szeretnénk koncentrálni.
Egy csúcs lehet fontos:
1. önmagában, a teljes hálózatban, 2. vagy néhány más csúcshoz képest
A 2. típusú kérdés a biológiában például proteomikai mérések kiértékelésénél merül fel: Ha néhány fehérje koncentrációja megváltozik egy folyamatban, akkor szeretnénk tudni, hogy mely más fehérjék vannak ezekkel szoros kapcsolatban.
A cél: fontos csúcsok megtalálása fehérjehálózatokban
A cél: fontos csúcsok megtalálása fehérjehálózatokban
Ha nem a saját méréseinket használjuk, hol találunk fehérjehálózatokat?
IntAct (EMBL-EBI): 900 000 él, 100 000 fehérje
STRING (EMBL) 24 millió fehérje, 2 milliárd interakció (persze nem mért, főleg jósolt)
KEGG (Kyoto Univ.) metabolikus hálózatok
Generált hálózatok: nascent.pitgroup.org, nem csak modell organizmusokra
A cél: fontos csúcsok megtalálása fehérjehálózatokban
Milyen hálózatokat tekintünk?
Fizikai interakciós hálózatok:
Csúcsok: fehérjék, élek: két fehérje
éllel van összekötve, ha köztük interakció van:
•mért {TAP, Y2H, ko-immunoprecitipáció vagy egyéb},
•jósolt
Irányítatlan gráfok:
A cél: fontos csúcsok megtalálása fehérjehálózatokban
Milyen hálózatokat tekintünk?
Metabolikus hálózatokat:
Csúcsok: reakciók, élek az A-ból B-be: ha van az A reakciónak olyan terméke, amelyet a B használ fel. A B
Az éleket lehet a fluxussal is címkézni.
Példa: Az Mtb mikolsav pathway-e
Boehringer „Metabolic pathways” poszter
„Egyéb” (~fizikai) fehérje-fehérje interakciók adatbázisai
• Gráfpontok cimkéje:
– a fehérje azonosítója (kérdés: milyen adatbázisban?)
• Élek: számos lehetőség, pl.:
– Az él jelenlétének megbízhatósága (a gyakorlatban nincs jelölve…) – Az él által reprezentált kapcsolat típusa („elvileg” sok lehetőség, de…)
• Az élek eredete: folyóiratcikkek átvizsgálása:
– adatbányászati módszerekkel jelölhetők a feltehetően fehérje-fehérje interakciókról szóló cikkek
• aránylag sok hiba, saját tapasztalat:
– hibás szintaktikájú UniProt-azonosító
– eltérő fajokból származó fehérjék közötti élek behúzása
(nem mindig hiba, pl.: vírusok vs. emberi UniProt kódú fehérje egérben)
– Az élek megkülönböztethetetlenek, valamint: ténylegesen egy kapcsolattípus dominál (physical interaction)
– Él behúzása kapcsolatban nem lévő sejtkompartmentekben található fehérjék közé (aránylag alacsony, 1-2%-os hibaarány, ez jó hír)
• Példaadatbázisok:
– MINT, DIP, INTACT, HPRD...MIPS, STRING, BIND...
Megjegyzések
• A továbbiakban:
– „metabolikus hálózat”-nak nevezzük a metabolikus interakciókat tartalmazó fehérje-fehérje hálózatokat, – „interakciós hálózat”-nak nevezzük az eddig „egyéb”
néven hivatkozott, főként fizikai interakciókat tartalmazó fehérje-fehérje hálózatokat.
1.: Metabolikus interakciók adatbázisai
• Gráfpontok cimkéje: fehérjefunkció (EC szám), vagy: egy v.
több enzim által katalizált metabolikus reakciók
• Élek: (pl.) metabolikus reakciók között:
– Él jelenléte: ha létezik olyan kismolekula, amely az egyik reakciónak szubsztrátja, a másiknak terméke
– Élcimke: pl. a reakcióban részt vevő kismolekulák (azonosítói)
• Megbízhatóbbak, mint az „egyéb” adatbázisok (ld. később), de azért… (reakciók megfordíthatósága, ligandok pongyola definiálása)
• Példaadatbázisok:
– KEGG (Kyoto Encyclopedia of Genes and Genomes, a majdani példabeli MTB metabolikus hálózat forrása)
– Boehringer „Metabolic Pathways” poszter
Nehézségek (néhány példa)
• Fehérjék definiálása ( Mit nevezünk fehérjének? )
– kémiai egység: aminosavszekvencia?
(génekben: csak a szekvencia kódolt) – biológiailag működőképes egység?
• Mikor azonos két fehérje?
– azonos szekvencia?
– azonos térszerkezet?
(ugyanannak a szekvenciának lehet többféle térszerkezete) – azonos funkció?
(~ EC számok: különböző fajokban esetleg eltérő szekvencia, de azonos funkció)
• Melyek a létező (működőképes) fehérjék?
– eleve működőképtelen (azonnal lebomló) szekvenciák – prekurzor szekvenciák („post-translational modifications”) – működőképes (adott közegben képes helyesen feltekeredni)
• Hogyan azonosítsuk tehát az „azonos" fehérjéket…?
– Egyelőre: UniProt azonosító (legtöbbször ~ faj + génnév)
A Mycobacterium tuberculosis metabolikus hálózata
• Pontok: Egy vagy több enzim által katalizált metabolikus reakciók
• Él vezet az R1 csomópontból az R2 csomópontba, ha van legalább egy olyan kismolekula, amely az R1 reakciónak terméke, az R2 reakciónak szubsztrátja.
– Nehézség: az élek megfelelő irányítása (pl. megfordítható reakció esetén irányítatlan élek) -> hibák a KEGG-ben
• (egy lehetséges) Élcimke: az reakciókban közös kismolekulák (azonosítói).
• A példában szereplő konkrét hálózatot (az MTB-re vonatkozó
„metabolikus gráfot”) úgy hoztuk létre, hogy
– A KEGG adatbázisát felhasználva az MTB-hez tartozó pathway fájlokra korlátoztuk a keresést
A Mycobacterium tuberculosis metabolikus hálózata (folytatás)
• Az élek eredete: a KEGG ligand „reaction” adatbázisa, a megfordíthatóságra vonatkozó információk: KEGG pathway egy példa-bejegyzés:
ENTRY R01072 Reaction NAME 5-Phosphoribosylamine:pyrophosphate phosphoribosyltransferase (glutamate-amidating)
DEFINITION 5-Phosphoribosylamine + Pyrophosphate + L-Glutamate
<=> L-Glutamine + 5-Phospho-alpha-D-ribose 1-diphosphate + H2O EQUATION C03090 + C00013 + C00025 <=> C00064 + C00119 + C00001 RPAIR RP: A00024 C00025_C00064 main
RP: A01278 C00119_C03090 main RP: A05686 C00001_C00013 leave RP: A05696 C00013_C00119 leave RP: A06428 C00025_C00119 trans RP: A06429 C00064_C03090 trans
PATHWAY PATH: rn00230 Purine metabolism PATH: rn00251 Glutamate metabolism
ENZYME 2.4.2.14
ORTHOLOGY KO: K00764 amidophosphoribosyltransferase ///
Az MTB metabolikus hálózata
(CytoScape-pel megjelenítve, spring embedded layout)
• Az ábrán 678
csomópont található, ezek különböző reakcióknak felelnek meg
– Az MTB H37RV törzsének genomjából kb. 4000 különböző fehérjét kódoló gént ismerünk
• Megjegyzés:
a megjelenítési mód („spring embedded layout”): a gráfpontok azonos előjelű töltések (taszítják egymást), az élek valamilyen
törvényszerűség szerint nyújtható rugók
– (mindjárt: példa
könnyen kiszámítható, de nem-túl-praktikus layout-ra )
(Gráfok szemléletes
és kevésbé szemléletes megjelenítése)
A Mycobacterium tuberculosis interakciós hálózata
• A { MINT, DIP, INTACT, (HPRD) } interakciós adatbázisokból összesen 17 olyan élt tudtunk kinyerni, amelynek mindkét végpontja MTB-
fehérjéhez tartozott – ez persze kevés.
– (Megjegyzés: az UniProt-ban
• az MTB-fehérjék 13-féle fajkóddal [taxonomy identifier],
• az Escherichia coli fehérjék 95-féle fajkóddal szerepelnek.)
– (Megjegyzés: összesen kb. 45000 fehérje és 192000 él)
• Mivel az E. coli fehérjéi közötti interakcióból jóval több van,
megpróbáltunk megfeleltetést létesíteni az MTB és az E. coli fehérjéi között.
• Ilyen megfeleltetés (elvileg) létesíthető manuálisan, illetve:
– Génnév alapján (ez készen van, de aggályos)
– Aminosavszekvencia alapján (ez készen lesz, de aggályos) – EC számok alapján (…)
• A megfeleltetés létesítése után (nagyvonalúan) úgy tekintjük, hogy az E.
coli fehérjéi közötti interakciók „valószínűleg” az MTB megfelelő fehérjéi között is léteznek.
Az MTB interakciós hálózata
(CytoScape-pel megjelenítve)
• Gráf a génneveken, mint pontokon
• Félő, hogy az élek jelenléte a kutatók érdeklődését (is)
reprezentálja (aki keres, az talál…)
– Más szavakkal: az összes, a valós hálózatban létező él közül elfogultan, azaz nem azonos
valószínűséggel
választott éleket látunk;
– …ez sajnos minden, általunk alkalmazandó algoritmust befolyásol majd.
További feladat: hálózat-analízis
• Adott organizmus metabolikus és interakciós hálózatainak integrálása
Sok megválaszolandó kérdés, pl.:
– Hogyan súlyozzuk a metabolikus ill. fizikai interakciókat jelentő éleket?
(A metabolikus éleket – egyelőre – megbízhatóbbaknak gondoljuk.)
– Hogyan találjuk meg az interakciós hálózatban a metabolikus hálózatbeli pontok megfelelőjét?
(EC számok vs. Génnevek vs. UniProt azonosítók)
• Az integrált hálózatban…
– „Fontos” pontok v. ponthalmazok keresése, amelyeket kiiktatva a hálózat szétesik
– „Fontos” (élek v.) élhalmazok (összeköttetések) keresése, amelyeket megszüntetve a hálózat szétesik
•Konkrét, nagy gráfok struktúrájának gyakorlati
vizsgálatához a WWW web-gráfjának tanulmányozása vezetett a 90-es évek közepén és végén;
• A cél a fontos csúcsok kiszűrése volt a web-gráfból:
ez azért volt érdekes, mert amikor valaki rákeres egy web-keresőben (pl. Google) egy kifejezésre, akkor a fontos találatokat akarja látni az elsők közt. Sokszor azonban több millió találat van...
A cél: fontos csúcsok megtalálása fehérjehálózatokban
The number of pharmaceutical target proteins
Overington et al. Nature Reviews Drug Discovery 5, 993–996 (December 2006) | doi:10.1038/nrd2199
Hogy működik egy webkereső?
• Letöltés (robot, crawler)
• Tárolás
• Indexezés
• Inverz indexezés
De: kell, hogy a több milliárd weboldal közül
a többmillió találatból a találati lista elején
a FONTOS találatok legyenek.
Web-gráf: csúcsok: a web oldalai
élek: A B, ha az A oldal hivatkozik B-re;
A cél: fontos csúcsok megtalálása fehérjehálózatokban
DEF 1:Fontos oldal azaz fontos csúcs: amelyre sokan hivatkoznak,azaz magas a be-foka:
be-fok=4 Sok alkalmazás;
scientometria:
hivatkozások száma, impakt faktor
hátránya: nem veszi figyelembe
a hivatkozók minőségét, ezért befolyásolható
A cél: fontos csúcsok megtalálása fehérjehálózatokban
DEF 2: Fontos oldal azaz fontos csúcs: amelyre sok fontos csúcs hivatkozik...
Mint definíció, ez így persze rossz. De könnyen lehet
egy iteratív algoritmust csinálni belőle: az elején mindenkinek
adok egy egységnyi „fontosságot”, aztán ezt (pongyolán fogalmazva) a csúcsok átörökítik azokra a csúcsokra, akikre mutatnak, és ezt ismételjük, amíg egy stabilizálódott határ-eloszláshoz nem jutunk (ez legtöbbször létezik).
Ennek az eljárásnak a hibatűrését és
robusztusságát lehet egy új ötlettel növelni.
Ezt véletlen bolyongással lehet jól elmondani.
Könnyen, gyorsan számolható, általában gyorsan konvergál.
Elindítunk egy sétáló embert a gráfon:
ha egy csúcsba ér, akkor egyenletes
valószínűséggel valamely kimenő élen megy tovább, vagy egy c valószínűséggel teleportál, egy véletlenül kiválasztott csúcsba:
Pl. c=0.2
8/50
Egy csúcs fontossága az a valószínűség, amellyel ott tartózkodunk (pontosabban a
határeloszlás)
Random Walks
• Simple graph.
• Move to a neighbor chosen uniformly at
random.
Random Walks
Random Walks
Random Walks
Random Walks
Random Walks
Random Walks
Random Walks
Ezt használta az első időkben a Google (Brin & Page 1998), tehát csak a linkek struktúrájából osztályozott).
Előnyei:
Aránylag nehéz mesterségesen befolyásolni (WWW) Hibatűrő (Biológiai felhasználások)
PageRang vektorok különbségének normája
A megváltozott csúcsok PageRangjainak összege c a teleportálási valószínűség,
c=0.2-re ez 8
Ha a fontos csúcsoknál kevés hiba van, akkor ez hibatűrő!
PageRang változata: a perszonalizált PageRang
1-(c+d) vsz. c vsz-el teleportál egyenletesen;
d vsz-el a kiválasztott csúcsokba
Azért nevezték perszonalizáltnak, mert a web egyes felhasználóinak személyes érdeklődését is figyelembe lehet venni a csúcsok fontosságának
kiszámolásánál.
A perszonalizált PageRank néhány tulajdonsága:
• A biológiai hálózatok jelenlegi méreteire könnyen, gyorsan számolható;
• hibatűrő,
•Jól használható irányítatlan, fizikai interakciós hálózatokra is
• óriási hálózatokra (több millió csúcstól) jó közelítő algoritmusok vannak a gyors kiszámítására is (így pl.
www, vagy az agy hálózatára is használható {Fogaras, Rácz}).
Miért hangsúlyozzuk a kiértékelő módszer hibatűrését?
Proteomikai mérések erősen laborfüggő eredményeket szolgálatnak gyakran;
Pl. 2006-ban a Nature ugyanazon számában jelent meg Gavin et al. és Krogan et al. két cikke az
élesztő (S. cerevisiae) teljes interaktómjáról; nagy különbségek voltak a két csoport eredményei között.
Értelmes kiértékeléshez jelentősen hibatűrő eljárások kellenek, különben értéktelen „eredményeket” kapunk.
Miért nem sima távolságot nézünk?
Mert nem hibatűrő.
Az alábbiakban Gavin et al. legnagyobb élesztő-fehérje komplexét tekintjük;
•véletlenül kiválasztunk belőle néhány fehérjét;
•ezekre perszonalizálunk;
•azt nézzük, hogy mennyire „húzza be” a PageRang a többi csúcsot:
A perszonalizált PageRang biológiai alkalmazásai - 1
A perszonalizált PageRang biológiai alkalmazásai - 1
A perszonalizált PageRang biológiai alkalmazásai - 2
Alkalmazás proteomikai adatok analízisére
Forgber et al (PlosOne 2009. ápr.) melanoma páciensek vérszérumában az alábbi fehérjék megnövekedett szintjét
találta:
Enolase 1: P06733 Calumenin: O43852
HSP70 protein B: P08107 2,4-dienoyl-CoA reductase:
Q9NUI1
Aldolase A: P04075
Fumarate hydratase: P07954 Aldose reductase: P15121
HSP70 protein 9B: Q96EY1 Aconitase 2: P21399
hnRNP1: P26599 VCP: P55072
LDH H: P07195 LAP3: Q944P7
UniProt accession numbers
A perszonalizált PageRang biológiai alkalmazásai - 2
•Tekintettük a HPRD-ben megtalálható humán interaktomot (38 806 él, 27 801 fehérje);
•perszonalizáltunk az előző oldalon látható mérési eredményekre
•megnéztük a legnagyobb perszonalizált PageRang- ú csúcsokat:
2356 csúcs, 13694 él, 2 sugarú környezet
In undirected graphs (e.g., physical interaction graphs) the PageRank of a node v is approximately proportional to the degree of node v, therefore it will not give much information
relative to simple degree counting.
Metabolic graphs are directed graphs, so it is interesting to compute PageRank for them.
Example:Mtb’s mycolic acid pathway Usually large-degree nodes have
large PageRank. Consequently it is especially interesting to find low-degree vertices with high
PageRank.
Relative PageRank
• PageRank in undirected graphs are
approximately proportional to the degree;
• Consider the quotient PageRank(v)/deg(v)
• This is approximately constant for any vertex in an undirected graph.
• Its large value is independent from the hub property, it depends only on the
intrinsic graph/network properties.
The quotient for the mycolic acids pathway:
Node ID PageRank In-Degree PageRank/In-Degree
scaled
inhA isoniazid t.
13.0 1 13.0
fabH 14.7 2 7.3
kasB kasA 11.8 2 5.9
UNK1 14.1 3 4.7
fabD 33.2 8 4.2
pks13 7.7 2 3.9
fas 7.6 2 3.8
accD5,accD4,accA3 12.4 4 3.1
acpS 23.3 9 2.6
fas 23.3 9 2.6
inhA:
(long-chain enoyl-acyl carrier protein reductase) egyike alegrégebben ismert TB célfehérjéknek, az izoniazid és az ethionamid ezt gátolja, ezen kívül több mai gyógyszerfejlesztés célpontja
fabH:
(acetyl-CoA:malonyl-[acyl-carrier-protein] C-acyltransferase) szintén több jelenlegi molekula célpontjaWe prepared the same analysis
• for the whole Mycobacterium tuberculosis,
• Plasmodium falciparum
• and MRSA Staphylococcus networks.
We have found several known and lots of
(still) unknown, non-hub important nodes,
possible novel drug targets.
Plasmodium falciparum high scores
reaction ID PageRank
in-degree PR/in-degree protein correspondence
R01940 3.78 1 3.78 2-oxoglutarate dehydrogenase (OGDH) EC 1.2.4.2
R00174 7.31 2 3.66 pyridoxal kinase-like protein, putative (EC:2.7.1.35)
R00173 7.31 2 3.66 pyridoxal phosphate phosphatase R08193 3.33 1 3.33 N-acetyl glucosamine phosphate
mutase, putative
R07384 3.33 1 3.33 ethanolaminephosphotransferase, putative
R07381 3.33 1 3.33 PI_PLC phospholipase C
• A legjobb enzim ( 2-oxoglutarate dehydrogenase (OGDH) E1 component). A reakció a B vitamin metabolizmussal kapcsolatos, nemrég javasolták célpontnak [Jan (2010) ]. Glutamát dehidrogenáz, ami szintén ezen az útvonalon van, szintén
célpontnak javasolt [Aug (2010) ].
• A 2. és a 3. legjobb találat pyridoxal kinázoknak felel meg, ezeket célozza a Roscovitine. Bebizonyították, [PLoS One 4(2), e4406 (2009) ] hogy ezek gátlása elpusztítja a parazitát.
• Az 5. legjobb reakció, az R07384, feltételezett
ethanolaminfoszfotranszferáznak felel
meg, esszenciális a Plasmodium berghei – nek [2010 október].
• A 6. legjobb találat foszfolipáz C-nek felel meg, ez régóta ismert Plasmodium
célpont, és több, mint húsz éve a
maláriaellenes vakcinafejlesztés
legfontosabb célpontja.
Personalized PageRank
• When the teleporting is made to only a subset of vertices, it is the personalized PageRank.
• The term comes from search engines: if somebody is fond of sports or cars, then his surfing behaviour is well described by teleporting to sports-related pages or car- related pages; those pages will got much higher
PageRanks
• But not only those! Also car tunning, car race, car parts, car models, driving, car manufacturers, etc. So the
related pages will also get high PageRanks, while unrelated pages, e.g., diving, will probably not.
Más fajok más hálózataira:
• MRSA Staphylococcus aureus-ban is sok olyan kisfokú (nem-hub) fehérjét találtunk magas PageRank/degree hányadossal, amelyek bizonyítottan jó célpontok.
• Persze sok olyat is, amelyekről ez nem
ismert lehetséges új célpontok.
Ko-citáció
• Hasonló csúcsok keresése hálózatban
Relative PageRank
• PageRank in undirected graphs are
approximately proportional to the degree;
• Consider the quotient PageRank(v)/deg(v)
• This is approximately constant for any vertex in an undirected graph.
• Its large value is independent from the hub property, it depends only on the
intrinsic graph/network properties.
Alzheimer’s disease facts
• Alzheimer’s disease and other dementias will cost 1% of the global GDP this year
• 70% of the estimated $ 604 billion will be paid for health care costs in Europe and North America this year.
• The global price will exceed $1 trillion by
2030, with more than 65 million sufferers
worldwide
• Dementia hurts more people globally than cancer or heart disease, and receives
lower research funding than those.
• The most common cause of dementia is Alzheimer’s disease (AD).
• The pathomechanism of AD is not yet fully
understood.
Main physiological changes include
(i) decreased levels of neurotransmitters in the brain,
(ii) a pathologic accumulation of the beta amyloid fibrillar peptide in the close proximity of
synapses
(iii) and abnormal densities of a modified form of the tau protein in neurons.
Amyloid plaques and tau protein tangles develop mostly in brain areas relevant to memory and intelligence.