• Nem Talált Eredményt

A fehérjehálózatok vizsgálatának matematikai módszereiről

N/A
N/A
Protected

Academic year: 2022

Ossza meg "A fehérjehálózatok vizsgálatának matematikai módszereiről"

Copied!
84
0
0

Teljes szövegt

(1)

A fehérjehálózatok vizsgálatának matematikai módszereiről

Grolmusz Vince

matematikus egyetemi tanár Köszönet: Iván Gábor

ELTE Matematikai Intézet PIT Bioinformatikai Csoport &

URATIM Kft.

(2)

Néhány vélemény szerint:

• A jelenlegi egy-egy fehérjét vagy egy receptort tekintő vagy támadó terápiás eljárásokból túl sok új eredményt nem lehet kihozni.

• Sok betegség komplex, sok biokémiai folyamatot érint, sok fehérjével van kapcsolatban.

• Pl. depresszió: nem felelős érte egyetlen fehérje.

Molekuláris mechanizmus nincs felderítve, marker sincs.

(3)

Több fehérje együttes hatását kell nézni!

• Rendszerbiológia,

• Proteomika,

• (metabolomika, genomika, stb.)

Vigyázat! Nagy veszélye van annak, hogy (nem túl értelmes) általánosságokat mondjunk.

Karl Popper: Az az állítás tudományos, amelyet elvileg lehetne cáfolni.

Pl. “Nehéz az élet!” “Minden mindennel összefügg”

nem tudományos állítások. “Az Antarktisz jégtömege növekszik” tudományos állítás (pontosabban: mikor, mihez képest…)

(4)

Proteomikai technikák széles körű elterjedése Hatalmas mennyiségű mérési adat és fehérjehálózat

Az eredmények „kézzel”, „ránézéssel” nem értékelhetők ki

Gyors, hibatűrő, biológiailag verifikált kiértékelési eljárásokra van szükség

(5)

Hálózatok = gráfok

• Matematikailag a hálózatok gráfok.

• Gráf: G(V,E) V: csúcsok, E élek halmaza

• Gráfelmélet: magyar matematikusok igen sokat tettek benne: Kőnig Dénes, Kőnig Gyula, Egervári Jenő, Turán Pál, Erdős Pál, Rényi Alfréd, Lovász László, ….

• Milyen problémák lehetnek itt?

• Legrövidebb út-leghosszabb út;

színezések, párosítások, stb.

(6)

Gráfokról - 1

• Gráfok és hipergráfok:

Mindkettő egy pár: G(V,E), illetve H(V,E).

V: csúcsok (pl. városok, fehérjék, pontok a síkon, emberek)

E: gráfnál: minden él egy csúcspár vagy

egyetlen csúcs (neve: hurokél). Két csúcs között lehet több él is (multigráf,

többszörös él). Ha nincs hurokél és

többszörös él, akkor a gráf egyszerű.

(7)

Gráfokról -2

• Hipergráf: E elemei részhalmazai a V-nek, nem csak egy vagy kételeműek lehetnek.

• Nézzük most csak az egyszerű gráfokat:

• Az egy csúcshoz illeszkedő élek száma a csúcs fokszáma: d(v).

• 

v2 V

d(v)=2|E|

(egy társaságban az emberek ismerősei

számának összege mindig páros szám)

(8)

Gráfokról - 3

• Egy gráf páros, ha a csúcsai két osztályba

oszthatók úgy, hogy csak köztük menjenek élek.

• Ezek elég egyszerű gráfok. A hipergráfok meg elég bonyolultak. Mégis: Minden hipergráf

megadható páros gráffal!

• Gráf csúcsszínezése: úgy akarjuk kiszínezni a csúcsokat, hogy a szomszédos csúcsok

különböző színűek legyenek. Egy G gráf kiszínezéséhez minimálisan (G) szín kell.

(9)

Gráfokról -4

• Összefüggőség, komponensek, fák

Egy gráf összefüggő, ha minden csúcsából

(éleken) el tudunk jutni minden más csúcsba.

Séta: egymás után következő élek tetszőleges sorozata

Út: csúcs-és élismétlődés nélküli séta

Kör: Ha egy út kezdő-és végpontját egy éllel összekötjük, kört kapunk (és minden kör előáll

így).

(10)

Gráfokról -5

• Összefüggő gráfnak egy komponense van, nemösszefüggőnek több.

• Komponens: maximális összefüggő részgráf.

• Gráfok bejárása:

– szélességi (BFS) – mélységi (DFS)

(11)

Fák

• Fa: körmentes összefüggő gráf.

• (nem hagyható ki belőle él, ha nem akarjuk, hogy szétessen)

• Minden n csúcsú fának pontosan n-1 éle van (de elég sok n csúcsú fa van) (Biz.

indukcióval)

• Ha egy fához hozzáveszünk egy élet,

pontosan egy kör lesz benne.

(12)

Gráfok ábrázolása

• Matematikailag:

– Adjacencia mátrix – Incidencia mátrix – Él-lista

(13)

Irányított gráfok

• Az élek nyilak, irányításuk is van.

• Ki-fok, meg be-fok is van. Ki-fokok

összege= a be-fokok összegével (=az élszámmal).

• Metabolikus gráfok leírására is jók

(14)

Itt és most nagy hálózatokban a fontos csúcsok megtalálására szeretnénk koncentrálni.

Egy csúcs lehet fontos:

1. önmagában, a teljes hálózatban, 2. vagy néhány más csúcshoz képest

A 2. típusú kérdés a biológiában például proteomikai mérések kiértékelésénél merül fel: Ha néhány fehérje koncentrációja megváltozik egy folyamatban, akkor szeretnénk tudni, hogy mely más fehérjék vannak ezekkel szoros kapcsolatban.

A cél: fontos csúcsok megtalálása fehérjehálózatokban

(15)

A cél: fontos csúcsok megtalálása fehérjehálózatokban

Ha nem a saját méréseinket használjuk, hol találunk fehérjehálózatokat?

IntAct (EMBL-EBI): 900 000 él, 100 000 fehérje

STRING (EMBL) 24 millió fehérje, 2 milliárd interakció (persze nem mért, főleg jósolt)

KEGG (Kyoto Univ.) metabolikus hálózatok

Generált hálózatok: nascent.pitgroup.org, nem csak modell organizmusokra

(16)

A cél: fontos csúcsok megtalálása fehérjehálózatokban

Milyen hálózatokat tekintünk?

Fizikai interakciós hálózatok:

Csúcsok: fehérjék, élek: két fehérje

éllel van összekötve, ha köztük interakció van:

•mért {TAP, Y2H, ko-immunoprecitipáció vagy egyéb},

•jósolt

Irányítatlan gráfok:

(17)

A cél: fontos csúcsok megtalálása fehérjehálózatokban

Milyen hálózatokat tekintünk?

Metabolikus hálózatokat:

Csúcsok: reakciók, élek az A-ból B-be: ha van az A reakciónak olyan terméke, amelyet a B használ fel. A B

Az éleket lehet a fluxussal is címkézni.

Példa: Az Mtb mikolsav pathway-e

(18)
(19)

Boehringer „Metabolic pathways” poszter

(20)

„Egyéb” (~fizikai) fehérje-fehérje interakciók adatbázisai

Gráfpontok cimkéje:

– a fehérje azonosítója (kérdés: milyen adatbázisban?)

Élek: számos lehetőség, pl.:

– Az él jelenlétének megbízhatósága (a gyakorlatban nincs jelölve…) – Az él által reprezentált kapcsolat típusa („elvileg” sok lehetőség, de…)

Az élek eredete: folyóiratcikkek átvizsgálása:

– adatbányászati módszerekkel jelölhetők a feltehetően fehérje-fehérje interakciókról szóló cikkek

aránylag sok hiba, saját tapasztalat:

– hibás szintaktikájú UniProt-azonosító

– eltérő fajokból származó fehérjék közötti élek behúzása

(nem mindig hiba, pl.: vírusok vs. emberi UniProt kódú fehérje egérben)

– Az élek megkülönböztethetetlenek, valamint: ténylegesen egy kapcsolattípus dominál (physical interaction)

– Él behúzása kapcsolatban nem lévő sejtkompartmentekben található fehérjék közé (aránylag alacsony, 1-2%-os hibaarány, ez jó hír)

Példaadatbázisok:

– MINT, DIP, INTACT, HPRD...MIPS, STRING, BIND...

(21)

Megjegyzések

• A továbbiakban:

– „metabolikus hálózat”-nak nevezzük a metabolikus interakciókat tartalmazó fehérje-fehérje hálózatokat, – „interakciós hálózat”-nak nevezzük az eddig „egyéb”

néven hivatkozott, főként fizikai interakciókat tartalmazó fehérje-fehérje hálózatokat.

(22)

1.: Metabolikus interakciók adatbázisai

Gráfpontok cimkéje: fehérjefunkció (EC szám), vagy: egy v.

több enzim által katalizált metabolikus reakciók

Élek: (pl.) metabolikus reakciók között:

– Él jelenléte: ha létezik olyan kismolekula, amely az egyik reakciónak szubsztrátja, a másiknak terméke

– Élcimke: pl. a reakcióban részt vevő kismolekulák (azonosítói)

• Megbízhatóbbak, mint az „egyéb” adatbázisok (ld. később), de azért… (reakciók megfordíthatósága, ligandok pongyola definiálása)

Példaadatbázisok:

KEGG (Kyoto Encyclopedia of Genes and Genomes, a majdani példabeli MTB metabolikus hálózat forrása)

– Boehringer „Metabolic Pathways” poszter

(23)

Nehézségek (néhány példa)

Fehérjék definiálása ( Mit nevezünk fehérjének? )

– kémiai egység: aminosavszekvencia?

(génekben: csak a szekvencia kódolt) – biológiailag működőképes egység?

Mikor azonos két fehérje?

– azonos szekvencia?

– azonos térszerkezet?

(ugyanannak a szekvenciának lehet többféle térszerkezete) – azonos funkció?

(~ EC számok: különböző fajokban esetleg eltérő szekvencia, de azonos funkció)

Melyek a létező (működőképes) fehérjék?

– eleve működőképtelen (azonnal lebomló) szekvenciák – prekurzor szekvenciák („post-translational modifications”) – működőképes (adott közegben képes helyesen feltekeredni)

Hogyan azonosítsuk tehát az „azonos" fehérjéket…?

– Egyelőre: UniProt azonosító (legtöbbször ~ faj + génnév)

(24)

A Mycobacterium tuberculosis metabolikus hálózata

Pontok: Egy vagy több enzim által katalizált metabolikus reakciók

Él vezet az R1 csomópontból az R2 csomópontba, ha van legalább egy olyan kismolekula, amely az R1 reakciónak terméke, az R2 reakciónak szubsztrátja.

– Nehézség: az élek megfelelő irányítása (pl. megfordítható reakció esetén irányítatlan élek) -> hibák a KEGG-ben

• (egy lehetséges) Élcimke: az reakciókban közös kismolekulák (azonosítói).

• A példában szereplő konkrét hálózatot (az MTB-re vonatkozó

„metabolikus gráfot”) úgy hoztuk létre, hogy

– A KEGG adatbázisát felhasználva az MTB-hez tartozó pathway fájlokra korlátoztuk a keresést

(25)

A Mycobacterium tuberculosis metabolikus hálózata (folytatás)

Az élek eredete: a KEGG ligand „reaction” adatbázisa, a megfordíthatóságra vonatkozó információk: KEGG pathway egy példa-bejegyzés:

ENTRY R01072 Reaction NAME 5-Phosphoribosylamine:pyrophosphate phosphoribosyltransferase (glutamate-amidating)

DEFINITION 5-Phosphoribosylamine + Pyrophosphate + L-Glutamate

<=> L-Glutamine + 5-Phospho-alpha-D-ribose 1-diphosphate + H2O EQUATION C03090 + C00013 + C00025 <=> C00064 + C00119 + C00001 RPAIR RP: A00024 C00025_C00064 main

RP: A01278 C00119_C03090 main RP: A05686 C00001_C00013 leave RP: A05696 C00013_C00119 leave RP: A06428 C00025_C00119 trans RP: A06429 C00064_C03090 trans

PATHWAY PATH: rn00230 Purine metabolism PATH: rn00251 Glutamate metabolism

ENZYME 2.4.2.14

ORTHOLOGY KO: K00764 amidophosphoribosyltransferase ///

(26)

Az MTB metabolikus hálózata

(CytoScape-pel megjelenítve, spring embedded layout)

Az ábrán 678

csomópont található, ezek különböző reakcióknak felelnek meg

Az MTB H37RV törzsének genomjából kb. 4000 különböző fehérjét kódoló gént ismerünk

Megjegyzés:

a megjelenítési mód („spring embedded layout”): a gráfpontok azonos előjelű töltések (taszítják egymást), az élek valamilyen

törvényszerűség szerint nyújtható rugók

(mindjárt: példa

könnyen kiszámítható, de nem-túl-praktikus layout-ra )

(27)

(Gráfok szemléletes

és kevésbé szemléletes megjelenítése)

(28)

A Mycobacterium tuberculosis interakciós hálózata

A { MINT, DIP, INTACT, (HPRD) } interakciós adatbázisokból összesen 17 olyan élt tudtunk kinyerni, amelynek mindkét végpontja MTB-

fehérjéhez tartozott – ez persze kevés.

– (Megjegyzés: az UniProt-ban

• az MTB-fehérjék 13-féle fajkóddal [taxonomy identifier],

• az Escherichia coli fehérjék 95-féle fajkóddal szerepelnek.)

– (Megjegyzés: összesen kb. 45000 fehérje és 192000 él)

Mivel az E. coli fehérjéi közötti interakcióból jóval több van,

megpróbáltunk megfeleltetést létesíteni az MTB és az E. coli fehérjéi között.

Ilyen megfeleltetés (elvileg) létesíthető manuálisan, illetve:

Génnév alapján (ez készen van, de aggályos)

– Aminosavszekvencia alapján (ez készen lesz, de aggályos) – EC számok alapján (…)

A megfeleltetés létesítése után (nagyvonalúan) úgy tekintjük, hogy az E.

coli fehérjéi közötti interakciók „valószínűleg” az MTB megfelelő fehérjéi között is léteznek. 

(29)

Az MTB interakciós hálózata

(CytoScape-pel megjelenítve)

Gráf a génneveken, mint pontokon

Félő, hogy az élek jelenléte a kutatók érdeklődését (is)

reprezentálja (aki keres, az talál…)

– Más szavakkal: az összes, a valós hálózatban létező él közül elfogultan, azaz nem azonos

valószínűséggel

választott éleket látunk;

– …ez sajnos minden, általunk alkalmazandó algoritmust befolyásol majd.

(30)

További feladat: hálózat-analízis

Adott organizmus metabolikus és interakciós hálózatainak integrálása

Sok megválaszolandó kérdés, pl.:

– Hogyan súlyozzuk a metabolikus ill. fizikai interakciókat jelentő éleket?

(A metabolikus éleket – egyelőre – megbízhatóbbaknak gondoljuk.)

– Hogyan találjuk meg az interakciós hálózatban a metabolikus hálózatbeli pontok megfelelőjét?

(EC számok vs. Génnevek vs. UniProt azonosítók)

Az integrált hálózatban…

– „Fontos” pontok v. ponthalmazok keresése, amelyeket kiiktatva a hálózat szétesik

– „Fontos” (élek v.) élhalmazok (összeköttetések) keresése, amelyeket megszüntetve a hálózat szétesik

(31)

•Konkrét, nagy gráfok struktúrájának gyakorlati

vizsgálatához a WWW web-gráfjának tanulmányozása vezetett a 90-es évek közepén és végén;

• A cél a fontos csúcsok kiszűrése volt a web-gráfból:

ez azért volt érdekes, mert amikor valaki rákeres egy web-keresőben (pl. Google) egy kifejezésre, akkor a fontos találatokat akarja látni az elsők közt. Sokszor azonban több millió találat van...

A cél: fontos csúcsok megtalálása fehérjehálózatokban

(32)

The number of pharmaceutical target proteins

Overington et al. Nature Reviews Drug Discovery 5, 993–996 (December 2006) | doi:10.1038/nrd2199

(33)

Hogy működik egy webkereső?

• Letöltés (robot, crawler)

• Tárolás

• Indexezés

• Inverz indexezés

De: kell, hogy a több milliárd weboldal közül

a többmillió találatból a találati lista elején

a FONTOS találatok legyenek.

(34)

Web-gráf: csúcsok: a web oldalai

élek: A B, ha az A oldal hivatkozik B-re;

A cél: fontos csúcsok megtalálása fehérjehálózatokban

DEF 1:Fontos oldal azaz fontos csúcs: amelyre sokan hivatkoznak,azaz magas a be-foka:

be-fok=4 Sok alkalmazás;

scientometria:

hivatkozások száma, impakt faktor

hátránya: nem veszi figyelembe

a hivatkozók minőségét, ezért befolyásolható

(35)

A cél: fontos csúcsok megtalálása fehérjehálózatokban

DEF 2: Fontos oldal azaz fontos csúcs: amelyre sok fontos csúcs hivatkozik...

Mint definíció, ez így persze rossz. De könnyen lehet

egy iteratív algoritmust csinálni belőle: az elején mindenkinek

adok egy egységnyi „fontosságot”, aztán ezt (pongyolán fogalmazva) a csúcsok átörökítik azokra a csúcsokra, akikre mutatnak, és ezt ismételjük, amíg egy stabilizálódott határ-eloszláshoz nem jutunk (ez legtöbbször létezik).

Ennek az eljárásnak a hibatűrését és

robusztusságát lehet egy új ötlettel növelni.

Ezt véletlen bolyongással lehet jól elmondani.

Könnyen, gyorsan számolható, általában gyorsan konvergál.

(36)

Elindítunk egy sétáló embert a gráfon:

ha egy csúcsba ér, akkor egyenletes

valószínűséggel valamely kimenő élen megy tovább, vagy egy c valószínűséggel teleportál, egy véletlenül kiválasztott csúcsba:

Pl. c=0.2

8/50

Egy csúcs fontossága az a valószínűség, amellyel ott tartózkodunk (pontosabban a

határeloszlás)

(37)

Random Walks

• Simple graph.

• Move to a neighbor chosen uniformly at

random.

(38)

Random Walks

(39)

Random Walks

(40)

Random Walks

(41)

Random Walks

(42)

Random Walks

(43)

Random Walks

(44)

Random Walks

(45)

Ezt használta az első időkben a Google (Brin & Page 1998), tehát csak a linkek struktúrájából osztályozott).

Előnyei:

Aránylag nehéz mesterségesen befolyásolni (WWW) Hibatűrő (Biológiai felhasználások)

PageRang vektorok különbségének normája

A megváltozott csúcsok PageRangjainak összege c a teleportálási valószínűség,

c=0.2-re ez 8

Ha a fontos csúcsoknál kevés hiba van, akkor ez hibatűrő!

(46)
(47)

PageRang változata: a perszonalizált PageRang

1-(c+d) vsz. c vsz-el teleportál egyenletesen;

d vsz-el a kiválasztott csúcsokba

Azért nevezték perszonalizáltnak, mert a web egyes felhasználóinak személyes érdeklődését is figyelembe lehet venni a csúcsok fontosságának

kiszámolásánál.

(48)

A perszonalizált PageRank néhány tulajdonsága:

• A biológiai hálózatok jelenlegi méreteire könnyen, gyorsan számolható;

• hibatűrő,

•Jól használható irányítatlan, fizikai interakciós hálózatokra is

• óriási hálózatokra (több millió csúcstól) jó közelítő algoritmusok vannak a gyors kiszámítására is (így pl.

www, vagy az agy hálózatára is használható {Fogaras, Rácz}).

(49)

Miért hangsúlyozzuk a kiértékelő módszer hibatűrését?

Proteomikai mérések erősen laborfüggő eredményeket szolgálatnak gyakran;

Pl. 2006-ban a Nature ugyanazon számában jelent meg Gavin et al. és Krogan et al. két cikke az

élesztő (S. cerevisiae) teljes interaktómjáról; nagy különbségek voltak a két csoport eredményei között.

Értelmes kiértékeléshez jelentősen hibatűrő eljárások kellenek, különben értéktelen „eredményeket” kapunk.

(50)

Miért nem sima távolságot nézünk?

Mert nem hibatűrő.

(51)

Az alábbiakban Gavin et al. legnagyobb élesztő-fehérje komplexét tekintjük;

•véletlenül kiválasztunk belőle néhány fehérjét;

•ezekre perszonalizálunk;

•azt nézzük, hogy mennyire „húzza be” a PageRang a többi csúcsot:

(52)

A perszonalizált PageRang biológiai alkalmazásai - 1

(53)

A perszonalizált PageRang biológiai alkalmazásai - 1

(54)

A perszonalizált PageRang biológiai alkalmazásai - 2

Alkalmazás proteomikai adatok analízisére

Forgber et al (PlosOne 2009. ápr.) melanoma páciensek vérszérumában az alábbi fehérjék megnövekedett szintjét

találta:

Enolase 1: P06733 Calumenin: O43852

HSP70 protein B: P08107 2,4-dienoyl-CoA reductase:

Q9NUI1

Aldolase A: P04075

Fumarate hydratase: P07954 Aldose reductase: P15121

HSP70 protein 9B: Q96EY1 Aconitase 2: P21399

hnRNP1: P26599 VCP: P55072

LDH H: P07195 LAP3: Q944P7

UniProt accession numbers

(55)

A perszonalizált PageRang biológiai alkalmazásai - 2

•Tekintettük a HPRD-ben megtalálható humán interaktomot (38 806 él, 27 801 fehérje);

•perszonalizáltunk az előző oldalon látható mérési eredményekre

•megnéztük a legnagyobb perszonalizált PageRang- ú csúcsokat:

(56)
(57)

2356 csúcs, 13694 él, 2 sugarú környezet

(58)

In undirected graphs (e.g., physical interaction graphs) the PageRank of a node v is approximately proportional to the degree of node v, therefore it will not give much information

relative to simple degree counting.

Metabolic graphs are directed graphs, so it is interesting to compute PageRank for them.

Example:Mtb’s mycolic acid pathway Usually large-degree nodes have

large PageRank. Consequently it is especially interesting to find low-degree vertices with high

PageRank.

(59)
(60)

Relative PageRank

• PageRank in undirected graphs are

approximately proportional to the degree;

• Consider the quotient PageRank(v)/deg(v)

This is approximately constant for any vertex in an undirected graph.

• Its large value is independent from the hub property, it depends only on the

intrinsic graph/network properties.

(61)

The quotient for the mycolic acids pathway:

       

 Node ID       PageRank       In-Degree     PageRank/In-Degree

  scaled

inhA isoniazid t.

13.0 1 13.0

fabH 14.7 2 7.3

kasB kasA 11.8 2 5.9

UNK1 14.1 3 4.7

fabD 33.2 8 4.2

pks13 7.7 2 3.9

fas 7.6 2 3.8

accD5,accD4,accA3 12.4 4 3.1

acpS 23.3 9 2.6

fas 23.3 9 2.6

(62)

inhA:

(long-chain enoyl-acyl carrier protein reductase) egyike a

legrégebben ismert TB célfehérjéknek, az izoniazid és az ethionamid ezt gátolja, ezen kívül több mai gyógyszerfejlesztés célpontja

fabH:

(acetyl-CoA:malonyl-[acyl-carrier-protein] C-acyltransferase) szintén több jelenlegi molekula célpontja

(63)
(64)

We prepared the same analysis

for the whole Mycobacterium tuberculosis,

Plasmodium falciparum

and MRSA Staphylococcus networks.

We have found several known and lots of

(still) unknown, non-hub important nodes,

possible novel drug targets.

(65)

Plasmodium falciparum high scores

reaction ID PageRank 

in-degree PR/in-degree protein correspondence

R01940 3.78 1 3.78 2-oxoglutarate dehydrogenase (OGDH) EC 1.2.4.2

R00174 7.31 2 3.66 pyridoxal kinase-like protein, putative (EC:2.7.1.35)

R00173 7.31 2 3.66 pyridoxal phosphate phosphatase R08193 3.33 1 3.33 N-acetyl glucosamine phosphate

mutase, putative

R07384 3.33 1 3.33 ethanolaminephosphotransferase, putative

R07381 3.33 1 3.33 PI_PLC phospholipase C

(66)

• A legjobb enzim ( 2-oxoglutarate dehydrogenase (OGDH) E1 component). A reakció a B vitamin metabolizmussal kapcsolatos, nemrég javasolták célpontnak [Jan (2010) ]. Glutamát dehidrogenáz, ami szintén ezen az útvonalon van, szintén

célpontnak javasolt [Aug (2010) ].

• A 2. és a 3. legjobb találat pyridoxal kinázoknak felel meg, ezeket célozza a Roscovitine. Bebizonyították, [PLoS One 4(2), e4406 (2009) ] hogy ezek gátlása elpusztítja a parazitát.

(67)

• Az 5. legjobb reakció, az R07384, feltételezett

ethanolaminfoszfotranszferáznak felel

meg, esszenciális a Plasmodium berghei – nek [2010 október].

• A 6. legjobb találat foszfolipáz C-nek felel meg, ez régóta ismert Plasmodium

célpont, és több, mint húsz éve a

maláriaellenes vakcinafejlesztés

legfontosabb célpontja.

(68)

Personalized PageRank

• When the teleporting is made to only a subset of vertices, it is the personalized PageRank.

• The term comes from search engines: if somebody is fond of sports or cars, then his surfing behaviour is well described by teleporting to sports-related pages or car- related pages; those pages will got much higher

PageRanks

• But not only those! Also car tunning, car race, car parts, car models, driving, car manufacturers, etc. So the

related pages will also get high PageRanks, while unrelated pages, e.g., diving, will probably not.

(69)

Más fajok más hálózataira:

MRSA Staphylococcus aureus-ban is sok olyan kisfokú (nem-hub) fehérjét találtunk magas PageRank/degree hányadossal, amelyek bizonyítottan jó célpontok.

• Persze sok olyat is, amelyekről ez nem

ismert lehetséges új célpontok.

(70)

Ko-citáció

• Hasonló csúcsok keresése hálózatban

(71)
(72)

Relative PageRank

• PageRank in undirected graphs are

approximately proportional to the degree;

• Consider the quotient PageRank(v)/deg(v)

This is approximately constant for any vertex in an undirected graph.

• Its large value is independent from the hub property, it depends only on the

intrinsic graph/network properties.

(73)

Alzheimer’s disease facts

• Alzheimer’s disease and other dementias will cost 1% of the global GDP this year

• 70% of the estimated $ 604 billion will be paid for health care costs in Europe and North America this year.

• The global price will exceed $1 trillion by

2030, with more than 65 million sufferers

worldwide

(74)

• Dementia hurts more people globally than cancer or heart disease, and receives

lower research funding than those.

• The most common cause of dementia is Alzheimer’s disease (AD).

• The pathomechanism of AD is not yet fully

understood.

(75)

Main physiological changes include

(i) decreased levels of neurotransmitters in the brain,

(ii) a pathologic accumulation of the beta amyloid fibrillar peptide in the close proximity of

synapses

(iii) and abnormal densities of a modified form of the tau protein in neurons.

Amyloid plaques and tau protein tangles develop mostly in brain areas relevant to memory and intelligence.

(76)

Need for early diagnosis:

• Decades before AD is diagnosed, the neuronal losses begin.

• Usually, by the time AD is diagnosed, most of the neurons are lost to the

disease.

• Therefore before we even may think on

therapy, reliable early diagnostic tools are

needed.

(77)

Current situation

• Neither cure, nor an early diagnostic

method exist.

(78)

Demonstration for AD

• IntAct database: Filtered for human proteins

• 11,700 vertices, 60,080 edges;

• Personalization: Using UniProt database,

we downloaded a list of around 150 AD-

related proteins

(79)
(80)

Pagerank computing

• and scoring with PageRank/degree

• The best hits:

(81)
(82)
(83)
(84)

Köszönöm a figyelmet!

Hivatkozások

KAPCSOLÓDÓ DOKUMENTUMOK

1. § A kártérítési felelősségről, valamint egyes meg nem térülő károk leírásának és törlésének szabályairól szóló 10/2013. 12.) HM rendelet (a továbbiakban:

(személyi igazolvány szám: ……….) kötelezettséget vállalok arra, hogy a gyógyászati segédeszközök árhoz nyújtott társadalombiztosítási támogatásának megállapításár

- Alternatív szubsztrát: a szubsztráthoz hasonló szerkezet ű molekula, ami beilleszkedik az enzim aktív centrumába, és aztán az enzim által katalizált reakció is végbemegy,

Objective: Separate assessment of airway resistance and respiratory tissue mechanics following fluid replacement with autologous blood (Group B), colloid (HES

Ezért kiemelt szempont megérteni, hogy a médiumokban milyen formákban jelenhetnek meg az adatok, információk (és azok feldolgo- zásával, tudatos elemzésével létrehozható

Az agresszív kontinuum két végpontján az antiszociális és proszociális viselkedés áll, ezért most világosan jelez- hetjük, hogy az erőszakos viselkedés egyértelműen az

Vizsgálódásunkat segíti az 1887 januárjától Graszel János (1) és Horváth József (2) szer- kesztésében és kiadásában Aradon megjelent Az Iskolakert.. A népiskolai

A második faktor, a vizuális közös figyelmi jelenet tekintetében azt láttuk, hogy szintén fő hatással bír, azaz a palatális alakváltozatot preferálták a résztvevők, ami-