A változók közötti kapcsolati típusok - Bayes-háló alapú relevanciaelemzés

1.3. Bayes-háló alapú relevanciaelemzés

1.3.2. A változók közötti kapcsolati típusok

Amennyiben rendelkezésünkre áll a tárgytartományt leíró valószín˝uségi háló, akkor an-nak struktúrájából kiolvashatók a változók között fennálló feltételes függetlenségi állí-tások. Közvetlenül adódik, hogy minden csomópont feltételesen független minden nem leszármazott csomóponttól az adott csomópont szüleinek ismeretében (azaz ha ismerjük a szül˝o csomópontoknak megfelel˝o valószín˝uségi változók konkrét értékét). Ezek a feltéte-les függetlenségi állítások továbbiakat vonnak maguk után, amelyeket az ún.d-szeparáció segítségével olvashatunk ki a gráf struktúrájából [73]. A d-szeparáció által megfogalmaz-ható állítások közül számunkra legfontosabb az, hogy mindenXváltozó feltételesen füg-getlen az összes többi változótól a változót reprezentáló csomópontMarkov-határának (az X csomópont szülei, gyermekei és gyermekeinek egyéb szülei) ismeretében (lásd 4. ábra). Intuitíven megfogalmazva egy változó Markov-határa azokat a változókat tartal-mazza, amelyek bizonyos értelemben közvetlen módon korrelálnak az adott változóval, illetve a további modellbeli változók hatását elfedik a változó el˝ol. Azaz ha ismerjük a Markov-határt alkotó változók értékét, akkor a többi változó értéke már lényegtelen;

nem ad semmilyen plusz információt az adott csomópont értékére vonatkozóan. Bizo-nyos általános feltételek teljesülése esetén kimondhatjuk, hogy egyX változó pontosan

9Ez azt jelenti, hogy a változók minden olyan sorrendezésére, amely az élek irányítottságával konzisz-tens, teljesül, hogy egy adott változó a szülei ismeretében feltételesen független a sorrendben ˝ot megel˝oz˝o változóktól.

akkorer˝osen relevánsegyY változó szempontjából, haXrésze azY Markov-határának.

Könny˝u ellen˝orizni, hogy a Markov-határbeliség (és így az er˝os relevancia is) szimmet-rikus kapcsolat: Y pontosan akkor van X Markov-határában, ha van köztük él, vagy mindketten szülei egy másik változónak.

4. ábra. A változók közötti különféle kapcsolati típusok ábrázolása egy Bayes-hálóban. Az ábrán látható gráf egy Bayes-háló struktúráját ábrázolja. A csomópon-tok a modellezett tárgytartomány valószín˝uségi változóinak felelnek meg, piros színnel vannak jelölve a kitüntetett célváltozók, zölddel pedig a genetikai variánsoknak megfe-lel˝o csomópontok. A pontokat összeköt˝o élek közvetlen kapcsolatokat reprezentálnak a megfelel˝o valószín˝uségi változók között. Páronkénti kapcsolati típusok: Közvetlen rele-vancia (pl. SNP4ésY1között, a köztük lév˝o közvetlen él miatt), Tiszta (f˝ohatás nélküli) interakció (pl. Y1 és SNP9 között, a közös gyermekük Y2 miatt), Er˝os relevancia (pl.

SNP1és Y1 között, a köztük lév˝o közvetlen relevancia miatt vagy pl. SNP7 ésY1 kö-zött, azY3 változón kersztül megvalósuló interakciós hatás miatt), Tranzitív relevancia (pl. SNP5és Y3 között, a köztük lév˝o irányított út miatt), Zavart relevancia (pl. SNP3 és Y2 között, a köztük lév˝o irányítatlan út miatt), Asszociáció (pl. SNP3 és Y2 között vagy pl. SNP5ésY3között).Variánshalmazok relevanciája: Er˝os relevancia (más néven Markov-határ halmaz, pl. Y1változó Markov-határát azY1szülei, gyermekei és a gyer-mekei egyéb szülei alkotják: {SNP1,SNP4,Y2,Y3,SNP9,SNP7} Amennyiben ezeknek a változóknak az értékét megismerjük,Y1függetlenné válik a háló többi csomópontjától.) Forrás: doi:10.1371/journal.pone.0033573.g001

A fentiek alapján adódik, hogy a genetikai asszociációs vizsgálatok során egy adott fenotípusos célváltozó (pl. betegség megléte) szempontjából er˝osen releváns változók jelentik azokat a genetikai és fenotípusos faktorokat, amelyeknek közvetlen hatása van a célváltozóra. Így a f˝o célunk az er˝osen releváns változók felderítése lesz (illetve ezen kap-csolatok valószín˝uségének becslése az adataink alapján). Egy adott faktor és a célváltozó között a következ˝o kapcsolati típusokat definiáljuk a valószín˝uségi hálózatok struktúrája

alapján (lásd 4. ábra):

Közvetlen relevancia: A faktor és a célváltozó között közvetlen él fut. Ilyen kapcsolat van például az oki (kauzális) SNP és a fenotípus között.

Tiszta (f˝ohatás nélküli) interakció: A faktornak és a célváltozónak van egy közös gyer-meke. Ebben az esetben az adott faktornak nincs saját (f˝o) hatása, de a gyermek csomópont ismeretében már befolyásolja a célváltozó értékét, így interakciós ha-tást fejt ki a célváltozóra. Az ilyen típusú kapcsolat lehet például az, amikor egy episztatikus hatású SNP befolyásolja egy másik SNP hatását a fenotípus megjele-nése szempontjából.

Er˝os relevancia: A faktor és a célváltozó között közvetlen relevancia vagy tiszta inter-akciós hatás van, azaz közvetlen él fut közöttük vagy van közös gyermekük.

Tranzitív relevancia: A faktor és a célváltozó között irányított út van. Ilyen kapcsolat lehet például az oki variánssal kapcsoltsági egyenl˝otlenségben álló további varián-sok és a célváltozó között.

Zavart relevancia: A faktor és a célváltozó között irányítatlan út van (azaz olyan út, amely során legalább egy csomópontban az élek egymás felé vagy egymástól elfe-lé néznek). A kapcsoltsági egyenl˝otlenségek komplex összefüggésrendszere miatt ilyen kapcsolat lehet az oki variánssal kapcsolatban álló további variánsok és a cél-változó között.

Asszociáció: A faktor és a célváltozó között közvetlen, tranzitív vagy zavart relevancia van, azaz létezik irányított vagy irányítatlan út a két változó között, amely egyetlen élb˝ol is állhat. Ilyen kapcsolat lehet például az oki variáns és a célváltozó között, illetve az oki variánssal kapcsoltsági egyenl˝otlenségben álló további variánsok és a célváltozó között.

Fontos hangsúlyozni, hogy a frekventista megközelítés szerinti asszociáció fogalma nem egyezik meg az er˝os relevancia fogalmával, ugyanis (1) az asszociáció nem tartal-mazza a tiszta interakciós hatást, illetve (2) az er˝os relevancia a célváltozó szempontjából

közvetlen hatású variánsokat foglalja magában, azaz az asszociációval szemben nem tar-talmazza a tranzitív és zavart relevanciát. Megjegyezzük továbbá, hogy két változó közöt-ti er˝os relevancia által teremtett kapcsolat abban az értelemben mondható közvetlennek, hogy amodellben szerepl˝ováltozók közül egyetlen további változó sem tehet˝o felel˝ossé a közöttük lév˝o függ˝oség kialakításáért. Létezhet ugyanakkor egy olyan, nem megfigyelt változó, amely közvetlennek t˝un˝o hatást teremt, és amelyet ha megfigyelnénk, akkor ez a közvetlen hatás elt˝unhetne. Emiatt a relevanciaelemzés eredményeit mindig a megfigyelt változók tükrében lehet csak értelmezni.

1.3.3. A változók közötti kapcsolati típusok valószín ˝uségének meghatározása bayesi

In document Genetikai variánskivonatoló munkafolyamatok automatikus fúziója és a bayesi relevanciaelemzés alkalmazása jelölt gén asszociációs vizsgálatokban (Pldal 31-34)