• Nem Talált Eredményt

Mennyire pontosak és reprodukálhatók az eredmények?

In document A bizonyítékokon alapuló orvoslás (Pldal 82-88)

a rendszerezett irodalmi áttekintésben?

7. Mennyire pontosak és reprodukálhatók az eredmények?

A rendszerezett áttekintő közleményekben feldolgozott adatforrások eredményeit általában átlagértékek és megbízhatósági tartomány (konfidenciaintervallum)

for-májában rögzítik a szerzők, az eredmények esetleges matematikai összegzése (meta-analízis) is általában ilyen formában megadott adatok alapján történik. A Matematikai Kislexikon meghatározása szerint a megbízhatósági intervallum olyan, a mintából számított intervallum, amely a populáció valamely paraméterének értékét adott valószínűséggel tartalmazza. Az intervallum végpontjai a konfidenciahatárok. Az adott valószínűséget konfidenciaszintnek hívjuk. Egy tetszőleges, de széles körben használt konfidenciaszint a 95%, ami azt jelenti, hogy egy a húszhoz az esélye annak, hogy az intervallum nem tartalmazza a helyes paramétert. A bizonyítékokon alapu-ló orvoslás tanítása során szerzett tapasztalatok azonban azt mutatják, hogy a kér-dést érdemes a matematikai megközelítés mellett a gyakorlat oldaláról is megvilágí-tani.

Az élő szervezetben végzett vizsgálatok soha nem ismételhetőek meg teljes pon-tossággal. Az ugyanazokban a vizsgált személyekben ugyanazt a beavatkozást ugyanazzal a kontrolleljárással összevető két vizsgálat eredményei is valamilyen mértékig különbözni fognak. Ha a vizsgálat végeredményét a kimeneteli mutató átlagértékével írjuk le, gyakorlatilag bizonyosak lehetünk abban, hogy a vizsgálat megismétlésekor nem ugyanazt az átlagértéket fogjuk észlelni. A 95%-os megbízha-tósági tartomány meghatározza az egy adott vizsgálatban tapasztalt átlagérték körül az értékeknek azt a tartományát, amiben (csupán) egy a húszhoz az esélye annak, hogy a megismételt vizsgálat eredménye nem lesz benne (8-2. ábra).

Tegyük fel, egy vérnyomáscsökkentő szer hatását tanulmányozó vizsgálat azt az eredményt adta, hogy a kezelt személyekben a szisztolés vérnyomás átlagértéke 20 Hgmm-rel csökkent, és a változás 95%-os megbízhatósági tartománya 10 Hgmm és 30 Hgmm közötti értéksávban volt. Ennek a vizsgálatnak az alapján azt mondhatjuk egy magas vérnyomással bajlódó betegnek, hogy a vizsgálatban használt gyógyszer alkalmazása esetén a betegekben a szisztolés vérnyomás általában 20 Hgmm-rel csökken, továbbá 95%-os valószínűséggel remélhető, hogy a szisztolés vérnyomás csökkenése az adott beteg esetében sem lesz kevesebb 10 Hgmm-nél, és nem lesz több 30 Hgmm-nél. A felvázolt példa jelzi a megbízhatósági tartomány használatá-ban rejlő gyakorlati lehetőségeket. A megbízhatósági tartomány további nagy elő-nye, hogy az átlag és standard deviáció értékeiből egy egyszerű matematikai képlet segítségével kiszámítható, azaz az adat akkor is létrehozható, ha egy adott vizsgálat szerzői azt nem szerepeltették a vizsgálat eredményeinek a leírásában.

8-2. ábra. Az átlagérték és a megbízhatósági

tar-tomány (konfidencia- intervallum) fogalmának grafikai megjelenítése

A rendszerezett áttekintő közlemény leglényegesebb eleme az ugyanarra a kime-neteli mutatóra vonatkozó egyedi eredmények összegzése. A 8-3. ábrán 4 hipoteti-kus vizsgálat egy folyamatos változóval jellemzett kimeneteli mutatójának (pl. a vérnyomás értékének alakulása a beavatkozás csoportjában a kontrollcsoporthoz viszonyítva) átlagértékeit és az átlagokhoz tartozó 95%-os megbízhatósági tartomá-nyokat tüntettük fel. A hatástalanság vonala a beavatkozás és a kontrolleljárás ered-ményének megegyező voltát jelöli (pl. azonos vérnyomásváltozás a vizsgálat mind-két ágán). Az A hipotetikus vizsgálatban az átlagérték is és a 95%-os konfidencia-határok is a hatástalanság vonalának a növekvő értékek felőli oldalán helyezkedik el, azaz az A-vizsgálat az érték szignifikáns növekedését írta le. A B hipotetikus vizsgá-lat esetében az átlagérték a hatástalanság vonalának a növekvő, míg a C-vizsgávizsgá-latéban a csökkenő oldalán fekszik. A 95%-os megbízhatósági tartomány azonban mind a B-, mind pedig a C-vizsgálat esetében áthalad a hatástalanság vonalán. Tehát sem a B-, sem pedig a C-vizsgálat esetében nem lehet 95%-os valószínűséggel megjósolni, hogy a vizsgálat ismétlődésekor a kimeneteli mutató értéke a növekvő vagy a csök-kenő oldalán lesz. Más szavakkal: a B- és a C-vizsgálat nem mutatott szignifikáns változást a kimeneteli mutató értékben. A D hipotetikus vizsgálatban az átlagérték is és a 95%-os konfidenciahatár is a hatástalanság vonalának a csökkenő értékek felőli oldalán helyezkedik el, azaz a D-vizsgálat az érték szignifikáns csökkenését írta le.

Hangsúlyozni kell, hogy a 8-3. ábra B- és C-vizsgálatai egyetlen korrekt értelme-zése a „nincs kimutatott szignifikáns hatás” értékelés lehet. A B-vizsgálat esetében

„nem szignifikáns növekedésről”, vagy a C-vizsgálat esetében „nem szignifikáns

8-3. ábra. Hipotetikus vizsgálatok eredményeinek grafikai megjelenítése. A hatástalanság vonala jelöli a kimeneteli mutató értékeinek skáláján az a helyet, ahol a beavatkozás és a kontrolleljárás pontosan ugyanazt az eredményt adja. Az A-, B-, C- és D-jelzésekkel jelölt vízszintes vonalak különböző vizsgálatok 95%-os megbízhatósági tartományát jelölik, melyeket középen elválaszt az átlagértéket jelölő kis függőleges vonalka. Az A-, B-, C- és D-jelölések értelmezését a szövegben adjuk meg

csökkenésről” beszélni inkorrekt megfogalmazás. Ugyanis, ha egy tudományos közlemény összeállítói matematikai statisztikai módszerek alkalmazása mellett döntöttek, akkor ez a döntésük azt is jelenti, hogy következetesen vállalják a mate-matikai statisztikai terminológia használatát. A „nem szignifikáns növekedés” kor-rekt megfogalmazásban nem más, mint a növekedés hiányának matematikai sta-tisztikai módszerekkel történt alátámasztása. A B- és a C-vizsgálat eredményeinek a leírásakor formailag nem inkorrekt megfogalmazás növekedési vagy csökkenési

„tendenciáról” vagy „trendről” beszélni, azonban ezeknek a fogalmaknak nincs a szignifikanciát vizsgáló matematikai tesztekhez köthető tartalma, értelmezésük esetleges. A szignifikáns változás hiányának „tendencia” vagy „trend” formájában történő megfogalmazása sok esetben egyenesen félrevezető lehet.

Az orvostudomány és az egészségtudomány területén végzett vizsgálatok ered-ményeinek természetesen nemcsak statisztikai, hanem gyakorlati (klinikai, epide-miológiai, stb.) értelmezése is van, egy adott kimeneteli mutatóra vonatkozóan általában megjelölhető a változásnak az a mértéke, amit már a gyakorlat szemszö-géből is jelentősnek tarthatunk. A 8-4. ábrán kijelöltük a hatástalanság vonalának mindkét oldalán azt a tartományt, amiben a változást a gyakorlat szemszögéből

8-4. ábra. Hipotetikus vizsgálatok eredményeinek grafikai megjelenítése a gyakorlat szempontjá-ból jelentéktelennek tekinthető tartomány megjelölésével (álló téglalap). A hatástalanság vonala jelöli a kimeneteli mutató értékeinek skáláján az a helyet, ahol a beavatkozás és a kontrolleljárás pontosan ugyanazt az eredményt adja. Az A-, B-, C-, D-, E- és F-jelzésekkel jelölt vízszintes vonalak különböző vizsgálatok 95%-os megbízhatósági tartományát jelölik, melyeket középen elválaszt az átlagértéket jelölő kis függőleges vonalka. Az A-, B-, C-, D-, E- és F-jelölések értelmezését a szö-vegben adjuk meg

nem tekintjük jelentősnek. A 8-3. ábrán már megjelenített A, B, C és D hipotetikus vizsgálatok eredményeinek értékelését a gyakorlatilag jelenéktelen hatástartomá-nyának a kijelölése nem változtatja. Az E és az F hipotetikus vizsgálatok eredmé-nyeire egyaránt igaz, hogy pusztán statisztikai megközelítésben szignifikánsak: az E-vizsgálat az átlagérték szignifikáns növekedését, míg az F-vizsgálat szignifikáns csökkenését mutatja. Mivel azonban mind az E, mind pedig az F-vizsgálat átlagér-téke a gyakorlatilag jelentéktelennek tartható hatás tartományában van, ezért a 8-4.

ábrán feltüntetett 6 hipotetikus vizsgálat eredményei közül csak az A- és a D-vizsgálatot tekinthetjük a gyakorlat szemszögéből is jelentősnek.

A „csak” statisztikailag szignifikáns eredmények a gyakorlatilag is szignifikáns eredményektől történő elkülönítése a rendszerezett áttekintő közlemények kritikus értékelésének egyik legnehezebb feladata. Az ebben a döntéshozatalban szinte elke-rülhetetlen szubjektivitás zavaró hatása úgy mérsékelhető, ha még a rendszerezett áttekintő közlemény létrehozása előtt, ideálisan a közlemény módszertani kérdéseit rögzítő protokollban meghatározzák a szerzők, hogy a gyakorlat szemszögéből mit tekintenek szignifikáns eredménynek. Azt is hangsúlyozni kell, hogy míg egy sta-tisztikailag szignifikáns eredményről kimondható, hogy gyakorlatilag jelentéktelen, addig a gondolatmenet fordítva nem alkalmazható, egy statisztikai teszt negatív eredményét nem lehet, mintegy a gyakorlat oldaláról felülírva, mégis szignifikáns eredményként értelmezni.

A rendszerezett áttekintő közleményekben a vizsgálatok eredményeit összefogla-ló ábrák általában egy standard megjelenítési formát követnek. A 8-5. ábrán Nielsen és mtsai a Journal of Critical Care folyóiratban 2005-ben megjelent, rendszerezett áttekintő közleményének egyik ábráján szemléltetjük az ilyen típusú ábrák szokásos alkotóelemeit (azért ezt választva, mert erre az ábrára majd visszautalunk a tan-könyv 11. fejezetében). Az ábra felső 3 sorában az immunglobulin-kezelés szeptikus betegek kórházi ápolásának tartamára gyakorolt hatásáról adatot szolgáltató 3 ran-domizált, kontrollált vizsgálat eredményei jelennek meg részben grafikailag,

rész-8-5. ábra. Az immunglobulin-kezelés hatása a szeptikus betegek kórházi ápolásának tartamára Nielsen és mtsai a Journal of Critical Care folyóiratban 2005-ben megjelent rendszerezett áttekin-tő közleményének egyik ábrája alapján. Az ábra értelmezését a szövegben adjuk meg

ben pedig számadatokkal jellemzett módon. A grafika függőleges vonalai azokat az ápolási napokat jelölik, melyekkel megrövidül, vagy éppen meghosszabbodik a kór-házi kezelés az immunglobulin-terápia hatására. A vízszintes vonalak a 95%-os megbízhatósági tartományt jelölik, melyek közepén a kör szimbolizálja az átlagérté-ket. Az ábra bal oldalán az első számoszlop az átlagérték, a második az alsó konfi-denciahatár, a harmadik pedig a felső konfidenciahatár értékének számszerű meg-jelenítése. A negyedik oszlopban a vizsgálatban résztvevők teljes száma (beavatko-zás plusz kontrolleljárás), míg az ötödik oszlopban az alkalmazott statisztikai teszt P-értéke szerepel. A három vizsgálat közül a harmadik az ápolási idő szignifikáns megrövidülését mutatta, az első két vizsgálat nem igazolt szignifikáns hatást.

A 8-5. ábra negyedik sora a három egyedi vizsgálat eredményeinek összegzését jeleníti meg. Az összegzett átlagértéket és annak megbízhatósági tartományát álta-lában fekvő rombusz formájában szokták megjeleníteni, aminek az angol neve alap-ján az ilyen grafikont „blobbogram”-nak nevezik (másik elnevezése a vízszintes vonalak keltette grafikai benyomáson alapuló „forest plot”). A 8-5. ábrán az összeg-ző érték nem mutat szignifikáns változást, azaz a három randomizált, kontrollált vizsgálat eredményeinek összegzése ebben az esetben mintegy „felülírja”a 3. sorban szereplő eredményt, ami önmagában szignifikáns hatásra utalna.

A rendszerezett áttekintő közlemény azonban nemcsak természetes egységekben (Hgmm, ápolási nap stb.) foglalhatja össze az eredményeket. Az olvasó gyors tájé-koztatását sokszor jobban szolgálja a kimeneteli mutató megvalósulásának (a beteg-ség gyógyulása vagy javulása a terápiás beavatkozások esetében, az egészbeteg-ségromlás megelőzése a preventív beavatkozások esetében) esélyarány (angolul: odds ratio) vagy kockázati arány (angolul: risk ratio) formájában történő összehasonlítása a vizsgálatok két ága között. Fogalmilag az esély a kimeneteli mutató két állapotának egymással történő összehasonlítása (matematikailag a/b), míg a kockázat valame-lyik állapot összevetése az összes lehetőséggel (matematikailag a/[a+b]). Amennyiben viszonylag ritka eseményt vizsgálunk, akkor az esély és a kockázat közel van egy-máshoz. Ha minden 100. beteg esetében következik be valamilyen esemény, akkor az esemény bekövetkezésének az esélye 0,0101 (1/99), míg a kockázata 0,01 (1/100).

Azonban, ha viszonylag gyakori eseményeket írunk le, akkor az esély és a kockázat számértéke már lényegesen különbözhet: ha minden 5. beteg esetében következik be valamilyen esemény, akkor az esemény bekövetkezésének az esélye 0,25 (1/4), míg a kockázata 0,20 (1/5).

Az esélyekből vagy kockázatokból képzett hányadosok némileg tovább bonyolít-ják a kérdést. A 8-4. táblázatban három olyan hipotetikus vizsgálat eredményeiből számítottunk esélyarány és kockázati arány értékeket, melyekben a beavatkozás oldalán egy adott kimeneteli esemény feleakkora gyakorisággal következett be, mint a kontrolleljárás oldalán. Más szavakkal: az esemény relatív gyakorisága mindhá-rom vizsgálatban azonos volt a beavatkozás és a kontrolleljárás között. Ebből faka-dóan a kockázati arány értékek mindhárom vizsgálat esetében azonosak. Az esély-arány értékek azonban igen jelentősen csökkennek az esemény gyakoriságának

mindkét csoportban arányos módon észlelhető növekedésével (8-4. táblázat). Ez a számokkal való játék arra hívja fel a figyelmet, hogy az esélyarány és a kockázati arány fogalmai egymással nem felcserélhetőek. A rendszerezett áttekintő közlemény kritikus értékelésekor ezt a szempontot is figyelembe kell venni.

8. Használhatók-e az eredmények

In document A bizonyítékokon alapuló orvoslás (Pldal 82-88)