• Nem Talált Eredményt

A fajok válogatóképessége

5. Fidelitás

5.3. A fajok válogatóképessége

A fidelitás vizsgálatokhoz kapcsolódóan feltehetjük a következő kérdéseket is: A felvételek több alternatív csoportosítása közül melyik alapján mennyire jósolható meg a faj előfordulása (abundanciája)? A faj jelenléte (tömegessége) alapján mennyire jósolható meg, hogy a felvétel melyik csoportba tartozik? Ezekre a kérdésekre a fajok válogatóképességének (separation power) a mérésével adhatunk választ. Egy faj válogatóképessége annál nagyobb, minél inkább megjósolható a faj jelenléte a felvétel csoportja alapján, illetve minél inkább megjósolható a felvételcsoport a faj jelenlétéből/hiányából.

Az előző fejezetben bemutatott átfogó mérőszámok (χ2-, G-statisztika, R2) alkalmasak a fajok válogatóképességének mérésére, de értékük függ a csoportok számától (13. ábra). Ez nem jelent problémát, ha azt vizsgáljuk, hogy egy csoportosítást leginkább mely fajok magyaráznak. Ha viszont különböző csoportosításokat hasonlítunk össze, azok gyakran a csoportok számában is különböznek. Ilyenkor korrigálni kell az értékeket, hogy a csoportok számának hatását eltávolítsuk.

Ha a faj előfordulása és a felvételek csoportosítása független egymástól, a χ2 és a G-statisztika megközelítőleg K-1 szabadsági fokú χ2 eloszlást követ. Az ilyen eloszlású valószínű-

4 A faj jelenléte/hiánya egy bináris skálájú abundancia mérőszámnak tekinthető.

5 Az angol „separation power” kifejezés tükörfordítása helyett szemléletesebbnek érezem ezt a megnevezést.

49 13. ábra: A khi-négyzet statisztika eloszlása különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő).

ségi változók várhatóértéke K-1, szórása √21 2. Ez alapján javasoltuk korábban (Botta-Dukát et al. 2005) a G-statisztika értékének standardizálását:

?K;7 1 1

√21 2

Hasonló standardizálás alkalmazható a χ2-statisztika esetén is:

?K;7 1 1

√21 2

A χ2-eloszlás csak akkor illeszkedik jól a valódi eloszláshoz, ha a várt gyakoriság a kontingencia-tábla egyik cellájában sem túl kicsi. Emiatt ritka fajoknál ez a standardizálás nem alkalmazható. A csoportok számának emelkedésével csökken a csoportok mérete, így egyre gyakrabban jelennek meg a kis várt gyakoriságok. Emiatt az elméleti eloszlás illeszkedése a csoportszám növekedésével romlik. Ezért a standardizált értékek sem teljesen függetlenek a csoportok számától: átlaguk emelkedik (14. ábra), szórásuk csökken (15. ábra) a csoportszám emelkedésével.

A függetlenség esetén várható átlagot és szórást a csoporttagságok permutációjával készült random csoportosításokból is becsülhetjük. Ebben az esetben nincs trendje sem a standardizált értékek átlagának (16. ábra), sem a szórásuknak (17. ábra), mindkettő a várt elméleti értékek körül ingadozik. Az eredmények stabilitásához azonban elegendő permutáció alapján kell a standardizálásnál használt átlagot és szórást kiszámolni (18. ábra).

A szükséges permutációk számára nem lehet általános receptet adni, minden konkrét esetben érdemes ellenőrizni, mennyire stabilak a standardizált értékek.

2 4 6 8 10 13 16 19 22 25 28

010203040506070

csoportok száma

khi-négyzet

50 14. ábra: Az elméleti értékekkel standardizált khi-négyzet értékek átlaga (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő). A vízszintes vonal a várt elméleti értéket jelöli. A piros görbe az általánosított additív modellel illesztett trendvonal.

15. ábra: Az elméleti értékekkel standardizált khi-négyzet értékek átlaga (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő). A vízszintes vonal a várt elméleti értéket jelöli. A piros görbe az általánosított additív modellel illesztett trendvonal.

5 10 15 20 25 30

-0.10-0.050.000.05

csoportok száma

átlagos standardizált khi-négyzet

5 10 15 20 25 30

0.940.960.981.001.021.04

csoportok száma

standardizált khi-négyzet értékek szósa

51 16. ábra A permutációval becsült (500 permutáció) értékekkel standardizált R2 értékek átlaga (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő). A vízszintes vonal a várt elméleti értéket jelöli. A piros görbe az általánosított additív modellel illesztett trendvonal.

17. ábra: A permutációval becsült (500 permutáció) értékekkel standardizált R2 értékek átlaga (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő). A vízszintes vonal a várt elméleti értéket jelöli. A piros görbe az általánosított additív modellel illesztett trendvonal.

5 10 15 20 25 30

-0.06-0.04-0.020.000.020.040.06

csoportok száma

átlagos standardizált R-négyzet

5 10 15 20 25 30

0.940.960.981.001.021.041.06

csoportok száma

standardizált R-négyzet értékek szórása

52 18. ábra: A várhatóérték és a szórás becslésénél használt permutációk számának hatása az eredmények stabilitására. A sziklagyepi adatsor zajszűrés (lásd 5.1.4 fejezet) utáni Ward módszerrel készített hierarchikus klasszifikációját elvágva alakítottam ki a csoportokat. Mindkét faj esetén 5 ismétlésben vizsgáltam a fajok válogatóképességét különböző csoportszámoknál. A bal oldali oszlopban ismétlésenként 100, a jobboldaliban ismétlésenként 500 permutáció alapján számoltam a standardizálásnál használt átlagot és szórást.

Az R2 értékek növekedése a paraméterek számával jól ismert a lineáris modelleknél.

Esetünkben a paraméterek száma a csoportok száma – 1. A különböző számú paramétert tartalmazó lineáris modellek összehasonlítására a korrigált (adjusted) R2-t javasolják:

L;7 1 1 L .. 1 .. 1 1

5 10 15 20

681012141618

Acinos arvensis

csoportok száma

standardizált R-négyzet

5 10 15 20

468101214

Acinos arvensis

csoportok száma

standardizált R-négyzet

5 10 15 20

51015

Linum tenuifolium

csoportok száma

standardizált R-négyzet

5 10 15 20

51015

Linum tenuifolium

csoportok száma

standardizált R-négyzet

53 19. ábra: A korrigált (adjusted) R2 értékek átlaga (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma:

500, a faj összesen 50 felvételben fordul elő). A piros görbe az általánosított additív modellel illesztett trendvonal.

20. ábra: A korrigált R2 értékek szórása (100 ismétlésből) különböző csoportszámok esetén, ha a faj jelenléte és a csoportosítás független egymástól (felvételek száma: 500, a faj összesen 50 felvételben fordul elő). A piros görbe az általánosított additív modellel illesztett trendvonal.

5 10 15 20 25 30

0.00000.00050.00100.00150.00200.00250.0030

csoportok száma

átlagos korrigált R-négyzet

5 10 15 20 25 30

0.0020.0040.0060.0080.0100.0120.0140.016

csoportok száma

korrigált R-négyzet értékek szósa

54 Hátránya, hogy értéke akkor is pozitív (igaz nagyon kis érték), ha a faj előfordulása független a csoportosítástól (19. ábra) és szórása nem állandó, hanem nő a csoportszám növekedésével (20. ábra).

Dufrene & Legendre (1997) az egyes csoportokra kiszámolt IndVal értékek maximumát javasolták a faj válogatóképességének jellemzésére. Ennek hátránya az eddig bemutatott módszerekkel szemben, hogy előnyben részesíti a csak egy csoporthoz hű fajokat, a több csoportot is preferáló fajokkal szemben. De Cáceres és munkatársai (2010) javasolt csoportok összevonásán alapuló módszerrel számolt átfogó (overall) fidelitás is használható a faj válogatóképességének mérésére, de magas csoportszám esetén számításigénye extrém magas lehet. Mindkét esetben szükség van a standardizálásra a permutációk alapján becsült átlagot és szórást felhasználva.

55