• Nem Talált Eredményt

Pedotranszfer típusú összefüggések képzése, becslő eljárások összeve- összeve-tése

3.2.1 Az adatállomány szűrése, felosztása

A becslő függvények képzését megelőző statisztikai vizsgálatokat a teljes adatállományon végeztem („A” adatállomány). Az eltérő célú pályázati munkákhoz kapcsolódó vizsgálatokra azonban külön-böző talaj, illetve ásványi keveréksor elemek kerültek kiválasztásra21, részben a statisztikai vizsgála-tok céljának megfelelően is (11. melléklet, 1. táblázat). Az „A” adatállomány 369 rekordjából csak 337 minta víztartó-képesség adatai álltak rendelkezésemre, ezek adataival tudtam elvégezni azokat a statisztikai vizsgálatokat, amelyekben a kétféle folyadék-visszatartó képesség összevetése volt a cél, vagy a víztartó-képességből kiinduló becslések eredményei is szerepeltek. A DUNASOL-visszatartó képesség becslésére alkalmas PTF-ek kidolgozásához az adatokat továbbá előzetesen statisztikai és szakmai alapon szűrtem. A kiugró értékeket az SPSS esetvizsgálója segítségével határoztam meg (SPSS/Casewise diagnostic). Mivel az adatállomány részben már ellenőrzött volt – mérési hibákkal jelentősen terhelt adatokat nem tartalmazott –, így csak azokat a rekordokat szűrtem ki, amelyeknél a függő változó szignifikáns eltérése meghaladta a szórás kétszeresének értékét, statisztikailag kiugró értékenek volt tekinthető (13. melléklet). A szűrést követően megmaradt rekordok száma 316 („B”

adatállomány – 16. melléklet).

A PTF-ek megbízhatóságának tesztelésére az adatállományt előzetesen 90:10 arányban (kalibrációs és validálási adatok) osztottam fel Tóth(2011) javaslata alapján, a lehető legnagyobb munka adatál-lomány felhasználásával képezve a becslő függvényeket 0,01, 0,3, 1, 10, 33, 100, 330, 15 849 és 158 489 kPa nyomásértékekre. A teszt adatállomány így 287 („Bk” adatállomány), a validálási állomány („Bv” adatállomány) pedig 29 véletlenszerűen kiválasztott (SPSS/random number generator) minta adatait tartalmazta. A textúra csoportokra képzett PTF-ek képzését pedig csak a négy legnagyobb

21 Az adatbázis folyamatos bővülésével mind nagyobb adatállomány statisztikai vizsgálatára adódott lehetőség.

A

49 mintaszámú (n > 20) textúra csoport (agyagos-vályog, iszapos-agyagos-vályog, iszapos-vályog és ho-mokos vályog) adataival végeztem el („Ck” és „Cv” adatállomány N: 264, illetve 26).

3.2.2 A becslő változók kiválasztása a talajok DUNASOL-visszatartó képességét becslő pedotranszfer függvények (PTF) képzéséhez

A dolgozatomban ismertetni kívánt előzetes vizsgálatok során a mechanikai összetétel, a karbonát és humusz-tartalom, illetve a térfogattömeg hatását vizsgáltam a talajok folyadékvisszatartó-képessé-gére. Azért elsősorban e talajtulajdonságok szerepét taulmányoztam, mert ezek alapvizsgálati talajjel-lemzők, szinte minden mintavételezésnél meghatározása kerülnek a talajmintákból, a vizsgálat céljától függetlenül. A főkomponens analízist, a tulajdonságok közötti összefüggések jellegét vizsgáló plot-ok elemzését, egyes esetekben a kovariancia és korrelációs mátrixplot-ok elemzését és az előzetes regresz-sziós futtatásokat a szakirodalom előzetes vizsgálatként is javasolja, eltérő céllal (pl. Vereecken &

Herbst, 2004). A dolgozat végső verziójában meghagytam tehát az előzetes főkomponens analízis eredményeit (PCA1), és egy a futtatást követően végzett főkomponens analízis eredményeit is (PCA2), mert jól szemléltetik a változók közötti korrelációs kapcsolatokat, amelyet a regressziós becs-lés eredménytábláinak alapos áttekintésével lenne lehetséges csak feltérképezni. (Így egyfajta irány-mutatást jelent a szerzőnek és az olvasónak is a későbbi eredmények értékeléséhez és a hibásan levon-ható következtetések csökkentéséhez. Például a transzformált változók felhasználásával képzett becslő egyenletek képzésekor a „túlillesztés”, a túl sok becslő változó bevonása az egyenletbe, amel-lett hogy kismértékben befolyásolhatja a becslés pontosságának statisztikai mutatóit, nem feltétlenül szakmailag magyarázható összefüggést mutathat). A regressziós becslő függvény képzését követően részben azért végeztem újabb főkomponens analízist (PCA2) – amit eredetileg nem állt szándékomban – mert felvetődött bennem, hogy mennyire reális összefüggések jelennek-e meg a sok származtatott érték bevonásával képzett becslő egyenletekben. A főkomponens analízis továbbá arra is alkalmas, hogy megmutassa a változók együttes, és/vagy összetett, szakmailag jól indokolható szerepét a folyadékvisszatartó-képesség görbe különböző nyomástartományaiban (pl. térfogattömeg és karbonát tartalom dominánsabb szerepe a kapilláris folyadék visszatartó képesség alakulásában, vagy a hu-musz- és agyagtartalom jelentősebb szerepe az adszorpciós pórusok folyadékvisszatartó-képességé-ben). A főkomponens analízis alkalmazásának kritériumai általánosságban megegyeznek a lineáris regressziós modellalkotás szükséges feltételeivel22, de a főkomponensek képzésének ez esetben felté-tele a változók közötti jelentős, de nem túlnagy mértékű korreláció (általánosan a legmegfelelőbb a 0,3–0,7 közötti érték)23, a változók közötti multikollinearitás tehát nem akadálya az elemzésnek.

Első lépésben képeztem a vizsgálatba vont változók közötti összefüggéseket jellemző korrelációs mát-rixot és pontdiagramokat (14. melléklet, 1. táblázat; N = 316). A tényezőváltozók közötti – a becslő

22 A homoszkedaszticitás, normalitás és linearitás feltételeinek sérülése a változók közötti korreláció mértékét csökkentheti.

23 A megközelítőleg 1 értékű korrelációs koefficienssel jellemezhető változók esetén nagy a valószínűsége, hogy a változók mind egy faktorba kerülnek az analízis során, így a faktoranalízisnek nem lesz megoldása.

50 változók és a folyadékvisszatartó-képesség értékek, illetve a VG függvény paraméterek közötti – kap-csolatokat főkomponens analízissel (Principal component analysis/Varimax rotation, Kaiser normalization) elemeztem. A faktorok meghatározásához a Varimax rotációs eljárás (főkomponensek tengelymenti elforgatása) általában azért javasolt, mert könnyebben értelmezhető főkomponeneseket eredményez (Sajtos & Mitev, 2006). Ez esetben célom elsősorban a talajjellemzők közötti kapcsolatok lehető legpontosabb, legszemléletesebb meghatározása és jellemzése volt, amely a jól elkülönülő komponensekkel szemléletesen bemutatható. A Kaiser-normalizáció pedig azt jelenti, hogy csak azok a főkomponenek kerülnek kiválasztásra az analízis során, amelyek sajátértéke legalább 124. A változók közötti korrelációs mátrixok segítségével, csak kiegészítő elmezésként vizsgáltam a becslő változók szerepét a folyadék-visszatartó képesség értékek alakulásában. A főkomponens analízis során az SPSS program lehetőséget ad olyan tesztek elvégzésére is, amelyek eredménye alapján megállapítható, hogy a változók milyen mértékben korrelálnak egymással (Kaiser–Meyer–Olkin-teszt – KMO, Bartlett-teszt), illetve hogy az adatállomány elemszáma megfelelő-e az adott függőségi kapcsolat leírásához (Bartlett-teszt)25. A KMO kritérium számítása az ún. anti-image mátrix elemzésén alapul. A kovari-ancia mátrix tartalmazza a változók által – a többi változótól függetlenül – magyarázott varikovari-ancia ér-tékeket, míg a korrelációs anti-image mátrix átlójában található MSA (measure of sampling adequacy) értékek alapján zárhatók ki egyes változók a becslésből (MSA< 0,5 feltétel mellett), hiszen azt mutatja meg, hogy egy változó kapcsolata mennyire szoros a többi változóval26. A KMO-teszt eredménye (MSA értékek átlaga) pedig azt mutatja meg, hogy a változók együttesen mennyire alkalmasak a fő-komponens elemzésre. Az adatok az alábbiak szerint jellemezhetőek az analízisre való alkalmasság szempontjából: amennyiben a KMO értéke ≥ 0,9 kíváló; ≥ 0,8 nagyon jó; ≥ 0,7 megfelelő; ≥ 0,6 kö-zepes; ≥ 0,5 gyenge és ha KMO 0,5 alatti, akkor elfogadhatatlan. A Bartlett-teszt az adatok alkalmas-ságát vizsgálja a főkomponens analízissel végzett statisztikai vizsgálatokhoz (nullhipotézis: a korre-lációs mátrixnak a főátlón kívüli elemei csak véletlenül térnek el a nullától; korrelálatlanok) (Ketskeméti et al., 2011).

A regresszió becslő függények képzését követően végzett főkomponens analízist (PCA2) módszerta-nilag az előbbivel azonos módon végeztem, de a tényezők változók között a becslő változók mért értékei és az azokból képzett származtatott értékek is szerepeltek (3.2.3. alfejezet).

24 Ha egy faktor sajátértéke kisebb mint egy, akkor kevesebb információt hordoz, mint egy változó, így nem érdemes bevonni az analízisbe.

25 Minél nagyobb a mintaelemszám, annál jobban értelmezhető faktorok képezhetőek. A Bartlett-teszt kismér-tékű (0,05 alatti) szignifikancia értéke – ill. minél nagyobb a khi2 próbastatisztika értéke adott szignifikancia szinten –, annál biztosabb, hogy a faktoranalízisbe vont adatállomány mérete elégséges a változók közötti kap-csolatok elemzéséhez.

26 Ha egy változó MSA értéke 1, az azt jelenti, hogy az adott változó a többi változó segítségével hiba nélkül becsülhető (SPSS; Sajtos & Mitev, 2006)

A

51 3.2.3 A becslő és az eredményváltozók transzformációja

A pedotranszfer típusú becslő összefüggések képzésekor a becslő és eredményváltozók közötti nagy-mértékben nemlineáris összefüggés miatt lehet szükséges az becslőváltozók transzformációja. PhD dolgozatomban, a Wösten et al., (1999) által javasolt eljárás szerint, a független/becslő változók loga-ritmikus (ln (x)), inverz (x-1) négyzetes (x2) és szorzat értékeit (xi xj) számítottam és használtam fel a becslő egyenletek képzéséhez. A becslő változók eredeti és transzformált értékeinek normalitás vizs-gálata (minta-elemszámtól függő módszertan szerint meghatározott hipotézis vizsgálat), vagy plottok képzése javasolt ahhoz, hogy eldönthessük, mely transzformált változó érték felhasználása javasolható mind a folyadék-visszatartó képesség mind a paraméterbecslésre alkalmas lineáris kapcsolatokat leíró egyenletek képzésére (Wösten et al., 1999; Vereecken & Herbst, 2004; Vereecken et al., 2010). A dolgozatomban ismertetett vizsgálatok során ezt nem végeztem el, illetve nem mutatom be minden becslésbe vont változóra, hiszen az általam alkalmazott ún. „stepwise”, illetve „backward” iterációval végzett többszörös lineáris regressziós modellépítés során a becslésbe vont kopulák szignifikáns ha-tása és becslő változóként azok multikollinearitásának mértéke is tesztelésre kerül (Ketskeméti et al., 2011).

A paraméterbecslő pedotranszfer függvények kidolgozásánál az eredményváltozók/illesztési paramé-terek eloszlásának normáltól való eltérése esetén szükséges lehet az eredményváltozók transzformá-ciója is. Az illesztési paraméterek eloszlását az alapstatisztikák eredményei alapján elemeztem (átlag, medián, szórás és elsősorban csúcsosság, illetve ferdeség). Az alapstatisztikák eredményei alapján az α és n paraméterek logaritmikus értékeit használtam fel eredményváltozóként. A későbbiekben PTF-ekkel becsült DUNASOL-visszatartó képesség értékek meghatározásához a becsült paraméterértéke-ket visszatranszformáltam (back transformation – Tietje & Hennings, 1996, Schaap & Leij, 2000;

Vereecken & Herbst, 2004; Vereecken et al., 2010). A változók eloszlásának normalitását tesztelő hipotézisvizsgálatokat Vereecken és Herbst (2004) javaslata alapján az 50 feletti elemszámú adatállo-mány esetén alkalmazható egymintás Kolmogorov-Szmirnov teszttel végeztem el. Számítottam az eredeti és a transzformált illesztési paraméterek leíró statisztikáit.

3.2.4 Pontbecslő PTF-ek képzése

A pontbecslő PTF-ekkel a függvényillesztést követően számított 0,01; (0,2;) 1; (2; 5;) 10; (15; 40;) 100; (150;) 15 849 és 158 489 kPa nyomásértékhez rendelhető folyadékvisszatartó-képesség értékeket becsültem. (Az illesztett értékek használata tette lehetővé az különböző részadatállományok eltérő nyomásértékeken, illetve a kétféle folyadékkal mért folyadékvisszatartó-képesség értékek statisztika-ilag összevethetők legyenek) („B” adatállomány – N = 316; 16. melléklet).

A pontbecslő PTF-ek öt típusát képeztem, többszörös lineáris regressziós eljárással (MLR/Stepwise method). Mind az öt becslő összefüggést kidolgoztam az összes vizgálatba vont adatra vonatkozóan PO_1_x sorozat) és az adatokat fizikai féleség szerint csoportosítva is (PO_2_x sorozat).

52 Az első esetben (PO_x_1) a tömegszázalékos agyag, por, humusz- és karbonát tartalom, illetve a tér-fogattömeg értékeket használtam fel független változóként. A további négy esetben (PO/PAR_x.2–5) az eredeti változók mellett azok transzformált értékei (logaritmikus, inverz, négyzetes és szorzat27) is szerepeltek becslő változóként, a Wösten és munkatársai (1995) által kidolgozott módszertant kö-vetve. A PO_x.2 becslés esetében az MSZ-08 0205:1978 szabvány szerint meghatározott mechanikai összetétel frakciók tömegszázalékos értékeit (kivétel a durva homok frakció) vettem fel becslő válto-zóként az egyenletbe, míg a PO_x.3 képzésekor a FAO módszertan (ISO/DIS 11277:1995 szabvány) szerint meghatározott frakciók mechanikai összetétel adatait használtam. A negyedik (PO_x.4) és ötö-dik (PO_x.5) becslő függvényben a mechanikai összetételt egy számmal jellemző átlagos geometriai átmérő értékek (GMDmech) voltak az egyenlet független változói a humusz- és karbonát tartalom, il-letve a térfogattömeg mellett. A PTF-ek fejlesztésére minden esetben az ún. „stepwise” iterációs el-járást alkalmaztam. Ez az eljárás egyesíti a magyarázó változók – előre és a visszafelé haladó – a becslő egyenletbe lépésenként történő beválasztását lehetővé tevő iterációs eljárások (forward és backward iteration) előnyeit. Az algoritmus felváltva veszi be és távolítja el a magyarázó változókat a modellből az F-statisztikák lépésenkénti számítását követően, mind a két módszer megállítási krité-riumait alkalmazva28. Az eredményváltozó szempontjából szignifikáns hatású becslő változók pedig egészen addig kerülhetnek be a becslő egyenletbe – folytatva az iterációt –, míg újabb szignifikáns hatású becslő változó felvétele már nem növeli tovább a becslés pontosságát (az R2 érték alapján). A magyarázó változók egyenkénti beválasztásának további korlátja, hogy minden egyes lépés után, min-den újabb becslő változó egyenletbe vonását követően meghatározza a tolerancia értékeket, figye-lembe véve a becslő változók között fellépő lehetséges multikollinearitás mértékét.

A pontbecslő függvények alkalmazhatóságát a regresziós becslés determinációs koefficiensei (R2), az F-próbastatisztika, a multikollinearitásra vonatkozó mutatók, a becslés standard hiba értékei (SE), az iterációs lépések száma, a becslő egyenlet konstans értékeinek értékelése és a maradványértékek sta-tisztikái alapján elemeztem. A becslésbe vont változók szerepét a becslő egyenletek koefficiensei, a standardizált koefficiens értékek, esetenként a parciális korrelációs együtthatók és a változók közötti kapcsolatokat feltáró korrelációs és kovarianca mátrix, illetve egy, a becslő változók származtatott értékei és a minták DUNASOL-visszatartó képessége közötti összefüggések jellemzésére végzett fő-komponens analízis eredményei alapján vizsgáltam.

27 Az adatbázisomban szereplő talajok, illetve agyagásvány őrlemények egy része karbonát, illetve humuszmen-tes, így e két talajtulajdonság logaritmikus és inverz kopuláit természetesen nem képeztem és használtam fel a becslő egyenletek képzése és fejlesztése során.

28 Forward selection: az F-statisztika alapján először az eredményváltozóval legnagyobb parciális korrelációs együtthatójú magyarázó változó felvételéről dönt a modellbe, majd lépésenként veszi fel a további változókat, amíg a próbastatisztika a kijelölt érték alá nem csökken (vagy a szignifikancia szint a megadott értéket megha-ladja).

Backward elimination: Először az összes szignifikáns hatású magyarázó változóval építi fel a regreszziós mo-dellt, majd mindig a megmaradt változók közül legkisebb béta együtthatójút zárja ki, míg az F-próbastatisztika a megadott küszöbérték alá nem csökken (vagy a szignifikancia szint a megadott értéket meghaladja), az iteráció megáll.

A

53 3.2.5 Paraméterbecslő PTF-ek képzése

A PhD tanulmányaim keretében végzett vizsgálatok során elvégeztem egy statisztikai futtatást arra vonatkozóan is, hogy adataim felhasználásával milyen pontossággal és megbízhatósággal képezhetők a Van Genuchten függvény illesztési paramétereit (α, n, Vm) becslő ek. A paraméterbecslő PTF-ek képzése során először a pontbecslő PTF-PTF-ek képzésénél felhasznált talajjellemzőket vettem fel füg-getlen változóként (PAR_x_1–5) (MLR/Stepwise iteration) („B” adatállományon képzett becslés; N

= 316). A második futtatást (MLR/Backward elimination) csak a „Ck” adatbázis adatainak felhaszná-lásával végeztem el (négy legnagyobb elemszámú textúra csoportból leválogatott adatokon; N= 290).

Mivel sok többfázisú áramlási modellben lehetőség van a VG függvény fizikai féleség szerint csopor-tosított átlagos paraméterértékeinek használatára a szimulációs számítások során (HSSM model, STOMP, NAPL szimulátor, stb.), kísérletet tettem négy fizikai féleség kategória DUNASOL-visszatartó képességét külön becslő PTF-ek képzésére (PAR_2_x sorozat – agyag, iszapos-agyagos-vályog, iszapos-vályog és homokos-vályog; n > 20). A paraméterbecslő PTF-ek közül a PAR_2_1 és 2_2 átfogó statisztikai elemzését végeztem el. A paraméterbecslésnél az RMSE értékeket a visszatranszformált paraméterértékek ismeretében számítottam, a becslési hiba mértékének jobb ér-telmezhetőségéhez. (A visszatranszformált értékek hibái ismeretében lehetőség adódik a paraméter-becslés összevetésére a többi vizsgált paraméter-becslési eljárással29.)

3.2.6 Az DUNASOL-visszatartó képesség becslése térképi információk alapján

A talajok víztartó képességét becslő pedotranszfer szabályokhoz (PTR) hasonlóan képeztem a kivá-lasztott talajminták („C” adatállomány; N = 290) DUNASOL-visszatartó képességét becslő összefüg-géseket úgy is, hogy becslő változóként a talajok alapvizsgálati adatait a talajtérképezési útmutató (Jassó et al., 1988) és Makó és munkatársainak(2005) módszertana alapján talajtérképi kategória kó-dokká konvertálva használtam fel (19. melléklet 1. táblázat). A minták Arany-féle kötöttségét, kém-hatását (pHKCl), humusz- és karbonát tartalmát fizikai féleség, kémhatás, mész- és humusztartalom kategória értékekké konvertáltam. A térképi kategória kódok képzéséhez hiányzó Arany-féle kötöttség adatok nem minden esetben álltak rendelkezésemre. A hiányzó adatokat a MARTHA (Magyarországi Részletes Talajfizikai Adatbázis – Makó et al., 2010, 2011) adataiból leválogatott alállományon kép-zett becslő eljárással számítottam ( 3.2. egyenlet – R2 = 0,704).

KA = 49,773 – 0,297 x1 + 0,307 x2 + 0,006 x3 – 0,072 x4 + 0,200 x5 + 0,014 x6 – 1,673 x7 +0,048 x8 – 0,003 x9

+ 0,824 x10 + 0,314 x11 – 0,002 x12 + 2,482 x13 + 0,002 x14 + 3,547 x15 (3.2) ahol: x1 a Homok; x2 a hatv_Humusz (humusz tartalom négyzetes értéke); x3 az Agyag2 (aza agyagtartalom négy-zete); x4 az Agyag x Humusz szorzat; x5 a Por x Humusz szorzat; x6 a Homok x Humusz szorzat; x7 az ln_Agyag (agyagtartalom logaritmusa; x8 a Humusz x CaCO3 szorzat; x9 az Agyag x CaCO3 szorzat; x10 az ln_CaCO3 (a karbonát-tartalom logaritmusa); x11 az inv_CaCO3 (karbonát-tartalom inverz értéke); x12 a Por x CaCO3 szorzat;

x13 az ln_Por (a portartalom logaritmusa); x14 az Agyag x Por szorzat és x15 az inv_Por (a portartalom reciproka/inverz értéke)

29 Transzformált változók ismeretében csak dimenzió nélküli hiba értékek számíthatók (Tietje & Hennings, 1996, Schaap & Leij, 2000).

54 A becslő PTR-eket lineáris regressziós fák generálásával (Classification and regression tree – CRT) képeztem. A regressziós fák képzését az alábbi általánosan javasolt kritériumok és beállítások mellett (Hill & Lewicki, 2006) végeztem.: a) A kategóriák összevonásának és az adatok felosztásának szignifikancia szintje: p < 0,05; b) A fa szintjeinek száma nem korlátozott; c) A csomópontok eset-száma min. 10; A végső csoportok eseteset-száma minimum öt; d) Tízszeres keresztvalidálással optimali-záltam a fákat a véletlenszerű felosztásból eredő lehetséges hibák csökkentésére. A regressziós fákat mindkét esetben az adatállományból véletlenszerűen kiválasztott, az adatok 90%-át tartalmazó munkaadatállományon képeztem, majd a tesztadatállomány (fennmaradó 10%) adatain vizsgáltam a CRT fák alkalmazásával képzett DUNASOL-visszatartó képesség becslő PTR-ek megbízhatóságát.

Ez a felosztás tette lehetővé, hogy a többi DUNASOL-visszatartó képesség becslő eljárással is össze-hasonlíthassam a regressziós fák pontosságát jellemző statisztikai mutatókat (R2 és RMSE).

3.2.7 A DUNASOL-visszatartó képesség becslési módszerek összevetése

A hidraulikai függvény illesztését követően meghatározott folyadékvisszatartó-képesség értékeket becslő PTF-ek (pontbecslések) és a függvényparamétereket becslő PTF-ek (paraméterbecslések) pon-tosságát azok RMSE, RME és R2 értékei alapján hasonlítottam össze (11. melléklet). Két általam kép-zett PTF pontosságát (PO_2_2 és PAR_2_2) és megbízhatóságát vetettem össze a Leverett egyenlet (1941) és a Lenhard és Parker (1987) által javasolt skálázással (ld. 2.5. alfejezet, 2.5. egyenlet) meg-határozható eredményekkel (R2 és RMSE). A becslések R2 és RMSE értéke alapján vetettem össze a DUNASOL-visszatartó képesség meghatározására alkalmas pont és paraméterbecslő PTF-ek, a Lenhard és Parker (1987) által javasolt skálázási eljárás és a PTR típusú becslések pontosságát is.

A talajok DUNASOL-visszatartó képességére kidolgozott PTF és PTR-ek kiterjeszthetősé-gének előzetes vizsgálata

Az általam képzett pedotranszfer függvények kiterjeszthetőségének vizsgálatára egyfajta előzetes ösz-szehasonlító vizsgálatot végeztem, egy már meglévő talajfizikai adatbázisból (MARTHA – Magyar-országi Részletes Talajfizikai és Hidrológia Adatbázis – Makó et al., 2010, 2011) a saját adatállomá-nyomban található mintákkal azonos fizikai féleségű rekordok leválogatásával képzett részadatállomány felhasználásával30 (17. és 21. melléklet). Mivel a MARTHA adatbázis nem tartal-maz szerves folyadék visszatartó képesség adatokat, az általam készített adatállomány mért víztartó képesség adatait hasonlítottam össze a MARTHA rész-adatállomány adataival. Számítottam a dolgo-zatomban felhasznált adatállomány és a MARTHA részállományának alapadatai közötti statisztikai távolsági értékeket a Nemes és munkatársai (2006), illetve a Tranter és munkatársai (2009) által java-solt módszertannak megfelelően az alábbi lépések szerint.: a) Számítottam a kalibrációs adatbázis

30 A vizsgálatot – a már a textúracsoportok DUNASOL-visszatartó képességét becslő PTF kidolgozásához felhasznált (3.3.2 alfejezet) – négy kiválasztott fizikai féleség csoport adataival végeztem.

A

55 független változóinak átlagát és szórását; b) Meghatároztam a kalibrációs adatbázis független válto-zóinak variancia-kovariancia mátrixát; c) Számítottam az elfogadhatónak ítélt statisztikai távolság ha-tárértékét (H – kumulatív χ2 eloszlás 97,5%-os pecentilise); d) A kiugró értékek (H <) távolságának számítása a kalibrációs adatok aritmetikai átlagához viszonyítva; e) Kiszámítottan a PTF kalibrációs adatbázisának számtani átlaga és a vizsgálandó talajminták közötti Mahalanobis távolságot (Md). A módszertan alapján, amennyiben Md > H, nem javasolt a pedotranszfer függvény alkalmazása, kiter-jesztése a vizsgálat adatokra.

56 4. EREDMÉNYEK