• Nem Talált Eredményt

A nem-line´ aris regresszi´ o a gyakorlatban

In document ¨o T bbdimenzi ´o sstatisztika (Pldal 46-51)

3. Nem-line´ aris regresszi´ o 28

3.2.3. A nem-line´ aris regresszi´ o a gyakorlatban

A becs¨ult param´eterek megb´ızhat´os´aga

V´egezet¨ul h´arom technik´at mutatunk be, amivel az illesztett modell megb´ızhat´os´aga szeml´eltethet˝o. Az els˝o a konfidencia tartom´anynak a likelihood f¨uggv´enyen alapul´o meghat´aroz´asa. A m´asodik a megold´aspont k¨ozel´eben a megold´asfelsz´ın ´es a param´ eter-vonalak g¨orb¨uletein alapul´o becsl´es ´ert´ekel´es. A harmadik eszk¨oz azR-project ’nlstools’

kieg´esz´ıt˝o csomagj´aban tal´alhat´o. Az ottani elj´ar´asok seg´ıts´eg´evel jackknife ´es bootstrap m´odszereket alkalmazhatunk a becs¨ult param´eterek megb´ızhat´os´ag´anak ellen˝orz´es´ere ´es n¨ovel´es´ere.

A becsl´esek konfidenciatartom´anya

A ’profile()’ f¨uggv´eny egy likelihood maximaliz´al´assal nyert modell eset´en veszi a becs¨ult param´eterek konfidenciatartom´any´at a log-likelihood f¨uggv´eny profiljai alapj´an.

Ha lefuttatjuk az al´abbi programr´eszletet, akkor a v´egeredm´enyk´ent a3.13´abr´at nyerj¨uk.

M <- nls(demand ~ SSasympOrig(Time, A, lrc), data = BOD) pr <- profile(M, alpha = 0.05)

coef(M)

par(mfrow=c(2,2))

plot(pr, conf = c(95, 90, 80, 50)/100)

plot(pr, conf = c(95, 90, 80, 50)/100, absVal = FALSE)

A programsorok a ’datasets’ csomagban tal´alhat´o, mind¨ossze 6 adatsort tartalmaz´o

’BOD’ adathalmazt dolgozz´ak fel. A ’BOD’ (Biochemical Oxygen Demand) adathal-maz egy v´ızminta, kezel´es k¨ozbeni oxig´en ig´eny´et mutatja naponk´enti id˝ok¨oz¨okben mg/l m´ert´ekegys´egben megadva. Ennek az adathalmaznak k´et adatoszlopa van: a ’demand’ ´es a ’Time’. A c´elv´altoz´o az oxig´en ig´eny, a magyar´az´o v´altoz´o az id˝o. Az illesztett modell a 3.4 ´abr´an is bemutatott ’SSasympOrig’, orig´on ´atmen˝o aszimptotikus regresszi´o modell.

A k¨ovetkez˝o ’profile’ parancs a konfidencia tartom´any meghat´aroz´as´ahoz sz¨uks´eges ’pr’

seg´edv´altoz´ot ´all´ıtja el˝o. A keletkezett n´egy ´abr´an azt l´athatjuk, hogy a modell ’A=19.14’

aszimptotikus ´ert´ek´enek ´es ’lrc=-0.63’ logaritmikus v´altoz´asi sebess´eg´enek mik aτ ´ert´ek alapj´an sz´amolt 95, 90, 80, 50 %-os konfidenciatartom´anyai.

3.13. ´abra. A becs¨ult param´eterek konfidenciatartom´anyai

A megold´aspont k¨or¨uli g¨orb¨uletek

Egy nem-line´aris modell becsl´esi pont k¨or¨uli nem-linearit´asa k´et komponensre bonthat´o.

Az egyik komponens a modellnek mint egy a megfigyel´esi t´erben elhelyezked˝o, a megfi-gyel´esi t´ern´el alacsonyabb dimenzi´os felsz´ınnek a g¨orb¨ulete a becsl´es k¨or¨ul. Ez f¨uggetlen a modell konkr´et param´eterez´es´et˝ol. A m´asik komponens pedig a modell felsz´ın´en fut´o param´eter-g¨orbe g¨orb¨ulete. Mindkett˝o befoly´asolja a becsl´esek megb´ızhat´os´ag´at ´es an-nak egym´ast´ol val´o f¨ugg´es´et.

A ’Puromycin’ adathalmaz egy 23 soros 3 oszlopos adathalmaz amiben a harmadik (’state’) oszlop azt mutatja, hogy az els˝o (’conc’) oszlopban adott koncetr´aci´o ´es a m´ a-sodik (’rate’) oszlopban adott enzimreakci´o sebess´eget kezelt (’treated’), vagy kezeletlen (’untreated’) anyagon m´ert´ek. Az els˝o parancs az ’adat’ v´altoz´oba menti az adathal-maz kezelt esetekre vonatkoz´o 12 soros r´esz´et. A k¨ovetkez˝o parancs a ’deriv3()’ elj´ar´ast felhaszn´alva kisz´am´ıtja a 3.11 ´abr´an is bemutatott Michaelis-Menten g¨orbe szimbolikus deriv´altj´at. A harmadik parancs megfelel˝o kezd˝o´ert´ekek mellett a modellt illeszti. V´ e-g¨ul az utols´o parancs megh´ıvja az illesztett modellre — az alap´ertelmez´es szerint nem bet¨olt¨ott ’MASS’ alapcsomagb´ol — az ’rms.curv()’ programot. Ennek eredm´enye:

Parameter effects: c^theta x sqrt(F) = 0.2121 Intrinsic: c^iota x sqrt(F) = 0.092

a nem-linearit´as param´eterez´esb˝ol ´es a modellb˝ol sz´armaz´o k´et r´esz´enek a m´ert´eke.

Az ’nlstools’ csomag jackknife ´es bootstrap eszk¨ozei

A k¨ovetkez˝o programr´eszlet az ’nlstools’ csomag [1] ’survivalcurve2’ interpret´aci´os adat-halmaz´aval sz´amol. Ez egy 23 soros 2 oszlopos ’data.frame’, ami a bakt´erium-s˝ur˝us´eg logaritmusa az id˝o m´ul´as´aval. Az els˝o parancs bet¨olti az ’nlstools’ kieg´esz´ıt´est. Nem tartozik az R alapk´eszlet´ehez, el˝oz˝oleg install´alni kell! A m´asodik pedig, egy r¨ovidebb nev˝u v´altoz´oba t¨olti a feldolgozott adatsort.

require(nlstools)

data(survivalcurve2);sc2<-survivalcurve2

mafart#Weibull model as parameterized by Mafart et al.

preview(mafart,sc2,start=list(p=1,delta= 1,LOG10N0=7 )) preview(mafart,sc2,start=list(p=1,delta=10,LOG10N0=7 ))

preview(mafart,sc2,start=list(p=2,delta=10,LOG10N0=7.5))

A h´arom egym´asut´ani ’preview()’ parancs egy-egy ´abr´at k´esz´ıt, az elemzend˝o adatokkal

´

es a ’mafart’ v´altoz´oban megadott modell ’start’ szerinti param´eterez´es´evel. Ezek az

´

abr´ak, ez az utast´as arra alkalmas, hogy megfelel˝o indul´o´ert´ekeket tal´aljunk a modell k´es˝obbi illeszt´es´ehez.

A ’mafart’ egy ’formula’ oszt´aly´u v´altoz´o. Ha ki´ıratjuk, l´athatjuk, hogy l´enyeg´eben egy hatv´any f¨uggv´eny:

LOG10N $\sim$ LOG10N0 - (t/delta)\verb|^|p

Az illeszt´es eredm´eny´et az adatokkal a ’plotfit()’ kirajzolja, ´ugy mint az a 3.14 ´abr´an l´athat´o.

Az ’nlsContourRSS()’ a legkisebb n´egyzetek m´odszer´evel hat´arozza meg a becs¨ult para-m´eterek megb´ızhat´os´agi tartom´any´at. Grafikus eredm´eny´et a 3.15 ´abra mutatja. Van a csomagban egy ’nlsConfRegions()’ f¨uggv´eny is, ami a likelihood f¨uggv´eny alapj´an veszi a megb´ızhat´os´agi tartom´anyt. ´Erdekes ¨osszehasonl´ıtani a kett˝ot!

Az ’nlsJack()’ megmutatja, hogy melyik megfigyel´esek vannak k¨ul¨on¨osen er˝os befoly´ as-sal a param´eterbecsl´esekre. Az eredm´enyek grafikusan is szeml´eltethet˝oek. Itt csak a numerikus eredm´enyeket mutatjuk be.

---Jackknife estimates

p delta LOG10N0 2.632607 11.260269 7.669289

3.14. ´abra. A bakt´erium-s˝ur˝us´eg modellje

3.15. ´abra. Ap´es a delta megb´ızhat´os´aga legkisebb n´egyzetek m´odszer´evel v´eve

---Jackknife confidence intervals

Low Up

p 2.155147 3.110067 delta 9.916903 12.603636 LOG10N0 7.497482 7.841096

---Influential values

* Observation 15 is influential on p

* Observation 18 is influential on p

* Observation 22 is influential on p

* Observation 15 is influential on delta

* Observation 18 is influential on delta

Az utols´o k´et utas´ıt´as k¨oz¨ul az els˝o a ’nlsBoot()’. Ez egy 2000 elem˝u bootstrap minta alapj´an k´esz´ıt becsl´est ´es konfidencia intervallumot a param´eterekre.

A m´asodik, a form´azott ki´ırat´as eredm´enye:

Figyelemrem´elt´o, a kor´abbi becsl´esekt˝ol val´o elt´er´es.

In document ¨o T bbdimenzi ´o sstatisztika (Pldal 46-51)