Spline - ALKALMAZOTT MÓDSZEREK - STATISZTIKAI IDİSORELEMZÉS A TİZSDÉN

4 ALKALMAZOTT MÓDSZEREK

4.1 Dekompozíció

4.1.4 Spline

A trendszámítás alapproblémája, hogy ismert értékekhez, illetve (azokat ábrázolva) pontokhoz keresünk egy olyan görbét, amely azokat megfelelıen jól közelíti. A matematikán belül ennek a problémának egy lehetséges megoldására az approximációt alkalmazzák.

A klasszikus interpolációs elmélet Lagrange nevéhez főzıdik. A probléma tehát, amelyre három megoldási módot is adtak azóta, a következı: keresem azt az n-ed fokú polinomot, amely minden megfigyelt értéken éppen keresztül megy, azaz illeszkedik.

Abban az esetben, ha a megfigyelés csupán két értékbıl áll, akkor a keresett polinom egy egyenes, vagyis egy elsı-fokú polinom.

A polinomom általános formája:

b x m

y= ⋅ + (4.22.)

ahol két ismeretlen van: m, amely az egyenes meredekségét adja meg,

b , amely pedig azt mutatja meg, hogy az egyenes milyen magasságban metszi az y tengelyt.

A két ismeretlen miatt ezt az egyenest 2 egyenlet megoldásával meghatározható.

8. ábra: Két megfigyelésre illeszkedı polinom

Ha a megfigyelések száma 3, akkor egy parabolával lehet ezeket az ábrában összekötni. A parabola egy másod-fokú polinom, melynek általános formája:

c x b x a

y= ⋅ ² + ⋅ + (4.23.) .

0 2 4 6 8 1 0 1 2

0 1 2 3

9. ábra: Három megfigyelés és a polinomja

Ugyanezt a logikát követve: ha n+1pont, megfigyelés lenne, akkor arra egy n-ed fokú polinom illeszthetı. A polinomom általános alakja ebben az esetben:

0 1

2 2 1

1 ...

)

(x y a x a x a x a x a

y = = _n⋅ ⁿ + _n₋ ⋅ ⁿ⁻ + + ⋅ + ⋅ + (4.24.)

Jól látható, hogy az n-ed fokú polinomnak n+1 darab ismeretlenje van, amelyet n+1 darab egyenletbıl álló egyenletrendszer oldana meg. Ez már elég nagy feladat.

10. ábra: Több elemő megfigyelés és polinomja

Ennek a bonyolult egyenletrendszernek a megoldására adtak meg a matematikusok három megoldást.

1. „Egyszerő” megoldás

Sajnos ennek a módszernek csak a neve egyszerő. Ugyanis egy ilyen lineáris egyenletrendszert eredményez:

-6 -4 -2 0 2 4 6 8 10

0 1 2 3 4

0 2 4 6 8 10 12 14 16

0 1 2 3 4 5 6 7 8

Az ilyen típusú rendszert pl. elemi bázis transzformáció módszerrel segítségével lehet megoldani, ami nagy elemszámú mintánál meglehetısen nehezen számolható ki.

2. Lagrange - féle alappolinomos elıállítás

Ennél a módszernél a keresett polinomot elemeire kell szétszedni a következık alapján:

elıször is olyan függvényeket keresünk, amelyek teljesítik az alábbi feltételt:

• az x helyen a függvény értéke éppen _k y_k =1, míg az összes többi adott

• köztük pedig bármilyen módon mozoghat a polinom.

4. ábra: Egy lehetséges Lagrange - alappolinom

Ezt a feltételt teljesíti a Lagrange – féle alappolinom:

)

A (4.26.) képletet egy kicsit megvizsgálva látható:

• bármely x helyen az _k y értéke 1 lesz (hiszen ekkor _k xhelyébe x -t írva a _k számláló és a nevezı ugyanaz lesz.)

• bármely olyan adott helyen, ami nem x , ott pedig a számláló valamelyik tagja _k 0 lesz, és így a számlálót is 0-vá teszi. Ekkor pedig már teljesen mindegy, hogy milyen nem 0 nevezıvel osztom el.

Azzal, ha egy egyszerő mőveletet, szorzást (y_k⋅l_k(x)) végrehajtjuk akkor x helyen nem _k 1-et, hanem éppen a keresett y értéket veszi fel a polinom. _k

Ezután már a keresett y(x) egyenletet kell megoldani, hogy összeadva az összesen +1

n darab felszorzott polinomot, azaz

n l

y l

y l y x

y( )= ₀⋅ ₀+ ₁⋅ ₁+...+ ⋅ (4.27.) legyen a végeredmény.

3. Newton – féle interpoláció

Ezt a módszert napjainkban osztott differenciák módszerének hívják. Ez egy olyan megoldási módszer, amely ugyanazt a fent említett Lagrange-féle interpolációs polinomot adja eredményül más matematikai meggondolások alapján.

Az interpolációnak van egy kellemetlen tulajdonsága, az oszcillálás, vagyis hogy a görbénken túl nagy „kinyúlások” vannak. Ezeket a kiugrásokat képes az approximáció, annak egy lehetséges megvalósítása a spline, csökkenti, mintegy kisimítva ezzel a görbét.

Approximáció az a matematikai mővelet, amelynél nem az a feladat, hogy a megfigyelt pontokon átmenı görbét adjon, hanem hogy a pontokat a lehetı legjobban közelítse. A trendszámításnak is éppen ez lenne a lényege.

A spline az interpolációs görbét alacsonyabb rendő, egymáshoz kapcsolódó görbeívekbıl állítja elı, azaz lokálisan keresi a pontokat közelítı görbét. Éppen ezen tulajdonság miatt képesek a trendet jobban leírni az approximációs spline-ok, hiszen nem globálisak, s így a helyi érzékenységük is nagyobb.

Egy a matematikában is új eljárás képes a regresszió és az approximáció elınyös tulajdonságait ötvözni. Az eljárás a legkisebb négyzetek módszerének elve alapján végzi a súlyok kiválasztását és iterációs eljárás eredménye a spline közelítés (Polgár [48] ). Az alkalmazott módszer a megfelelı súlyok választásával alkalmas robosztus becslés elkészítésére, amellyel az outlierek is kiszőrhetıek vagy kisebb súllyal szerepeltethetıek.

Az eljárás elsı lépésében meg kell határozni, hogy hány splineból ( N ) álljon a keresett görbe. Ennek megállapításához a rendelkezésre álló adatok alapján „szakértıi” döntést kell hozni.

A második teendı annak eldöntése, hogy az osztópontok (z₀,z₁,K,z_N), ahol az egyes görbedarabkák érintkeznek melyik pontok legyenek. Itt több lehetıség közül lehet választani. Az egyik megoldás, amikor a megfigyelt pontok közül választunk érintkezési pontot, azaz z₀,z₁,K,z_N ∈

{

t₁,K,tn

}

. A másik megoldásban megengedjük, hogy a köztes pontok bármely más értéket felvegyenek a megfigyelt pontok között, azaz

1 1, ,z_N₋

z K ∈

]

t₁,K,tn

[

, míg a végpontok meghatározásának ismét több lehetısége adódik. Az általam választott megoldásban az elsı megfigyelt érték az elsı spline kiindulópontja és az utolsó megfigyelés az utolsó spline záró pontja, vagyis z₀ =t₁ és

N t

z = .

Az eljárás harmadik lépésében már a minimum feladat végrehajtása zajlik, ahol a keresett összefüggésünk:

min )

) ( ( )

( ²

1 2 0

→

−

′′ +

∫ ∑

= i i

z z

i g z f

N g

λ ^. ^(4.28.)

Az összefüggés elsı tagja biztosítja a klasszikus interpolációs/approximációs spline görbületének értékeit, miközben a második tag a robosztus becslést végzi, s az outlierek szerepét csökkenti.

A keresett függvényünk a következıképpen néz ki: azaz köbös spline-ok.

A tızsdei folyamatokról bár tudjuk, hogy nem kiszámíthatóak, ám feltételezzük, hogy valamilyen szintig mégiscsak azok, ezért kell olyan görbetípust választanunk, ahol a görbület minimális. Ezt a feltételt egy harmadfokú görbe teljesíti, s ezért használunk köbös spline-t.

A harmadfokú görbe általános alakja:

A spline-nak az alábbi feltételeket kell teljesítenie:

1. A görbéknek folyamatosnak kell lenniük, vagyis az egyes pontokban a két érintkezı görbének ugyanazt az értéket kell felvennie:

g₁(z₁)= g₂(z₁)

2. A görbéknek folytonosan differenciálhatónak kell lennie, ezzel biztosítva, hogy a görbékhez húzott érintı (a szélsı két pontot kivéve) a pontokban megegyezzen (ezzel biztosítva, hogy ne „törjön” a görbe):

) ( )

( ₁ ₂ ₁

1 z g z

g′ = ′

) ( )

( ₂ ₃ ₂

2 z g z

g′ = ′ (4.32.)

g′_N₋₁(z_N₋₁)= g′_N(z_N₋₁)

3. A görbék akárhányszor differenciálhatóak legyenek, hogy a görbék görbülete a közbensı pontokban azonos legyen:

) ( )

( ₁ ₂ ₁

1 z g z

g′′ = ′′

) ( )

( ₂ ₃ ₂

2 z g z

g′′ = ′′′ (4.33.)

g_N′′₋₁(z_N₋₁)=g_N′′′(z_N₋₁)

A fenti feltételeknek megfelelıen a minimum feladat algoritmusa MapleV 5 programmal futtatható, ahol az iterációs eljárás a következıképp zajlik:

1. megválasztjuk a p_i kezdı súlyok értékét. (Indításkor egységsúlyok alkalmazás a legmegfelelıbb.)

2. kiszámítja a a ,_i b ,_i c ,_i d együtthatókat _i

3. ha egy elıre megadott megállási feltétel²¹ teljesül leáll, különben g(z) spline segítségével újra meghatározza a

p súlyokat és visszaugrik a 2. lépéshez.

In document STATISZTIKAI IDİSORELEMZÉS A TİZSDÉN (Pldal 60-66)