4 ALKALMAZOTT MÓDSZEREK
4.1 Dekompozíció
4.1.4 Spline
A trendszámítás alapproblémája, hogy ismert értékekhez, illetve (azokat ábrázolva) pontokhoz keresünk egy olyan görbét, amely azokat megfelelıen jól közelíti. A matematikán belül ennek a problémának egy lehetséges megoldására az approximációt alkalmazzák.
A klasszikus interpolációs elmélet Lagrange nevéhez főzıdik. A probléma tehát, amelyre három megoldási módot is adtak azóta, a következı: keresem azt az n-ed fokú polinomot, amely minden megfigyelt értéken éppen keresztül megy, azaz illeszkedik.
Abban az esetben, ha a megfigyelés csupán két értékbıl áll, akkor a keresett polinom egy egyenes, vagyis egy elsı-fokú polinom.
A polinomom általános formája:
b x m
y= ⋅ + (4.22.)
ahol két ismeretlen van: m, amely az egyenes meredekségét adja meg,
b , amely pedig azt mutatja meg, hogy az egyenes milyen magasságban metszi az y tengelyt.
A két ismeretlen miatt ezt az egyenest 2 egyenlet megoldásával meghatározható.
8. ábra: Két megfigyelésre illeszkedı polinom
Ha a megfigyelések száma 3, akkor egy parabolával lehet ezeket az ábrában összekötni. A parabola egy másod-fokú polinom, melynek általános formája:
c x b x a
y= ⋅ 2 + ⋅ + (4.23.) .
0 2 4 6 8 1 0 1 2
0 1 2 3
x
y
9. ábra: Három megfigyelés és a polinomja
Ugyanezt a logikát követve: ha n+1pont, megfigyelés lenne, akkor arra egy n-ed fokú polinom illeszthetı. A polinomom általános alakja ebben az esetben:
0 1
2 2 1
1 ...
)
(x y a x a x a x a x a
y = = n⋅ n + n− ⋅ n− + + ⋅ + ⋅ + (4.24.)
Jól látható, hogy az n-ed fokú polinomnak n+1 darab ismeretlenje van, amelyet n+1 darab egyenletbıl álló egyenletrendszer oldana meg. Ez már elég nagy feladat.
10. ábra: Több elemő megfigyelés és polinomja
Ennek a bonyolult egyenletrendszernek a megoldására adtak meg a matematikusok három megoldást.
1. „Egyszerő” megoldás
Sajnos ennek a módszernek csak a neve egyszerő. Ugyanis egy ilyen lineáris egyenletrendszert eredményez:
-6 -4 -2 0 2 4 6 8 10
0 1 2 3 4
x
y
0 2 4 6 8 10 12 14 16
0 1 2 3 4 5 6 7 8
x
y
0
Az ilyen típusú rendszert pl. elemi bázis transzformáció módszerrel segítségével lehet megoldani, ami nagy elemszámú mintánál meglehetısen nehezen számolható ki.
2. Lagrange - féle alappolinomos elıállítás
Ennél a módszernél a keresett polinomot elemeire kell szétszedni a következık alapján:
elıször is olyan függvényeket keresünk, amelyek teljesítik az alábbi feltételt:
• az x helyen a függvény értéke éppen k yk =1, míg az összes többi adott
• köztük pedig bármilyen módon mozoghat a polinom.
4. ábra: Egy lehetséges Lagrange - alappolinom
Ezt a feltételt teljesíti a Lagrange – féle alappolinom:
)
A (4.26.) képletet egy kicsit megvizsgálva látható:
• bármely x helyen az k y értéke 1 lesz (hiszen ekkor k xhelyébe x -t írva a k számláló és a nevezı ugyanaz lesz.)
• bármely olyan adott helyen, ami nem x , ott pedig a számláló valamelyik tagja k 0 lesz, és így a számlálót is 0-vá teszi. Ekkor pedig már teljesen mindegy, hogy milyen nem 0 nevezıvel osztom el.
Azzal, ha egy egyszerő mőveletet, szorzást (yk⋅lk(x)) végrehajtjuk akkor x helyen nem k 1-et, hanem éppen a keresett y értéket veszi fel a polinom. k
Ezután már a keresett y(x) egyenletet kell megoldani, hogy összeadva az összesen +1
n darab felszorzott polinomot, azaz
n
n l
y l
y l y x
y( )= 0⋅ 0+ 1⋅ 1+...+ ⋅ (4.27.) legyen a végeredmény.
3. Newton – féle interpoláció
Ezt a módszert napjainkban osztott differenciák módszerének hívják. Ez egy olyan megoldási módszer, amely ugyanazt a fent említett Lagrange-féle interpolációs polinomot adja eredményül más matematikai meggondolások alapján.
Az interpolációnak van egy kellemetlen tulajdonsága, az oszcillálás, vagyis hogy a görbénken túl nagy „kinyúlások” vannak. Ezeket a kiugrásokat képes az approximáció, annak egy lehetséges megvalósítása a spline, csökkenti, mintegy kisimítva ezzel a görbét.
Approximáció az a matematikai mővelet, amelynél nem az a feladat, hogy a megfigyelt pontokon átmenı görbét adjon, hanem hogy a pontokat a lehetı legjobban közelítse. A trendszámításnak is éppen ez lenne a lényege.
A spline az interpolációs görbét alacsonyabb rendő, egymáshoz kapcsolódó görbeívekbıl állítja elı, azaz lokálisan keresi a pontokat közelítı görbét. Éppen ezen tulajdonság miatt képesek a trendet jobban leírni az approximációs spline-ok, hiszen nem globálisak, s így a helyi érzékenységük is nagyobb.
Egy a matematikában is új eljárás képes a regresszió és az approximáció elınyös tulajdonságait ötvözni. Az eljárás a legkisebb négyzetek módszerének elve alapján végzi a súlyok kiválasztását és iterációs eljárás eredménye a spline közelítés (Polgár [48] ). Az alkalmazott módszer a megfelelı súlyok választásával alkalmas robosztus becslés elkészítésére, amellyel az outlierek is kiszőrhetıek vagy kisebb súllyal szerepeltethetıek.
Az eljárás elsı lépésében meg kell határozni, hogy hány splineból ( N ) álljon a keresett görbe. Ennek megállapításához a rendelkezésre álló adatok alapján „szakértıi” döntést kell hozni.
A második teendı annak eldöntése, hogy az osztópontok (z0,z1,K,zN), ahol az egyes görbedarabkák érintkeznek melyik pontok legyenek. Itt több lehetıség közül lehet választani. Az egyik megoldás, amikor a megfigyelt pontok közül választunk érintkezési pontot, azaz z0,z1,K,zN ∈
{
t1,K,tn}
. A másik megoldásban megengedjük, hogy a köztes pontok bármely más értéket felvegyenek a megfigyelt pontok között, azaz1 1, ,zN−
z K ∈
]
t1,K,tn[
, míg a végpontok meghatározásának ismét több lehetısége adódik. Az általam választott megoldásban az elsı megfigyelt érték az elsı spline kiindulópontja és az utolsó megfigyelés az utolsó spline záró pontja, vagyis z0 =t1 ésn
N t
z = .
Az eljárás harmadik lépésében már a minimum feladat végrehajtása zajlik, ahol a keresett összefüggésünk:
min )
) ( ( )
( 2
1 2 0
→
−
′′ +
∫ ∑
= i i
z z
N
i
i g z f
p
N g
λ . (4.28.)
Az összefüggés elsı tagja biztosítja a klasszikus interpolációs/approximációs spline görbületének értékeit, miközben a második tag a robosztus becslést végzi, s az outlierek szerepét csökkenti.
A keresett függvényünk a következıképpen néz ki: azaz köbös spline-ok.
A tızsdei folyamatokról bár tudjuk, hogy nem kiszámíthatóak, ám feltételezzük, hogy valamilyen szintig mégiscsak azok, ezért kell olyan görbetípust választanunk, ahol a görbület minimális. Ezt a feltételt egy harmadfokú görbe teljesíti, s ezért használunk köbös spline-t.
A harmadfokú görbe általános alakja:
i
A spline-nak az alábbi feltételeket kell teljesítenie:
1. A görbéknek folyamatosnak kell lenniük, vagyis az egyes pontokban a két érintkezı görbének ugyanazt az értéket kell felvennie:
g1(z1)= g2(z1)
2. A görbéknek folytonosan differenciálhatónak kell lennie, ezzel biztosítva, hogy a görbékhez húzott érintı (a szélsı két pontot kivéve) a pontokban megegyezzen (ezzel biztosítva, hogy ne „törjön” a görbe):
) ( )
( 1 2 1
1 z g z
g′ = ′
) ( )
( 2 3 2
2 z g z
g′ = ′ (4.32.)
M
g′N−1(zN−1)= g′N(zN−1)
3. A görbék akárhányszor differenciálhatóak legyenek, hogy a görbék görbülete a közbensı pontokban azonos legyen:
) ( )
( 1 2 1
1 z g z
g′′ = ′′
) ( )
( 2 3 2
2 z g z
g′′ = ′′′ (4.33.)
M
gN′′−1(zN−1)=gN′′′(zN−1)
A fenti feltételeknek megfelelıen a minimum feladat algoritmusa MapleV 5 programmal futtatható, ahol az iterációs eljárás a következıképp zajlik:
1. megválasztjuk a pi kezdı súlyok értékét. (Indításkor egységsúlyok alkalmazás a legmegfelelıbb.)
2. kiszámítja a a ,i b ,i c ,i d együtthatókat i
3. ha egy elıre megadott megállási feltétel21 teljesül leáll, különben g(z) spline segítségével újra meghatározza a
ij
p súlyokat és visszaugrik a 2. lépéshez.