AZ OPTIMALIZ ÁL ÁS ALKALMAZ ÁSAI

(1)

AZ OPTIMALIZ ´ AL ´ AS ALKALMAZ ´ ASAI

Csendes Tibor

Szeged, 2018.

(2)

El ˝osz ´o

A jelen jegyzet a Szegedi Tudományegyetemen 2004-t˝ol tartott Az optimalizálás alkalmazásai c´ım ˝u tárgy anyagát tartalmazza. A tárgy heti két óra el˝oadást és egy óra gyakorlatot jelent.

A jegyzet az operáci ókutatás, lineáris algebra, kalkulus és numerikus matematika témáira támaszkodik. Aktuális változata egy része, a hozzá kapcsol ód ó feladatok, gyakorlatok és adataik elérhet˝ok a

http://www.inf.u-szeged.hu/_∼csendes/optalk.pdf c´ımen.

A tárgy olyan tudást k´ıván adni, amely elegend˝o egyszer ˝ubb optimalizálási, operáci ókutatási munkák elvégzéséhez, és amelyet önáll ó gyakorlással továbbfejlesztve egy-egy ilyen feladat teljes megoldását meg lehet találni. Mivel az érintett eljárások, programcsomagok gyakran változnak, az anyag f˝oleg az álland ó vagy kevésbé változ ó ismereteket tartalmazza.

A rendelkezésre áll ó r övid id˝o (kb. 14×3 óra) nem elég a teljes k ör ˝u tárgyalására, ezért a legfontosabb defin´ıci ókat, összef üggéseket és az elméletet az érintett eljárások tárgyalása el˝ott csak a feltétlen ül sz ükséges terjedelemben ismertetj ük. A teljesen önáll ó optimalizáláshoz ez persze nem elegend˝o. Ennek ellenére b´ızom benne, hogy a tárgyalt anyag seg´ıt a leggyakoribb hibákat elker ülni, és a viszonylag k önnyen kezelhet˝o programok seg´ıtségével (támaszkodva a mind t öbb esetben rendelkezésre áll ó readme fájlokra, s úg ó, tanácsad ó varázsl ókra) önáll ó munkával is lehetséges a további sz ükséges modellek és eljárások megismerése. A teljes itt k özreadott anyag t öbb, mint amit egy féléves kurzusban át lehet adni, ez némi rugalmasságot k övetel az el˝oad ót ól, illetve a gyakorlatvezet˝ot˝ol.

További cél seg´ıtséget ny újtani az optimalizálási, operáci ókutatási vizsgálatokhoz olyanok számára is, akik ezt a hagyományos képzés keretében nem tanulták. Így a jegyzet alapján az egyszer ˝ubb feladatok esetén az olvas ó elegend˝o útmutatást kap ahhoz, hogy a feladatát úgy fogalmazza meg, illetve ´ırja át, hogy az a rendelkezésre áll ó szoftverrel hatékonyan megoldhat ó legyen.

A kreditrendszerre val ó áttéréssel megváltozott a tantárgyak teljes´ıtésének feltétele is. A félreértések, tévedések elker ülése céljáb ól hasznos el˝ore áttekinteni az Informatikai Intézet vendégoldalán hogy mi mindent kell ahhoz teljes´ıteni, hogy a vizsgára bocsáthat ósági szintet el lehessen érni.

Itt mondok k ösz önetet korábbi hallgat óimnak és munkatársaimnak a jegyzet létrej öttéhez, illetve a jav´ıtásához ny újtott seg´ıtség ükért. Várom a további véleményeket és javaslatokat is. A tananyag az EFOP-3.5.1-16-2017-00004 pályázat támogatásával kész ült.

Szeged, 2018. szeptember

a szerz˝o 3

(3)

4

(4)

Jel ¨ol´esek

Itt a legfontosabb, szinte mindig a megadott formában használatos jel öléseket adjuk meg, de ezekt˝ol helyenként – ahol a tárgyalás ezt megk öveteli – eltérhet ünk.

AD automatikus differenci´al´as

α intervallum sorozatok konvergencia rendje c(X) a k özponti alak alappontja azX intervallumban f(x) a célf üggvény

f(X) a célf üggvény értékkészlete azXintervallumon

F(X) a célf üggvény befoglal ó f üggvénye azXintervallumon F^′(X) az egyváltoz ós f üggvény deriváltja befoglal ó f üggvénye f(x^∗) a globális minimum értéke

f˜ intervallumos optimalizálási m ódszerben a globális minimum ak- tuális fels˝o becslése

gi(x) egy feltételi f üggvény

H(x) a célf üggvény Hesse-mátrixa

H(X) a célf üggvény Hesse-mátrixa befoglal ó f üggvénye

I a kompakt intervallumok halmaza

Iⁿ azn-dimenzi ós kompakt intervallumok halmaza m(X) azX intervallum k özéppontja

∇f(x) a célf üggvény gradiense

R a val ´os sz´amok halmaza

Rⁿ azn-dimenzi ós val ós vektorok halmaza x, y, ... változ ók

X, Y, ..., A, B, ... intervallumok vagy m´atrixok

X, X azX intervallum als ó és fels˝o korlátja,X = [X, X]

x^∗ a globális minimumpont w(X) azXintervallum szélessége

5

(5)

6 Jel ¨ol´esek

(6)

1. fejezet Bevezet´es

Optimalizálási feladatok a mindennapi élet számos ter ületén el˝ofordulnak, f˝oleg a mérn öki, gaz- dasági alkalmazások ter ületén, de természetesen a tudományos kutatásban is. Ide tartoznak azok a problémák, amelyekben a kérdésfeltevés a k övetkez˝o sémát k öveti: mikor lesz minimális egy mennyiség, melyik esetben optimális egy beáll´ıtás, milyen paraméterek mellett lesz maximális egy egy ütthat ó értéke stb. Gyakorlati esetben a hasonl ó kérdések úgy hangzanak például, hogy:

mikor lesz a legnagyobb a profit, ha k ül önben adott termelési feltételeknek elegettesz ünk, mely esetben lesz minimális a k öltsége egy beruházásnak, mik özben el˝o´ırt mennyiséget gyártunk, és a lehetséges megoldásainkat feltételek korlátozzák.

Az optimalizálás a matematika, azon bel ül az operáci ókutatás, vagy más szempontb ól a numerikus matematika része. Érintkezik a szám´ıtástudománnyal, és van szám´ıtástechnikai vet ülete is. Az operáci ókutatás mint önáll ó tudományter ület a m últ század k özepét˝ol létezik,

és számos k öz ös részter ülete van az alkalmazott matematikával. Az OR Today c´ım ˝u szakmai foly óirat egy korábbi felmérése szerint az Amerikai Egyes ült Államokban az operáci ókutatási szakemberek álláskilátása volt a negyedik legjobb a vizsgált nagyon sok szakma k öz ül.

A finomabb kategorizálás szerint a globális optimalizálás a nemlineáris optimalizálás, vagy más néven a matematikai programozás témak öréhez tartozik. Az ut óbbi név a lineáris prog- ramozás anal ógiájára azt a ter ületet jel öli, amikor az optimalizáland ó f üggvény, vagy a feltételi halmazt kijel öl˝o f üggvények valamelyike nem lineáris.

Az egyik, Hans-Paul Schwefel professzort ól hallott t örténet szerint a SIEMENS cég számára az atomer˝om ˝uvek f ˝ut˝oelemeinek elhelyezését optimalizálták egy (kés˝obb tárgyalt) ún. evol úci ós algoritmussal. A mérn ök ök által gyakorlati megfontolásokon és szimmetria elven alapul ó korábbi megoldáson kb. egy százalékot siker ült jav´ıtani a hatékonyság szempontjáb ól. Ennek ellenére nem tudhat ó, hogy mi lenne az optimális elhelyezés, és az sem, hogy a jelen megoldás a cél- f üggvény értékében mennyire tér el att ól. Mégis, az új elhelyezési javaslat akkora megtakar´ıtást jelentett, hogy a kutat ó intézete német Márkában is 9 jegy ˝u támogatásban részes ült.

Egy másik hasonl ó, nagy volumen ˝u optimalizálási feladatban egy nagy eur ópai multi számára kellett a telephelyek optimális elhelyezését meghatározni. Jellemz˝o m ódon a feladat modelljének feláll´ıtása nem volt triviális, és a piacon kaphat ó kereskedelmi optimalizál ó szoftver nem volt alkalmas a feladat k özvetlen megoldására. A talált k özel´ıt˝o megoldás kb. 7%-os megtakar´ıtást jelentett, mik özben az érintett vállalkozás éves pénzforgalma Eur óban is t öbb százmilli ós volt.

A 2000-ben Budapesten rendezett EURO nev ˝u operáci ókutatási konferencián (a konferencia internetes vendégoldala ahttp://www.sztaki.hu/conferences/euro17/c´ımen érhet˝o el) George L. Nemhauser professzor Large-Scale Discrete Optimization in Airline Scheduling c´ım ˝u plenáris el˝oadásával arr ól számolt be, hogy az amerikai légitársaságok optimalizálási feladatai (pl. a személyzet beosztása, ütemezési, hozzárendelési és száll´ıtási feladatok) az évi t öbb milliárd

7

(7)

8 1. FEJEZET, BEVEZET ÉS Dolláros k öltségek százalékos nagyságrendjét is megtakar´ıthatják.

Saját eset ünkben a K ÉSZ Kft. számára kerest ünk egy olyan gyors algoritmust, amely képes a napi ép´ıtési feladatokhoz meghatározni azt, hogy a leszaband ó munkadarabokat milyen sorrendben és milyen orientálással vágják ki a raktáron lev˝o k ül önb öz˝o profil ú acél rudakb ól

úgy, hogy a veszteség minimális legyen. A teljes leszámolás kb. annyi eset megvizsgálását igényelte volna, ahány elemi részecske van az univerzumban (és emiatt nyilván kivitelezhetetlen lett volna). A javasolt heurisztika a részfeladatok nagy részén garantáltan optimális megoldást szolgáltatott, a t öbbin pedig jobb eredményeket tudott adni, mint a korábban használt eljárás.

Az ilyen jelleg ˝u nyersanyagok felhasználásának éves volumene az érintett vállalatnál milliárdos nagyságrend ˝u.

Ezen példák mindegyikében kimondatlanul is nyilván a legjobb megoldás megtalálásában vol- tunk érdekeltek, és nem csak egy olyant keres ünk, amely egy sz ˝uk k örnyezetében a legjobb

értéket adja. Emiatt ezek is a globális optimalizálás témak örébe tartoznak. Ennek ellenére a globális optimalizálási feladatok leggyakoribb kezelési m ódja az ignorálás, tehát a felhasznál ó sokszor megelégszik egy helyi keres˝o eljárás által adott k özel´ıt˝o megoldással — ami nyilvánval ó m ódon mind a célf üggvényértékben, mind a talált optimalizáland ó változ ók értékében tetsz˝o- legesen messze lehet a val ódi megoldást ól.

1.1. Intervallum matematika

1.1.1. Intervallum-aritmetika és a befoglal ó f üggvények

Legyen I a kompakt val ós intervallumok tere. Az intervallum-aritmetika m ˝uveletei ezen a halmazon vannak értelmezve. A m ˝uveleteket úgy kell definiálni, hogy az A ◦ B eredménye egy olyan C intervallum legyen, amely pontosan azon c val ós számok halmaza, amelyekhez léteznek olyan a ∈ A és b ∈ B val ósok, hogy c = a◦b. Itt ◦ a négy alapm ˝uvelet valamelyikét jel öli. Az ilyen aritmetika seg´ıtségével k övetni lehet a kerek´ıtési hibákat, és az adatainkat terhel˝o bizonytalanság t ükr öz˝odhet az eredményekben.

Az el˝oz˝o defin´ıci ó mellett az intervallum-aritmetikát lehet kizár ólag a val ós aritmetikára támaszkodva is definiálni. Az[a, b] és[c, d] intervallumokra legyen

[a, b] + [c, d] = [a+c, b+d], [a, b]−[c, d] = [a−d, b−c],

[a, b][c, d] = [min(ac, ad, bc, bd), max(ac, ad, bc, bd)], [a, b]/[c, d] = [a, b][1/d, 1/c].

Az osztást csak akkor értelmezz ük, ha 0 ∈/ [c, d]. Érdemes megjegyezni, hogy ez ut óbbi feltétel j ól megfogalmazott gyakorlati feladatokban tapasztalataink szerint szinte kivétel nélk ül teljes ül.

A val ós m ˝uveleteknek ezt a kiterjesztését intervallumokra természetes vagy naiv intervallum- kiterjesztésnek nevezik. Az ut óbbi években vizsgálják az olyan intervallum-aritmetikákat is, amelyek nem csak kompakt intervallumokon definiáltak. Ezeken a nullát tartalmaz ó intervallummal val ó osztás is értelmezhet˝o.

Bár az alapm ˝uveletek pontosak a fenti értelemben, mégis, a vel ük kiszám´ıtott bonyolultabb f üggvények durva becslései is lehetnek a megfelel˝o értékkészletnek. A gyakran emlegetett példa a k övetkez˝o: az x − x² értékkészlete a [0, 2] intervallumon [−2, 0,25]. Ezzel szemben az intervallum-kiterjesztéssel ad ód ó intervallum [−4, 2].

(8)

1.1. INTERVALLUM MATEMATIKA 9 Az intervallum-aritmetika m ˝uveleteinek tulajdons´agaival foglalkozik az intervallum-algebra.

Számos, a val ós m ˝uveletekre érvényes tulajdonság változatlanul teljes ül az intervallum-m ˝uveletekre is (pl. a kommutativitás, asszociativitás az összeadásra és a szorzásra), de általában nincs inverz, és érvényes a szubdisztrib úci ós tulajdonság: A(B+C)⊆AB +AC.

Az alapm ˝uveletekhez hasonl óan k önnyen lehet definiálni az elemi f üggvények intervallum- kiterjesztését is, tehát a szám´ıt ógépen kiszám´ıthat ó f üggvényeket szinte kivétel nélk ül meg lehet val ós´ıtani természetes intervallum-kiterjesztésben is.

Az intervallum-aritmetika alkalmazása szempontjáb ól alapvet˝o fogalom a befoglal ó f ügg- vény. Az F(X) :Iⁿ→ Iaz f(x) n-változ ós val ós f üggvény befoglal ó f üggvénye, haf(x)∈F(X)

érvényes minden x ∈ X pontra és X ∈ Iⁿ intervallumra. Az intervallum-matematika fontos eredménye, hogy az f(x) val ós f üggvényb˝ol természetes (vagy naiv) intervallum-kiterjesztéssel ad ód ó F(X)f üggvény befoglal ó f üggvény.

A befoglal ó f üggvényekt˝ol természetes azt elvárni, hogy b˝ovebb argumentum-intervallumra ne adjanak sz ˝ukebb eredmény-intervallumot. Ezt a feltételt fogalmazza meg az izotonitás: egy F(X) befoglal ó f üggvény akkor izoton, ha X ⊆ Y-b ól k övetkezik F(X) ⊆ F(Y). Az izotonitás szinte minden intervallum-aritmetika implementáci óra érvényes.

A befoglal ó f üggvények min˝oségének fontos mutat ója a rend: azt mondjuk, hogy az F(X) befoglal ó f üggvény rendje α >0, ha létezik olyan c val ós konstans, hogy w(F(X))−w(f(X))≤ cw(X)^α teljes ül minden X ∈ Iⁿ-re, ahol w(X) az X intervallum szélessége, és X az X intervallum fels˝o korlátja. A természetes intervallum-kiterjesztéssel ad ód ó befoglal ó f üggvények els˝orend ˝uek, de kidolgozott a magasabbrend ˝u befoglal ó f üggvények elmélete is. Az egynél széle- sebb intervallumokra a természetes intervallum-kiterjesztést, a kisebbekre pedig a magasabbrend ˝u befoglal ó f üggvényeket szokták ajánlani.

A szám´ıt ógépes megval ós´ıtás során minden intervallum-m ˝uvelet végrehajtása után a kapott intervallumot m ódos´ıtani szokás. Az intervallum als ó határát lefelé, fels˝o határát felfelé kell kerek´ıteni a legk özelebbi ábrázolhat ó számra. Ezzel az úgynevezett kifelé kerek´ıtési eljárással el lehet érni, hogy a befoglalási tulajdonság a kerek´ıtési hibák ellenére is fennmaradjon. Ezen a m ódon szám´ıt ógéppel automatizálhat ó a garantált megb´ızhat óság ú befoglal ó f üggvények el˝oáll´ıtása.

Az intervallum-aritmetikához használatos speciális kerek´ıtéseket az IEEE szabvány biztos´ıtja, ezért napjaink szinte minden processzora támogatja. A hetvenes évek k özepét˝ol elérhet˝ok olyan programozási nyelvek, amelyek az INTERVAL adatt´ıpus használatát támogatják. Ilyen nyelveken még az intervallum-aritmetikát megval ós´ıt ó szubrutinokat sem kell meg´ırni: a megfelel˝o befoglal ó f üggvény implementálásához elegend˝o a f üggvény kiszám´ıtásához használt változ ók t´ıpusát megváltoztatni.

A befoglal ó f üggvényekre támaszkod ó numerikus algoritmusok érzékenyek a befoglal ó f üggvény min˝oségére, pontosságára. A vázolt természetes intervallum-kiterjesztés mellett számos más eljárás is ismert a befoglal ó f üggvények el˝oáll´ıtására, például a magasabbrend ˝u deriváltakat is használ ó ún. k özépponti alakok, az automatikus deriválásra és monotonitás- vizsgálatra ép ül˝o stratégiák a befoglal ó f üggvény jav´ıtására, illetve az optimális pontosság ú befoglal ó f üggvényt generál ó eljárás. Ezek a m ódos´ıtások természetesen n övelik az egy befoglal ó f üggvény kiértékeléséhez sz ükséges szám´ıtások mennyiségét.

Az intervallum matematikát részletesen tárgyal ó jegyzet vagy magyar nyelv ˝u irodalom sajnos még nincs. Angol és német (esetleg orosz) nyelv ˝u bevezet˝o k önyveket tudok ajánlani:

1. G. Alefeld, J. Herzberger: Einf ¨uhrung in die Intervallrechnung, Bibliographises Institut AG, Mannheim, 1974.

(9)

10 1. FEJEZET, BEVEZET ´ES 2. G. Alefeld, J. Herzberger: Introduction to Interval Computations, Academic Press, New

York, 1983.

3. H. Ratschek, J. Rokne: Computer Methods for the Range of Functions, Ellis Horwood Ltd., Chichester, 1984.

4. S.A. Kalmikov, Yu.I. Sokin, Z.H. Yuldashev: Az intervallum-anal´ızis m ´odszerei (oroszul), Nauka, 1986.

5. H. Ratschek, J. Rokne: New Computer Methods for Global Optimization, Ellis Horwood Ltd., Chichester, 1988.

A jelenlegi numerikus eljárások szinte kivétel nélk ül helyi informáci ón alapulnak: pl. a vizsgált f üggvényt adott pontban kiértékel˝o szubrutin megadását k´ıvánják meg. Bár a sz óbaj öv˝o f üggvények pontos képletét, vagy legalább annak kiszám´ıtási m ódját ismerni kell, mégis a legt öbb numerikus m ódszer csak adott pontbeli f üggvényértékre ép ül. Számos feladat és m ódszer esetén igazolhat ó, hogy csak helyi informáci óra támaszkodva az illet˝o feladat véges sok lépésben nem oldhat ó meg, s˝ot, ilyen m ódszer se létezhet (v ö. Cs. T., Acta Cybernetica, 1988). Az a paradox helyzet áll fenn, hogy val ójában az illet˝o f üggvényr˝ol lényegesen t öbbet tudunk, mint amennyit a legt öbb numerikus m ódszer a megoldáshoz felhasznál. Ezek tehát a fekete doboz elvén m ˝uk ödnek.

Esszé ´ırásra a kapcsol ód ó választhat ó témák a k övetkez˝ok:

• Affin aritmetika (Ronald van Iwaarden doktori dolgozata alapj´an)

• Back-boxing, illetve ǫ-infláci ó (Ronald van Iwaarden doktori dolgozata alapján)

• Kiterjesztett intervallum aritmetikák, Kaucher-féle intervallum aritmetika (els˝osorban a Kearfott k önyv alapján)

• Intervallumos Newton-iteráci ó, Prekond´ıcionálás (Kearfott k önyve alapján)

• lejt˝o aritmetika (slope, Dietmar Ratz habilitáci ós disszertáci ója alapján)

• változ ó pontosság ú aritmetikák

• Taylor-modellek (Martin Berz munk´ai alapj´an) Feladatok:

• Írjunk egy rövid programot, amely három valós számot összead, majd igazoljuk, hogy van három szám, amelyre a program által adott eredmény a ténylegest˝ol legalább 2002-vel eltér!

• M ódos´ıtsuk a programot úgy, hogy az ut óbbi három számra pontos legyen!

• Adjunk meg néhány olyan összead ó eljárást, amely a fenti problémára megoldást jelenthet!

• Vizsgáljuk meg az egyes algoritmusok m ˝uveletigényét!

• Milyen m ódszer felel meg a pénz ügyi szám´ıtásokhoz, ahol lényegében csak egész számok- kal számolnak, de azért 100.˙3 + 100.˙3 + 100.˙3 = 301?

(10)

1.1. INTERVALLUM MATEMATIKA 11

• Mit lehet ajánlani olyan alkalmazáshoz, ahol minden sz óbaj öv˝o szám racionális, és azt szeretnénk, ha (xy)/y =x mindig teljes ülne?

Postscript file-ként rendelkezésre áll ó doktori dolgozatok, illetve kéziratok:

1. S.L.P. Ferguson: Sphere Packings (a Kepler feladat megoldásának részletei)

2. R.J. Van Iwaarden: An improved unconstrained global optimization algorithm, Denver, 1996.

3. F. Messine: Methodes d’Optimisation Globale basees sur l’Analyse d’Intervale pour la Resolution de Problemes avec Contraintes. Toulouse, 1997.

4. A. Wiethoff: Verifizierte globale Optimierung auf Parallelrechnern. Karlsruhe, 1997.

Alap ötlet: a val ós számokra végzett m ˝uveleteket ki lehet terjeszteni intervallumokra is, és ha valamely mennyiségr˝ol nem egy konkrét val ós számmal val ó egyenl˝oségét, hanem egy intervallumba val ó tartozását ismerj ük, akkor az intervallumokra végrehajtott m ˝uveletek célirányosnak t ˝unnek.

Halmazelméleti defin´ıci ó: A◦B := {a◦b : a ∈ A, b ∈ B}; A, B ∈ I, ahol I a val ós kompakt intervallumok halmaza (azaz olyan (i, j) pároké, amelyekre i, j ∈R, és i≤j).

Aritmetikai defin´ıci ´o:

[a, b] + [c, d] = [a+c, b+d]

[a, b]−[c, d] = [a−d, b−c]

[a, b]∗[c, d] = [min(ac, ad, bc, bd),max(ac, ad, bc, bd)]

[a, b]/[c, d] = [a, b]∗[1/d,1/c], ha 0∈/ [c, d].

Megjegyzés: az osztás definiálásánál a0∈/ [c, d]feltétel gyakran el˝ofordul ó megszor´ıtásnak t ˝unik, de a tapasztalatok szerint nem az.

All´ıtás:´ az aritmetikai defin´ıci ó megfelel a halmazelméletinek, és viszont. Tehát az intervallum- aritmetika ebben az értelemben pontos.

Az intervallum-aritmetika algebrai tulajdons´agai:

• az + és a −, illetve az ∗ és a / nem inverzei egymásnak, ha intervallumokra alkalmazzuk

˝oket. Például [0,1]−[0,1] = [−1,1], és [1,2]/[1,2] = [1/2,2]. Valamint [0,0] + [0,1]−[0,1] = [−1,1] és az eredmény nem [0,0].

• érvényes az ún. szubdisztrib úci ós t örvény, azaz A(B+C)⊆AB+AC. Például[0,1]([1,1]− [1,1]) = [0,0] ⊂ [0,1][1,1]− [0,1][1,1] = [−1,1]. Másrészt viszont az a ∈ R konstansra a(B +C) =aB+aC.

• érvényes az az általános szabály is, hogy a 0-szélesség ˝u intervallumokra (amelyekrew(A) = 0, ahol w(A) = b − a, ha A = [a, b]) az intervallum-m ˝uveletek megegyeznek a val ós számokon szokásos m ˝uveletekkel.

• az összeadás és a szorzás kommutat´ıv és asszociat´ıv. Az egyetlen egységelem az [1,1], az egyetlen zéruselem a [0,0].

(11)

12 1. FEJEZET, BEVEZET ´ES

• érvényes az intervallum-m ˝uveletek befoglalási izotonitása: A ⊆B, C ⊆D-b˝ol k övetkezik, hogy A◦C⊆B ◦D. (Persze csak akkor, ha az illet˝o m ˝uveletek definiáltak.)

• definiáljuk az n-dimenzi ós A ∈ Iⁿ intervallum szélességét a koordinátánkénti intervallumok szélességének maximumaként: w(A) := max(w(Ai) i = 1, . . . , n), ha A = (A1, A2, . . . , An)∈Iⁿ. Ekkor teljes ülnek a k övetkez˝ok:

1. haA ⊆B, akkor w(A)≤w(B)

2. w(C+D) =w(C) +w(D)(az egy dimenzi ´os esetben) 3. w(aB) =|a|w(B)

• Definiáljuk az Aintervallum m(A) k özéppontját a k övetkez˝ok szerint: m(A) = (a+b)/2, ha A ∈I, és m(A) = (m(A1), m(A2), . . . , m(An)), ha A∈Iⁿ. Ekkor m(A±B) =m(A)±m(B), ha A, B ∈Iⁿ.

1.1.2. Intervallum-feloszt´asi algoritmus

Az intervallum-felosztási (Moore-Skelboe) algoritmus adott nemlineáris f üggvény valamely intervallumon vett globális minimumának als ó- és fels˝obecslését adja meg. A kezdeti X intervallumban egy olyan X^′-t keres meg, hogy F(X^′) tartalmazza a globális minimum értékét,

és az F(X^′) intervallum szélessége kisebb legyen, mint egy el˝ore adott ε pozit´ıv konstans. Az algoritmus a k övetkez˝o:

1. Legyen Y :=X és y:= minF(X). Inicializáljuk az L= ((Y, y))listát.

2. Válasszunk egy olyan k koordinátát, amellyel párhuzamosan az Y = Y1 × · · · × Yn-nek maximális hossz úság ú éle van.

3. Vágjuk ketté Y -t a k irány mentén: ´ıgy olyan V1 és V2 boxokat kapunk, amelyekre Y =V1∪V2.

4. Szám´ıtsuk ki F(V₁)-et és F(V₂)-t, és legyen vi = minF(Vi) i= 1, 2-re.

5. T ör ölj ük (Y, y)-t az L listáb ól.

(a) Monotonitási-vizsgálat: t ör ölj ük a (Vi, vi) párt, ha0∈/ F_j^′(Vi)valamelyj (1≤j ≤n)-re

´es i= 1, 2-re.

(b) Kivágási-vizsgálat: t ör ölj ük a (Vi, vi) párt, ha vi > δ (ahol δ adott eljárás-paraméter,

általában a globális minimum legjobb ismert fels˝o korlátja) és i= 1, 2.

6. Tegy ük a (V1, v1) és (V2, v2) párokb ól a megmaradtakat a listába. Ha a lista üres, akkor STOP.

7. Jel ölj ük a lista azon párját, amelynek második eleme a legkisebb, (Y, y)-al.

8. Ha F(Y) szélessége kisebb, mint ε, akkor nyomtassuk ki F(Y) és Y értékét, és STOP.

9. Folytassuk az algoritmust a 2. lépésnél.

(12)

1.1. INTERVALLUM MATEMATIKA 13 Az 5a pontbeli monotonitási teszt akkor t ör öl valamely intervallumot, ha azon az f(x) f üggvény szigor úan monoton. Ilyen esetben az adott intervallum nem tartalmazhat a belsejében minimumpontot. Ha az algoritmus azzal áll le, hogy üres lett a lista, akkor meg kell vizsgálni, hogy nem lehetett-e minimumpont az eredetiX intervallum határán (például úgy, hogy az algoritmust

újraind´ıtjuk egy Xˆ ⊃ X intervallummal. Másik megoldás lehet, ha az 5a lépésben a t örlés helyett az aktuális intervallumot helyettes´ıtj ük a megfelel˝o lapjával. Ekkor nincs sz ükség az Xˆ intervallummal val ó ellen˝orzésre.

Az 5b pontbeli kivágási teszt olyan részintervallumokat dob el, amelyekre az f(x) f üggvény lehetséges legkisebb értéke is nagyobb, mint δ. A δ értékét megválaszthatjuk a feladatra vonatkoz ó el˝ozetes informáci óink alapján, de adapt´ıv m ódon is: kezdetben legyenδ= maxF(X), majd minden vágásnál δ = min(δ, maxF(V₁), maxF(V₂)). Algoritmusunk 5b lépése az ut óbbi eljárással biztos nem dob ki olyan részintervallumot, amelyben globális minimumpont van.

Teszteredmények az 5a, 5b lépések nélk ül, illetve az 5a lépéssel:

S5 S7 S10 H3^† H6^† GP^† RB SHCB RCOS

STU 0.4 0.7 1.4 244.3 249.8 199.5 0.1 142.7 0.1

NFE 90 186 204 11453 11319 10499 56 9024 98

NDE – – – – – – – – –

LLI 48 137 166 5000 5000 5000 28 5000 47

EFF 0.3 0.6 0.5 97.5 49.0 52.8 0.3 77.5 0.8

S5 S7 S10 H3 H6 GP RB SHCB RCOS

STU 1.2 1.7 2.5 9.5 75.2 746.8 0.1 0.9 0.4

NFE 86 92 94 722 2288 34850 56 384 98

NDE 205 219 227 1158 8141 46355 63 540 149

LLI 3 5 10 361 1238 5000 9 194 29

EFF 1.0 1.0 0.9 16.0 45.1 408.1 0.6 7.9 2.1

Itt S5 - RCOS standard globális optimalizálási tesztf üggvények, a hatékonyságot jelz˝o mutat ók pedig: STU – standard id˝oegység, NFE – A f üggvényh´ıvások száma, NDE – a deriválth´ıvások száma, LLI – a maximális listahossz, és EFF az intervallumos m ódszer relat´ıv hatékonysága, a hagyományos, sztochasztikus algoritmusokhoz képest.

1.1.3. Intervallumos Newton m ´odszer

Azf(x)f üggvény befoglalását kiszám´ıtjuk. Feltételezz ük, hogyf^′(x)folytonos f üggvény az[a, b]

intervallumon, ´es

0∈ {/ f^′(x), x∈[a, b]}´esf(a)f(b)<0.

(13)

14 1. FEJEZET, BEVEZET ÉS Ha az f(x) zérushelyének egy Xn befoglalása ismert, egy jobb Xn+1 befoglalást a k övetkez˝o iteráci ós képlettel kaphatunk:

Xn+1 :=

m(Xn)− f(m(Xn)) F^′(Xn)

∩Xn,

ahol m(X) az X intervallum egy bels˝o pontja (például a k özéppontja). Tekints ük az f(x) =

√x+ (x+ 1) cos(x) f üggvényt a [2,3]intervallumon. A kapott iteráci ós sorozat az intervallumok w(Xk)szélességével egy ütt:

k Xk w(Xk)

1 [2,0, 3,0] 1,0

2 [2,0, 2,3] 0,3

3 [2,05, 2,07] 0,02

4 [2,05903, 2,05906] 0,00003

5 [2,059045253413, 2,059045253417] 0,000000000004

Optimalizálási feladatokra nyilván a célf üggvény deriváltjára kell a képleteinket alkalmazni, hiszen annak a zérushelyeit keress ük. Ekkor az iteráci ós formula a k övetkez˝o lesz:

X_n+1 :=

m(Xn)− f^′(m(Xn)) F^′′(Xn)

∩Xn.

Ittf^′(x) a célf üggvény deriváltja, F^′′(X) pedig a második derivált befoglal ó f üggvénye. Vegy ük

észre, hogy az iteráci ós képlet ünk nem f ügg k özvetlen ül magát ól a célf üggvényt˝ol. Ez rendben is van abb ól a szempontb ól, hogy nyilván azonos iteráci ós sorozatot várunk f(x)-re, és annak eltoltjára, f(x) +c-re.

Idézet a C-XSC Toolbox k önyvb˝ol¹ az intervallumos Newton m ódszernek az adott példára val ó használatával:

#include "interval.h" /* include interval arithmetic package */

#include "imath.h" /* include interval standard functions */

interval F (real& x) {

return sqrt(x) + (x+1) * cos(x);

}

interval Deriv (interval& x) {

return (1 / (2 * sqrt(x)) + cos(x) - (x+1) * sin(x));

}

int Criter (interval& x) { /* computing F(a) * F(b) < 0 */

interval Fa, Fb; /* using point intervals */

Fa = Inf(x); /* operator <= is the relational */

Fb = Sup(x); /* operator ’element of’ */

return (Sup(Fa*Fb) < 0.0 && !(0 <= Deriv(x)));

}

1Hammer, R. M. Hocks, U. Kulisch, D. Ratz: C++ Toolbox for Verified Computing. Springer, Berlin, 1995

(14)

1.1. INTERVALLUM MATEMATIKA 15 main() {

interval y, y_old;

real mid (interval&); /* prototype of the midpoint function */

cout << "Please enter starting interval:"; cin >> y;

while (Inf(y) != Sup(y)) { if (Criter(y)) {

do {

y_old = y;

cout << "y = " << y << "\n";

y = (mid(y)-F(mid(y))/Deriv(y)) & y; /* The iteration formula */

} /* & is the intersection */

while (y != y_old);

} else {

cout << "Criterion not satisfied! \n";

}

cout << "Please enter starting interval: ";

cin >> y;

} }

1.1.4. P´eld´ak

1. Az intervallumos Newton m ódszer m ˝uk ödésének illusztrálására tekints ük az f(x) = x² −x f üggvényt. Ez egy egyszer ˝u parabola, amelynek tengelye párhuzamos az y tengellyel, és amelynek két zérushelye a 0 és az 1. A f üggvény minimumpontja a 0,5, ahol itt a f üggvényérték -0,25. A célf üggvény ünk deriváltja azf^′(x) = 2x−1, második deriváltja pedig f^′′(x) = 2).

Tekints ük el˝osz ör az X0 = [0,1] indul ó intervallumot, az iteráci ó els˝o lépése erre:

X1 =

m(X0)− f^′(m(X0)) F^′′(X0)

∩X0 =

0,5− 0,0 [2,2]

∩[0,1] = [0,5,0,5]∩[0,1] = [0,5,0,5].

Ez azt jelenti, hogy pontos aritmetikával az intervallumos Newton m ódszer egy lépésben meg tudja határozni egy kvadratikus f üggvény minimumát abszol út pontosan. A kifelé kerek´ıtés ezen nyilván ront, de ezzel egy ütt is nagyon hatékony eszk öz ez az optimalizálásban. Nyilván

általában nem kvadratikus f üggvényt kell optimalizálnunk, de mivel a sima f üggvényeknek egy pont kis k örnyezetében a kvadratikus k özel´ıtés tetsz˝olegesen j ó, ezért az intervallumos Newton m ódszert˝ol hasonl óan j ó hatékonyságot várhatunk sima nemlineáris optimalizálásban.

Eml´ıtésre mélt ó az is, hogy példánkban nem volt t úlbecslés az érintett f üggvényekben, mert mind a lineáris, mind a konstans f üggvényhez (a kifelé kerek´ıtést leszám´ıtva az implementáci ó- ban) pontos befoglal ó f üggvényt kapunk már a természetes intervallum kiterjesztéssel is.

Tekints ¨uk most az X0 = [0,2]kezd˝ointervallumot, erre a k ¨ovetkez˝ot kapjuk:

X1 =

m([0,2])−f^′(m([0,2])) F^′′([0,2])

∩X0 =

1− 1,0 [2,2]

∩[0,2] = [0,5,0,5]∩[0,2] = [0,5,0,5].

Ebb˝ol az látszik, hogy az el˝oz˝o nagyszer ˝u eredményben nem volt annak szerepe, hogy a kiindul ó intervallum k özéppontja volt a keresett minimumpont. Tekints ünk most egy olyan intervallumot,

(15)

16 1. FEJEZET, BEVEZET ´ES amely nem tartalmaz minimumpontot,X0 = [1,2]:

X1 =

m([1,2])− f^′(m([1,2])) F^′′([1,2])

∩[1,2] =

1,5− 2,0 [2,2]

∩[1,2] = [0,5,0,5]∩[1,2] =∅. Az intervallumos Newton m ódszer tehát igazolta, hogy a keresési tartományban nincs minimumpont.

2. Vegy ük most az el˝oz˝o példa célf üggvényének a négyzetét: f(x) =x⁴−2x³+x². Ennek nyilván a 0 és az 1 pontok a minimumpontjai. Az els˝o és a második derivált f üggvény: f^′(x) = 4x³−6x²+2x, illetvef^′′(x) = 12x²−12x+2. Els˝o keresési intervallumként tekints ük azX0 = [0,2]intervallumot, ami tehát mindkét minimumpontot (és k özt ük az egyetlen maximumpontot is) tartalmazza. Erre az intervallumos Newton m ódszerrel a k övetkez˝o eredményt kapjuk:

X₁ =

m(X₀)− f^′(m(X₀)) F^′′(X0)

∩X₀ =

1− 0,0 [−22,50]

∩[0,2] = [−∞,∞]∩[0,2] = [0,2].

Ez a példa azt mutatja, hogy ha a kiindulási intervallumban t öbb széls˝oérték is van, akkor az intervallum nem változik. Figyelj ük meg, hogy a metszetképzés kellett ahhoz, hogy a keresési intervallum ne n˝oj ön. A második derivált most egy kvadratikus f üggvény, amihez a befoglal ó f üggvény általában csak t úlbecsléssel adhat ó meg. Eset ünkben az értékkészlet, [−1,26]

lényegesen kisebb, mint a kapott befoglalás: [−22,50]. Ennek ellenére az értékkészlettel is a fenti eredményt kaptuk volna, mivel az értékkészlet is tartalmazza a nullát.

A második derivált befoglalására a k övetkez˝o értékeket kapjuk:

F^′′([0,9,1,1]) = [−1,48,6,02], illetve

F^′′([0,99,1,01]) = [1,6412,2,3612].

Sajnos ez a példa se igazolja azt a k özkelet ˝u vélekedést, hogy az intervallumos Newton m ód- szert akkor érdemes használni, ha az argumentum intervallum szélessége egynél kisebb. Az elmondottak miatt csak a második esetben szám´ıthatunk arra, hogy a keresési intervallumunk méretét cs ökkenteni tudjuk. Ekkor az eredmény ünk az [1, 1] intervallum. Ennek a magyarázata pedig az, hogy a keresési intervallum k özéppontjában az els˝o derivált értéke nulla, másrészt a második derivált értékei minden ütt pozit´ıvak, ´ıgy a széls˝oértéket a f üggvény csak a k özéppont- ban veheti fel.

Tekints ünk akkor most egy olyan intervallumot, amelynek felez˝opontja nem megoldás: [0,98, 1,01]. Erre az intervallumos Newton m ódszerrel azt kapjuk, hogy

X1 =

m(X0)− f^′(m(X0)) F^′′(X₀)

∩X0 =

0,995− −0,0098505 [1,4048, 2,4812]

∩[0,98,1,01] =

= (0,995 + [0,003970, 0,007012])∩[0,98,1,01] = [0,99897,1,002012]∩[0,98,1,01] =

= [0,99897,1,002012].

Ezzel a megoldásunkra egy meglehet˝osen sz ˝uk intervallumot kaptunk: a keresési intervallum kb. tizedére (a szélessége 0,03-r ól 0,003042-re) cs ökkent, és ezzel egy ütt a bizonytalanságunk is a minimum helyét illet˝oen.

(16)

1.2. AUTOMATIKUS DIFFERENCI ÁL ÁS 17 P ÉLDA. A SIAM (Ipari és Alkalmazott Matematikai) Társaság 2002-ben 10 numerikus feladatot t ˝uz ött ki². Feladatonként 10 helyes decimális jeggyel 100 dollárt lehetett nyerni. A negyedik megadott feladat a k övetkez˝o f üggvény minimalizálása volt:

exp(sin(50x)) + sin(60e^y) + sin(70 sin(x)) + sin(sin(80y))−

−sin(10(x+y)) + 1

4(x²+y²).

A feladat megoldására egy intervallum aritmetikára alapul ó korlátozás és szétválasztás m ódszert használtunk. A kapott eredmény a [−10.0,10.0] keresési tartományon a globális minimum értékére a k övetkez˝o als ó- és fels˝o korlátokat adta:

[−3.306868647475316,−3.306868647475196].

Az eredményben a kiemelt els˝o 13 jegy matematikai bizony´ıt óer˝ovel igazoltan helyes. Ehhez 0.26 másodperc CPU-id˝o, minimális mem óriaigény (75 részintervallum tárolására volt sz ükség), 1975 célf üggvény-, 1158 gradiens- és 92 Hesse-mátrix kiértékelés kellett mind össze.

1.2. Automatikus differenci´al´as

Ahogy a korábbiakban láttuk, a differenciál-hányadosoknak fontos szerep ük van a nemlineáris optimalizálásban, de a numerikus matematika számos ter ületen is szinte elengedhetetlen a hasz- nálatuk. Ide tartoz ó problémák vannak a nemlineáris egyenletmegoldásban, az irány´ıtáselmélet- ben és az érzékenység-vizsgálatban is. Talán a legismertebb eset a f üggvények zérushelyének megkeresése, itt a derivált használatával m ˝uk öd˝o Newton-Rawson eljárás konvergencia-sebessé- ge lényegesen jobb, mint a deriváltakat nem használ ó szel˝o- vagy h úrm ódszeré.

Ma már egyes programozási nyelvek (pl. a PASCAL-XSC³) is támogatják az automatikus differenciálást megfelel˝o adatt´ıpussal és m ˝uveletekkel, és számos szoftver is használja ezt a deriválási m ódszert⁴.

1.2.1. Deriváltak a szám´ıt ógépeken

A leggyakrabban használt két m ódszer a deriváltértékek el˝oáll´ıtására azok numerikus k özel´ıtése

és a ”kézzel” val ó derivált-meghatározás a deriválási szabályok alkalmazásával. A legt öbb numerikus matematikai monográfia és a professzionális numerikus programcsomagok t öbbsége is ezt a két utat javasolja. Mindkét m ódszernek vannak azonban olyan gyengéi, amelyek számos feladatban lehetetlenné vagy értelmetlenné teszik alkalmazásukat. A ritka kivételek egyike Skeel

és Keiper k önyve⁵, amely a szimbolikus differenciálással szemben is az automatikus deriválást javasolja.

Érdekes összef üggések vannak a deriválás és az integrálás analitikus, illetve numerikus meg- határozása k öz ött is. Az analitikus deriválás k önnyen, csaknem mechanikusan végrehajthat ó,

2Nick Trefethen: A Hundred-Dollar, Hundred-digit Challenge. SIAM News 35(2002)

3Klatte, R., U. Kulisch, M. Neaga, D. Ratz, Ch. Ullrich: PASCAL-XSC, Springer-Verlag, Berlin, 1991.

4Pl. a D. Ratz: Automatische Ergebnisverifikation bei globalen Optimierungsproblemen. (Doktori értekezés, Karlsruhei Egyetem, 1992.) c´ım ˝u disszertáci óban le´ırt optimalizálási eljárás, amely csak a célf üggvény megadását igényli.

5Skeel, R.D., J.B. Keiper: Elementary Numerical Computing with MATHEMATICA. McGraw-Hill Inc., New York, 1993.

(17)

18 1. FEJEZET, BEVEZET ÉS m´ıg az analitikus integrálás nehéz vagy akár lehetetlen is lehet. Ezzel szemben a numerikus k özel´ıtés a deriváltra gyakran pontatlan, m´ıg az integrálra általában pontosabb.

A numerikus differenciálás viszonylag k önnyen programozhat ó, sokszor a k önyvtári program maga áll´ıtja ˝oket el˝o, ha a felhasznál ó nem adott meg szubrutint az analitikus deriváltak kiszám´ıtására. A numerikus derivált használatának el˝onye, hogy

+ nincs el˝ozetes munkaráford´ıtás a deriváltak ”kézzel” t örtén˝o el˝oáll´ıtására, + emiatt jav´ıtani sem kell az azok programozása során elk övetett hibákat, és

+ akkor is m ˝uk ödik, ha az illet˝o f üggvény képletét nem ismerj ük, csak a kiszámolására szolgál ó szubrutin adott.

H´atr´anya viszont, hogy

– a levágási hiba miatt sok értékes jegy veszik el. Ez a jelenség csak bonyolult, és nem is minden szám´ıt ógépes k örnyezetben rendelkezésre áll ó eszk öz ökkel cs ökkenthet˝o (változ ó méret ˝u számábrázolás, racionális aritmetika stb.),

– a gyorsan változ ó deriváltak becslésére alkalmatlan.

A h üvelykszabály szerint – hacsak lehetséges – érdemes el˝oáll´ıtani a deriváltakat szám´ıt ó szubrutinokat. Ezen eljárás el˝onye, hogy

+ a levágási hiba nem jelentkezik, a kiszám´ıtott deriváltértékek általában csak nagyon kis kerek´ıtési hibával terheltek, és

+ a gyorsan változ ó deriváltértékek is j ól meghatározhat ók.

A h´atr´anya ezzel szemben, hogy

– a deriváltak képletének meghatározása munkaigényes, és a ”kézzel” val ó el˝oáll´ıtás esetén gyakran komoly hibaforrás, valamint

– csak a képlettel adott f üggvények deriváltja határozhat ó meg ilyen m ódon, tehát a kizár ólag algoritmussal adottakat általában nem lehet ´ıgy deriválni.

Itt kell megjegyezni, hogy a szám´ıt ógépes algebrarendszerek (mint például a Mathematica, a Maple vagy a Derive) szimbolikus manipuláci óval el˝o tudják áll´ıtani a képlettel adott f üggvények deriváltjait. Így ez az el˝okész´ıt˝o munka legalább szám´ıt ógépes´ıthet˝o, tehát nem feltétlen ül kell

”kézzel” végrehajtani. Az ilyen szimbolikus deriválás, a vele jár ó egyszer ˝us´ıtés és a programozási nyelvre val ó alak´ıtás id˝oigénye nagyon változ ó, mindenesetre a szám´ıt ógépes algebrarendszerek sokat fejl˝odtek ezen a téren az ut óbbi id˝oben⁶.

Az automatikus differenciálás egyszer ˝uen abb ól az igényb˝ol fakadt, hogy az el˝oz˝o m ódszerek el˝onyeit kell egyes´ıteni a hátrányok elhagyásával. Olyan eljárást kerestek tehát, amely

6L´asd Iri, M.: History of automatic differentiation and rounding error estimation, in: Griewank, A., G. Corliss (Eds.): Automatic Differentiation of Algorithms: Theory, Implementation, and Application. SIAM, Philadelphia, 1991. 3-16.

(18)

1.2. AUTOMATIKUS DIFFERENCI ÁL ÁS 19 1.. táblázat. Néhány alapm ˝uvelet és elemi f üggvény differenciálása

y=f(x) a±x a∗x a/x √

x log(x) exp(x) cos(x) f^′(x) ±1 a −y/x 0.5/y 1/x y −sin(x)

+ lényegében nem igényel el˝ozetes ráford´ıtást a deriváltak ”kézzel-” vagy akár szám´ıt ógépes algebrarendszerrel, szimbolikus manipuláci óval val ó meghatározására,

+ emiatt nem is kell a megfelel˝o szubrutinokat programozni ´es jav´ıtani,

+ akkor is m ˝uk ödik, ha csak az illet˝o f üggvény kiszámolására szolgál ó szubrutin adott, de a f üggvény képlete nem ismert,

+ a levágási hiba miatt nem vesznek el értékes jegyek,

+ a gyorsan változ ó deriváltak meghatározására is alkalmas, és

+ a deriváltak kiszám´ıtásának m ˝uveletigénye általában kisebb, mint a numerikus deriválásé, illetve az analitikus deriváltakat kiszám´ıt ó szubrutinoké.

Maga az ötlet nem nagyon bonyolult, és jellemz˝o m ódon t öbben egymást ól f üggetlen ül rátaláltak⁷. Ha valaki kedvet érez hozzá, maga is megpr óbálhatja az automatikus differenciálást

újra felfedezni: az el˝oz˝o feltételeket teljes´ıt˝o eljárást kell megadni (eddig nem árultunk el semmi lényegeset a tr ükkb˝ol).

1.2.2. Az ¨otlet.

A tr ükk mind össze annyi, hogy használjuk az adott f üggvényre ismert kiszám´ıtási eljárást az egyes m ˝uveletekhez tartoz ó deriválási szabályokkal egy ütt. Például haf(x) =f1(x)∗f2(x), akkor legyen f^′(x) értéke f₁^′(x)∗f2(x) +f1(x)∗f₂^′(x), ahol f₁^′(x) és f₂^′(x) értéke már ismert. Minden egyes részletszám´ıtással egy ütt tehát a rá vonatkoz ó, az aktuális változ ó- és konstansértékekhez tartoz ó deriváltértéket is meghatározzuk. A kiinduláshoz a változ ó deriváltja természetesen 1, a konstansé nulla. Az 1. Táblázat egyes alapm ˝uveletek és elemi f üggvények differenciálásának formális le´ırását tartalmazza, itt x változ ó, a pedig konstans.

Az automatikus differenciálás implementálása során célszer ˝u olyan adatszerkezetet válasz- tani, hogy minden, az illet˝o f üggvény kiszám´ıtásában szerepet játsz ó változ ó és konstans számára egy rendezett párt használunk, amelynek els˝o tagja a szokásos értéket tartalmazza majd, a második tag pedig a hozzá tartoz ó deriváltértéket. Ilyen adatstrukt úrával az új m ˝uveleteket egyszer ˝u fel´ırni szubrutinok seg´ıtségével, vagy egyes újabb programozási nyelvekben (pl.

C++ vagy FORTRAN-90) az eredeti m ˝uveletek és standard f üggvények defin´ıci ójának az új adatszerkezetre val ó kiterjesztésével (operation overloading). Az ut óbbi esetben a már m ˝uk öd˝o, az eredeti f üggvényt kiszám´ıt ó programban csak az adatt´ıpust kell kicserélni (pl. ”real” helyett

”derivative” vagy ”gradient”), és máris rendelkezésre állnak a k´ıvánt deriváltértékek.

7Ostrovskij, G.M., Ju. M. Wolin, W.W. Borisov: Über die Berechnung von Ableitungen, Wissenschaftliche Zeitschrift der Technischen Hochschule f ür Chemie, Leuna-Merseburg 13(1971) 382-384 és Wengert, R.E.: A simple automatic derivative evaluation program, Communications of the ACM 7(1964) 463-464.

(19)

20 1. FEJEZET, BEVEZET ÉS Tekints ünk egy egyszer ˝u példát az automatikus differenciálás használatára: határozzuk meg az f(x) = (x−1)² f üggvény deriváltját az x = 2 pontban! A differenciálhányados-f üggvény f^′(x) = 2(x−1), a keresett deriváltérték pedig 2.

A változ ónkhoz tartoz ó pár(2,1), a f üggvényben szerepl˝o konstanshoz tartoz ó pedig(1,0). A zár ójelen bel üli kifejezés f(x) képletében a (2,1)−(1,0) = (1,1)párt eredményezi. A négyzetre- emelést szorzással értelmezve az (1,1)∗(1,1) = (1,2) párt kapjuk, amelyb˝ol kiolvashat ó, hogy f(2) = 1, és f^′(2) = 2.

1.2.3. Kiterjeszt´esek.

A képlettel megadott f üggvények differenciálásával szemben szokás kiemelni az ”algoritmusok differenciálását”. Ezen az automatikus differenciálás egyszer ˝u kiterjesztését értik feltételes utas´ıtásokat is tartalmaz ó eljárásokkal megadott f üggvények deriválására. Az ut óbbiakkal kapcsolatban persze felvet˝odik, hogy differenciálhat ók-e ezek egyáltalán. Szerencsére ez a probléma inkább matematikai jelleg ˝u, és a technikai megoldást nem nagyon befolyásolja.

A magasabbrend ˝u deriváltak el˝oáll´ıtásához két út k öz ött választhatunk: vagy k özvetlen ül az egyes m ˝uveletekhez tartoz ó magasabbrend ˝u deriválási képleteket használjuk (például, haf(x) = g(x)+h(x), akkorf^′′(x) =g^′′(x)+h^′′(x)), vagy az alacsonyabbrend ˝u deriváltak kiszám´ıtására már meglév˝o algoritmusra alkalmazzuk ismételten az algoritmusok differenciálását.

A t öbbváltoz ós f üggvények differenciálására a bevezetett automatikus differenciálási m ódszer minden további nélk ül alkalmazhat ó, az egyes parciális deriváltak meghatározásakor csak a változ ó-konstans viszonyt kell mindig megfelel˝oen tisztázni. Ez is k önnyen programozhat ó, és

´ıgy a gradiens, a Hesse- és a Jacobi-mátrix kiszám´ıtása is nagyon kényelmessé tehet˝o.

1.2.4. Az automatikus differenciálás két változata.

Az automatikus differenciálás legegyszer ˝ubb megval ós´ıtása az, amikor a k ül önben már rendelke- zésre áll ó, az adott f üggvényt kiszám´ıt ó programot kib˝ov´ıtj ük az egyes m ˝uveletekhez tartoz ó elemi deriválási lépésekkel - megtartva az eredeti algoritmus szerkezetét. Ezt a m ódszert a továbbiakban sima algoritmusnak fogjuk nevezni. Az angol nyelv ˝u szakirodalomban nincs még kialakult egységes elnevezése, a ”forward”, ”contravariant” vagy ”bottom-up” jelz˝okkel szo- kás megk ül önb öztetni (a másik, ford´ıtott eljárás angolul ”reverse”, ”backward”, ”covariant”

vagy ”top-down”). A két eljárás lényegében az összetett f üggvények deriválásához használatos láncszabály végrehajtási irányában k ül önb özik.

A sima eljárás például azy=f(g(h(x), k(x))) f üggvény automatikus differenciálása során a

du = h^′(x)dx, dv = k^′(x)dx,

dw = [gu(u, v)h^′(x) +gv(u, v)k^′(x)]dx, dy = f^′(w)[gu(u, v)h^′(x) +gv(u, v)k^′(x)]dx sorrendet k ¨oveti.

A ford´ıtott eljárás az ellentétes irányban alkalmazza a láncszabályt:

dy = f^′(w)dw,

(20)

1.2. AUTOMATIKUS DIFFERENCI ´AL ´AS 21 dy = f^′(w)[gu(u, v)du+gv(u, v)dv],

dy = f^′(w)[gu(u, v)du+gv(u, v)k^′(x)dx], dy = f^′(w)[gu(u, v)dh^′(x) +gv(u, v)k^′(x)]dx.

A ford´ıtott algoritmus el˝onye abban van, hogy ez a végrehajtási sorrend lehet˝ové teszi t öbbváltoz ós f üggvények differenciálása során bizonyos sz ükségtelen m ˝uveletek elhagyását.

Ennek az az ára (amit a k övetkez˝o szakasz adatai is alátámasztanak), hogy a ford´ıtott algoritmus tárigénye magasabb, és a sima algoritmus egymenetes végrehajtásával szemben két menetet igényel.

A két változat k öz ötti k ül önbség megvilág´ıtása céljáb ól tekints ük az f(x) = x1(1 − x2)² f üggvényt az x = [2,1]^T pontban. A sima eljárás az egyes végrehajtott m ˝uveletekkel egy ütt a megfelel˝o deriváltértékeket is meghatározza:

f1 =x1 = 2 d1 = (1,0), f2 =x2 = 1 d2 = (0,1), f₃ = 1 d₃ = (0,0),

f4 =f3−f2 = 0 d4 =d3−d2 = (0,−1), f5 =f₄² = 0 d5 = 2f4d4 = (0,0), f₆ =f₁f₅ = 2 d₆ =f₁d₅+d₁f₅ = (0,0).

A sima eljárás ek özben esetleg t öbbsz ör is végrehajtja ugyanazt a m ˝uveletet, viszont nem igényli a kiszám´ıtási fa létrehozását és tárolását. A ford´ıtott algoritmus ezzel szemben el˝osz ör meghatározza azfi értékeket és a kiszám´ıtási fát, majd ennek seg´ıtségével el˝oáll´ıtja adi =∂f /∂fi

´ert´ekeket:

d₆ = 1 d5 =d6∂f6

∂f5 =d6f1 = 2, d4 =d5∂f5

∂f4 =d52f4 = 0, d₃ =d₄^∂f_∂f⁴

3 =d₄1 = 0, d₂ =d₄^∂f_∂f⁴₂ =d₄(−1) = 0, d1 =d6∂f6

∂f1 =d6f5 = 0.

A gradiens értékét a [d1, d2]^T vektor adja.

1.2.5. M ˝uvelet- és tárigény.

A 2. Táblázat az automatikus differenciálás két változatának m ˝uvelet- és tárigényét adja meg néhány gyakori deriválási feladatra. A legmeglep˝obb adat talán az, hogy egy t öbbváltoz ós f üggvénynek és gradiensének meghatározása a ford´ıtott algoritmussal legfeljebb négyszerannyi m ˝uveletet igényel mint az illet˝o f üggvény kiszám´ıtása. A fels˝o korlát tehát nem is f ügg k özvetlen ül az illet˝o f üggvény változ óinak számát ól.

Az automatikus differenciálás m ˝uveletigénye nagyjáb ól megfeleltethet˝o egy ciklusmentes gráfban a legr övidebb út megkeresése m ˝uveletigényének, hozzáadva a kiszám´ıtási gráf létre- hozásának m ˝uveletigényét. A tárigény nagy részét a kiszám´ıtási gráf tárolása okozza. A tár- és m ˝uveletigény jav´ıtása terén még várhat ók további eredmények, de az is látszik, hogy a tárigény inkább csak a m ˝uveletigény rovására cs ökkenthet˝o (és viszont).

(21)

22 1. FEJEZET, BEVEZET ÉS 2.. táblázat. A fontosabb automatikus differenciálási feladatok m ˝uvelet- és tárigénye. Magya- rázat: f: egy n-változ ós f üggvény, f: m darab n-változ ós f üggvény, ∇f: az f gradiense, H: az f Hesse-mátrixa, J: az f Jacobi-mátrixa, L(.): az argumentumok meghatározásának m ˝uveletigénye a {+,−,∗, /,√,log,exp,sin,cos} alapm ˝uveletek felett, és S(.): az argumentumok meghatározásának tárigénye.

Feladat Algoritmus

sima ford´ıtott L(f,∇f) ≤4nL(f) ≤4L(f) L(f,∇f, H) O(n²L(f)) ≤(10n+ 4)L(f)

L(f, J) O(nL(f)) ≤(3m+ 1)L(f) S(f,∇f) O(S(f)) O(S(f) +L(f)) S(f,∇f, H) O(S(f)) O(S(f) +L(f)) S(f, J) O(S(f)) O(S(f) +L(f))

1.2.6. Az automatikus differenciálás veszélyei.

Az el˝oz˝oek alapján úgy t ˝unhet, hogy az automatikus differenciálás szám´ıt ógépes megval ós´ıtása problémamentes. Sajnos nem egészen ez a helyzet, ´ıme néhány példa:

1. A zérus gy ök ök esete. Tekints ük az f(x) = p

x⁴₁+x⁴₂ f üggvényt. Ez differenciálhat ó, és a gradiense a (0.,0.)^T pontban (0.,0.)^T. Az automatikus differenciálás a négyzetgy ök m ˝uvelethez azonban nem tud értéket rendelni, ha a gy ök argumentuma nulla. A felhasznál ó számára ilyen esetekben az a leghasznosabb, ha az illet˝o implementáci ó felh´ıvja a figyelmet erre a hibalehet˝oségre, pl. az IEEE aritmetikát támogat ó szám´ıt ógépekben a NaN (Not a Number) érték hozzárendelésével.

2. A programelágazás esete. Tekints ük az alábbi utas´ıtást:

if x= 1 then f(x) = 1 else f(x) =x²

Világos, hogy az ´ıgy definiált f üggvény folytonosan differenciálhat ó, mégis az automatikus differenciálás a hamis f^′(1) = 0 értéket adja. A példa kicsit er˝oltetettnek t ˝unik, de viszonylag gyakran el˝ofordul, hogy adott f üggvény kiszám´ıtására hasonl ó m ódon az argumentumok

értékét˝ol f ügg˝oen más és más eljárást adunk meg. Val ódi megoldást erre a problémára nem lehet javasolni, legfeljebb azt, hogy a jelenség tudatában (k ül ön ösen az egyenl˝oség-feltétellel adott programelágazás esetén) a felhasznál ó ellen˝orizze, hogy ilyen hiba felléphet-e.

3. A határértékkel adott f üggvény esete. Eddig a f üggvények megadására mindig véges eljárást használtunk. Mi t örténik akkor, ha ez a le´ırás végtelen? K önny ˝u olyan alkalmazási példát mutatni, ahol a differenciálni k´ıvánt f üggvényt csak egy iterat´ıv sorozattal tudjuk jellemezni.

A klasszikus anal´ızis szerint viszont a differenciálás és a határértékképzés nem cserélhet˝ok fel.

Tekints ük a k övetkez˝o egyszer ˝u f üggvénysorozatot:

f1(x) =xe^−x², f2(x) =xe^−x²e^−x², . . . , fk=x(e^−x²)^k, . . .

Automatikus differenciálással (is) lim_k→∞f_k^′(0) = 1, habár a val ódi f(x) határf üggvényre f^′(0) = 0. Ebben az esetben is csak azt lehet tanácsolni, hogy a jelenség ismeretében az

(22)

1.2. AUTOMATIKUS DIFFERENCI ÁL ÁS 23 automatikus differenciálással nyert értékeket ellen˝orizni kell. Ehhez viszonylag kényelmesen használhat ó elméleti eredmények is rendelkezésre állnak⁸.

1.2.7. Az automatikus differenciálás implementálása.

A már eml´ıtett PASCAL-XSC beép´ıtett adatt´ıpusainak és kiterjesztett alapm ˝uveleteinek a haszná- lata a legegyszer ˝ubb. A felhasznál ónak mind össze a megfelel˝o adatt´ıpusokat kell megváltoztat- nia. A FORTRAN-90 és C++ nyelvekben ezek az új adatt´ıpusok és a kiterjesztett m ˝uveletek megval ós´ıtása után ugyanolyan kényelmesen lehet az automatikus differenciálás sima algoritmusát alkalmazni, mint a PASCAL-XSC támogatásával.

A k övetkez˝o egyszer ˝u példában az f(x) = 25(x−1)/(x+ 2) f üggvény és deriváltja értékét határozzuk meg automatikus differenciálással azx= 2 pontban. A PASCAL-XSC implementáci ó

´erdekesebb r´eszleteit adjuk csak meg.

program pelda (input,output); type df_type = record f,df: real; end;

operator + (u,v: df_type) res: df_type; begin res.f:=u.f+v.f;

res.df:=u.df+v.df; end;

...

operator * (u,v: df_type) res: df_type; begin res.f:=u.f*v.f;

res.df:=u.df*v.f+u.f*v.df; end;

...

function df_var (h: real) : df_type; begin df_var.f:=h; df_var.df:=1.0; end;

var x,f: df_type;

h: real;

begin h:=2.0;

x:=df_var(h);

f:=25*(x-1)/(x+2);

writeln(’f, df:’,f.f,f.df);

end.

Számos kevésbé elegáns, de annál hatásosabb szám´ıt ógépes eszk öz (preprocesszor, precompiler, keresztford´ıt ó és más programcsomag) érhet˝o el az automatikus differenciálás megval ós´ıtá- sára. Mintaként néhány h´ıresebbnek az adatai:

• A JAKEF egy FORTRAN precompiler, amit az Argonne National Laboratory fejlesztett ki.

Inputként egy skalár vagy vektorf üggvényt kiszám´ıt ó szubrutint használ, és eredményként egy a gradienst, illetve a Jacobi-mátrixot el˝oáll´ıt ó szubrutint ad. A ford´ıtott algoritmusra

ép ül. A dokumentáci ót és a forrássz öveget is meg lehet kapni. A NETLIB nev ˝u adatbázis- ban találhat ó, b˝ovebb informáci ót úgy kaphatunk, hogy a netlib@research.att.com E-mail c´ımre egy ”send index” üzenetet k üld ünk.

8Fischer, H.: Special problems in automatic differentiation, in: Griewank, A., G. Corliss (Eds.): Automatic Differentiation of Algorithms: Theory, Implementation, and Application. SIAM, Philadelphia, 1991, 43-50.

(23)

24 1. FEJEZET, BEVEZET ´ES

• A FORTRAN programok sima algoritmussal val ó automatikus differenciálására szolgál ó GRAD programcsomag a k övetkez˝o c´ımen érhet˝o el: Larry Husch, Dept. Mathematics, University of Tenessee, Knoxville TN, USA, illetve husch@WUARCHIVE.WUSTL.EDU az elektronikus postával.

• Az ADOL-C egy C++ nyelven ´ırt rendszer, amely C vagy C++ nyelv ˝u algoritmusok differenciálására alkalmas sima és ford´ıtott eljárással is. A forrásk ód és a dokumentáci ó Andreas Griewank c´ımén érhet˝o el (Argonne National Labs, Argonne, IL 60439, USA, illetve elektronikus postával griewank@antares.mcs.anl.gov).

• A MAPLE nev ˝u szám´ıt ógépes algebrarendszer az 5.1-es változatát ól kezdve a szimbolikus deriválás mellett képes az automatikus differenciálásra is (a sima algoritmussal). Az

”optimize” rutinja cs ökkentheti a m ˝uveletigényt, és az eredményt FORTRAN vagy C nyelven is ki tudja adni.

Meg kell még eml´ıteni, hogy az automatikus differenciáláshoz természetes m ódon kapcsol- hat ó a kerek´ıtési hibák becslése és a szám´ıtott deriváltak als ó- és fels˝okorlátjainak meghatározása is. Az ut óbbi feladatok (részben az intervallum-aritmetikára támaszkodva) szintén kényelmesen megoldhat ók szám´ıt ógépen. Az automatikus differenciálásnak b˝o irodalma érhet˝o el, eml´ıtésre mélt ó a k övetkez˝o két cikk, illetve k önyv:

• Kedem, G.: Automatic differentiation of computer programs, ACM Transactions on Mathe- matical Software 6(1980) 150-165.

• Rall, L.B.: Automatic Differentiation: Techniques and Applications. Lecture Notes In Computer Science, Vol. 120, Springer-Verlag, Berlin, 1981.

1.3. Ellen ˝orz ˝o kérdések és gyakorl ó feladatok

1. Ki lehet-e terjeszteni a négy alapm ˝uveletek val ós számokr ól intervallumokra?

2. Igaz-e, hogy két intervallum összege pontosan azokat a pontokat tartalmazza, amelyek el˝oállnak a két argumentum-intervallumbeli pontok összegeként?

3. Milyen informáci óra támaszkodik a monotonitási teszt?

4. Mi okozza a befoglal ó f üggvények durva becslését?

5. Mi a kifel´e-kerek´ıt´es?

6. Hány féle kerek´ıtést enged meg az IEEE processzor-szabvány?

7. Igaz-e, hogy egy szigor úan monoton f üggvény deriváltjának befoglal ó f üggvénye nem tartalmazza a nullát?

8. Igaz-e, hogy az intervallumos befoglal ó f üggvény szám´ıtása mindig tovább tart, mint az eredeti val ós f üggvényé?

9. Melyik eljárással kapjuk a legjobb befoglal ó f üggvényt az X*X-X f üggvényre a [-1,1]

intervallumra? (X*X nem négyzetreemelés, azonos pontosság esetén a gyorsabb eljárás a jobb)

(24)

1.3. ELLEN ˝ORZ ˝O K ÉRD ÉSEK ÉS GYAKORL Ó FELADATOK 25 10. Melyik eljárással kapjuk a legrosszabb befoglal ó f üggvényt az X*X-X f üggvényre a [-1,1]

intervallumra? (X*X nem négyzetreemelés, azonos pontosság esetén a lassabb eljárás a rosszabb)

11. Melyik eljárással kapjuk a legjobb befoglal ó f üggvényt az X*X-X f üggvényre a [1,10]

12. Melyik eljárással kapjuk a legrosszabb befoglal ó f üggvényt az X*X-X f üggvényre a [1, 10]

intervallumra? (X*X nem négyzetreemelés, azonos pontosság esetén a lassabb eljárás a rosszabb)

13. Melyik eljárással kapjuk a legjobb befoglal ó f üggvényt az X*X-X f üggvényre a [0.4, 0.6]

14. Melyik eljárással kapjuk a legrosszabb befoglal ó f üggvényt az X*X-X f üggvényre a [0.4, 0.6] intervallumra? (X*X nem négyzetreemelés, azonos pontosság esetén a lassabb eljárás a rosszabb)

15. Mutassunk p´eld´at arra az esetre, amikor w(X) +w(Y)6=w(X+Y)!

16. Mi a szubdisztrib úci ós szabály?

17. Invertálhat ó-e az intervallumos összeadás?

18. Azonos-e az X intervallum n´egyzete X * X -el?

19. Reprezentálhat ók-e mindig a val ós m ˝uveletek intervallum-m ˝uveletekkel?

20. Igaz-e, hogy ha X része Y-nak, akkor minden befoglal ó f üggvényre F(X) is része F(Y)-nak?

21. Milyen programozási nyelvek alkalmasak intervallum aritmetikával val ó számolásra?

22. Igazoljuk, hogy a vázolt eljárás kerek´ıtés nélk üli aritmetika esetén pontosan a derivált

értékét adja.

23. Adjunk becslést arra, hogy az automatikus differenciálás és az analitikusan megadott derivált m ˝uveletigénye hogyan viszonyul egymáshoz!

24. Hogyan m ˝uk ödik a bels˝of üggvény deriválása eset ünkben?

25. Hogyan lehet eljárásunkat t öbbváltoz ós f üggvények parciális deriválására kiterjeszteni?

(Mit kell konstansnak, és mit változ ónak tekinteni?)

26. Határozzuk meg a másodrend ˝u deriváltak el˝oáll´ıtásához sz ükséges aritmetikát!

27. Vizsgáljuk meg annak lehet˝oségét, hogy az automatikus differenciáláshoz hasonl óan felép´ıt- het˝o (?) optimalizálási aritmetikát milyen feladatokra lehet alkalmazni!

28. Az intervallumokra definiált m ˝uveletek pontosak, de pontosak-e az ezekkel felép´ıtett f üggvények ? Mutassunk példát!

(25)

26 1. FEJEZET, BEVEZET ÉS 29. Milyen f üggvények intervallumon vett értékkészlete szám´ıthat ó pusztán az intervallum

végpontjaiban felvett f üggvényértékekkel?

30. Mit mondhatunk a konvex, és a konkáv f üggvények befoglal ó-f üggvényeir˝ol?

31. Pr óbáljuk meg a val ós számokra ismert négy alapm ˝uveletet általános´ıtani kompakt val ós intervallumokra!

32. Igaz-e, hogy ha X része Y-nak, akkor minden befoglal ó f üggvényre F(X) is része F(Y)-nak?

33. Igaz-e, hogy egy szigor úan monoton f üggvény deriváltjának befoglal ó f üggvénye nem tartalmazza a nullát?

34. Milyen intervallumot kapunk eredmény ül, ha az f(x) = (2x − 1) ∗ (x² − x) f üggvény természetes intervallum-kiterjesztését a [−1,1]intervallumon kiértékelj ük?

35. Milyen informáci óra támaszkodik az intervallumos korlátozás és szétválasztás t´ıpus ú globális optimalizálási algoritmusban a monotonitási teszt?

36. Definiálja a természetes intervallum kiterjesztést, és mutasson rá példát!

37. Ismertesse az intervallum aritmetika néhány, a val ós aritmetikáét ól eltér˝o algebrai tulaj- donságát!

38. Írja meg az automatikus differenciálás szubrutinjait, és tesztelje néhány f üggvényen!

(26)

2. fejezet

A h´atizs´ak feladat

Adottak száll´ıtand ó tárgyak s úllyal (vagy térfogattal) és értékkel (vagy fontossággal). A feladat az, hogy meghatározzuk a hátizsákba beteend˝o holmiknak azt a részhalmazát, amelyek az el˝oz˝o

értelemben a leghasznosabbak, és egy ütt beférnek a korlátozott kapacitás ú hátizsákba.

Használjuk a k övetkez˝o jel ölést:

m a t´argyak sz´ama,

ai azi. tárgy s úlya,i= 1,2, . . . , m, ci azi. tárgy értéke,i= 1,2, . . . , m,

b a rakomány megengedett maximális összs úlya.

Legyen xi értéke 1, ha azi-edik tárgy beker ült a hátizsákba, és 0, ha nem (i= 1,2, . . . , m).

A megoldand ´o feladat ezekkel fel´ırva:

max

m

X

i=1

cixi, felt´eve, hogy

m

X

i=1

aixi ≤b, ´es xi ∈ {0,1}, i= 1,2, . . . , m.

A hátizsák feladat tehát egy egészérték ˝u, bináris lineáris programozási feladat. Egy egyszer ˝u kiterjesztése ad ódik akkor, ha az elhelyezend˝o tárgyak k öz ött vannak azonosak. Ekkor az optimalizáland ó változ ók értékei nemnegat´ıv egészek lehetnek.

A feladat jellege miatt a kiindulási feladatra legt öbbsz ör fel lehet tenni azt, hogy a s úlyok és a s úlyhatár nemnegat´ıvak. Ennek ellenére mind azai, mind a ci értékek el˝ojele tetsz˝oleges.

2.1. A hátizsák feladat megoldása teljes leszámolással

A hátizsák feladatot megoldhatjuk a durva er˝o m ódszerével (brute force, enumeration). Ennek lényege, hogy felsoroljuk az összes változ ó-kombináci ót, meghatározzuk a lehetséges megoldá- sokra a célf üggvény értékét, és kiválasztjuk ez alapján az optimálisat.

27