Konvex függvények - A konvex optimalizálás alapjai 41

2. A konvex optimalizálás alapjai 41

2.1.2. Konvex függvények

A konvex halmazok után most a konvex függvényekkel fogunk foglalkozni.

2.30. Lemma. Legyen az f konvex függvény a C konvex halmazon deﬁniálva. Ekkor f folytonos C relatív belseje, C⁰ felett.

∗Bizonyítás: Legyenp∈ C⁰ tetszőleges pont. Az általánosság megsértése nélkül feltehetjük, hogyC teljes dimenziójú,paz origó ésf(p) = 0. Először tekintsük az egydimenziós esetet. Mivel az origó benne vanf értelmezési tartományának, C-nek a relatív belsejében, ezért létezik olyanv >0, amelyrev∈ C és

−v∈ C. Tekintsük a következő két lineáris függvényt:

ℓ1(x) :=xf(v)

v és ℓ2(x) :=xf(−v)

−v . Könnyen ellenőrizhető, hogyf konvexitása miatt igazak a következő relációk:

• ℓ1(x)≥f(x)hax∈[0, v];

• ℓ1(x)≤f(x)hax∈[−v,0];

• ℓ2(x)≥f(x)hax∈[−v,0];

• ℓ2(x)≤f(x)hax∈[0, v].

Deﬁniáljuk a

g(x) := min{ℓ1(x), ℓ2(x)} és h(x) := max{ℓ1(x), ℓ2(x)} függvényeket a[−v, v]intervallumon. Ekkor

g(x)≤f(x)≤h(x).

A fentiℓ1(x)és ℓ2(x)lineáris függvények nyilván folytonosak, így h(x)és g(x)is folytonos. Az f(0) = g(0) =h(0) = 0relációból következik, hogyf(x)folytonos a0pontban.

Azn-dimenziós esetet hasonlóan vezetjük le. Ismét tegyük fel, hogy az origó benne vanCbelsejében ésf(0) = 0. Legyenekv1, . . . , vn, vn+1 olyan vektorok, amelyekre a

( x:x=

n+1X

i=1

λ_iv_i, λ_i∈[0,1],

n+1X

i=1

λ_i = 1 )

konvex halmaz megegyezik a teljesRⁿ térrel. Minden i = 1, . . . , n+ 1 esetén legyen az Li(x) lineáris függvény (hipersík) a következőképp deﬁniálva:Li(0) = 0ésLi(vj) =f(vj)mindenj6=iesetén. Legyen

g(x) := min{L1(x), . . . , Ln+1(x)} és h(x) := max{L1(x), . . . , Ln+1(x)}. Könnyen belátható, hogyg(x)ésh(x)folytonos, valamintf(0) =g(0) =h(0) = 0és

g(x)≤f(x)≤h(x).

Tehátf(x)folytonos a 0pontban. 2

2.8. Feladat. Bizonyítsuk be, hogy a fent deﬁniáltg(x)ésh(x)függvények folytonosak,f(0) = h(0) =g(0) = 0és g(x)≤f(x)≤h(x).

Megjegyzés: f lehet nem folytonos a C \ C⁰ relatív határon.

2.5. ábra. Azf függvény nem folytonos a teljes számegyenesen, de folytonos(−1,1)-en és konvex [−1,1]-en.

2.31. Példa. A 2.5 ábrán látható f(x) = halmazon deﬁniáljuk, akkor sem folytonos, de C⁰ felett már folytonos ésC felett konvex.

A következő eredmény alapvető fontosságú a konvex analízisben.

2.32. Lemma (Jensen-egyenlőtlenség). Legyen f konvex függvény a C ⊆ Rⁿ konvex halmazon. Legyen x¹, . . . , x^k ∈ C és λ¹, . . . , λ^k≥0, Pk

∗Bizonyítás: A bizonyítást k szerinti teljes indukcióval végezzük el. Ha k = 2, akkor 0.2 deﬁníció értelmében igaz az állítás. Tegyük fel, hogy az állítás igaz k≥2 esetén; belátjuk, hogyk+ 1mellett is igaz.

Legyenx¹, . . . , x^k, x^k+1 ∈ C ésλ¹, . . . , λ^k, λ^k+1 ≥0, Pk+1

i=1 λⁱ = 1 adott. Ha legfeljebbk darab λⁱ, 1 ≤ i ≤ k+ 1 együttható nem nulla, akkor elhagyva a nulla együtthatóval rendelkező xⁱ pontot, az egyenlőtlenség azonnal adódik az indukciós feltevésből. Most tegyük fel, hogy egyik λⁱ együttható sem nulla. EkkorC konvexitása miatt

˜ ahol az első egyenlőtlenségf konvexitásából (0.2 deﬁníció), a második egyenlőtlenség az indukciós

felte-vésből adódott. 2

A következő két lemma a deﬁníciók felhasználásával könnyen igazolható.

2.33. Lemma. Legyenekf¹, . . . , f^k konvex függvények aC ⊆Rⁿkonvex halmazon. Ekkor i. az

f(x) = Xk

i=1

λⁱfⁱ(x) (2.2)

függvény minden λ¹, . . . , λ^k≥0 mellett konvex;

ii. az

f(x) = max

1≤i≤kfⁱ(x) (2.3)

függvény konvex.

2.34. Deﬁníció. A h:R→R függvényt

• monoton növekvőnek³ hívjuk, ha minden t1 < t2 ∈R esetén h(t1)≤h(t2);

• szigorúan monoton növekvőnek hívjuk, ha minden t1 < t2 ∈R esetén h(t1)< h(t2).

2.35. Lemma. Legyenf konvex függvény aC ⊆Rⁿkonvex halmazon és legyenh:R→R konvex, monoton növekvő függvény. Ekkor a h(f(x)) :C → R összetett függvény konvex.

2.9. Feladat. Bizonyítsuk be a 2.33 és a 2.35 lemmákat.

2.10. Feladat. Tegyük fel, hogy a 2.35 lemmában ahfüggvény nem monoton növekvő. Mutas-sunk konkrét példát arra az esetre, amikor a lemma állítása nem igaz.

2.36. Deﬁníció. Legyen f :C → Rkonvex függvény aC konvex halmazon. Legyen α∈R egy tetszőleges szám. ADα ={x∈ C :f(x)≤α}halmazt azf függvény szinthalmazának⁴ nevezzük.

2.37. Lemma. Ha f konvex függvény C felett, akkor a Dα szinthalmaz minden α ∈ R esetén (esetleg üres) konvex halmaz.

∗Bizonyítás: Legyenx, y∈ Dαés0≤λ≤1. Ekkorf(x)≤α,f(y)≤αés f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y)≤λα+ (1−λ)α=α.

Az első egyenlőtlenségf konvexitásából következett. Ezzel az állítást bizonyítottuk. 2

2.11. Feladat. Mutassunk példát olyan nemkonvex függvényre, amelynek minden szinthalmaza konvex.⁵

Tudjuk, hogy azf függvény gradiense,∇f, deﬁníció szerint azf függvény _∂x^∂f

i parciális deriváltjaiból álló vektor. A továbbiakban az iránymenti derivált fogalmát deﬁniáljuk.

3Elterjedt még amonoton nemcsökkenő elnevezés is.

4Szokásos még a nívóhalmaz elnevezés is.

5Azokat a függvényeket, amelyeknek minden szinthalmaza konvex, kvázikonvex függvényeknek nevez-zük. Minden konvex függvény kvázikonvex, de nem minden kvázikonvex függvény konvex.

2.38. Deﬁníció. Egy f : Rⁿ → R függvény x ∈ Rⁿ pontbeli s ∈ Rⁿ irányú iránymenti deriváltját a következőképp deﬁniáljuk:

δf(x, s) = lim

λ→0

f(x+λs)−f(x)

λ ,

ha a határérték létezik.

Ha az f függvény folytonosan diﬀerenciálható, akkor _∂x^∂f

i = δf(x, ei), ahol ei az i-edik egységvektor. Ebből adódik a következő lemma.

2.39. Lemma. Ha az f függvény folytonosan diﬀerenciálható, akkor minden s ∈ Rⁿ esetén

mátrixot a függvény Hesse-mátrixának nevezzük.

2.41. Lemma. Egy konvex C ⊆ Rⁿ halmazon értelmezettf függvény akkor és csak akkor konvex, ha minden x∈ C és x+s ∈ C esetén a φ(λ) =f(x+λs) függvény konvex a[0,1]

intervallumon.

∗Bizonyítás: Először tegyük fel, hogy f konvex függvény. Belátjuk, hogyφ(λ)konvex a[0,1] inter-vallumon. Legyenλ¹, λ²∈[0,1]és0≤α≤1. Ekkor ami igazolja az állítás első felét.

Másrészt, haφ(λ)konvex a[0,1]intervallumon mindenx, x+s∈ C esetén, akkor legyenx, y∈ C és s:=y−x. Ekkor

f(αy+ (1−α)x) =f(x+α(y−x)) =φ(α) =φ(α·1 + (1−α)·0)≤

≤αφ(1) + (1−α)φ(0) =αf(y) + (1−α)f(x). (2.5)

Ezzel az állítást beláttuk. 2

2.42. Példa. Legyen f(x) = x²₁ +x²₂ és legyen E_f az f függvény epigráfja (lásd a 2.6 ábrát).

Mindens∈R² vektorhoz deﬁniálhatunk egyV_s⊂R³ félsíkot:{(x, y)∈R²×R:x=µs, µ >0}. Ekkor x = (0,0) esetén a φ(λ) = f(x+λs) = f(λs) függvény epigráfja Vs∩E_f, ami konvex halmaz. Ezértφ(λ) konvex függvény.

2.43. Lemma. Legyen f folytonosan diﬀerenciálható függvény a C ⊆ Rⁿ nyílt, konvex halmazon. Ekkor a következő állítások ekvivalensek:

s Vs

φ(λ)

2.6. ábra. Az f(s) =x²₁+x²₂ függvény epigráfja.

i. Az f függvény konvex a C halmazon.

ii. Bármely x,x¯∈ C esetén (lásd a 2.7 ábrát)

∇f(x)^T(¯x−x)≤f(¯x)−f(x)≤ ∇f(¯x)^T(¯x−x).

iii. Bármely x, x+s ∈ C esetén a φ(λ) = f(x+λs) függvény folytonosan diﬀerenciál-ható a nyílt (0,1) intervallumon, a deriváltja φ^′(λ) =s^T∇f(x+λs), továbbá φ^′(λ) monoton növekvő függvény.

∗Bizonyítás:

i.→ii. Legyen0≤λ≤1ésx,x¯∈ C. Ekkorf konvexitása miatt

f(λ¯x+ (1−λ)x)≤λf(¯x) + (1−λ)f(x), ahonnan egyszerűen kapjuk, hogy

f(x+λ(¯x−x))−f(x)

λ ≤f(¯x)−f(x).

Vegyük a baloldal határértékétλ→0mellett, és használjuk a 2.39 lemmát, ezzel megkapjukii. első egyenlőtlenségét. Az xésx¯szerepének felcserélésével egyszerűen adódik a másik egyenlőtlenség.

ii.→iii

. Legyenx, x+s∈ C és0≤λ¹, λ²≤1. Ekkor ii. összefüggéseit az x+λ¹s ésx+λ²spontokra alkalmazva kapjuk, hogy

¡λ²−λ¹¢

∇f¡

x+λ¹s¢T

s≤f¡

x+λ²s¢

−f¡

x+λ¹s¢

≤¡

λ²−λ¹¢

∇f¡

x+λ²s¢T

Innen

¡λ²−λ¹¢ φ^′¡

λ¹¢

≤φ¡ λ²¢

−φ¡ λ¹¢

≤¡

λ²−λ¹¢ φ^′¡

λ²¢ . A λ¹< λ²feltevést használva kapjuk, hogy

φ^′(λ¹)≤ φ(λ²)−φ(λ¹)

λ²−λ¹ ≤φ^′(λ²),

ami bizonyítja, hogy a φ^′(λ) függvény monoton növekvő. A φ deriváltjára vonatkozó kifejezés levezetését az olvasóra bízzuk (2.12 feladat).

f(x)

2.7. ábra. Az f konvex függvény gradienséhez kapcsolódó összefüggések.

iii.→i. Csak azt kell belátnunk, hogy haφ^′(λ)monoton növekvő, akkorφ(λ)konvex. Legyen0< λ¹<

Ezzel a lemmát beláttuk. 2

2.12. Feladat. Legyen f : Rⁿ → R kétszer folytonosan diﬀerenciálható függvény, és legyen x ∈ Rⁿ és s ∈ Rⁿ adott. Deﬁniáljuk a φ : R → R függvényt a φ(λ) = f(x+λs) formulával.

Bizonyítsuk be, hogy

φ^′(λ) =s^T∇f(x+λs) és

φ^′′(λ) =s^T∇²f(x+λs)s.

2.44. Lemma. Legyen f kétszer folytonosan diﬀerenciálható függvény a C ⊆ Rⁿ nyílt, konvex halmazon. Az f függvény akkor és csak akkor konvex, ha Hesse-mátrixa, ∇²f(x), minden x∈ C esetén pozitív szemideﬁnit (PSD). Továbbá φ^′′(λ) =s^T∇²f(x+λs)s.

∗Bizonyítás: Legyen x∈ C éss ∈Rⁿ tetszőleges, és φ(λ) = f(x+λs). Haf konvex, akkor φ^′(λ) monoton növekvő, vagyisφ^′′(λ)nemnegatív minden x∈ C és0≤λ≤1esetén. Így

s^T∇²f(x)s=φ^′′(0)≥0,

ami bizonyítja, hogy a∇²f(x)pozitív szemideﬁnit.

Másrészt, ha∇²f(x)pozitív szemideﬁnit minden x∈ C mellett, akkor s^T∇²f(x+λs)s=φ^′′(λ)≥0,

azazφ^′(λ)monoton növekvő, amiből a 2.43 lemma szerint következikf konvexitása. 2

A következő állítás a 2.44 lemmához hasonlóan bizonyítható.

2.45. Állítás. Legyen f kétszer folytonosan diﬀerenciálható függvény a C nyílt, konvex halmazon. Ekkorf akkor és csak akkor szigorúan konvex, ha∇²f(x)minden x∈ C esetén pozitív deﬁnit.

In document OPERÁCIÓKUTATÁS No. 5. (Pldal 53-59)