2. A konvex optimalizálás alapjai 41
2.1.2. Konvex függvények
A konvex halmazok után most a konvex függvényekkel fogunk foglalkozni.
2.30. Lemma. Legyen az f konvex függvény a C konvex halmazon definiálva. Ekkor f folytonos C relatív belseje, C0 felett.
∗Bizonyítás: Legyenp∈ C0 tetszőleges pont. Az általánosság megsértése nélkül feltehetjük, hogyC teljes dimenziójú,paz origó ésf(p) = 0. Először tekintsük az egydimenziós esetet. Mivel az origó benne vanf értelmezési tartományának, C-nek a relatív belsejében, ezért létezik olyanv >0, amelyrev∈ C és
−v∈ C. Tekintsük a következő két lineáris függvényt:
ℓ1(x) :=xf(v)
v és ℓ2(x) :=xf(−v)
−v . Könnyen ellenőrizhető, hogyf konvexitása miatt igazak a következő relációk:
• ℓ1(x)≥f(x)hax∈[0, v];
• ℓ1(x)≤f(x)hax∈[−v,0];
• ℓ2(x)≥f(x)hax∈[−v,0];
• ℓ2(x)≤f(x)hax∈[0, v].
Definiáljuk a
g(x) := min{ℓ1(x), ℓ2(x)} és h(x) := max{ℓ1(x), ℓ2(x)} függvényeket a[−v, v]intervallumon. Ekkor
g(x)≤f(x)≤h(x).
A fentiℓ1(x)és ℓ2(x)lineáris függvények nyilván folytonosak, így h(x)és g(x)is folytonos. Az f(0) = g(0) =h(0) = 0relációból következik, hogyf(x)folytonos a0pontban.
Azn-dimenziós esetet hasonlóan vezetjük le. Ismét tegyük fel, hogy az origó benne vanCbelsejében ésf(0) = 0. Legyenekv1, . . . , vn, vn+1 olyan vektorok, amelyekre a
( x:x=
n+1X
i=1
λivi, λi∈[0,1],
n+1X
i=1
λi = 1 )
konvex halmaz megegyezik a teljesRn térrel. Minden i = 1, . . . , n+ 1 esetén legyen az Li(x) lineáris függvény (hipersík) a következőképp definiálva:Li(0) = 0ésLi(vj) =f(vj)mindenj6=iesetén. Legyen
g(x) := min{L1(x), . . . , Ln+1(x)} és h(x) := max{L1(x), . . . , Ln+1(x)}. Könnyen belátható, hogyg(x)ésh(x)folytonos, valamintf(0) =g(0) =h(0) = 0és
g(x)≤f(x)≤h(x).
Tehátf(x)folytonos a 0pontban. 2
2.8. Feladat. Bizonyítsuk be, hogy a fent definiáltg(x)ésh(x)függvények folytonosak,f(0) = h(0) =g(0) = 0és g(x)≤f(x)≤h(x).
Megjegyzés: f lehet nem folytonos a C \ C0 relatív határon.
2.5. ábra. Azf függvény nem folytonos a teljes számegyenesen, de folytonos(−1,1)-en és konvex [−1,1]-en.
2.31. Példa. A 2.5 ábrán látható f(x) = halmazon definiáljuk, akkor sem folytonos, de C0 felett már folytonos ésC felett konvex.
A következő eredmény alapvető fontosságú a konvex analízisben.
2.32. Lemma (Jensen-egyenlőtlenség). Legyen f konvex függvény a C ⊆ Rn konvex halmazon. Legyen x1, . . . , xk ∈ C és λ1, . . . , λk≥0, Pk
∗Bizonyítás: A bizonyítást k szerinti teljes indukcióval végezzük el. Ha k = 2, akkor 0.2 definíció értelmében igaz az állítás. Tegyük fel, hogy az állítás igaz k≥2 esetén; belátjuk, hogyk+ 1mellett is igaz.
Legyenx1, . . . , xk, xk+1 ∈ C ésλ1, . . . , λk, λk+1 ≥0, Pk+1
i=1 λi = 1 adott. Ha legfeljebbk darab λi, 1 ≤ i ≤ k+ 1 együttható nem nulla, akkor elhagyva a nulla együtthatóval rendelkező xi pontot, az egyenlőtlenség azonnal adódik az indukciós feltevésből. Most tegyük fel, hogy egyik λi együttható sem nulla. EkkorC konvexitása miatt
˜ ahol az első egyenlőtlenségf konvexitásából (0.2 definíció), a második egyenlőtlenség az indukciós
felte-vésből adódott. 2
A következő két lemma a definíciók felhasználásával könnyen igazolható.
2.33. Lemma. Legyenekf1, . . . , fk konvex függvények aC ⊆Rnkonvex halmazon. Ekkor i. az
f(x) = Xk
i=1
λifi(x) (2.2)
függvény minden λ1, . . . , λk≥0 mellett konvex;
ii. az
f(x) = max
1≤i≤kfi(x) (2.3)
függvény konvex.
2.34. Definíció. A h:R→R függvényt
• monoton növekvőnek3 hívjuk, ha minden t1 < t2 ∈R esetén h(t1)≤h(t2);
• szigorúan monoton növekvőnek hívjuk, ha minden t1 < t2 ∈R esetén h(t1)< h(t2).
2.35. Lemma. Legyenf konvex függvény aC ⊆Rnkonvex halmazon és legyenh:R→R konvex, monoton növekvő függvény. Ekkor a h(f(x)) :C → R összetett függvény konvex.
2.9. Feladat. Bizonyítsuk be a 2.33 és a 2.35 lemmákat.
2.10. Feladat. Tegyük fel, hogy a 2.35 lemmában ahfüggvény nem monoton növekvő. Mutas-sunk konkrét példát arra az esetre, amikor a lemma állítása nem igaz.
2.36. Definíció. Legyen f :C → Rkonvex függvény aC konvex halmazon. Legyen α∈R egy tetszőleges szám. ADα ={x∈ C :f(x)≤α}halmazt azf függvény szinthalmazának4 nevezzük.
2.37. Lemma. Ha f konvex függvény C felett, akkor a Dα szinthalmaz minden α ∈ R esetén (esetleg üres) konvex halmaz.
∗Bizonyítás: Legyenx, y∈ Dαés0≤λ≤1. Ekkorf(x)≤α,f(y)≤αés f(λx+ (1−λ)y)≤λf(x) + (1−λ)f(y)≤λα+ (1−λ)α=α.
Az első egyenlőtlenségf konvexitásából következett. Ezzel az állítást bizonyítottuk. 2
2.11. Feladat. Mutassunk példát olyan nemkonvex függvényre, amelynek minden szinthalmaza konvex.5
Tudjuk, hogy azf függvény gradiense,∇f, definíció szerint azf függvény ∂x∂f
i parciális deriváltjaiból álló vektor. A továbbiakban az iránymenti derivált fogalmát definiáljuk.
3Elterjedt még amonoton nemcsökkenő elnevezés is.
4Szokásos még a nívóhalmaz elnevezés is.
5Azokat a függvényeket, amelyeknek minden szinthalmaza konvex, kvázikonvex függvényeknek nevez-zük. Minden konvex függvény kvázikonvex, de nem minden kvázikonvex függvény konvex.
2.38. Definíció. Egy f : Rn → R függvény x ∈ Rn pontbeli s ∈ Rn irányú iránymenti deriváltját a következőképp definiáljuk:
δf(x, s) = lim
λ→0
f(x+λs)−f(x)
λ ,
ha a határérték létezik.
Ha az f függvény folytonosan differenciálható, akkor ∂x∂f
i = δf(x, ei), ahol ei az i-edik egységvektor. Ebből adódik a következő lemma.
2.39. Lemma. Ha az f függvény folytonosan differenciálható, akkor minden s ∈ Rn esetén
mátrixot a függvény Hesse-mátrixának nevezzük.
2.41. Lemma. Egy konvex C ⊆ Rn halmazon értelmezettf függvény akkor és csak akkor konvex, ha minden x∈ C és x+s ∈ C esetén a φ(λ) =f(x+λs) függvény konvex a[0,1]
intervallumon.
∗Bizonyítás: Először tegyük fel, hogy f konvex függvény. Belátjuk, hogyφ(λ)konvex a[0,1] inter-vallumon. Legyenλ1, λ2∈[0,1]és0≤α≤1. Ekkor ami igazolja az állítás első felét.
Másrészt, haφ(λ)konvex a[0,1]intervallumon mindenx, x+s∈ C esetén, akkor legyenx, y∈ C és s:=y−x. Ekkor
f(αy+ (1−α)x) =f(x+α(y−x)) =φ(α) =φ(α·1 + (1−α)·0)≤
≤αφ(1) + (1−α)φ(0) =αf(y) + (1−α)f(x). (2.5)
Ezzel az állítást beláttuk. 2
2.42. Példa. Legyen f(x) = x21 +x22 és legyen Ef az f függvény epigráfja (lásd a 2.6 ábrát).
Mindens∈R2 vektorhoz definiálhatunk egyVs⊂R3 félsíkot:{(x, y)∈R2×R:x=µs, µ >0}. Ekkor x = (0,0) esetén a φ(λ) = f(x+λs) = f(λs) függvény epigráfja Vs∩Ef, ami konvex halmaz. Ezértφ(λ) konvex függvény.
2.43. Lemma. Legyen f folytonosan differenciálható függvény a C ⊆ Rn nyílt, konvex halmazon. Ekkor a következő állítások ekvivalensek:
s Vs
φ(λ)
2.6. ábra. Az f(s) =x21+x22 függvény epigráfja.
i. Az f függvény konvex a C halmazon.
ii. Bármely x,x¯∈ C esetén (lásd a 2.7 ábrát)
∇f(x)T(¯x−x)≤f(¯x)−f(x)≤ ∇f(¯x)T(¯x−x).
iii. Bármely x, x+s ∈ C esetén a φ(λ) = f(x+λs) függvény folytonosan differenciál-ható a nyílt (0,1) intervallumon, a deriváltja φ′(λ) =sT∇f(x+λs), továbbá φ′(λ) monoton növekvő függvény.
∗Bizonyítás:
i.→ii. Legyen0≤λ≤1ésx,x¯∈ C. Ekkorf konvexitása miatt
f(λ¯x+ (1−λ)x)≤λf(¯x) + (1−λ)f(x), ahonnan egyszerűen kapjuk, hogy
f(x+λ(¯x−x))−f(x)
λ ≤f(¯x)−f(x).
Vegyük a baloldal határértékétλ→0mellett, és használjuk a 2.39 lemmát, ezzel megkapjukii. első egyenlőtlenségét. Az xésx¯szerepének felcserélésével egyszerűen adódik a másik egyenlőtlenség.
ii.→iii
. Legyenx, x+s∈ C és0≤λ1, λ2≤1. Ekkor ii. összefüggéseit az x+λ1s ésx+λ2spontokra alkalmazva kapjuk, hogy
¡λ2−λ1¢
∇f¡
x+λ1s¢T
s≤f¡
x+λ2s¢
−f¡
x+λ1s¢
≤¡
λ2−λ1¢
∇f¡
x+λ2s¢T
s.
Innen
¡λ2−λ1¢ φ′¡
λ1¢
≤φ¡ λ2¢
−φ¡ λ1¢
≤¡
λ2−λ1¢ φ′¡
λ2¢ . A λ1< λ2feltevést használva kapjuk, hogy
φ′(λ1)≤ φ(λ2)−φ(λ1)
λ2−λ1 ≤φ′(λ2),
ami bizonyítja, hogy a φ′(λ) függvény monoton növekvő. A φ deriváltjára vonatkozó kifejezés levezetését az olvasóra bízzuk (2.12 feladat).
f(x)
2.7. ábra. Az f konvex függvény gradienséhez kapcsolódó összefüggések.
iii.→i. Csak azt kell belátnunk, hogy haφ′(λ)monoton növekvő, akkorφ(λ)konvex. Legyen0< λ1<
Ezzel a lemmát beláttuk. 2
2.12. Feladat. Legyen f : Rn → R kétszer folytonosan differenciálható függvény, és legyen x ∈ Rn és s ∈ Rn adott. Definiáljuk a φ : R → R függvényt a φ(λ) = f(x+λs) formulával.
Bizonyítsuk be, hogy
φ′(λ) =sT∇f(x+λs) és
φ′′(λ) =sT∇2f(x+λs)s.
2.44. Lemma. Legyen f kétszer folytonosan differenciálható függvény a C ⊆ Rn nyílt, konvex halmazon. Az f függvény akkor és csak akkor konvex, ha Hesse-mátrixa, ∇2f(x), minden x∈ C esetén pozitív szemidefinit (PSD). Továbbá φ′′(λ) =sT∇2f(x+λs)s.
∗Bizonyítás: Legyen x∈ C éss ∈Rn tetszőleges, és φ(λ) = f(x+λs). Haf konvex, akkor φ′(λ) monoton növekvő, vagyisφ′′(λ)nemnegatív minden x∈ C és0≤λ≤1esetén. Így
sT∇2f(x)s=φ′′(0)≥0,
ami bizonyítja, hogy a∇2f(x)pozitív szemidefinit.
Másrészt, ha∇2f(x)pozitív szemidefinit minden x∈ C mellett, akkor sT∇2f(x+λs)s=φ′′(λ)≥0,
azazφ′(λ)monoton növekvő, amiből a 2.43 lemma szerint következikf konvexitása. 2
A következő állítás a 2.44 lemmához hasonlóan bizonyítható.
2.45. Állítás. Legyen f kétszer folytonosan differenciálható függvény a C nyílt, konvex halmazon. Ekkorf akkor és csak akkor szigorúan konvex, ha∇2f(x)minden x∈ C esetén pozitív definit.