文章目录
凸集
根据 凸优化简介9中凸函数的定义: f ( a x + ( 1 − a ) y ) ≤ a f ( x ) + ( 1 − a ) f ( y ) , ∀ x , y ∈ R n , a ∈ [ 0 , 1 ] f(ax+(1-a)y)\leq af(x)+(1-a)f(y), \forall x,y \in \mathbb{R}^n, a\in [0,1] f(ax+(1−a)y)≤af(x)+(1−a)f(y),∀x,y∈Rn,a∈[0,1]。因此,在某个段 [ x , y ] [x,y] [x,y]上的任何点都会满足 z = a x + ( 1 − a ) y , a ∈ [ 0 , 1 ] z=ax+(1-a)y, a\in [0,1] z=ax+(1−a)y,a∈[0,1]。因此,通过端点 x , y x,y x,y属于集合可以得到 x , y x,y x,y中间的段也是属于这个集合。
定义:如果对于任意的 x , y ∈ Q x,y\in Q x,y∈Q, a ∈ [ 0 , 1 ] a\in [0,1] a∈[0,1],有 a x + ( 1 − a ) y ∈ Q ax+(1-a)y\in Q ax+(1−a)y∈Q,那么集合 Q Q Q称为凸集。点 a x + ( 1 − a ) y ax+(1-a)y ax+(1−a)y称为 x , y x,y x,y两个点的凸组合。
在凸优化简介3中提到过层集level set
。
引理:如果函数 f ( x ) f(x) f(x)是一个凸函数,那么对于任意的 β ∈ R 1 \beta\in\mathbb{R}^1 β∈R1,它的层集为 L f ( β ) = { x ∈ R n ∣ f ( x ) ≤ β } \mathfrak{L}_f(\beta)=\{x\in \mathbb{R}^n| f(x)\leq \beta\} Lf(β)={ x∈Rn∣f(x)≤β}要么是凸的,要么是空的。
证明:设 x , y ∈ L f ( β ) x, y\in \mathfrak{L}_f(\beta) x,y∈Lf(β),那么 f ( x ) ≤ β f(x)\leq \beta f(x)≤β, f ( y ) ≤ β f(y)\leq \beta f(y)≤β。因此,使用上面凸函数的定义得到不等式:
f ( a x + ( 1 − a ) y ) ≤ a f ( x ) + ( 1 − a ) f ( y ) ≤ β f(ax+(1-a)y)\leq af(x)+(1-a)f(y)\leq \beta f(ax+(1−a)y)≤af(x)+(1−a)f(y)≤β,表明 a x + ( 1 − a ) y ∈ L f ( β ) ax+(1-a)y\in \mathfrak{L}_f(\beta) ax+(1−a)y∈Lf(β).
引理:设函数 f ( x ) f(x) f(x)是一个凸函数,那么它的像 ( e p i g r a p h ) (epigraph) (epigraph), ε f = { ( x , τ ) ∈ R n + 1 ∣ f ( x ) ≤ τ } \varepsilon_f=\{(x,\tau)\in \mathbb{R}^{n+1}|f(x)\leq \tau\} εf={ (x,τ)∈Rn+1∣f(x)≤τ}是一个凸集。
证明:设 z 1 = ( x 1 , τ 1 ) ∈ ε f z_1=(x_1,\tau_1)\in \varepsilon_f z1=(x1,τ1)∈εf,并且 z 2 = ( x 2 , τ 2 ) ∈ ε f z_2=(x_2,\tau_2)\in \varepsilon_f z2=(x2,τ2)∈εf,那么,对于任意的 a ∈ [ 0 , 1 ] a\in [0,1] a∈[0,1]有:
z a = a z 1 + ( 1 − a ) z 2 = ( a x 1 + ( 1 − a ) x 2 , a τ 1 + ( 1 − a ) τ 2 ) z_a=az_1+(1-a)z_2=(ax_1+(1-a)x_2,a\tau_1+(1-a)\tau_2) za=az1+(1−a)z2=(ax1+(1−a)x2,aτ1+(1−a)τ2),
f ( a x 1 + ( 1 − a ) x 2 ) ≤ a f ( x 1 ) + ( 1 − a ) f ( x 2 ) ≤ a τ 1 + ( 1 − a ) τ 2 f(ax_1+(1-a)x_2)\leq af(x_1)+(1-a)f(x_2)\leq a\tau_1+(1-a)\tau_2 f(ax1+(1−a)x2)≤af(x1)+(1−a)f(x2)≤aτ1+(1−a)τ2.
因此,再次使用上面凸函数的定义的不等式得到 f ( a x 1 + ( 1 − a ) x 2 ) ≤ a f ( x 1 ) + ( 1 − a ) f ( x 2 ) ≤ a τ 1 + ( 1 − a ) τ 2 f(ax_1+(1-a)x_2)\leq af(x_1)+(1-a)f(x_2)\leq a\tau_1+(1-a)\tau_2 f(ax1+(1−a)x2)≤af(x1)+(1−a)f(x2)≤aτ1+(1−a)τ2.
定理:设 Q 1 ⊆ R n Q_1\subseteq \mathbb{R}^n Q1⊆Rn, Q 2 ⊆ R m Q_2\subseteq \mathbb{R}^m Q2⊆Rm是凸集,且 A ( x ) \mathfrak{A}(x) A(x)是一个线性算子: A ( x ) = A x + b : R n → R m