拟凸函数一阶条件的证明

  1. 首先来看看拟凸函数的定义:函数f:Rn→Rf:R^n\to Rf:RnR称为拟凸函数(或称单峰函数),如果其定义域及所有下水平集Sα={x∈domf∣f(x)⩽α}S_\alpha=\left\{ {x \in domf\left| {f\left( x \right) \leqslant \alpha } \right.} \right\}Sα={xdomff(x)α} α∈R\alpha \in RαR都是凸集。从该定义可知,凸函数一定是拟凸函数,但拟凸函数不一定是凸函数(如函数f(x)=−exf\left(x\right)=-e^xf(x)=ex)。
  2. 基本性质:函数fff是拟凸函数的充要条件是,domfdomfdomf是凸集,且对任意x,y∈domfx,y\in domfx,ydomf0⩽θ⩽10\leqslant\theta\leqslant10θ1,有f(θx+(1−θ)y)⩽max{f(x),f(y)}(1)f\left(\theta x+\left(1-\theta\right)y\right)\leqslant max\left\{f\left(x\right),f\left(y\right)\right\} \tag1f(θx+(1θ)y)max{f(x),f(y)}(1)
  3. 拟凸函数的一阶条件:设函数f:Rn→Rf:R^n\to Rf:RnR可微,则函数fff是拟凸的充要条件是:domfdomfdomf是凸集,且对任意x,y∈domfx,y\in domfx,ydomff(y)⩽f(x)⇒∇f(x)T(y−x)⩽0(2)f\left(y\right)\leqslant f\left(x\right)\Rightarrow\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0 \tag2f(y)f(x)f(x)T(yx)0(2)
  4. 一阶条件的证明:
    (1)必要性:设函数f:Rn→Rf:R^n\to Rf:RnR可微,且domfdomfdomf是凸集,对x,y∈domfx,y\in domfx,ydomff(y)⩽f(x)f\left(y\right)\leqslant f\left(x\right)f(y)f(x),根据上面拟凸函数的基本性质有 f(θx+(1−θ)y)⩽max{f(x),f(y)}f\left(\theta x+\left(1-\theta\right)y\right)\leqslant max\left\{f\left(x\right),f\left(y\right)\right\}f(θx+(1θ)y)max{f(x),f(y)},综合得:f(θx+(1−θ)y)⩽f(x)(3)f\left(\theta x+\left(1-\theta\right)y\right)\leqslant f\left(x\right) \tag3f(θx+(1θ)y)f(x)(3),将f(x)f\left(x\right)f(x)拆分为f(θx+(1−θ)x)f\left(\theta x+\left(1-\theta\right)x\right)f(θx+(1θ)x),则(3)式变为f(θx+(1−θ)y)⩽f(θx+(1−θ)x)(4)f\left(\theta x+\left(1-\theta\right)y\right)\leqslant f\left(\theta x+\left(1-\theta\right)x\right) \tag4f(θx+(1θ)y)f(θx+(1θ)x)(4)
    f(θx+(1−θ)y)−f(θx+(1−θ)x)⩽0(5)f\left(\theta x+\left(1-\theta\right)y\right)-f\left(\theta x+\left(1-\theta\right)x\right)\leqslant0 \tag5f(θx+(1θ)y)f(θx+(1θ)x)0(5)
    将(5)式变为(6)式:
    f(θx+(1−θ)x+(1−θ)(y−x))−f(θx+(1−θ)x)⩽0(6)f\left(\theta x+(1-\theta)x+\left(1-\theta\right)(y-x)\right)-f\left(\theta x+\left(1-\theta\right)x\right)\leqslant0 \tag6f(θx+(1θ)x+(1θ)(yx))f(θx+(1θ)x)0(6)
    再将(6)式变成(7)式:
    f(θx+(1−θ)x+(1−θ)(y−x))−f(θx+(1−θ)x)(1−θ)(y−x)(1−θ)(y−x)⩽0(7)\frac{{f\left( {\theta x +(1-\theta)x+ \left( {1 - \theta } \right)(y-x)} \right) - f\left( {\theta x + \left( {1 - \theta } \right)x}\right)}}{{\left( {1 - \theta } \right)\left( {y - x} \right)}}\left( {1 - \theta } \right)\left( {y - x} \right) \leqslant 0 \tag7(1θ)(yx)f(θx+(1θ)x+(1θ)(yx))f(θx+(1θ)x)(1θ)(yx)0(7)

对(7)式的第一项取极限θ→1\theta \to1θ1得:lim⁡θ→1f(θx+(1−θ)x+(1−θ)(y−x))−f(θx+(1−θ)x)(1−θ)(y−x)(1−θ)(y−x)=∇f(x)T(y−x)⩽0\mathop {\lim }\limits_{\theta \to 1}\frac{{f\left( {\theta x +(1-\theta)x+ \left( {1 - \theta } \right)(y-x)} \right) - f\left( {\theta x + \left( {1 - \theta } \right)x}\right)}}{{\left( {1 - \theta } \right)\left( {y - x} \right)}}\left( {1 - \theta } \right)\left( {y - x} \right)=\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0θ1lim(1θ)(yx)f(θx+(1θ)x+(1θ)(yx))f(θx+(1θ)x)(1θ)(yx)=f(x)T(yx)0.
(2)充分性:对任意的x,y∈domfx,y\in domfx,ydomf,以及θ∈[0,1]\theta \in \left[0,1\right]θ[0,1],假设f(y)⩽f(x)f\left(y\right)\leqslant f\left(x\right)f(y)f(x),且∇f(x)T(y−x)⩽0\nabla f{\left(x\right)^T}\left(y-x\right)\leqslant0f(x)T(yx)0。我们将证明:f(θx+(1−θ)y)−max{f(x),f(y)}⩽0(8)f\left(\theta x+\left(1-\theta\right)y\right)-max\left\{f\left(x\right),f\left(y\right)\right\}\leqslant0 \tag8f(θx+(1θ)y)max{f(x),f(y)}0(8)如果(8)成立,则表示该函数是拟凸函数(注意前面拟凸函数的基本性质)。
首先我们证明θ=0或θ=1\theta=0或\theta=1θ=0θ=1的情况,当θ=0\theta=0θ=0时,f(θx+(1−θ)y)=f(y)f\left(\theta x+\left(1-\theta\right)y\right)=f\left(y\right)f(θx+(1θ)y)=f(y),(8)式显然成立;当θ=1\theta=1θ=1时,f(θx+(1−θ)y)=f(x)f\left(\theta x+\left(1-\theta\right)y\right)=f\left(x\right)f(θx+(1θ)y)=f(x),(8)式同样成立;
接下来我们证明θ∈(0,1)\theta \in \left(0,1\right)θ(0,1)的情况,我们假设x≠yx\ne yx=y(若x=yx=yx=y,(8)式是显然成立的),我们令z=θx+(1−θ)yz=\theta x+\left(1-\theta\right)yz=θx+(1θ)y,则我们要证明的(8)式变成f(z)⩽f(x)f\left(z\right) \leqslant f\left(x\right)f(z)f(x),我们用反证法来证明:
假设f(z)>f(x)f\left(z\right) > f\left(x\right)f(z)>f(x)(此时f(z)>f(y)f\left(z\right) > f\left(y\right)f(z)>f(y)),根据前面的命题假设,我们有∇f(z)T(z−x)⩽0\nabla f{\left(z\right)^T}\left(z-x\right)\leqslant0f(z)T(zx)0 ∇f(z)T(z−y)⩽0\nabla f{\left(z\right)^T}\left(z-y\right)\leqslant0f(z)T(zy)0z=θx+(1−θ)yz=\theta x+\left(1-\theta\right)yz=θx+(1θ)y代入上面两个式子中得:(1−θ)∇f(z)T(y−x)⩽0(9)\left(1-\theta\right)\nabla f{\left(z\right)^T}\left(y-x\right)\leqslant0 \tag9(1θ)f(z)T(yx)0(9) θ∇f(z)T(x−y)⩽0(10)\theta\nabla f{\left(z\right)^T}\left(x-y\right)\leqslant0 \tag{10}θf(z)T(xy)0(10)由于θ∈(0,1)\theta \in \left(0,1\right)θ(0,1),故由(9)、(10)式可得∇f(z)=0\nabla f\left(z\right)=0f(z)=0
我们知道z∈(x,y)z\in \left(x,y\right)z(x,y),f(z)>f(x)f\left(z\right)>f\left(x\right)f(z)>f(x),由于该函数是连续的,那么我们肯定可以找到一点z1∈(z,x)z_1 \in \left(z,x\right)z1(z,x)使得f(z1)>f(x)f\left(z_1\right)>f\left(x\right)f(z1)>f(x),然后再次利用假设中的条件得到类似(9)、(10)式的结果,即∇f(z1)=0\nabla f\left(z_1\right)=0f(z1)=0,一直重复上述步骤,我们将最终得到在(z,x)\left(z,x\right)(z,x)之间的点的一阶导数都为0,这说明f(z)=f(x)f\left(z\right)=f\left(x\right)f(z)=f(x),所以假设f(z)>f(x)f\left(z\right) > f\left(x\right)f(z)>f(x)不成立,则(8)式满足,所以命题得证。
————————————————————————————————
总结:拟凸函数一阶条件证明的关键在于构造出∇f(x)T\nabla f{\left(x\right)^T}f(x)T,而这点我们可以根据导数的基本定义出发去构造。

评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值