凸优化简介21

本文深入探讨了凸优化中的近似方法,包括近似操作、近似梯度方法及其加速策略。详细介绍了近似梯度的更新规则、线搜索策略以及Douglas-Rachford Splitting算法在非光滑、光滑+非光滑和非光滑+非光滑最小化问题中的应用。此外,还讨论了固定点属性和反射操作在优化过程中的作用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

近似方法

1. 近似操作

凸函数 h h h的近似操作也称为近似映射(proximal mapping)定义为 p r o x h ( x ) = arg min ⁡ u ( h ( u ) + 1 2 ∥ u − x ∥ 2 2 ) prox_h(x)=\argmin\limits_{u}\left(h(u)+\frac{1}{2}\|u-x\|^2_2\right) proxh(x)=uargmin(h(u)+21ux22)

下面是一些函数的例子:
1. 对于 h ( x ) = 0 h(x)=0 h(x)=0,其 p r o x h ( x ) = x prox_h(x)=x proxh(x)=x;
2. 对于指示函数( X → { 0 , 1 } X\rightarrow\{0,1\} X{ 0,1} h ( x ) h(x) h(x),在凸集 X X X上,有 p r o x h ( x ) = arg min ⁡ u ∈ X ∥ u − x ∥ 2 2 = π X ( x ) prox_h(x)=\argmin_{u\in X}\|u-x\|^2_2=\pi_X(x) proxh(x)=uXargminux22=πX(x);
3. 对于 h ( x ) = ∥ x ∥ 1 h(x)=\|x\|_1 h(x)=x1 p r o x h ( x ) i = { x i − 1 , x i ≥ 1 0 , ∥ x i ∥ x i + 1 , x i ≤ − 1 prox_h(x)_i=\left\{\begin{aligned}&x_i-1,& x_i\geq 1\\ &0, & \|x_i\|\\&x_i+1, &x_i\leq -1\end{aligned}\right. proxh(x)i=xi1,0,xi+1,xi1xixi1 该近似映射函数被称为soft-threshold
在这里插入图片描述

2. 近似梯度方法

将无约束的优化问题分成两个部分, m i n { f ( x ) ≜ g ( x ) + h ( x ) } min\left\{f(x)\triangleq g(x)+h(x)\right\} min{ f(x)g(x)+h(x)}。其中 g g g是凸的且可微,且 d o m   g = R n dom\ g=\mathbb{R}^n dom g=Rn h h h是凸的,且代价较小(inexpensive)的近似操作。
近似梯度方法为 x k + 1 = p r o x t k h ( x k − t k ∇ g ( x k ) ) x_{k+1}=prox_{t_kh}(x_k-t_k\nabla g(x_k)) xk+1=proxtkh(xktkg(xk))。其中 t k > 0 t_k>0 tk>0是步长。
使用近似操作的定义对近似梯度方法进行转换得到 x k + 1 = p r o x t h ( x k − t ∇ g ( x k ) ) = arg min ⁡ u ( h ( u ) + 1 2 t ∥ u − x k + t ∇ g ( x k ) ∥ 2 2 ) = arg min ⁡ u ( h ( u ) + g ( x k ) + ∇ g ( x k ) T ( u − x k ) + 1 2 t ∥ u − x k ∥ 2 2 ) x_{k+1}=prox_{th}(x_k-t\nabla g(x_k))\\=\argmin\limits_{u}\left(h(u)+\frac{1}{2t}\|u-x_k+t\nabla g(x_k)\|^2_2\right)\\=\argmin\limits_{u}\left(h(u)+g(x_k)+\nabla g(x_k)^T(u-x_k)+\frac{1}{2t}\|u-x_k\|^2_2\right) xk+1=proxth(xktg(xk))=uargmin(h(u)+2t1uxk+tg(xk)22)=uargmin(h(u)+g(xk)+g(xk)T(uxk)+2t1uxk22)
使用前面的例子中的函数举例:
1. 对于 h ( x ) = 0 h(x)=0 h(x)=0,因为 p r o x h ( x ) = x prox_{h}(x)=x proxh(x)=x,所以近似梯度为 x k + 1 = x k − t ∇ g ( x ) x_{k+1}=x_{k}-t\nabla g(x) xk+1=xktg(x)
2. 对于 h ( x ) = I X ( x ) h(x)=I_X(x) h(x)=IX(x),有 x k + 1 = π X ( x k − t ∇ g ( x k ) ) x_{k+1}=\pi_X(x_k-t \nabla g(x_k)) xk+1=πX(xktg(xk))
3. 对于 h ( x ) = ∥ x ∥ 1 h(x)=\|x\|_1 h(x)=x1 x k + 1 = p r o x t h ( x − t ∇ g ( x ) ) x_{k+1}=prox_{th}(x-t\nabla g(x)) xk+1=proxth(xtg(x))。其中 p r o x t h ( u ) i = { u i − t , u i ≥ t 0 , ∣ u i ∣ ≤ t u i + t , x i ≤ − t prox_{th}(u)_i=\left\{\begin{aligned}&u_i-t, & u_i \geq t\\ & 0, & |u_i|\leq t\\ &u_i+t, &x_i\leq -t\end{aligned}\right. proxth(u)i=uit,0,ui+t,uituitxit

性质: 如果函数 h h h是凸且闭的,那么 p r o x h ( x ) = arg min ⁡ u ( h ( u ) + 1 2 ∥ u − x ∥ 2 2 ) prox_h(x)=\argmin\limits_{u}\left(h(u)+\frac{1}{2}\|u-x\|^2_2\right) proxh(x)=uargmin(h(u)+21ux22)存在且对所有的 x x x唯一

该性质可以由 h ( u ) + 1 2 ∥ u − x ∥ 2 2 h(u)+\frac{1}{2}\|u-x\|^2_2 h(u)+21ux22强凸得到。

性质: u = p r o x h ( x ) u=prox_h(x) u=proxh(x)与下面的等同:
1. x − u ∈ ∂ h ( u ) x-u\in \partial h(u) xuh(u);
2. 对于所有的 x x x h ( z ) ≥ h ( u ) + ( x − u ) T ( z − u ) h(z)\geq h(u)+(x-u)^T(z-u) h(z)h(u)+(xu)T(zu)

证明:因为 0 ∈ ∂ { h ( u ) + 1 2 ∥ u − x ∥ 2 2 } 0\in \partial \{h(u)+\frac{1}{2}\|u-x\|^2_2\} 0{ h(u)+21ux22},所以 0 ∈ ∂ h ( u ) + u − x 0\in \partial h(u)+u-x 0h(u)+ux。此外,对于 g ∈ ∂ h ( u ) g\in \partial h(u) gh(u),有 h ( z ) ≥ h ( u ) + g ( z − u ) h(z)\geq h(u)+g(z-u) h(z)h(u)+g(zu)

性质:在指示函数 I X I_X IX上的近似映射是在 X X X上的欧几里得投影。
p r o x I X ( x ) = arg min ⁡ u ∈ X ∥ u − x ∥ 2 2 = π X ( x ) prox_{I_X}(x)=\argmin\limits_{u\in X}\|u-x\|^2_2=\pi_{X}(x) proxIX(x)=uXargminux22=πX(x),并且 ( x − u ) T ( z − u ) ≤ 0 , ∀ z ∈ X (x-u)^T(z-u)\leq 0, \forall z\in X (xu)T(zu)0,zX

证明:首先,对于所有的 z z z h ( z ) ≥ h ( u ) + ( x − u ) T ( z − u ) h(z)\geq h(u)+(x-u)^T(z-u) h(z)h(u)+(xu)T(zu),通过指示函数的定义有 h ( z ) = h ( u ) = 0 h(z)=h(u)=0 h(z)=h(u)=0

性质(固定点):设函数 f f f是凸的,有点 x ∗ x_* x最小化 f ( x ) f(x) f(x)当且仅当 x ∗ = p r o x f ( x ∗ ) x_*=prox_f(x_*) x=proxf(x)

证明:首先,如果 x ∗ x_* x能够最小化 f ( x ) f(x) f(x),那么我们有 f ( x ) ≥ f ( x ∗ ) f(x)\geq f(x_*) f(x)f(x)。因此, f ( x ) + 1 2 ∥ x − x ∗ ∥ 2 2 ≥ f ( x ∗ ) + 1 2 ∥ x ∗ − x ∗ ∥ 2 2 f(x)+\frac{1}{2}\|x-x_*\|_2^2\geq f(x_*)+\frac{1}{2}\|x_*-x_*\|^2_2 f(x)+21xx22f(x)+21xx

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值