凸优化学习
对偶性是凸优化学习的核心,重中之重。
学习笔记
一、拉格朗日函数与对偶函数
对于一个普通优化问题:
minf0(x)s.t.fi(x)≤0i=1⋯mhi(x)=0i=1⋯p \begin{aligned} \min&& f_0(x)&\\ \text{s.t.}&&f_i(x)&\le0\qquad i=1\cdots m\\ &&h_i(x)&=0\qquad i=1\cdots p\\ \end{aligned}\\ mins.t.f0(x)fi(x)hi(x)≤0i=1⋯m=0i=1⋯p
由此问题定义的拉格朗日函数(lagrangian function\text{lagrangian function}lagrangian function):
l(x,λ,v)=f0(x)+∑i=1mλifi(x)+∑i=1pvihi(x) l(x,\lambda,v)=f_0(x)+\sum_{i=1}^m\lambda_if_i(x)+\sum_{i=1}^pv_ih_i(x) l(x,λ,v)=f0(x)+i=1∑mλifi(x)+i=1∑pvihi(x)
其中λ,v\lambda,vλ,v被称为拉格朗日乘子,分别为与等式相关的拉格朗日乘子和与不等式相关的拉格朗日乘子。
由拉格朗日函数构造的对偶函数(dual function\text{dual function}dual function):
g(λ,v)=infx∈Dl(x,λ,v) g(\lambda,v)=\inf_{x\in D}l(x,\lambda,v) g(λ,v)=x∈Dinfl(x,λ,v)
二、对偶函数的性质
1、对偶函数一定是凹函数
线性函数组合的inf\infinf一定是凹函数。
线性函数组合的sup\supsup一定是凸函数。
2、g(λ,v)≤p∗g(\lambda,v)\le p^*g(λ,v)≤p∗
*证明:*设x∗x^*x∗是原问题最优解,则必是可行解。
则l(x∗,λ,v)=f0(x∗)+∑i=1mλifi(x∗)+0≤p∗ \begin{aligned} l(x^*,\lambda,v)&=f_0(x^*)+\sum_{i=1}^m\lambda_if_i(x^*)+0\\ &\le p^* \end{aligned} l(x∗,λ,v)=f0(x∗)+i=1∑mλif

最低0.47元/天 解锁文章
9730





