(二)拉格朗日乘子法——KKT条件

假设目标函数是求解 f(x,y)=x2+y2 f ( x , y ) = x 2 + y 2 的最小问题。
(1)假设约束条件是 h(x,y)=x+y1 h ( x , y ) = x + y ⩽ 1 ,即

minf(x,y)=x2+y2s.th(x,y)=x+y1 { m i n f ( x , y ) = x 2 + y 2 s . t h ( x , y ) = x + y ⩽ 1

这个不等式约束实际上包含了原点,而原点是最小的值,所以这个约束条件等价于没有约束条件的求解,其求解过程是一样的
这里写图片描述
(2)假设约束条件是 h(x,y)=x+y2 h ( x , y ) = x + y ⩽ − 2 ,即
minf(x,y)=x2+y2s.th(x,y)=x+y2 { m i n f ( x , y ) = x 2 + y 2 s . t h ( x , y ) = x + y ⩽ − 2

这个情况下,与约束条件是 g(x,y)=x+y=2 g ( x , y ) = x + y = − 2 进行约束的求解过程是一样的
这里写图片描述
即求解
f+μh=0s.th(x,y)=x+y+2=0 { ▽ f + μ ▽ h = 0 s . t h ( x , y ) = x + y + 2 = 0

(3)新增的条件
不等式实际上带来了新的条件,因为梯度指向了函数增长的方向如图,所以目标函数的梯度如下图所示,而约束函数的梯度则是相反的方向(可以理解为对 h(x,y) h ( x , y ) 而言,对 x,y x , y 的偏导都需要使得 x,y x , y 变大,所以梯度为 f ▽ f 的相反方向)(因为梯度下降法 w=wαw w = w − α ▽ w 使得 w w 值变小)

这里写图片描述
所以,有

f+μh=0,μ0

其中, μ0 μ ⩾ 0 表示 f,h ▽ f , ▽ h 方向相反.
完整的方程组如下:
f+μh=0h(x,y)=x+y+2=0μ0 { ▽ f + μ ▽ h = 0 h ( x , y ) = x + y + 2 = 0 μ ⩾ 0

综合以上,可以把求极值问题:
minfs.tgi=0,i=1,2,...,nhi0,i=1,2,...,m { m i n f s . t g i = 0 , i = 1 , 2 , . . . , n h i ⩽ 0 , i = 1 , 2 , . . . , m

通过解下面这个方程组来得到:
f+niλigi+mjμjhj=0gi=0,i=1,2,...,nhi0,j=1,2,...,mμj0μjhj=0 { ▽ f + ∑ i n λ i ▽ g i + ∑ j m μ j ▽ h j = 0 g i = 0 , i = 1 , 2 , . . . , n h i ⩽ 0 , j = 1 , 2 , . . . , m μ j ⩾ 0 μ j h j = 0

这个方程组也就是所谓的 KKT条件

参考非线性优化中的 KKT 条件该如何理解?

拉格朗日乘子法是一种用于寻找多元函数在其变量受到一个或多个条件限制时的局部极值的方法。这种方法引入了新的未知数——称为拉格朗日乘子,来构建一个新的无约束的目标函数,即所谓的拉格朗日函数。 对于对偶问题,在数学规划中指的是从原问题出发构造出另一个优化问题的过程。通常情况下,给定一个最小化问题(原问题),其对应的对偶问题是最大化某个下界;反之亦然。这种关系可以通过拉格朗日对偶性建立起来。 ### 拉格朗日乘子法的应用 - **等式约束下的最优化** 当存在等式约束g(x) = c时,为了找到f(x)在这些约束下的极值点,可以构造拉格朗日函数$L(x,\lambda)=f(x)-\sum \lambda_i(g_i(x)-c_i)$,其中$\lambda_i$就是拉格朗日乘子。 - **不等式约束下的最优化** 如果还有不等式约束$h_j(x)\leq b_j$,那么就需要考虑广义形式的拉格朗日函数以及KKT(Karush-Kuhn-Tucker)条件来进行分析。 ### 对偶原理的理解 当处理含有复杂约束的问题时,直接解决可能比较困难。此时通过对原始问题应用拉格朗日乘子法得到拉格朗日对偶函数$d(\lambda, \mu) = inf_x[L(x, \lambda, \mu)]$,进而形成对偶问题$max_{\lambda>=0} d(\lambda, \mu)$。这样做的好处是可以简化计算或者提供更好的数值稳定性。 此外,在某些特定条件下(比如强对偶成立的情况下),原问题和它的对偶问题有着相同的最优解价值,这意味着我们既可以从原问题也可以从更简单的对偶问题入手解决问题。 ### 应用领域 - **经济学**: 分析生产者行为、消费者选择等问题; - **工程设计**: 寻找满足性能指标的设计方案; - **机器学习**: 支持向量机(SVMs),特征选择和其他正则化的模型训练过程都涉及到这类优化技巧。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值