考虑的问题是带约束的( 意思是 subject to 受制于)优化问题:
准确的说,约束的是是自变量 ,
后的意思就是:这个自变量(比如是向量
)
在 的情况下,
;
在 的情况下,
;
就是 都要满足,所以可行域定义为:
拉格朗日函数与对偶问题
拉格朗日函数的基本思想是给该问题中的每一个约束指定一个拉格朗日乘子,以乘子为加权系数将约束增加到目标函数中。
拉格朗日函数:
对拉格朗日函数 中的
取下确界可定义拉格朗日对偶函数,这一函数将在对偶理论中起到很关键的作用。
拉格朗日对偶函数(定理:对偶函数都为凹函数):
通俗的讲,拉格朗日对偶函数就是,调节 的值,使得
最小。
拉格朗日对偶函数与原问题的关系:
弱对偶性原理:
看上面一行,我们已知一个关系:,可以推断出:
满足就是弱对偶性。
强对偶性原理:
我们用图来举例说明:
图解:图上方的黑色曲线为 ,下方的黑色弧线为在
的情况下,
,然后这些彩色的点点组成的曲线,表示在不同
下的
。
1. 根据上面的公式, 肯定是大于零的,而且也提到了,我们可以看到在
的情况下,
,所以推出,原式
的最优解:
公式详解:首先区域一定是在两条竖着的虚线中间,等式左边我们要求的 就是求极小值时
的值,也就是最优解,等式右侧的
表示调节参数
使得函数
改变,就是图中那些彩色的点点组成的连续函数,最大明显就还是最上面的实线,也就还是
,再取
,就是这条线上的最小值对应的
,最小值时 我们看到:
,对应:
2. 根据上面的公式,我们希望求其对偶函数的最优解,对偶函数公式为( 为下确界):
其对偶最优为:
公式详解:首先区域一定是在两条竖着的虚线中间,我们先了解一下其中的 ,也就是对偶函数
为两条竖着的虚线中间那些彩色的点点组成的不同
下的一个个函数,先找出这些函数每个函数取最小值的时候,对应的
值,这样每一个函数上都有一个
,组成了一个集合,然后通过
操作,再找刚才这些点集合的最大点,我们发现,最后得出的点对应的:
,对应:
我们发现,上面的 原式最优解 = 对偶最优解,也就是
。当这种情况时,就是强对偶性(strong duality)
强对偶是一个非常好的性质,因为在强对偶成立的情况下,可以通过求解对偶问题来得到原始问题的解。
举例
1.线性规划问题的对偶
如下线性规划问题:
可以看到两个约束条件:
对于等式约束 ,我们引入拉格朗日乘子
;
对于非负约束 ,我们引入拉格朗日乘子
,并且
构造如下拉格朗日函数(原函数拉格朗日函数):
根据原函数拉格朗日函数引出其对偶函数:
可以看到拉格朗日对偶函数的约束条件只有一个 (就相当于
对
求偏导
,所以有:
),因此原函数(线性规划问题)的对偶问题可以写成:
我们再来看看刚才推出的原函数拉格朗日函数:
上式可由原函数(线性规划问题)的对偶问题直接导出。
这个可能表达的不是很明确,我们先看下一个实例。
2.最小二范数问题
这是一个具有强凸性的问题,我们先写下其拉格朗日函数:
根据这个函数 写出对偶函数,我们在前面已经学习到
,所以我们为了求对偶函数
,我们对
对
求偏导:
所以:
可以看出 是一个凹函数。
在前面已经学习到: ,所以,我们相当于再对上面求出来的
对
求偏导数
,得到:
所以:
由于 :
最小值就算是求出来了。