对偶理论说明

本文详细探讨了带约束优化问题的拉格朗日函数及其对偶性,包括如何构造拉格朗日函数、对偶函数的定义、强弱对偶性的推导,以及在线性规划和最小二范数问题中的应用实例。理解这对优化问题求解至关重要。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

考虑的问题是带约束的(s.t. 意思是 subject to 受制于)优化问题:

准确的说,约束的是是自变量 \large x ,s.t.后的意思就是:这个自变量(比如是向量 \large x

i\in I 的情况下,c_{i}(x)\leqslant 0

i\in \varepsilon 的情况下,c_{i}(x)=0

就是 x 都要满足,所以可行域定义为:

拉格朗日函数与对偶问题

拉格朗日函数的基本思想是给该问题中的每一个约束指定一个拉格朗日乘子,以乘子为加权系数将约束增加到目标函数中。

拉格朗日函数

对拉格朗日函数 L(x,\lambda ,\upsilon )  中的 x 取下确界可定义拉格朗日对偶函数,这一函数将在对偶理论中起到很关键的作用。

拉格朗日对偶函数(定理:对偶函数都为凹函数):

\large g(\lambda ,\upsilon )=min_{x}L(x,\lambda ,\upsilon )

通俗的讲,拉格朗日对偶函数就是,调节 \lambda ,\upsilon 的值,使得 L(x,\lambda ,\upsilon ) 最小。

拉格朗日对偶函数与原问题的关系:

\large f(x)\geqslant L(x,\lambda ,\upsilon )\geqslant g(\lambda ,\upsilon )

弱对偶性原理:

看上面一行,我们已知一个关系:f(x)\geqslant L(x,\lambda ,\upsilon )\geqslant g(\lambda ,\upsilon ),可以推断出:

\large {\color{Red} f(x^{*})\geqslant g(\lambda ^{*})}

\large {\color{Red} p^{*}\geqslant d^{*}}

满足就是弱对偶性。

强对偶性原理:

我们用图来举例说明:

图解图上方的黑色曲线为 f(x) ,下方的黑色弧线为在 i\in I 的情况下,c_{i}(x)\leqslant 0然后这些彩色的点点组成的曲线,表示在不同  \lambda ,\upsilon 下的  L(x,\lambda ,\upsilon )

1.  根据上面的公式, \lambda _{i} 肯定是大于零的,而且也提到了,我们可以看到在 i\in I 的情况下,c_{i}(x)\leqslant 0 ,所以推出,原式  f(x) 的最优解

{\color{Red} \large min_{x}f(x)=min_{x}(max_{\lambda ,\upsilon }L(x,\lambda ,\upsilon ))=p^{*}}

公式详解:首先区域一定是在两条竖着的虚线中间,等式左边我们要求的 min_{x}f(x) 就是求极小值时 x 的值,也就是最优解,等式右侧的 max_{\lambda ,\upsilon } 表示调节参数 \lambda ,\upsilon 使得函数 L 改变,就是图中那些彩色的点点组成的连续函数,最大明显就还是最上面的实线,也就还是f(x) ,再取 min_{x},就是这条线上的最小值对应的 x,最小值时 我们看到: x=-0.46,对应:p^{*}=1.54

2.  根据上面的公式,我们希望求其对偶函数的最优解,对偶函数公式为(\large inf 为下确界):

\large g(\lambda ,\upsilon )=min_{x}L(x,\lambda ,\upsilon )=infL(x,\lambda ,\upsilon )

对偶最优为:

{\color{Red} max_{\lambda ,\upsilon }g(\lambda ,\upsilon )=max_{\lambda ,\upsilon }(min_{x}L(x,\lambda ,\upsilon ))=max_{\lambda ,\upsilon }(infL(x,\lambda ,\upsilon ))=d^{*}}

公式详解:首先区域一定是在两条竖着的虚线中间,我们先了解一下其中的 min_{x}L(x,\lambda ,\upsilon ),也就是对偶函数  \large g(\lambda ,\upsilon ) 为两条竖着的虚线中间那些彩色的点点组成的不同 \lambda ,\upsilon 下的一个个函数,先找出这些函数每个函数取最小值的时候,对应的 x 值,这样每一个函数上都有一个 x,组成了一个集合,然后通过  max_{\lambda ,\upsilon } 操作,再找刚才这些点集合的最大点,我们发现,最后得出的点对应的:x=-0.46,对应:d^{*}=1.54

\large {\color{Green} \bigstar}  我们发现,上面的   原式最优解 = 对偶最优解,也就是 p^{*}=d^{*} 。当这种情况时,就是强对偶性(strong duality)

强对偶是一个非常好的性质,因为在强对偶成立的情况下,可以通过求解对偶问题来得到原始问题的解。

举例

1.线性规划问题的对偶

如下线性规划问题:

 可以看到两个约束条件:

对于等式约束 \large Ax = b ,我们引入拉格朗日乘子 \large \upsilon

对于非负约束 \large x \geqslant 0,我们引入拉格朗日乘子 \large s ,并且 \large s\geqslant 0

构造如下拉格朗日函数(原函数拉格朗日函数):

\large L(x,s,\upsilon )=c^{T}x-s^{T}x+\upsilon (Ax-b)

\large = (A^{T}\upsilon -s+c)^{T}x-b^{T}\upsilon

 根据原函数拉格朗日函数引出其对偶函数:

\large g(s,\upsilon )=infL(x,s,\upsilon )=\left\{\begin{matrix} -b^{T}\upsilon ,&A^{T}\upsilon -s+c=0 \\ \infty & others\end{matrix}\right.

可以看到拉格朗日对偶函数的约束条件只有一个  A^{T}\upsilon -s+c  (就相当于 \large L\large x 求偏导 \large =0,所以有:A^{T}\upsilon -s+c=0 ),因此原函数(线性规划问题)的对偶问题可以写成:

我们再来看看刚才推出的原函数拉格朗日函数:

\large L(x,s,\upsilon )= (A^{T}\upsilon -s+c)^{T}x-b^{T}\upsilon

上式可由原函数(线性规划问题)的对偶问题直接导出。

这个可能表达的不是很明确,我们先看下一个实例。

2.最小二范数问题

\large min\left \| x \right \|_{2}^{2}

\large s.t.Ax=b

这是一个具有强凸性的问题,我们先写下其拉格朗日函数:

\large L(x,\upsilon )=x^{T}x+\upsilon^{T} (Ax-b)

根据这个函数 \large L 写出对偶函数,我们在前面已经学习到 g(\upsilon )=min_{x}L(x ,\upsilon ) ,所以我们为了求对偶函数 g(\lambda ,\upsilon ) ,我们对 L(x,\upsilon )x 求偏导:

\large = 2x+\upsilon ^{T}A=0

\large x = -\frac{1}{2}\upsilon ^{T}A=x^{*}

所以:

\large g(\upsilon )=L(x^{*},\upsilon )

=\frac{1}{4}A^{T}\upsilon \upsilon ^{T}A-\frac{1}{2}\upsilon ^{T}AA^{T}\upsilon -\upsilon ^{T}b

=-\frac{1}{4}\upsilon ^{T}AA^{T}\upsilon-\upsilon ^{T}b

可以看出 g(\upsilon ) 是一个凹函数。

在前面已经学习到:d^{*}=max_{\upsilon }g(\upsilon )  ,所以,我们相当于再对上面求出来的 g(\upsilon )\upsilon 求偏导数 =0,得到:

\large =-\frac{1}{2}AA^{T}\upsilon -b=0

\large \upsilon =-2(AA^{T})^{-1}b=\upsilon ^{*}

所以:

\large d^{*}=g(\upsilon ^{*})

\large =b^{T}(AA^{T})^{-1}b

由于  \large d^{*}=p^{*}  :

x^{*} = -\frac{1}{2}\upsilon ^{T}A=A^{T}(AA^{T})^{-1}b

\large {\color{Red} p^{*}=d^{*}\geqslant-\frac{1}{4}\upsilon ^{T}AA^{T}\upsilon-\upsilon ^{T}b}

最小值就算是求出来了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值