最优化:建模、算法与理论(最优性理论2

本文介绍了约束优化中的投影问题(仿射空间),包括拉格朗日函数和KKT条件的应用。随后讨论了线性规划问题及其KKT条件,以及最大割问题的半定规划松弛。最后提到一种非凸分解模型,但具体内容未详述。

5.7 约束优化最优性理论应用实例

5.7.1 仿射空间的投影问题

考虑优化问题
min⁡x∈Rn12∣∣x−y∣∣22,s.t.Ax=b\min_{x{\in}R^n}\frac{1}{2}||x-y||_2^2,\\ s.t.{\quad}Ax=bxRnmin21∣∣xy22,s.t.Ax=b
其中A∈Rm×n,b∈Rm,y∈RnA{\in}R^{m \times n},b{\in}R^m,y{\in}R^nARm×n,bRm,yRn为给定的矩阵和向量,这里不妨设矩阵A是行满秩的,这个问题可以看成仿射平面{x∈Rn∣Ax=b}\{x{\in}R^n|Ax=b\}{xRnAx=b}的投影问题
对于等式约束,我们引入拉格朗日乘子λ∈Rm\lambda{\in}R^mλRm,构造拉格朗日函数
L(x,λ)=12∣∣x−y∣∣2+λT(Ax−b)L(x,\lambda)=\frac{1}{2}||x-y||^2+\lambda^T(Ax-b)L(x,λ)=21∣∣xy2+λT(Axb)
因为只有仿射约束,估SlaterSlaterSlater条件满足,x∗x^*x为一个全局最优解,当且仅当存在λ∗∈Rm\lambda^*{\in}R^mλRm使得
{x∗−y+ATλ=0Ax∗=b \left\{ \begin{matrix} x^*-y+A^T\lambda=0\\ Ax^*=b \\ \end{matrix} \right. {xy+ATλ=0Ax=b
由上述KKT条件第一式,等号左右两边同时左乘AAA可得
Ax∗−Ay+AATλ=0Ax^*-Ay+AA^T\lambda=0AxAy+AATλ=0
注意到Ax∗=bAx^*=bAx=b以及AATAA^TAAT是可逆矩阵,因此可以解出乘子
λ=(AAT)−1(Ay−b)\lambda=(AA^T)^{-1}(Ay-b)λ=(AAT)1(Ayb)
代入回去可以得到
x∗=y−AT(AAT)−1(Ay−b)x^*=y-A^T(AA^T)^{-1}(Ay-b)x=yAT(AAT)1(Ayb)

5.7.2 线性规划问题

考虑线性规划问题
min⁡x∈RncTx,s.t.Ax=b,x≥0(5.7.1)\min_{x{\in}R^n}{\quad}c^Tx,\\ s.t.{\quad}Ax=b,\\ x{\ge}0\tag{5.7.1}xRnmincTx,s.t.Ax=b,x0(5.7.1)
其中A∈Rm×n,b∈Rm,c∈RnA{\in}R^{m \times n},b{\in}R^m,c{\in}R^nARm×n,bRm,cRn分别为给定的矩阵和向量
拉格朗日函数可以写为
L(x,s,v)=cTx+vT(Ax−b)−sTx=−bTv+(ATv−s+c)Tx,s≥0L(x,s,v)=c^Tx+v^T(Ax-b)-s^Tx\\ =-b^Tv+(A^Tv-s+c)^Tx,s{\ge}0L(x,s,v)=cTx+vT(Axb)sTx=bTv+(ATvs+c)Tx,s0
其中s∈Rn,v∈Rms{\in}R^n,v{\in}R^msRn,vRm,由于线性规划是凸问题且满足SlaterSlaterSlater条件的,因此对于任意一个全局最优解x∗x^*x,我们有如下KKT条件
{c+ATv∗−s∗=0,Ax∗=bx∗≥0s∗≥0s∗x∗=0(5.7.2) \left\{ \begin{matrix} c+A^Tv^*-s^*=0,\\ Ax^*=b \\ x^*{\ge}0\\ s^*{\ge}0\\ s^*x^*=0 \end{matrix} \right.\tag{5.7.2} c+ATvs=0,Ax=bx0s0sx=0(5.7.2)
我们设原始问题和对偶问题最优解函数值分别为p∗p^*pd∗d^*d,则根据p∗p^*p取值情况,有如下三种可能
(1)如果−∞<p∗<+∞(有界)-\infty<p^*<+\infty(有界)<p<+(有界),那么原始问题可行而且存在最优解,由SlaterSlaterSlater条件知强对偶原理成立,因此有d∗=p∗d^*=p^*d=p,即对偶问题也是可行的且存在最优解
(2)如果p∗=−∞p^*=-\inftyp=,那么原始问题可行,但目标函数值无下界,由弱对偶原理知d∗≤p∗=−∞d^*{\le}p^*=-\inftydp=,即d∗=−∞d^*=-\inftyd=,因为对偶问题是对目标函数极大化,所以此时对偶问题不可行
(3)如果p∗=+∞p^*=+\inftyp=+,那么原始问题无可行解,注意到SlaterSlaterSlater条件对原始问题不成立,此时对偶问题既可能是函数值无界(d∗=+∞d^*=+\inftyd=+)也可能无可行解(d∗=−∞d^*=-\inftyd=),我们说,不可能出现−∞<d∗<+∞-\infty<d^*<+\infty<d<+的情形,这是因为如果对偶问题可行且存在最优解,那么可对对偶问题应用强对偶原理,进而导出原始问题也存在最优解,这矛盾了
在这里插入图片描述

5.7.3 基追踪

min⁡x∈Rn∣∣x∣∣1,s.t.Ax=b(5.7.3)\min_{x{\in}R^n}||x||_1,\\ s.t.{\quad}Ax=b\tag{5.7.3}xRnmin∣∣x1,s.t.Ax=b(5.7.3)
利用分解xi=xi+−xi−x_i=x_i^+-x_i^-xi=xi+xi,其中xi+=max{xi,0},xi−=max⁡{−xi,0}x_i^+=max\{x_i,0\},x_i^-=\max\{-x_i,0\}xi+=max{xi,0},xi=max{xi,0}分别表示xxx的正部和负部,问题5.7.3的一种等价形式可以写成
min⁡∑ixi++xi−,s.t.Ax+−Ax−=b,x+,x−≥0\min{\sum_i}x_i^++x_i^-,\\ s.t.{\quad}Ax^+-Ax^-=b,\\ x^+,x^-{\ge}0minixi++xi,s.t.Ax+Ax=b,x+,x0
进一步的,令y=[xi+,xi−]T∈R2ny=[x_i^+,x_i^-]^T{\in}R^{2n}y=[xi+,xi]TR2n,我们将问题5.7.3转化为如下线性规划问题
min⁡y∈R2n1Ty,s.t.[A,−A]y=b,y≥0\min_{y{\in}R^{2n}}1^Ty,\\ s.t.{\quad}[A,-A]y=b,\\ y{\ge}0yR2nmin1Ty,s.t.[A,A]y=b,y0
其中1=(1,1,⋯ ,1)T∈R2n1=(1,1,\cdots,1)^T{\in}R^{2n}1=(1,1,,1)TR2n
那么根据一般线性规划的最优性条件,等价于求解
{1+[A,−A]Tv∗−s∗=0,[A,−A]y∗=by∗≥0s∗≥0s∗y∗=0(5.7.4) \left\{ \begin{matrix} 1+[A,-A]^Tv^*-s^*=0,\\ [A,-A]y^*=b \\ y^*{\ge}0\\ s^*{\ge}0\\ s^*y^*=0 \end{matrix} \right.\tag{5.7.4} 1+[A,A]Tvs=0,[A,A]y=by0s0sy=0(5.7.4)
同样的,我们也可以直接推导5.7.3的最优性条件,拉格朗日函数为
L(x,v)=∣∣x∣∣1+vT(Ax−b)L(x,v)=||x||_1+v^T(Ax-b)L(x,v)=∣∣x1+vT(Axb)
x∗x^*x为全局最优解当且仅当存在v∗∈Rmv^*{\in}R^mvRm使得
{0∈∂∣∣x∗∣∣1+ATv∗,Ax∗=b(5.7.5) \left\{ \begin{matrix} 0{\in}\partial||x^*||_1+A^Tv^*,\\ Ax^*=b \\ \end{matrix} \right.\tag{5.7.5} {0∣∣x1+ATv,Ax=b(5.7.5)
最优性条件5.7.4和5.7.5本质上是等价的

5.7.4 最大割问题的半定规划松弛以及非凸分解模型

第三章说明了最大割问题的半定规划松弛问题。如下
max⁡<C,X>,s.t.Xii=1,i=1,2,⋯ ,n,X⪰0(5.7.6)\max{\quad}<C,X>,\\ s.t.{\quad}X_{ii}=1,i=1,2,\cdots,n,\\ X{\succeq}0\tag{5.7.6}max<C,X>,s.t.Xii=1,i=1,2,,n,X0(5.7.6)
该问题是一个凸优化问题,并且Slater约束品性成立,对于等式约束,我们引入拉格朗日乘子μiR,i=1,2,⋯ ,n\mu_{i}R,i=1,2,\cdots,nμiR,i=1,2,,n;对于半正定约束,根据对偶锥,我们引入拉格朗日乘子Λ∈S+n\Lambda{\in}\mathcal{S}_+^nΛS+n,拉格朗日函数为
L(X,μ,Λ)=<C,X>+∑i=1nμi(Xii−1)−Tr(XΛ)L(X,\mu,\Lambda)=<C,X>+\sum_{i=1}^n\mu_i(X_{ii}-1)-Tr(X\Lambda)L(X,μ,Λ)=<C,X>+i=1nμi(Xii1)Tr(XΛ)
根据约束优化问题的最优性条件
{C+Diag(u∗)−Λ∗=0,Xii∗=1X∗≥0Λ∗≥0Tr(X∗Λ∗)=0 \left\{ \begin{matrix} C+Diag(u^*)-\Lambda^*=0,\\ X_{ii}^*=1 \\ X^*{\ge}0\\ \Lambda^*{\ge}0\\ Tr(X^*\Lambda^*)=0 \end{matrix} \right. C+Diag(u)Λ=0,Xii=1X0Λ0Tr(XΛ)=0
这个转化成迹就是因为X和ΛX和\LambdaXΛ的半正定性,上述条件Tr(X∗Λ∗)=0Tr(X^*\Lambda^*)=0Tr(XΛ)=0可以等价地用X∗Λ∗X^*\Lambda^*XΛ代替
下面的非凸分解模型还没看明白。。。以后有机会回来补

### 回答1: 最优化是一种解决各种实际问题的重要工具和方法。它的核心问题是找到一个最优解,使得目标函数取得最大或最小值,同时满足一定的约束条件。在这个过程中,建模算法与理论都是不可或缺的。 建模最优化的第一步。在建模阶段,我们需要将实际问题抽象成数学模型,将其表示为数学表达式和方程。这需要对实际问题有深刻的理解和分析,同时需要考虑到模型的可行性和有效性。只有合理建模,才能得到可靠的最优解。 算法最优化的核心。它决定了如何求解最优解。最优化算法可以分为精确算法和近似算法两大类。精确算法是指在有限时间内,能够找到最优解的算法。然而,精确算法的时间复杂度往往较高,难以处理大规模问题。近似算法则是寻找一个不完美但近似最优解的算法。近似算法的时间复杂度较低,可以处理大规模问题。 理论最优化的支撑。最优化理论研究最优解的存在性、唯一性、解的性质和算法的收敛性等问题。最优化理论算法提供了理论保障,指导算法的设计和分析,同时为实际问题的求解提供了一系列重要的理论工具和方法。 总之,最优化的成功离不开建模算法理论的有机结合。只有建立合理的数学模型,设计有效的算法,同时充分利用最优化理论的结果,才能得到可靠的最优解,为实际问题的求解提供有效的支持和指导。 ### 回答2: 《最优化建模算法与理论》是一本介绍最优化理论算法的教材,主要内容包括线性规划、非线性规划、整数规划、网络流、图论、近似算法、随机化算法等。这些内容与实际问题的建模算法应用有很大的关联。本书涉及到的算法和模型在各个领域都有广泛的应用,例如供应链管理、交通运输规划、金融分析、自然语言处理等。 本书主要涉及建模算法理论三个方面。建模方面,本书从实际问题入手,介绍了如何将实际问题抽象成数学模型,并通过一系列样例和练习,激发了学生对实际问题建模的兴趣。算法方面,本书详细介绍了各种最优化算法的实现原理和计算复杂度,使学生能够充分理解算法的背后机制,更好地分析和设计算法理论方面,本书在算法介绍的同时,也对其理论性能进行了严谨的分析和证明,既可用于查看算法理论性能的速率,也给出了算法的最劣情况,从而更好评估算法预测精度。 总之,如果你正在学习最优化知识,或者是为应用场景寻找最优化方法,那么《最优化建模算法与理论》将会是你的不二之选。在学习过程中,你将获得更清晰的思路,更好的理论框架,以及可供应用的实用算法,让你在实践中取得更好的效果。 ### 回答3: 《最优化建模算法与理论》一书对优化领域进行了深度的探究,是一本涵盖了优化领域所有方面的权威著作。书中涵盖了优化建模、常用算法和优化理论等方面,不仅对于学习最优化的初学者有很大的帮助,对于拥有一定优化知识的人来说也是极其有价值的。 本书首先讲述优化中的建模方法,重点介绍了线性规划、整数规划、非线性规划和二次规划等。每个模型都通过具体的例子进行了详细说明,让读者容易理解并且掌握。 其次,本书详细介绍了很多常用的优化算法,包括梯度下降法、牛顿法、共轭梯度算法等,让读者可以根据需要选择不同的算法进行优化。另外,本书还介绍了很多高级算法,例如单纯性法、内点法、启发式算法等,这些算法适用于更加复杂的优化问题。 最后,针对优化的理论方面,本书详细介绍了强对偶性、KKT条件、弱对偶性和凸优化理论等常用的理论基础。这些理论在解决实际问题时非常有用,并且在理解算法的实现时也非常重要。 总之,本书精心编写,全面详尽,是一本关于最优化领域必备的入门读物。本书既适用于学术界的研究者,也适用于从事优化应用的工程师或数据分析师。建议每一个有志于学习优化的人都应该阅读这本书。
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值