二次规划——Hessian矩阵为什么要求是半正定矩阵

文章探讨了二次规划目标函数为凸函数的条件,强调了Hessian矩阵的半正定性。通过证明g(x)=0.5x^TPx的凸性,得出当P为半正定矩阵时,二次规划函数f(x)=g(x)+q^Tx+r也是凸的结论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在学习资料满天飞的大环境下,知识变得非常零散,体系化的知识并不多,这就导致很多人每天都努力学习到感动自己,最终却收效甚微,甚至放弃学习。我的使命就是过滤掉大量的无效信息,将知识体系化,以短平快的方式直达问题本质,把大家从大海捞针的痛苦中解脱出来。

文章目录

1 原因

二次规划目标函数为凸函数的充分必要条件是,目标函数的Hessian矩阵是半正定的。具体来说,对于二次规划目标函数:

f ( x ) = 1 2 x T P x + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r f(x)=21xTPx+qTx+r

其中,P是一个对称矩阵。

充分条件:如果P是一个半正定矩阵,则目标函数f(x)是凸函数。

必要条件:如果目标函数f(x)是凸函数,则P是一个半正定矩阵。

需要注意的是,这里的凸函数指的是二次规划目标函数在定义域上的凸性。


2 证明

二次规划的目标函数可以表示为:

f ( x ) = 1 2 x T P x + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r f(x)=21xTPx+qTx+r

其中, P P P 是一个 n × n n \times n n×n 的半正定矩阵, q q q r r r n n n 维列向量。

我们需要证明,当 P P P 是半正定矩阵时, f ( x ) f(x) f(x) 是一个凸函数,即对于任意的 x 1 x_1 x1 x 2 x_2 x2,以及 0 ≤ λ ≤ 1 0 \leq \lambda \leq 1 0λ1,都有:

f ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ f ( x 1 ) + ( 1 − λ ) f ( x 2 ) f(\lambda x_1 + (1-\lambda) x_2) \leq \lambda f(x_1) + (1 - \lambda) f(x_2) f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2)

我们可以先考虑函数 g ( x ) = 1 2 x T P x g(x) = \frac{1}{2} x^T P x g(x)=21xTPx 是否是凸函数。对于任意的 x 1 x_1 x1 x 2 x_2 x2,以及 0 ≤ λ ≤ 1 0 \leq \lambda \leq 1 0λ1,都有:

g ( λ x 1 + ( 1 − λ ) x 2 ) = 1 2 ( λ x 1 + ( 1 − λ ) x 2 ) T P ( λ x 1 + ( 1 − λ ) x 2 ) g(\lambda x_1 + (1-\lambda) x_2) = \frac{1}{2} (\lambda x_1 + (1-\lambda) x_2)^T P (\lambda x_1 + (1-\lambda) x_2) g(λx1+(1λ)x2)=21(λx1+(1λ)x2)TP(λx1+(1λ)x2)

= 1 2 λ 2 x 1 T P x 1 + λ ( 1 − λ ) x 1 T P x 2 + 1 2 ( 1 − λ ) 2 x 2 T P x 2 = \frac{1}{2} \lambda^2 x_1^T P x_1 + \lambda (1-\lambda) x_1^T P x_2 + \frac{1}{2} (1-\lambda)^2 x_2^T P x_2 =21λ2x1TPx1+λ(1λ)x1TPx2+21(1λ)2x2TPx2

我们需要证明:

g ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ g ( x 1 ) + ( 1 − λ ) g ( x 2 ) g(\lambda x_1 + (1-\lambda) x_2) \leq \lambda g(x_1) + (1-\lambda) g(x_2) g(λx1+(1λ)x2)λg(x1)+(1λ)g(x2)

即:

1 2 λ 2 x 1 T P x 1 + λ ( 1 − λ ) x 1 T P x 2 + 1 2 ( 1 − λ ) 2 x 2 T P x 2 ≤ λ ( 1 2 x 1 T P x 1 ) + ( 1 − λ ) ( 1 2 x 2 T P x 2 ) \frac{1}{2} \lambda^2 x_1^T P x_1 + \lambda (1-\lambda) x_1^T P x_2 + \frac{1}{2} (1-\lambda)^2 x_2^T P x_2 \leq \lambda \left(\frac{1}{2} x_1^T P x_1\right) + (1-\lambda) \left(\frac{1}{2} x_2^T P x_2\right) 21λ2x1TPx1+λ(1λ)x1TPx2+21(1λ)2x2TPx2λ(21x1TPx1)+(1λ)(21x2TPx2)

将两边乘以 2 2 2,得到:

λ 2 x 1 T P x 1 + 2 λ ( 1 − λ ) x 1 T P x 2 + ( 1 − λ ) 2 x 2 T P x 2 ≤ λ x 1 T P x 1 + ( 1 − λ ) x 2 T P x 2 \lambda^2 x_1^T P x_1 + 2 \lambda (1-\lambda) x_1^T P x_2 + (1-\lambda)^2 x_2^T P x_2 \leq \lambda x_1^T P x_1 + (1-\lambda) x_2^T P x_2 λ2x1TPx1+2λ(1λ)x1TPx2+(1λ)2x2TPx2λx1TPx1+(1λ)x2TPx2

化简得:

( λ x 1 − ( 1 − λ ) x 2 ) T P ( λ x 1 − ( 1 − λ ) x 2 ) ≥ 0 (\lambda x_1 - (1-\lambda) x_2)^T P (\lambda x_1 - (1-\lambda) x_2) \geq 0 (λx1(1λ)x2)TP(λx1(1λ)x2)0

由于 P P P 是半正定矩阵,因此上式成立,即 g ( x ) g(x) g(x) 是凸函数。

接下来,我们可以将 f ( x ) f(x) f(x) 表示为 g ( x ) + q T x + r g(x) + q^T x + r g(x)+qTx+r 的形式,即:

f ( x ) = 1 2 x T P x + q T x + r = g ( x ) + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r = g(x) + q^T x + r f(x)=21xTPx+qTx+r=g(x)+qTx+r

由于 g ( x ) g(x) g(x) 是凸函数,而 q T x q^T x qTx r r r 都是线性函数,因此 f ( x ) f(x) f(x) 也是凸函数。因此,当 P P P 是半正定矩阵时,二次规划的目标函数是凸函数。


恭喜你又坚持看完了一篇博客,又进步了一点点!如果感觉还不错就点个赞再走吧,你的点赞和关注将是我持续输出的哒哒哒动力~~

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

穿越临界点

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值