在学习资料满天飞的大环境下,知识变得非常零散,体系化的知识并不多,这就导致很多人每天都努力学习到感动自己,最终却收效甚微,甚至放弃学习。我的使命就是过滤掉大量的无效信息,将知识体系化,以短平快的方式直达问题本质,把大家从大海捞针的痛苦中解脱出来。
1 原因
二次规划目标函数为凸函数的充分必要条件是,目标函数的Hessian矩阵是半正定的。具体来说,对于二次规划目标函数:
f ( x ) = 1 2 x T P x + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r f(x)=21xTPx+qTx+r
其中,P是一个对称矩阵。
充分条件:如果P是一个半正定矩阵,则目标函数f(x)是凸函数。
必要条件:如果目标函数f(x)是凸函数,则P是一个半正定矩阵。
需要注意的是,这里的凸函数指的是二次规划目标函数在定义域上的凸性。
2 证明
二次规划的目标函数可以表示为:
f ( x ) = 1 2 x T P x + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r f(x)=21xTPx+qTx+r
其中, P P P 是一个 n × n n \times n n×n 的半正定矩阵, q q q 和 r r r 是 n n n 维列向量。
我们需要证明,当 P P P 是半正定矩阵时, f ( x ) f(x) f(x) 是一个凸函数,即对于任意的 x 1 x_1 x1 和 x 2 x_2 x2,以及 0 ≤ λ ≤ 1 0 \leq \lambda \leq 1 0≤λ≤1,都有:
f ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ f ( x 1 ) + ( 1 − λ ) f ( x 2 ) f(\lambda x_1 + (1-\lambda) x_2) \leq \lambda f(x_1) + (1 - \lambda) f(x_2) f(λx1+(1−λ)x2)≤λf(x1)+(1−λ)f(x2)
我们可以先考虑函数 g ( x ) = 1 2 x T P x g(x) = \frac{1}{2} x^T P x g(x)=21xTPx 是否是凸函数。对于任意的 x 1 x_1 x1 和 x 2 x_2 x2,以及 0 ≤ λ ≤ 1 0 \leq \lambda \leq 1 0≤λ≤1,都有:
g ( λ x 1 + ( 1 − λ ) x 2 ) = 1 2 ( λ x 1 + ( 1 − λ ) x 2 ) T P ( λ x 1 + ( 1 − λ ) x 2 ) g(\lambda x_1 + (1-\lambda) x_2) = \frac{1}{2} (\lambda x_1 + (1-\lambda) x_2)^T P (\lambda x_1 + (1-\lambda) x_2) g(λx1+(1−λ)x2)=21(λx1+(1−λ)x2)TP(λx1+(1−λ)x2)
= 1 2 λ 2 x 1 T P x 1 + λ ( 1 − λ ) x 1 T P x 2 + 1 2 ( 1 − λ ) 2 x 2 T P x 2 = \frac{1}{2} \lambda^2 x_1^T P x_1 + \lambda (1-\lambda) x_1^T P x_2 + \frac{1}{2} (1-\lambda)^2 x_2^T P x_2 =21λ2x1TPx1+λ(1−λ)x1TPx2+21(1−λ)2x2TPx2
我们需要证明:
g ( λ x 1 + ( 1 − λ ) x 2 ) ≤ λ g ( x 1 ) + ( 1 − λ ) g ( x 2 ) g(\lambda x_1 + (1-\lambda) x_2) \leq \lambda g(x_1) + (1-\lambda) g(x_2) g(λx1+(1−λ)x2)≤λg(x1)+(1−λ)g(x2)
即:
1 2 λ 2 x 1 T P x 1 + λ ( 1 − λ ) x 1 T P x 2 + 1 2 ( 1 − λ ) 2 x 2 T P x 2 ≤ λ ( 1 2 x 1 T P x 1 ) + ( 1 − λ ) ( 1 2 x 2 T P x 2 ) \frac{1}{2} \lambda^2 x_1^T P x_1 + \lambda (1-\lambda) x_1^T P x_2 + \frac{1}{2} (1-\lambda)^2 x_2^T P x_2 \leq \lambda \left(\frac{1}{2} x_1^T P x_1\right) + (1-\lambda) \left(\frac{1}{2} x_2^T P x_2\right) 21λ2x1TPx1+λ(1−λ)x1TPx2+21(1−λ)2x2TPx2≤λ(21x1TPx1)+(1−λ)(21x2TPx2)
将两边乘以 2 2 2,得到:
λ 2 x 1 T P x 1 + 2 λ ( 1 − λ ) x 1 T P x 2 + ( 1 − λ ) 2 x 2 T P x 2 ≤ λ x 1 T P x 1 + ( 1 − λ ) x 2 T P x 2 \lambda^2 x_1^T P x_1 + 2 \lambda (1-\lambda) x_1^T P x_2 + (1-\lambda)^2 x_2^T P x_2 \leq \lambda x_1^T P x_1 + (1-\lambda) x_2^T P x_2 λ2x1TPx1+2λ(1−λ)x1TPx2+(1−λ)2x2TPx2≤λx1TPx1+(1−λ)x2TPx2
化简得:
( λ x 1 − ( 1 − λ ) x 2 ) T P ( λ x 1 − ( 1 − λ ) x 2 ) ≥ 0 (\lambda x_1 - (1-\lambda) x_2)^T P (\lambda x_1 - (1-\lambda) x_2) \geq 0 (λx1−(1−λ)x2)TP(λx1−(1−λ)x2)≥0
由于 P P P 是半正定矩阵,因此上式成立,即 g ( x ) g(x) g(x) 是凸函数。
接下来,我们可以将 f ( x ) f(x) f(x) 表示为 g ( x ) + q T x + r g(x) + q^T x + r g(x)+qTx+r 的形式,即:
f ( x ) = 1 2 x T P x + q T x + r = g ( x ) + q T x + r f(x) = \frac{1}{2} x^T P x + q^T x + r = g(x) + q^T x + r f(x)=21xTPx+qTx+r=g(x)+qTx+r
由于 g ( x ) g(x) g(x) 是凸函数,而 q T x q^T x qTx 和 r r r 都是线性函数,因此 f ( x ) f(x) f(x) 也是凸函数。因此,当 P P P 是半正定矩阵时,二次规划的目标函数是凸函数。
恭喜你又坚持看完了一篇博客,又进步了一点点!如果感觉还不错就点个赞再走吧,你的点赞和关注将是我持续输出的哒哒哒动力~~