为什么 A T A + λ I , λ > 0 A^{T}A+\lambda I,\quad \lambda>0 ATA+λI,λ>0 一定是正定矩阵(positive definite)
标题的问题来自 最优化 问题中对高斯牛顿法改进的 列文伯格-马克夸特法(LM)的增量方程。
本文默认读者对“二次型”及“二次型对应的矩阵”和“正定二次型”以及“正定矩阵”有了解。如果对上述概念了解不多,没关系,请看 二次型PPT,武汉大学数学与统计学院。
下面给出 “正定矩阵” 的一种定义。
定义:设有二次型
f
=
x
T
A
x
,
f=\bold{x}^{T}A\bold{x},
f=xTAx,
如果对任何
x
≠
0
⃗
\bold{x} \neq \vec{0}
x=0, 都有
f
(
x
)
>
0
f(\bold{x})>0
f(x)>0(显然
f
(
0
⃗
)
=
0
f(\vec{0})=0
f(0)=0),则称
f
f
f 为正定二次型 ,并且称矩阵
A
A
A 是正定的。
证明:
记
B
=
A
T
A
+
λ
I
,
λ
>
0
B = A^{T}A+\lambda I,\quad \lambda>0
B=ATA+λI,λ>0
其中
A
A
A 是
m
×
n
m\times n
m×n 的任意矩阵,
I
I
I 是
n
×
n
n\times n
n×n 的单位矩阵。
取
x
T
B
x
\bold{x}^{T}B\bold{x}
xTBx
将
B
=
A
T
A
+
λ
,
I
λ
>
0
B = A^{T}A+\lambda ,I\quad \lambda>0
B=ATA+λ,Iλ>0 代入,得
x
T
(
A
T
A
+
λ
I
)
x
(1)
\bold{x}^{T}(A^{T}A+\lambda I)\bold{x} \tag{1}
xT(ATA+λI)x(1)
根据矩阵乘法对加法的分配律,
(
1
)
(1)
(1) 等于
(
x
T
A
T
A
+
λ
x
T
I
)
x
(\bold x^{T}A^{T}A+\lambda \bold x^{T}I)\bold x
(xTATA+λxTI)x
进一步,
x
T
A
T
A
x
+
λ
x
T
x
\bold x^{T}A^{T}A\bold x+\lambda \bold x^{T}\bold x
xTATAx+λxTx
由于
x
T
A
T
A
x
=
(
A
x
)
T
A
x
≥
0
\bold x^{T}A^{T}A\bold x = (A\bold x)^{T}A\bold x \ge 0
xTATAx=(Ax)TAx≥0
λ
x
T
x
\lambda \bold x^{T}\bold x
λxTx 当
x
=
0
⃗
\bold x = \vec{0}
x=0 时为 0,其他情况都大于0。
故
x
T
B
x
>
0
,
\bold{x}^{T}B\bold{x}>0 ,
xTBx>0, 当
x
≠
0
⃗
\bold x \ne \vec{0}
x=0
而且显然
B
B
B 是对称矩阵。
所以
B
B
B 是正定矩阵。
1万+

被折叠的 条评论
为什么被折叠?



