一些数学公式证明

1. 最小二乘问题的几种证法

1.1

考虑最小二乘问题: min(\left \| AX-b \right \|),AX表示在A线性空间中的一组线性组合而成的一个向量,使其到b向量距离最短,由于最小二乘是超定方程,所以b向量维度比AX维度高的,什么时候取到最短,当且仅当(b-AX)\perp A时,如图所示:

b-AX垂直于A的向量空间,则有:A^T(b-AX)=A^Tb-A^TAX=0

得证:X=(A^TA)^{-1}A^Tb 

1.2 

\left \| AX-b \right \|^2=(AX-b)^T(AX-b)=X^TA^TAX-X^TA^Tb-b^TAX+b^Tb

取到极值时,倒数为0

再根据矩阵求导法则 (X^TA)^{'}=(A^TX)^{'}=A:

2A^TAX-2A^Tb=0,得证

2. 为什么海森矩阵半正定不能确定最小值

因为f(x+\delta x)\approx f(x) + f^{'}(x)x+\frac{1}{2}f^{''}(x)x,由于在极值处f^{'}(x)值为0,因此,f(x)是否时极值取决于f^{''}(x)的符号,当f^{''}(x)也为0时,就要取决于更高次的导数了,因此半正定无法确定最小值。反之,如果f^{''}(x)为正定矩阵,则f(x)肯定在x处取得最小值

3. 样本方差为什么是

s^2=\frac{n-1}{n}\sigma^2

证明:

E(s^2)=E(\frac{1}{n}\sum (x_i-\bar{x})^2)=E(\frac{1}{n}\sum [(x_i-u)-(\bar{x}-u)]^2)

=E(\frac{1}{n}\sum [(x_i-u)^2-2(x_i-u)(\bar{x}-u)+(\bar{x}-u)^2])=E(\frac{1}{n}[n\sigma^2-n(\bar{x}-u)^2])

又因为

\bar{x}=\frac{1}{n}(x_0-u)+\frac{1}{n}(x_1-u)+...+\frac{1}{n}(x_i-u)

所以,根据泰勒公式及协方差传播定律有:

E(\bar{x}-u)^2=D(\bar{x})=\frac{1}{n^2}\sigma^2+\frac{1}{n^2}\sigma^2+...+\frac{1}{n^2}\sigma^2=\frac{1}{n}\sigma^2

带入上式得:

E(s^2)=\frac{n-1}{n}\sigma^2

4. 李代数伴随矩阵证明

To expand on the existing answer: for me the tricky part was actually going from eq. 23 to eq. 24. There's probably an easier way to see it, but here's how I did it.

Recall that for a vector uu, the matrix u×u× is defined as the linear transformation

u×::v↦u×v.u×::v↦u×v.

So the identity R⋅ω×⋅R−1=(Rω)×R⋅ω×⋅R−1=(Rω)× can be intuitively interpreted as "[unrotating, then crossing with ωω, then rotating] is the same as [crossing with a rotated ωω]". We can prove this identity by letting the RHS of the identity act upon an arbitrary vector vv:

(Rω)×v=(Rω)×v=(Rω)×(RR−1v)=R[ω×(R−1v)]=Rω×R−1v,(Rω)×v=(Rω)×v=(Rω)×(RR−1v)=R[ω×(R−1v)]=Rω×R−1v,

where we have used the fact that for any rotation matrix UU and vectors a,ba,b we have

(Ua)×(Ub)=U(a×b)

5. 两种最小二乘公式的等价性证明

解释为什么 -(J^TJ)^{-1}J^Te 和 -J^T(JJ^T)^{-1}e 等价

要证明

-(J^TJ)^{-1}J^Te=-J^T(JJ^T)^{-1}e

我们需要利用矩阵的性质和伪逆的概念。以下将详细解释这一等式成立的原因。


1. 矩阵伪逆的性质

对于任意矩阵 J,其Moore-Penrose伪逆(记为 J^\dagger)可以根据矩阵的形状和秩来定义:

  • 当 J 是满列秩的矩阵(列向量线性无关,矩阵为高而窄,即行数大于等于列数,且满秩),则:

    J^\dagger =(J^TJ)^{-1}J^T

  • 当 J 是满行秩的矩阵(行向量线性无关,矩阵为扁而宽,即列数大于等于行数,且满秩),则:

    J^\dagger =J^T(JJ^T)^{-1}

在这种情况下,这两种形式的伪逆可以用来解释所给等式的等价性。


2. 利用SVD分解证明

假设矩阵 J 的奇异值分解(SVD)为:

J=U\Sigma V^T

其中:

  • U 是 m×m 的正交矩阵;
  • Σ 是 m×n 的对角矩阵,包含 J 的奇异值;
  • V 是 n×n 的正交矩阵。

基于SVD分解,我们可以计算:

(1) 计算 (J^TJ)^{-1}J^T

首先,计算J^TJ

J^TJ=(U\Sigma V^T)^T(U\Sigma V^T)=V\Sigma ^TU^TU\Sigma V^T=V\Sigma ^T\Sigma V^T

由于U^TU=I,其中 I为单位矩阵。

因此,

(J^TJ)^{-1}=V(\Sigma ^T \Sigma)^{-1}V^T

所以:

(J^TJ)^{-1}J^T=V(\Sigma^T\Sigma)^{-1}\Sigma ^TU^T

(2) 同理

J^T(JJ^T)^{-1}=V\Sigma^T(\Sigma\Sigma ^T)^{-1}U^T

(3) 比较两个结果:

我们发现:

(J^TJ)^{-1}J^T=V(\Sigma^T\Sigma)^{-1}\Sigma ^TU^T

J^T(JJ^T)^{-1}=V\Sigma^T(\Sigma\Sigma ^T)^{-1}U^T

注意到 \Sigma^T \Sigma\Sigma \Sigma^T都是对角矩阵,其逆矩阵也都是对角矩阵,有

(\Sigma^T\Sigma)^{-1}\Sigma^T=\Sigma^T(\Sigma \Sigma^T)^{-1}

因此,我们可以得出:

-(J^TJ)^{-1}J^T=J^T-(JJ^T)^{-1}

6. 证明:

RS^{\wedge }R^T=(RS)^{\wedge}

证明:

RS^{\wedge }R^Tv=R(S\times(R^Tv))=(RS)\times*(RR^Tv)=(RS)\times{v}=(RS)^{\wedge}v

于是:

RS^{\wedge }R^T=(RS)^{\wedge}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

神气爱哥

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值