线性代数之——子空间投影

1. 投影

向量 b=(2,3,4)b = (2, 3, 4)b=(2,3,4)zzz 轴上和在 xyxyxy 平面上的投影是什么,哪个矩阵能产生到一条线上和到一个平面的投影?

bbb 被投影到 zzz 轴上时,它的投影 ppp 就是 bbb 沿着那条线的部分。当 bbb 被投影到一个平面时,它的投影就是 bbb 在平面中的部分。

zzz 轴上的投影 p1=(0,0,4)p_1 = (0, 0, 4)p1=(0,0,4),到 xyxyxy 平面上的投影 p2=(2,3,0)p_2 = (2, 3, 0)p2=(2,3,0),两个投影矩阵 P1P_1P1P2P_2P2 分别为

P1P_1P1 就是选出每个向量的 zzz 分量, P2P_2P2 就是选出每个向量的 xxxyyy 分量。

在这个例子中,zzz 轴和 xyxyxy 平面是正交子空间,就像地面和两面墙的交线一样。

除此之外,它们还是正交补的。整个空间的任意向量都可以表示为它们在两个子空间中分量的和。

2. 到一条线上的投影

假设一条过原点的直线方向为 a=(a1,a2,⋯ ,am)a = (a_1, a_2,\cdots, a_m)a=(a1,a2,,am),我们要将点 b=(b1,b2,⋯ ,bm)b = (b_1, b_2,\cdots, b_m)b=(b1,b2,,bm) 投影到这条直线上。

投影 pppaaa 在一条直线上,因此有 p=x^ap = \hat xap=x^a,误差 e=b−p=b−x^ae = b-p = b-\hat xae=bp=bx^a,然后由 eee 垂直于 aaa,我们可得。

e⋅a=0→(b−x^a)⋅a=0→a⋅b−x^a⋅a=0e \cdot a = 0 \to (b-\hat xa) \cdot a = 0 \to a\cdot b - \hat x a\cdot a = 0ea=0(bx^a)a=0abx^aa=0

因此,可求得系数 x^\hat xx^

x^=a⋅ba⋅a=aTbaTa\hat x = \frac{a\cdot b}{a\cdot a} = \frac{a^Tb}{a^Ta}x^=aaab=aTaaTb

投影为 p=x^a=aTbaTaap = \hat x a = \frac{a^Tb}{a^Ta} ap=x^a=aTaaTba

如果 b=ab=ab=a,那么 x^=1\hat x = 1x^=1,投影还是它自己,Pa=aPa = aPa=a。 如果 b⊥ab\perp aba,那么 x^=0\hat x = 0x^=0,投影为 0。

将投影重写为 p=ax^=aaTbaTa=aaTaTabp = a \hat x =a \frac{a^Tb}{a^Ta} = \frac{aa^T}{a^Ta}bp=ax^=aaTaaTb=aTaaaTb。因此,投影矩阵 P=aaTaTaP = \frac{aa^T}{a^Ta}P=aTaaaT

如果向量 aaa 变为两倍,投影矩阵 PPP 不变,它还是投影到同一条直线。如果投影矩阵平方,那就是进行两次投影,和进行一次投影是一样的结果,因此有 P2=PP^2=PP2=P

同时,I−PI-PIP 也是一个投影矩阵,(I−P)b=b−p=e(I-P)b = b-p = e(IP)b=bp=e。当 PPP 投影到一个子空间时,I−PI-PIP 投影到和它垂直的另一个子空间。

3. 到子空间的投影

假设 nnnRm\boldsymbol R^mRm 空间中的向量 a1,⋯ ,ana_1,\cdots,a_na1,,an 是线性不相关的,我们想找到一个线性组合 p=x^1a1+⋯+x^nanp=\hat x_1 a_1+\cdots+\hat x_n a_np=x^1a1++x^nan 使得 ppp 距离一个给定向量 bbb 最近。

a1,⋯ ,ana_1,\cdots,a_na1,,an 可以看做是矩阵 AAA 的列,我们要找的线性组合是在矩阵 AAA 的列空间中。我们要找的是距离bbb 最近的一个组合 Ax^A\hat xAx^,也就是 bbb 在列空间的投影。

同理,误差 e=b−Ax^e=b-A\hat xe=bAx^ 垂直于子空间,也就是垂直于子空间的所有向量。

也即

AT(b−Ax^)=0→ATAx^=ATbA^T(b-A\hat x) = 0 \to A^TA\hat x = A^TbAT(bAx^)=0ATAx^=ATb

ATAA^TAATA 是一个 n×n 的矩阵,因为 AAA 的列是线性不相关的,所以其是可逆的。可得线性组合系数为

x^=(ATA)−1ATb\hat x = (A^TA)^{-1}A^Tb x^=(ATA)1ATb

所以有,投影和投影矩阵分别为

p=Ax^=A(ATA)−1ATbp = A \hat x = A(A^TA)^{-1}A^Tbp=Ax^=A(ATA)1ATb

P=A(ATA)−1ATP = A(A^TA)^{-1}A^TP=A(ATA)1AT

AT(b−Ax^)=0A^T(b-A\hat x) = 0AT(bAx^)=0 可知,误差 eee 位于 AAA 的左零空间 N(AT)N(A^T)N(AT) 中,向量 bbb 被分为了投影 ppp 和误差 eee 两部分。

ATAA^TAATA 是可逆的当且仅当 AAA 的列是线性不相关的。

Ax=0Ax=0Ax=0 时,我们有 ATAx=0A^TAx=0ATAx=0。而当 ATAx=0A^TAx=0ATAx=0 时,我们有
xTATAx=0→(Ax)TAx=0→Ax=0x^TA^TAx=0 \to (Ax)^TAx = 0 \to Ax = 0xTATAx=0(Ax)TAx=0Ax=0

因此 ATAA^TAATAAAA 有着一样的零空间,当 AAA 的列线性不相关时,ATAA^TAATA 是一个方阵,对称并且可逆。

获取更多精彩,请关注「seniusen」!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值