MIT 线性代数(25—27)读书笔记

本文讲解了线性代数中的关键概念,包括正交性、投影、行列式、特征值与特征向量等内容,并介绍了对称矩阵、正定矩阵、复数矩阵、傅里叶变换及其快速计算。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

第二十五讲:复习二

1.第14到24讲总结


  • 我们学习了正交性(正交向量和正交补),有矩阵Q=[q1 q2  qn],若其列向量相互正交,则该矩阵满足QTQ=I
  • 进一步研究投影(求解Ax=b和最小二乘法),我们了解了Gram-Schmidt正交化法,核心思想是求法向量,即从原向量中减去投影向量E=bP,P=Ax=AATbATA

  • 接着学习了行列式,根据行列式的前三条性质,我们拓展出了性质4-10。

  • 我们继续推导出了一个利用代数余子式求行列式的公式。

  • 又利用代数余子式推导出了一个求逆矩阵的公式(克拉默法则)、逆矩阵的求法和矩阵的几何意义。

  • 接下来我们学习了特征值与特征向量的意义:Ax=λx,进而了解了通过det(AλI)=0求特征值、特征向量的方法。
  • 有了特征值与特征向量,我们掌握了通过公式AS=ΛS对角化矩阵,同时掌握了求矩阵的幂Ak=SΛkS1
  • 最后是对角化、特征值和特征向量和正交化的应用,应用在:矩阵的幂、微分方程和eAt、马尔可夫矩阵和傅立叶级数。

注:微分方程不在本讲的范围内。下面通过往年例题复习上面的知识。

2. 例子


1. 1)求a=212的投影矩阵P;
2)求P矩阵的特征值和特征向量;
3) 有差分方程uk+1=Puk, u0=990,求解uk.


解: (15、21、22、23讲)
1)求a=212的投影矩阵P(A(bp)AT(bAx^)=0得到x^=(ATA)1ATb,求得p=Ax^=A(ATA)1ATb=Pb最终得到P)P=A(ATA)1AT=aaaTaTa=19424212424

2)求P矩阵的特征值:观察矩阵易知矩阵奇异,且为秩一矩阵,则其零空间为2维,所以由Px=0x得出矩阵的两个特征向量为λ1=λ2=0;而从矩阵的迹得知trace(P)=1=λ1+λ2+λ3=0+0+1,则第三个特征向量为λ3=1

λ3=1的特征向量:由Px=x我们知道经其意义为,x过矩阵P变换后不变,又有P是向量a的投影矩阵,所以任何向量经过P变换都会落在a的列空间中,则只有已经在a的列空间中的向量经过P的变换后保持不变,即其特征向量为x=a=212,也就是Pa=a(15)01

3)有差分方程uk+1=Puk, u0=990,求解uk
首先观察u1=Pu0,式子相当于将u0投影在了a的列空间中,计算得u1=aaTu0aTa=3a=636(这里的3相当于做投影时的系数x^),其意义为u1a上且距离u0最近。再来看看u2=Pu1,这个式子将u1再次投影到a的列空间中,但是此时的u1已经在该列空间中了,再次投影仍不变,所以有uk=Pku0=Pu0=636

总结:
上面的解法利用了投影矩阵的特殊性质,如果在一般情况下,我们需要使用AS=SΛA=SΛS1uk+1=Auk=Ak+1u0,u0=Scuk+1=SΛk+1S1Sc=SΛk+1c,最终得到公式Aku0=c1λk1x1+c2λk2x2++cnλknxn。题中P的特殊性在于它的两个“零特征值”及一个“一特征值”使得式子变为Aku0=c3x3,所以得到了上面结构特殊的解。


2.将点(1,4), (2,5), (3,8)拟合到一条过零点的直线上。


解: (15、16讲)
设直线为y=Dt,写成矩阵形式为123D=458,即AD=b,很明显D不存在。利用公式ATAD^=ATb得到14D=38, D^=3814,即最佳直线为y=3814t。这个近似的意义是将b投影在了A的列空间中。


3.a1=123 a2=111的正交向量


解: (17讲)
找到平面A=[a1,a2]的正交基,使用Gram-Schmidt法,以a1为基准,正交化a2,也就是将a2中平行于a1的分量去除,即a2xa1=a2aT1a2aT1a1a1=111614123


4.4×4矩阵A
1)其特征值为λ1,λ2,λ3,λ4,则矩阵可逆的条件是什么;
2)trace(A+I)的迹是什么。


解: (21、22讲)
1)矩阵可逆,则零空间中只有零向量,即Ax=0x没有非零解,则零不是矩阵的特征值。
detA1是什么:detA1=1detA,而detA=λ1λ2λ3λ4,所以有detA1=1λ1λ2λ3λ4

2)trace(A+I)的迹是什么:我们知道trace(A)=a11+a22+a33+a44=λ1+λ2+λ3+λ4,所以有trace(A+I)=a11+1+a22+1+a33+1+a44+1=λ1+λ2+λ3+λ4+4


5.有矩阵A4=1100111001110011
1)求Dn=?Dn1+?Dn2
2)判断递归式是否收敛。


解:
1)求递归式的系数,使用代数余子式将矩阵安第一行展开得detA4=11101110111100111011=111011101111111=detA3detA2。则可以看出有规律Dn=Dn1Dn2,D1=1,D2=0
使用我们在差分方程中的知识构建方程组{DnDn1=Dn1Dn2=Dn1,用矩阵表达有[DnDn1]=[1110][Dn1Dn2]。计算系数矩阵Ac的特征值,1λ11λ=λ2λ+1=0,解得λ1=1+3i2,λ2=13i2,特征值为一对共轭复数。

2)要判断递归式是否收敛,需要计算特征值的模,即实部平方与虚部平方之和14+34=1。它们是位于单位圆eiθ上的点,即cosθ+isinθ,从本例中可以计算出θ=60,也就是可以将特征值写作λ1=eiπ/3,λ2=eiπ/3。注意,从复平面单位圆上可以看出,这些特征值的六次方将等于一:e2πi=e2πi=1。继续深入观察这一特性对矩阵的影响,λ61=λ6=1,则对系数矩阵有A6c=I。则系数矩阵Ac服从周期变化,既不发散也不收敛。


6.有这样一类矩阵A4=0100102002030030,求投影到A3列空间的投影矩阵


解:
A3=010102020,按照通常的方法求P=A(ATA)1AT即可,但是这样很麻烦。我们可以考察这个矩阵是否可逆,因为如果可逆的话,R4空间中的任何向量都会位于A4的列空间,其投影不变,则投影矩阵为单位矩阵I。所以按行展开求行列式detA4=1133=9,所以矩阵可逆,则P=I
A3的特征值及特征向量:|A3λI|=λ101λ202λ=λ3+5λ=0,解得λ1=0,λ2=5,λ3=5

我们可以猜测这一类矩阵的规律:奇数阶奇异,偶数阶可逆。


第二十六讲:对称矩阵及正定性

前面我们学习了矩阵的特征值与特征向量,也了解了一些特殊的矩阵及其特征值、特征向量,特殊矩阵的特殊性应该会反映在其特征值、特征向量中。如马尔科夫矩阵,有一特征值为1,本讲介绍(实)对称矩阵(AT=A)。()


1.对称矩阵

1.1对称矩阵的性质


先提前介绍两个对称矩阵的特性:

  • 特征值为实数;(对比第二十一讲介绍的旋转矩阵,其特征值为纯虚数。)

  • 特征向量相互正交。(如果特征值互不相同,那么每个特征值的特征向量是在单独的一条线上,那些线是垂直正交的;如果特征值重复,那就有一整个平面的特征向量,在那个平面上,我们可以选择垂直的向量),我们可以将这组特征向量转化为标准正交向量。

解释:
1.单位矩阵
单位矩阵是对称矩阵,特征值都为1,每一个向量都是特征向量。

2.在通常(可对角化)情况下,一个矩阵可以化为:A=SΛS1
在矩阵对称的情况下,通过性质2可知,由特征向量组成的矩阵S中的列向量是,此时如果我们把特征向量的长度统一化为1,就可以得到一组。则对于对称矩阵有A=QΛQ1,而对于标准正交矩阵,有Q=QT,所以对称矩阵可以写为

A=QΛQ1=QΛQT(1)

观察(1)式,我们发现这个分解本身就代表着对称,(QΛQT)T=(QT)TΛTQT=QΛQT

注:
(1)式在数学上叫做谱定理(spectral theorem),谱就是指矩阵特征值的集合。(该名称来自光谱,指一些纯事物的集合,就像将特征值分解成为特征值与特征向量。)
(1)式在力学上称之为主轴定理(principle axis theorem),从几何上看,它意味着如果给定某种材料,在合适的轴上来看,它就变成对角化的,方向就不会重复。

1.2性质的证明


现在我们来证明性质1。
1)对于矩阵Ax=λx
2)对于其共轭部分总有A¯x¯=λ¯x¯,根据前提条件我们只讨论实矩阵,则有Ax¯=λ¯x¯,将等式两边取转置有x¯TA=x¯Tλ¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯
3)将“下划线”式两边左乘x¯Tx¯TAx=x¯Tλx,“上划线”式两边右乘xx¯TAx=x¯Tλ¯x,观察发现这两个式子左边是一样的,所以x¯Tλx=x¯Tλ¯x,则有λ=λ¯(这里有个条件,x¯Tx0),证毕。

注:
观察这个前提条件,

x¯Tx=[x¯1x¯2x¯n]x1x2xn=x¯1x1+x¯2x2++x¯nxn
,设x1=a+ib,x¯1=aibx¯1x1=a2+b2,所以有x¯Tx>0。而x¯Tx就是x长度的平方。

1.3性质拓展


拓展这个性质:
1)当A为复矩阵,根据上面的推导,则矩阵必须满足AT=AA=A¯T时,才有性质1、性质2成立(教授称具有这种)。

2)继续研究A=QΛQT=[q1 q2  qn]λ1λ2λnqT1qT1qT1=λ1q1qT1+λ2q2qT2++λnqnqTn,注意这个展开式中的qqTq是单位列向量所以qTq=1,结合我们在第十五讲所学的投影矩阵的知识有qqTqTq=qqT是一个投影矩阵,很容易验证其性质,比如平方它会得到qqTqqT=qqT于是多次投影不变等(验证了投影举证的性质)。

每一个对称矩阵都可以分解为一系列相互正交的投影矩阵。

3)在知道对称矩阵的特征值皆为实数后,我们再来讨论这些实数的符号,因为特征值的正负号会影响微分方程的收敛情况(第二十三讲,需要实部为负的特征值保证收敛)。用消元法取得矩阵的主元,观察主元的符号,主元符号的正负数量与特征向量的正负数量相同。即:

  • 主元符号的正负数量与特征向量的正负数量相同

  • 特征值之积等于主元之积。

2.正定矩阵


如果对称矩阵是“好矩阵”,则正定矩阵(positive definite)是其一个更好的子类。

  • 正定矩阵指特征值均为正数的矩阵(根据上面的性质有矩阵的主元均为正)。

  • 正定矩阵所有子行列式为正。

举个例子,[5223],由行列式消元知其主元为5,115,按一般的方法求特征值有5λ223λ=λ28λ+11=0,λ=4±5
正定矩阵的另一个性质是,所有子行列式为正。对上面的例子有|5|=5,5223=11

我们看到正定矩阵将早期学习的的消元主元、中期学习的的行列式、后期学习的特征值结合在了一起。

3.本章总结


  1. 对称矩阵(AT=A):
    1)性质:特征值为实数,特征向量相互正交(A=QΛQ1=QΛQT)。
    2)当A为复矩阵,根据上面的推导,则矩阵必须满足AT=AA=A¯T时,才有性质1、性质2成立。
    3)主元符号的正负数量与特征向量的正负数量相同;特征值之积等于主元之积。

  2. 正定矩阵

    • 如果一个实对称矩阵的特征值都是正数,那么它是正定矩阵。

    • 正定矩阵的主元也都是正数。

    • 正定矩阵的所有子行列式都是正数。

    • 正定矩阵将方阵特征值,主元,行列式融为一体。


第二十七讲:复数矩阵和快速傅里叶变换

本讲主要介绍复数向量、复数矩阵的相关知识(包括如何做复数向量的点积运算、什么是复数对称矩阵等),以及傅里叶矩阵(最重要的复数矩阵)和快速傅里叶变换。

一个重要的复矩阵的例子就是傅里叶矩阵。还将介绍傅里叶变换,简称FFT,在计算机里常用,特别是当涉及到大数据的时候,因为它可以很快的进行傅里叶变换,即是说做乘法时,怎样才能快速用这个n 阶方阵做乘法,通常,n 阶方阵的乘法要算n2 次,因为有n2 个非零元素,这是个全矩阵,且这个矩阵的列向量正交,而快速傅里叶变换将原先要进行的n2 次计算缩减到nlogn,这只是简单的矩阵分解,但改变是巨大的。

1.复数矩阵运算

1.1.计算复向量的模与内积


先介绍复数向量,我们不妨换一个字母符号来表示:z=z1z2zn,向量的每一个分量都是复数。此时z不再属于Rn实向量空间,它现在处于Cn复向量空间。

对比实向量,我们计算模只需要计算|v|=vTv即可,而如果对复向量使用zTz则有zTz=[z1z2zn]z1z2zn=z21+z22++z2n,这里zi是复数,平方后虚部为负,求模时本应相加的运算变成了减法。(如向量[1i],右乘其转置后结果为0,但此向量的长度显然不是零。)
根据上一讲我们知道,应使用|z|=z¯Tz,即[z¯1z¯2z¯n]z1z2zn,即使用向量共轭的转置乘以原向量即可。(如向量[1i],右乘其共轭转置后结果为[1i][1i]=2。)

我们把共轭转置z¯T乘以原向量记为zHzH读作埃尔米特(人名为Hermite,形容词为Hermitian)

有了复向量模的计算公式,同理可得,对于复向量,内积不再是实向量的yTx形式,复向量内积应为yHx

1.2. 复数对称矩阵


对于实矩阵,AT=A即可表达矩阵的对称性。而对于复矩阵,我们同样需要求一次共轭A¯T=A。举个例子[23i3+i5]是一个复数情况下的对称矩阵。这叫做埃尔米特矩阵,有性质AH=A

1.3. 正交性


在第十七讲中,我们这样定义标准正交向量:qTiqj={0ij1i=j。现在,对于复向量我们需要求共轭:q¯Tiqj=qHiqj={0ij1i=j
第十七讲中的标准正交矩阵:Q=[q1 q2  qn]QTQ=I。现在对于复矩阵则有QHQ=I
就像人们给共轭转置起了个“埃尔米特”这个名字一样:

正交性(orthogonal)在复数情况下也有了新名字,酉(unitary),unitarymatrix与正交矩阵类似,满足:

QHQ=I

而前面提到的傅里叶矩阵就是一个酉矩阵

1.4.傅里叶矩阵


n阶傅里叶矩阵Fn=11111ww2wn11w2w4w2(n1)1wn1w2(n1)w(n1)2,对于每一个元素有(Fn)ij=wiji,j=0,1,2,,n1。矩阵中的w是一个非常特殊的值,满足wn=1,其公式为w=ei2π/n。易知w在复平面的单位圆上,w=cos2πn+isin2πn
在傅里叶矩阵中,当我们计算w的幂时,w在单位圆上的角度翻倍。比如在6阶情形下,w=e2π/6,即位于单位圆上60角处,其平方位于单位圆上120角处,而w6位于1处。从开方的角度看,它们是16个六次方根,而一次的w称为原根。
我们现在来看4阶傅里叶矩阵,先计算ww=i, w2=1, w3=i, w4=1F4=11111ii2i31i2i4i61i3i6i9=11111i1i11111i1i
矩阵的四个列向量正交,我们验证一下第二列和第四列,c2¯Tc4=10+10=0,正交。不过我们应该注意到,F4的列向量并不是标准的,我们可以给矩阵乘上系数12(除以列向量的长度)得到标准正交矩阵F4=1211111i1i11111i1i。此时有FH4F4=I,于是该矩阵的逆矩阵也就是其共轭转置FH4

四阶傅里叶变换作用于四维向量 :

  • 傅里叶变换:向量左乘矩阵F4(四点傅里叶变换);
  • 傅里叶逆变换:向量左乘矩阵F14(四点傅里叶逆变换)。

一个很好的性质:

2. 快速傅里叶变换(Fast Fourier transform/FFT)


对于傅里叶矩阵,F6, F3F8, F4F64, F32之间有着特殊的关系。
举例,有傅里叶矩阵F64,一般情况下,用一个列向量右乘F64需要约642次计算,显然这个计算量是比较大的。我们想要减少计算量,于是想要分解F64,联系到F32,有[F64]=[IIDD][F3200F32]101010010101
我们分开来看等式右侧的这三个矩阵(分别是第一个矩阵、第二个矩阵和第三个矩阵):
1)第一个矩阵由单位矩阵I和对角矩阵D=1ww2w31组成,我们称这个矩阵为修正矩阵,显然其计算量来自D矩阵,对角矩阵的计算量约为32即这个修正矩阵的计算量约为32,单位矩阵的计算量忽略不计。

2)第二个矩阵是两个F32与零矩阵组成的,计算量约为2×322

3)第三个矩阵通常记为P矩阵,这是一个置换矩阵,其作用是讲前一个矩阵中的奇数列提到偶数列之前,[x0 x1 ][x0 x2  x1 x3 ],这个置换矩阵的计算量也可以忽略不计。(这里教授似乎在黑板上写错了矩阵,可以参考FFT、How the FFT is computed做进一步讨论。)

所以我们把642复杂度的计算化简为2×322+32复杂度的计算,我们可以进一步化简F32得到与F16有关的式子[I32I32D32D32]I16I16D16D16I16I16D16D16F16F16F16F16[P16P16][ P32 ]。而322的计算量进一步分解为2×162+16的计算量,如此递归下去我们最终得到含有一阶傅里叶矩阵的式子。
来看化简后计算量,2(2(2(2(2(2(1)2+1)+2)+4)+8)+16)+32,约为6×32=log264×642,算法复杂度为n2log2n
于是原来需要n2的运算现在只需要n2log2n就可以实现了。不妨看看n=10的情况,不使用FFT时需要n2=1024×1024次运算,使用FFT时只需要n2log2n=5×1024次运算,运算量大约是原来的1200

nn2n2log2n

3. 本章总结


  1. 酉矩阵和埃尔米特

    • 把共轭转置z¯T乘以原向量记为zHzH读作埃尔米特(人名为Hermite,形容词为Hermitian)

    • unitarymatrix

      QHQ=I

    • 傅里叶矩阵就是一个酉矩阵(傅里叶变换与逆变换)。

  2. 快速傅里叶变换

    nn2n2log2n

下一讲将继续介绍特征值、特征向量及正定矩阵。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值