该博文是总结一下线性代数中一些比较重要的概念的直观理解,方便对线性代数有个直观理解。
大部分观点源于
文章目录
向量
- 物理角度:空间中的箭头,箭头的长度和方向决定向量。
- 计算机角度:一个数字列表。
- 数学角度:保证两个向量相加和向量数乘有意义即可。(加法和数乘贯穿线性代数始终,即加法和数乘表达了线性)
向量运算
- 向量加法:对应项相加。(旋转且伸缩)
- 向量数乘:向量伸缩。(不旋转,只伸缩)
(在几何角度只有旋转和伸缩两个运动)
矩阵
- 矩阵实际上是一种线性变换,变换本质上是一种函数,输入输出都是向量。
- 在几何角度中,向量可以看做坐标,矩阵变换是对基做线性变换,而坐标不变。
- 矩阵的列表示基向量变换后的位置。
线性变换的性质
- 原点固定。
- 保持网格线平行且等距分布。
(实际上只有加法和数乘两种运算)
非方阵
- 非方阵:不同维数空间的转化。
- 例子:
3
×
2
3\times2
3×2的满秩矩阵是将二维空间映射为三维空间,即相当于三维空间中的一个面。(2个列表示有2个基向量,3阶表示基向量在变换后用三维坐标描述)。
2 × 3 2\times3 2×3的满秩矩阵是将三维空间映射为二维空间。
行列式
- 线性变换:将空间向外拉伸或向内挤压(对于基向量形成的空间为初始空间来说)。
- 行列式:测量变换对空间拉伸或挤压的比例。行列式的绝对值就是空间的大小。
- 行列式符号:可能出现负值,线性变换将该空间翻转了。
- 行列式为0,表示线性变换降维。
零空间和列空间
- 零空间:变换后落在原点的向量集合,被称为零空间或核。
- 列空间:矩阵的列向量张成的空间。(线性变换的结果集合)
线性方程组
A X = b AX = b AX=b
- 线性方程组:本质上是未知数组成的向量经过线性变换变成了b向量。
点积(内积)
a ∙ b = c a\bullet b=c a∙b=c
- 点积:运算上a向量和b向量对应元素相乘在相加,
即结果为一个数
。一般将运算过程理解为b乘以a在b向量上的投影的结果。 - 可知点积与 a T b = c a^T b = c aTb=c形式结果一致, a T a^T aT是1Xn的矩阵,即将n维空间到1为空间的线性变换,b是n维空间的坐标,则点积就变成了将b从n维空间线性变换到1维空间的结果。
叉积
v × w = q v\times w = q v×w=q
- 对于两个二维向量的叉积:结果的绝对值是两个向量张成的平行四边形的面积。 如 果 v 在 w 的 右 侧 , 结 果 为 正 , v 在 w 的 左 侧 , 结 果 为 负 如果 v 在 w 的右侧,结果为正,v 在 w 的左侧,结果为负 如果v在w的右侧,结果为正,v在w的左侧,结果为负。(可以使用行列式来求解,每一列均是一个向量)
- 对于两个三维向量的叉积:结果是一个方向垂直于(右手法则确定)两个向量张成的平面,且大小等于两个向量张成的平行四边形的面积的向量q。
对于q, q T x q^T x qTx(x为三维空间中任意一个向量)表示 v , w , x v,w,x v,w,x三个向量组成的平行四面体的体积(包含正负)。
可以使用行列式求解,第一列是基向量,其余列是两个向量。
基变换
B X = E C BX = EC BX=EC(B是基向量矩阵,X是在该基下的坐标,E是另一组基向量矩阵,C是该基下的坐标)
- 基变换:在一组基向量下的线性变换对应在另一组基向量下的线性变换(矩阵)。
-
A
−
1
M
A
A^{-1}MA
A−1MA(A表示将B的基转换为E的基的线性变换)表示先转换为E的基,在该基下进行M的线性变换,然后再转换为B的基,得到的结果是在B的基下进行相应的线性变换。
同一个线性变换在不同的基下是相似的,相似矩阵其实表示的是同一个线性变换(不同的基)
。
特征向量与特征值
A X = λ X AX=λX AX=λX
- 特征向量:对特征向量进行A的线性变换,特征向量并没有旋转,而是发生了伸缩。
- 特征值:特征向量线性变换后的伸缩比例。
特征值出现复数,不存在特征向量,一定是发生了某种旋转(比如旋转90度)。
从上面的理解可以知道一个特征值可以有多个特征向量,而一个特征向量只能对应一个特征值。
正定和半正定
对 于 非 零 向 量 x , 均 有 x T A x > 0 , 则 A 是 正 定 矩 阵 , 有 x T A x > = 0 , 则 A 是 半 正 定 矩 阵 对于非零向量x,均有x^TAx>0,则A是正定矩阵,有x^TAx>=0,则A是半正定矩阵 对于非零向量x,均有xTAx>0,则A是正定矩阵,有xTAx>=0,则A是半正定矩阵。
- 正定矩阵:令Y = Ax,则Y是x通过A的线性变换得到。设 θ \theta θ为Y和x的向量夹角, c o s θ = x T A / ( ∣ x ∣ ∣ A ∣ ) cos\theta = x^TA/(|x||A|) cosθ=xTA/(∣x∣∣A∣)。可以知道当 x T A > 0 x^TA>0 xTA>0时,0度< θ \theta θ<90度,即将任意一个非零向量x经过A的线性变换后旋转的角度小于90度,则A为正定矩阵。
- 半正定矩阵:理解类似正定矩阵,只不过包含90度。
一些特殊的矩阵与线性变换之间的关系
正交矩阵与正交变换
A
T
A
=
I
A^TA = I
ATA=I
旋转矩阵一定是正交矩阵,正交矩阵包含旋转和镜面反射(有人说是线性变换之后保持两点之间的距离不变的矩阵)。
当|A|为1时,正交矩阵只包含旋转。
当|A|为-1时,正交矩阵包含旋转和镜面反射。
- 正交矩阵:各列均为单位向量且两两正交,即标准正交基。
- 正交变换:由于不改变向量的模和向量间的夹角(旋转和镜面反射)。
一些性质的几何理解
A是正交矩阵,所以 A T A = I A^TA = I ATA=I。
- 易知 A T = A − 1 A^T = A^{-1} AT=A−1。
- 由于A是旋转矩阵, A T A = I A^TA = I ATA=I表示先将基向量按A旋转后,在进行 A T A^T AT的线性变换,可知 A T A^T AT是反向旋转,所以 A T 和 A − 1 A^T和A^{-1} AT和A−1均是正交矩阵, A n A^n An表示一直按A旋转,当然也是正交矩阵。