本篇文章旨在与大家一起学习线性代数中有关本征值与本征向量的概念,并且更深一步地看到潜藏在繁杂计算式下面的物理含义。
本征值与本征向量的数学描述及求解方法
线性变换矩阵在向量空间上的特征向量,通常又称为本征向量(eigenvector),定义为:对于任意非零向量
,下面的式子都成立:
上面是常见于量子力学中的表达式,在线性代数中有更为简单的表达形式:
其中为本征向量,而称
为矩阵
对应于该本征向量
的本征值。本征值是一个数值,可能为实数或者是复数,而本征向量是一个向量,求解本征值和本征向量需要用到本征方程。
上述表达式经过简单移项以后可以变换为:
我们知道任何矩阵与单位矩阵的乘积都等于该矩阵本身,那么这里便利用这一点将本征值构造成了一个与变换矩阵相同维度的矩阵。假设括号里的矩阵是可逆的,那么左乘该逆矩阵后便得到向量为零的结果,这样的结果是没有讨论意义的,所以我们得知,括号中的矩阵不可逆,也就是说括号中矩阵对应的行列式为0.
上面的公式是一个与有关的代数表达式,计算之后可以得到本征值
的取值。假如行列式是个
的矩阵,那么代数式中
的最高幂次为
,也就是说理论上存在
个数值解,但未必是不同的数值。使用行列式求解得到本征值后,代入到前一步式子中,通过求解方程组便可以得到对应不同本征值的本征向量。
矩阵对角化
上面提到求解行列式后理论上存在个数值解,那么当求解的
个数值均不相同时,说明得到的本征向量不相同且相互线性无关,而当且仅当
阶矩阵有
个线性无关的本征向量时,该矩阵可以对角化。
所谓对角化,从数学语言上来说就是存在一个可逆矩阵,使得矩阵
经过运算之后可以变换为由所有本征值构成的对角矩阵:
详细的充分必要性的证明可以参考《线性代数》科学出版社P102~P103.
本征值与本征向量的物理含义
探究数学表达式背后的物理含义往往能够增进我们对一个概念的理解。那么在上面繁杂的计算里面,本征值和本征向量到底代表着什么含义呢?
从字面意思上来看,“本征”其实就是本来的特征,指的就是一个变换矩阵所带来的最本质的改变。
举个简单的例子,在第一幅图中以正交基矢长成的二维空间中有一个正方形,如果将原来的两个向量变换为第二幅图中的情况,那么空间坐标便会发生变化,原来的正方形也会被挤压成菱形,但我们同样可以看到,两标红对角线方向的向量方向不变,只是大小发生了一定程度的缩放,这两个不改变方向的向量即为本征向量,缩放的倍数即为本征值。
任意一个矩阵都可以看做是对向量做一个线性的变换,而这种线性的变换都可以从另一个角度理解为本征向量的本征值倍缩放造成的,就像是齿轮带动传送带运送,空间参数的变化就是外面的传送带,而真正在改变的齿轮其实就是缩放的本征向量。
现在回头去看本征值和本征向量的定义式,一个二维矩阵作用于特征向量等于一个一维的数值与本征向量相乘,也就是说这个二维矩阵的作用令这个过程发生了坍缩,从二维的旋转变换坍缩成了一维的尺寸缩放。说明这个矩阵带来的最根本的变化就是本征向量的缩放。
从之前基矢的角度来看,算符可以写成
的形式,而若是以特征向量作为基矢,那么算符则可以写成以特征值排列而成的对角矩阵,这就是矩阵的对角化,当然上面所说的前提条件仍然需要满足。
上述提及的可逆矩阵为所有线性无关的本征向量构成的矩阵,那么如果将变换矩阵
与其相乘,便有如下的式子:
式子里面的为本征向量所构成的列向量,矩阵运算中是可以将一个矩阵看做是一列一列的向量分别进行乘法运算的,而根据本征值的定义,这个式子有可以演变为如下形式:
同样可以拆分成矩阵相乘的形式
那么我们可以得到两个基矢相互变换的表达式,在一般基矢需要转换到本征基矢时,变换式可以写为:
而在本征基矢需要转换到一般基矢时,变换时可以用相似的表达式呈现。这两个式子是说这个变换矩阵的作用可以看做是将待作用的向量先投影在本征向量的方向上,再对其进行缩放的变换,最后再投影到原来的方向。
参考视频:
【熟肉】线性代数的本质 - 10 - 特征向量与特征值_哔哩哔哩_bilibili
本文写的比较简略和粗糙,如若有误,还望大家批评指正~