所谓
![]()
—矩阵,实际上我们并不陌生,在学习线性变换的特征值与特征向量时,我们引入了线性变换的特征矩阵
![]()
,其中
![]()
是数域
![]()
上的
![]()
维线性空间
![]()
中的线性变换
![]()
在某一组基
![]()
下的矩阵,这个特征矩阵
![]()
就是一个
![]()
—矩阵,接下来我们严格的讨论下究竟什么是
![]()
—矩阵。
在我们学习数字矩阵时,矩阵当中的每一个位置都放置一个数字元素,而如果将数字矩阵当中的数字全部替换成数域
![]()
上的一元多项式环
![]()
中的一元多项式
![]()
,那么对应得到的新的矩阵就称之为
![]()
—矩阵。我们在学习一元多项式的时候,教材上面特别说明了一元多项式
![]()
中的元素
![]()
为一个文字,所谓文字就是说这里的
![]()
有别于函数
![]()
中的变量
![]()
,在具体的需要时,可以将一元多项式
![]()
中的
![]()
替换成方阵
![]()
,或者线性变换
![]()
,但同时相应的一元多项式中的常数项
![]()
也要替换成矩阵
![]()
(
![]()
为单位矩阵)或者映射
![]()
(
![]()
为恒等映射)我个人认为一元多项式中的常数1代表的意思更应该是线性空间中的乘法单位元,之所以直接记成数字1也许是为了使用上的方便,而到了具体的问题时只需要将其替换成相应的乘法单位元即可。
上面这段话实际上想表达的意思是,一元多项式实际上是一个形式表达式,这个观点在教材中也提出过,但在笔者初学高等代数时一直不理解什么是所谓的形式表达式,直到后来遇到矩阵的多项式和线性变换的多项式后才逐渐理解了这样一种思想,我们不需要关心一元多项式中的
![]()
究竟是什么,我们只关心定义在一元多项式上面的运算下一元多项式所具有的运算性质,因此我们研究的是一元多项式的通用性质,无论其中的文字
![]()
替换成什么数学对象,它所具有的运算性质都是完全相同的,这就足够了。
上面我们给出的关于
![]()
—矩阵的定义是采用了北大版高等代数教材上面对
![]()
—矩阵的描述性定义,在这种定义下的
![]()
—矩阵的范围很广,但是我们真正使用到的
![]()
—矩阵中的一元多项式
![]()
实际上是我们所熟悉的一元多项式函数,这个细节我们在下面的讨论中默认如此。
由于一元多项式环
![]()
中的多项式之间的运算——加法、减法、乘法与数字之间的加、减、乘遵循同样的运算规律,因此,对于
![]()
—矩阵我们可以类似的定义
![]()
—矩阵之间的加法、数乘以及乘法,这些运算与数字矩阵具有完全相同的运算规律,因此我们就不在这里赘述了。同样的我们还可以定义
![]()
的
![]()
—矩阵所对应的行列式,它与数字矩阵的行列式具有完全相同的性质,例如, 对于
![]()
—矩阵的行列式,矩阵乘积的行列式等于行列式的乘积,这一结论同样是成立的。既然说到
![]()
—矩阵的行列式,那么必然也有
![]()
—矩阵的子式的概念,其与数字矩阵的子式的概念也是完全类似的,利用
![]()
—矩阵的子式的概念,我们可以给出下面的定义。
定义1:如果
![]()
—矩阵
![]()
中有一个
![]()
级子式不为零,任意的
![]()
级子式(如果有的话)全为零,则称
![]()
的秩为
![]()
,零矩阵的秩固定为零。
可以看出,这里对于
![]()
—矩阵的秩的定义方式是数字矩阵秩的定义的延续,并没有什么新鲜的内容。
定义2:一个
![]()
的
![]()
—矩阵
![]()
称为
可逆的,如果有一个
![]()
的
![]()
—矩阵
![]()
使
![]()
,这里的
![]()
是
![]()
级单位矩阵。
这里关于
![]()
—矩阵可逆的定义与数字矩阵中的可逆的矩阵的定义是类似的,在定义中其实是可以进行精简的,只需保证
![]()
或
![]()
我们都可以推导出另外的一个,在数字矩阵可逆的定义中同样如此,接下来我们给出下面的定理,由下面的这个定理我们就知道为什么我们可以对上面的定义进行精简。
定理1:一个
![]()
的
![]()
—矩阵
![]()
是可逆的充分必要条件是行列式
![]()
是一个非零的数。
证明:必要性是显然的,我们只需要对
![]()
两端同时取行列式,则有
![]()
,由于
![]()
与
![]()
都是
![]()
的多项式,由它们的乘积为1可推知它们都是零次多项式,也就是非零的常数。
接下来我们证明充分性,不妨设
![]()
是一个非零的常数,
![]()
是
![]()
的伴随矩阵,它也是一个
![]()
—矩阵,此时有
![]()
,由此可知
![]()
可逆。
由上面定理证明的必要性知,当满足
![]()
时即可推得
![]()
及
![]()
的行列式为非零的常数,再由上面定理的充分性知
![]()
及
![]()
均可逆,同理,由
![]()
也可推得这一结论,因此我们可以对定义2进行简化,更近一步的,如果有
![]()
,那么对等式两端同时右乘
![]()
,将得到
![]()
,同样的如果两端同时左乘
![]()
,即只要看到
![]()
这一关系成立,就可知
![]()
,
![]()
均可逆,且
![]()
与
![]()
互逆。
在数字矩阵中,一个数字矩阵可逆的充要条件为这个数字矩阵的行列式不为零,同样可以理解为数字矩阵可逆的充要条件为这个数字矩阵的行列式为一个非零的常数,乍一看
![]()
—矩阵可逆的充要条件也是如此,都论述为行列式是否为非零的常数,但仔细琢磨发现二者存在细微差别,在数字矩阵中,行列式的值必为常数,因此结果被划分成两种,要么行列式是非零常数——可逆,要么行列式为零——不可逆,但是
![]()
—矩阵的行列式的结果除了零和非零常数外还有另外一种结果——
![]()
的非零多项式,由于这一结果上的差异造就了
![]()
—矩阵在判断是否可逆时不能依赖于
![]()
—矩阵是否满秩来进行判断,因此我们得到下面的结论:
![]()
—矩阵
![]()
的秩为
![]()
是
![]()
可逆的必要不充分条件。
在数字矩阵中,我们定义了数字矩阵的三种初等行列变换,即
![]()
互换矩阵中任意两行(列)的位置;
![]()
将矩阵中的任意一行(列)乘以一个非零常数
![]()
;
![]()
将矩阵的任意一行(列)乘以任意一个常数后加到另外一行(列)上。
数字矩阵中的这三种初等行列变换本质上是对线性方程组的同解变换,并且容易证明这三种初等行列变换均为可逆变换,并且每一种行(列)初等变换都可以用对应的初等矩阵去左(右)乘该矩阵得到变换后的矩阵,且在矩阵变换的前后,矩阵的可逆性不发生改变。
仿照数字矩阵中初等变换的定义,我们给出
![]()
—矩阵所对应的初等行列变换的定义。
定义3:如下的三种行列变换称为
![]()
—矩阵的初等行列变换:
![]()
互换矩阵中任意两行(列)的位置;
![]()
将矩阵中的任意一行(列)乘以一个非零常数
![]()
;
![]()
将矩阵的任意一行(列)乘以任意
![]()
后加到另外一行(列)上。
与数字矩阵的初等变换的唯一的不同就在于
![]()
这一条,看完
![]()
这一条后再看
![]()
可能会出现这样一个问题,为什么
![]()
中是乘以为零常数
![]()
,而不是多项式
![]()
呢?
这是因为我们在对
![]()
—矩阵定义初等行列变换时,要保证这样的初等行列变换前后不改变原来的
![]()
—矩阵的可逆性,如果将
![]()
中的非零常数
![]()
修改成任意的多项式
![]()
,那么就很有可能破坏变换前的
![]()
—矩阵的可逆性,这是因为对变换后的
![]()
—矩阵取行列式,得到的结果为变换前的矩阵的行列式的
![]()
倍,根据我们上面的定理1知,如果
![]()
不是非零的常数,那么变换后的
![]()
—矩阵就将不可逆,这一定义上的细节是值得我们去思考的问题。
在数字矩阵中,如果两个数字矩阵
![]()
和
![]()
可以经过初等变换互化,那么我们称这两个矩阵是等价的,同样的我们也可以定义
![]()
—矩阵的等价的概念。
定义4:
![]()
—矩阵
![]()
和
![]()
如果可以经过一系列初等变换互化,那么就称
![]()
与
![]()
等价。
由于
![]()
—矩阵和数字矩阵一样,在进行相应的初等行(列)变换时,都可以通过左(右)乘一个初等矩阵得到,因此对于两个
![]()
—矩阵等价,我们有下面的描述:
矩阵
![]()
与
![]()
等价的充要条件是有一系列初等矩阵
![]()
使
![]()
。
在数字矩阵中,我们知道矩阵在进行初等行(列)变换前后能够保持很多重要性质的不变,同样的,在
![]()
—矩阵在进行初等行(列)变换前后也能够保持
![]()
—矩阵的很多重要性质不变,具体能够保持什么重要性质不变我们暂时先不揭开谜底,我们就姑且假定我们知道初等变换能够保证
![]()
—矩阵的某些重要性质不变,现在只关心任意一个
![]()
—矩阵在进行初等变换后能够将矩阵化简成何种简单的模型,为了说明这个问题,我们需要先学习下面的引理。
引理:设
![]()
—矩阵
![]()
的左上角的元素
![]()
,并且
![]()
中至少有一个元素不能被它除尽,那么一定可以找到一个与
![]()
等价的矩阵
![]()
,它的左上角元素也不为零,但是次数比
![]()
的次数低。
证明:根据
![]()
中不能被
![]()
除尽的元素所在的位置,分以下三种情况讨论:
![]()
若在
![]()
的第一列中有一个元素
![]()
不能被
![]()
除尽,根据带余除法则有
![]()
其中余式
![]()
,且次数比
![]()
的次数低。
对
![]()
作初等行变换,将
![]()
的第
![]()
行减去第一行的
![]()
倍,得到
再将该矩阵的第一行与第
![]()
行互换得到
![]()
即为符合定理结论的那个左上角元素不为零且次数小于
![]()
的矩阵。
![]()
的第一行中有一个元素
![]()
不能被
![]()
除尽,这种情况的处理手段和第一种情况完全类似,只不过这里进行的是初等列变换。
![]()
的第一行与第一列中的元素都可以被
![]()
除尽,但
![]()
中有另一个元素
![]()
不能被
![]()
除尽,不妨设
![]()
,对
![]()
作下述初等行变换:
矩阵
![]()
的第一行中,有一个元素
![]()
不能被
![]()
除尽,这就化成了
![]()
中的情况。
有了上面的引理,我们就可以得到下面的重要定理。
定理2:任意一个非零的
![]()
的
![]()
—矩阵
![]()
都等价于下列形式的矩阵
其中
![]()
是首项系数为1的多项式,且
![]()
。
证明:由于
![]()
非零,那么总可以经过适当的初等行列变换使得
![]()
左上角的元素
![]()
,如果
![]()
不能除尽
![]()
中的全部元素,那么由上面引理可知
![]()
可进行一系列的初等行列变换得到一个左上角元素不为零且次数小于
![]()
的矩阵
![]()
,记
![]()
的左上角元素为
![]()
,如果
![]()
还不能除尽
![]()
中的全部元素,继续利用上面的引理对
![]()
进行初等行列变换得到
![]()
,记
![]()
的左上角的元素为
![]()
,
![]()
且次数小于
![]()
,由于每使用一次引理得到的新的矩阵的左上角元素的次数都会减少,由于次数不能无限制的减少下去,最坏的情况是左上角的元素的次数减少到零次时,必然可以除尽那个矩阵当中的全部元素,我们不妨设终止与
![]()
,它的左上角的元素
![]()
且可以除尽
![]()
的全部元素
![]()
,不妨设
![]()
对
![]()
作初等变换:
在右下角的
![]()
—矩阵
![]()
中全部的元素都可以被
![]()
除尽,因为它们都是
![]()
中元素的组合。
如果
![]()
,则对于
![]()
可以重复上述的步骤,反复使用上面的步骤最后把矩阵化成
其中
![]()
都是首项系数为1的多项式,且
最后化成的这个矩阵称为
![]()
的标准形。
现在我们提出一个问题,对于一个
![]()
—矩阵
![]()
,它的标准形是否唯一呢?为了回答这个问题我们需要引入下面的概念:
定义5:设非零的
![]()
—矩阵
![]()
的秩为
![]()
,对于正整数
![]()
,
![]()
,
![]()
中必有非零的
![]()
级子式,
![]()
中全部
![]()
级子式的首项系数为1的最大公因式
![]()
称为
![]()
的
![]()
级
行列式因子。
由上面的定义可以很容易的看出,对于任意一个秩为
![]()
的
![]()
—矩阵,它共有
![]()
个行列式因子,前面我们学习了
![]()
—矩阵的等价的概念,那么两个等价的
![]()
—矩阵是否具有相同的行列式因子呢,或者说行列式因子在进行初等变换前后是否不变呢?接下来我们给出下面的定理来回答这个问题。
定理3:等价的
![]()
—矩阵具有相同的秩与相同的各级行列式因子。
证明:我们只需要证明
![]()
—矩阵经过一次初等行(列)变换之后,秩与行列式因子不变即可。
设
![]()
—矩阵
![]()
经过一次初等行变换变成
![]()
,
![]()
与
![]()
分别是
![]()
与
![]()
的
![]()
级行列式因子,我们要证明
![]()
,由于初等行变换有三种,因此我们分以下三种情形讨论:
![]()
经第一种初等行变换变成
![]()
。此时,
![]()
的每个
![]()
级子式或者等于
![]()
的某个
![]()
级子式,或者与
![]()
的某个
![]()
级子式符号相反,因此
![]()
是
![]()
的
![]()
级子式的公因式,从而
![]()
。
![]()
经第二种初等行变换变成
![]()
。此时,
![]()
的每个
![]()
级子式或者等于
![]()
的某个
![]()
级子式,或者等于
![]()
的某个
![]()
级子式的
![]()
倍。因此
![]()
是
![]()
的
![]()
级子式的公因式,从而
![]()
。
![]()
经第三种初等行变换变成
![]()
(将
![]()
的第
![]()
行的
![]()
倍加到第
![]()
行)。此时,
![]()
中那些包含 第
![]()
行与第
![]()
行的
![]()
级子式和那些不包含第
![]()
行的
![]()
级子式都等于
![]()
中对应的
![]()
级子式;
![]()
中那些包含第
![]()
行但不包含第
![]()
行的
![]()
级子式,按第
![]()
行分成两部分,这两部分分别等于
![]()
中的一个
![]()
级子式和
![]()
中的一个
![]()
级子式的
![]()
倍,因此这两部分和在一起就等于
![]()
中两个
![]()
级子式的组合,由
![]()
的定义知,
![]()
为该组合的公因式,综合上面的情况知,
![]()
成立。
对于初等列变换上面的讨论同样完全适用,也能得到完全一致的结论
![]()
,由于初等变换的可逆性,可以得到
![]()
,于是有
![]()
。
若
![]()
的秩为
![]()
,由于
![]()
与
![]()
具有相同的
![]()
级行列式因子,故
![]()
也存在
![]()
阶子式不为零,而对于
![]()
任意的
![]()
阶子式均为零,否则的话与上面的结论(
![]()
与
![]()
具有相同的各阶行列式因子相矛盾),即
![]()
与
![]()
的秩相同。
综上,
![]()
与
![]()
具有相同的秩与相同的各级行列式因子。
上面我们证明了两个等价的
![]()
—矩阵具有相同的秩与相同的各级行列式因子,由前面我们证明过的定理2知任何一个非零的
![]()
—矩阵都与其标准形等价,因此要想计算
![]()
—矩阵
![]()
的行列式因子,只需要计算其标准形的行列式因子即可,下面我们来探讨
![]()
—矩阵的标准形的行列式因子的计算问题。
设
![]()
—矩阵
![]()
的标准形如下
由上面的定理3可知,标准形的秩仍然等于
![]()
的秩,因此标准形对角线上的元素的个数也就是
![]()
,值得注意的是,我们在证明了定理2之后并没有说明标准形的对角线上的元素的个数等于
![]()
的秩,那里我们虽然也将其角标标为
![]()
,但那时的
![]()
并没有说明就是
![]()
的秩,现在我们才能正式的承认那时的
![]()
其实就是
![]()
的秩。老实讲,更严格的做法是在定理2的结果中将角标
![]()
写成
![]()
,而当我们证明出定理3之后再将其修改成
![]()
,这一点我们心中有数就好。
由标准形的定义可知:
![]()
都是首项系数为1的多项式,且
![]()
因此容易推出,标准形矩阵的各级行列式因子分别为
![]()
,于是
![]()
,这说明
![]()
的标准形的主对角线上的非零元素是被
![]()
的行列式因子唯一确定的,由于等价的
![]()
—矩阵具有完全相同的各级行列式因子,再由等价的传递性,可知两个等价的
![]()
—矩阵的标准形等价,进而可推知这两个标准形完全一致,因此我们得到下面的定理:
定理4:
![]()
—矩阵的标准形是唯一的。
为了进一步研究问题的方便,我们给出下面重要的定义:
定义6:标准形的主对角线上的非零元素
![]()
称为
![]()
—矩阵
![]()
的
不变因子。
有上面的定义可以看出任何一个
![]()
—矩阵的不变因子的个数都等于该
![]()
—矩阵的秩,即行列式因子的个数
![]()
不变因子的个数
![]()
的秩
![]()
。
定理5:两个
![]()
—矩阵等价的充要条件是它们有相同的行列式因子,或者它们有相同的不变因子。
证明:定理3证明的就是该定理的必要性,接下来我们只证明定理的充分性即可。
假设
![]()
—矩阵
![]()
与
![]()
具有相同的各级行列式因子,由于行列式因子与不变因子是相互确定的,因此
![]()
与
![]()
具有相同的不变因子,由于不变因子和标准形之间的对应关系,可知
![]()
与
![]()
有相同的标准形,因此
![]()
与
![]()
是等价的。
接下来,我们来看一下可逆矩阵的行列式因子和不变因子及其标准形:
设
![]()
是一个
![]()
的可逆矩阵,由定理1知
![]()
,其中
![]()
是一非零常数,因此可知
![]()
,由可逆矩阵的各级行列式因子之间的整除关系
![]()
知,
![]()
,从而
![]()
,因此可逆矩阵的标准形为单位矩阵
![]()
。反过来与单位矩阵等价的
![]()
—矩阵一定是可逆的,因为它的行列式是一个非零的常数。这说明
![]()
—矩阵
![]()
可逆的充要条件是它与单位矩阵等价,即存在一系列初等矩阵
![]()
使
即
![]()
,由此我们得到下面的定理:
定理6:矩阵
![]()
可逆的充要条件是它可以表示成一系列初等矩阵的乘积。
由定理6可得到下面的推论:
推论:两个
![]()
的
![]()
—矩阵
![]()
与
![]()
等价的充要条件是,有一个
![]()
的可逆矩阵
![]()
与一个
![]()
的可逆矩阵
![]()
,使
![]()
。
证明:若
![]()
与
![]()
等价,则存在一系列初等矩阵,使
![]()
由上面的定理6知,记
![]()
,
![]()
,则
![]()
与
![]()
均可逆,即该推论的必要性成立,接下来证明充分性,由上面的定理6知,可逆矩阵
![]()
与
![]()
均可表示成一系列初等矩阵的乘积,即
![]()
,
![]()
由
![]()
知,
![]()
,即
![]()
与
![]()
等价。
在
![]()
—矩阵这一章,我们的终极目标是得到矩阵的若尔当标准形,前期我们讨论的这些基本概念与定理均是为若尔当标准形的到来做铺垫,接下来我们再给出一个重要的铺垫:
定理7:设
![]()
,
![]()
是数域
![]()
上的两个
![]()
矩阵,
![]()
与
![]()
相似的充要条件是它们的特征矩阵
![]()
与
![]()
等价。
这个定理的证明还需要两个引理,并且在证明该定理时所采用的证明方法技巧性较强,且证明思想相对结论而言并不是十分重要,因此在这里先不给出那两个引理和该定理的证明,在文章的最后我们再将那两个引理的证明和该定理的证明补充上。
对于数字方阵
![]()
我们也可以定义它的不变因子,我们称
![]()
的不变因子即为它的特征矩阵
![]()
的不变因子,因此以后我们再谈论数字方阵的不变因子时,默认是指它的特征矩阵的不变因子。
由上面的定理5知,两个
![]()
—矩阵等价的充要条件是它们有相同的不变因子,再结合定理7我们可知,两个数字矩阵相似的充要条件是它们有相同的不变因子。
由于特征矩阵的行列式是关于
![]()
的
![]()
次多项式,因此特征矩阵的行列式必不为零,即特征矩阵的秩为该特征矩阵的阶数
![]()
,因此任意一个数字方阵
![]()
的不变因子的个数都等于该数字矩阵的阶数,并且这些不变因子的乘积就等于数字矩阵
![]()
的特征多项式。
上面的结果表面,不变因子是数字矩阵的相似不变量,而又矩阵和线性变换的关系可知,线性变换无论取何组基都唯一的对应一组不变因子,因此我们可以相应的定义线性变换的不变因子。
在证明矩阵的若尔当标准形的道路上,我们还缺少一些数学工具,因此我们接着为矩阵的若尔当标准形做铺垫,请看下面的内容:
截止目前为止,我们上面所讨论的问题都是在任何的数域
![]()
中进行的,但接下来,我们将数域
![]()
限定为复数域
![]()
来进行讨论。
定义7:把矩阵
![]()
(或线性变换
![]()
)的每个次数大于零的不变因子分解成互不相同的首项为 1的一次因式方幂的乘积,所有这些一次因式方幂(相同的必须按出现的次数计算)称为矩阵
![]()
(或线性变换
![]()
)的
初等因子。
我们引入教材上面的一个例子加以说明初等因子和不变因子之间的关系。
例:设12级矩阵的不变因子是
其中1的个数为9,这一点实际上不说我们也是能推出来的,因为任何一个数字矩阵的不变因子的个数都等于这个矩阵的阶数。
按照上面的定义,我们能得到它的初等因子如下:
共计七个初等因子。
接下来我们进一步讨论不变因子和初等因子之间的关系。
设
![]()
为复数域上的
![]()
阶矩阵,那么它一定有
![]()
个不变因子,并且它的特征矩阵的标准形中右下角的元素
![]()
一定能够被其余的所有不变因子
![]()
除尽,如果我们已经知道
![]()
的所有初等因子,那么
![]()
一定是这些初等因子的最小公倍式,因此将这些不变因子中同一个
![]()
的一次多项式中幂次最高的拼凑在一起即得到
![]()
,同理,在剩下的初等因子中再拼凑出它们的最小公倍式作为
![]()
,以此类推进行下去,并且由初等因子能够确定特征矩阵的阶数(所有初等因子乘在一起得到的关于
![]()
的多项式即为矩阵
![]()
的特征多项式,该多项式的次数即为矩阵
![]()
的阶数),因此由初等因子就可以得到
![]()
的所有的不变因子,因此由初等因子可以推出不变因子,这里需要注意的是,我们目前所谈的初等因子都是数字矩阵的特征矩阵而言的,如果换成了一般的
![]()
—矩阵,我们是无法通过初等因子来确定全部的不变因子的,因为我们没法确定这个矩阵的阶数。
初等因子是由不变因子定义的,再加上上面我们论证了初等因子可以推出特征矩阵的所有不变因子,因此在数字矩阵中,初等因子和不变因子是相互确定的。
由此我们可知,如果两个数字矩阵具有相同的初等因子,则它们有相同的不变因子,进而它们之间是相似的关系,反之如果两个数字矩阵相似,则它们有相同的初等因子。
定理8:两个复数矩阵相似的充要条件是它们有相同的初等因子。
截止目前为止,我们求初等因子的方法是通过先求出矩阵的不变因子,再有不变因子进一步得出矩阵的初等因子,那么是否能绕过第一步,直接求出矩阵的初等因子呢?为了回答这个问题,我们需要下面的铺垫:
先介绍一个多项式的最大公因式的性质
如果多项式
![]()
都与
![]()
互素,则
![]()
。
证明:设
![]()
,
记
![]()
,
则必有
同理,记
![]()
,
也必有
从而
接下来证明
由
![]()
知,
![]()
再结合
可推出
同理,由
![]()
知,
![]()
再结合
![]()
可推出
再将
![]()
和
![]()
结合起来就有
![]()
。
上面叙述的这个多项式的性质是为了证明接下来的引理
引理:设
如果多项式
![]()
都与
![]()
互素,则
![]()
和
![]()
等价。
证明:由前面的定理5知,两个
![]()
—矩阵等价的充要条件是它们具有相同的行列式因子,因此我们只需要证明
![]()
与
![]()
具有相同的行列式因子即可。
显然,
![]()
与
![]()
具有相同的二阶行列式因子,因此我们只需证明它们具有相同的一阶行列式因子即可,设
![]()
与
![]()
的一阶行列式因子分别为
![]()
。
则
![]()
,
由上面多项式的讨论可知
即
![]()
和
![]()
等价。
利用上面的这个引理我们能够得到一个直接求出数字矩阵的初等因子的方法,见下面的定理:
定理9:首先用初等变换将特征矩阵
![]()
化为对角形式,然后将主对角线上的元素分解成互不相同的一次因式方幂的乘积,则所有这些一次因式的方幂(相同的按出现的次数计算)就是
![]()
的全部初等因子。
证明:设
![]()
已用初等变换化为对角形矩阵
其中每个
![]()
的最高项系数都为1,将
![]()
分解成互不相同的一次因式方幂的乘积:
我们现在要证明的是,对于每个相同的一次因式的方幂
![]()
在
![]()
的主对角线上按递升幂次排列后,得到的新的对角矩阵
![]()
与
![]()
等价。此时
![]()
就是
![]()
的标准形,而且所有不为1的
![]()
就是
![]()
的全部初等因子。
先对
![]()
的方幂进行讨论,记
而且每个
![]()
都与
![]()
互素。
如果有相邻的一对指数
![]()
,则在
![]()
中将
![]()
与
![]()
对调位置,而其余因式保持不动,根据引理
与
等价,从而
![]()
与对角矩阵
等价,然后对
![]()
作如上的讨论,如此继续进行,直到对角矩阵主对角线上元素所含
![]()
的方幂是按递升幂次排列为止。接着对
![]()
作同样的处理,最后得到的便是与
![]()
等价的对角矩阵
![]()
,它的主对角线上所含各个相同的一次因式的方幂,且都是按递升幂次排列的,且
![]()
即为
![]()
的标准形。
上面的定理9向我们提供了直接计算数字矩阵初等因子的方法,它不必先计算数字矩阵的不变因子,而是先将数字矩阵的特征矩阵化成对角矩阵,且保证该对角矩阵对角线上的元素
![]()
的最高项的系数为1,并且对所有的
![]()
在复数域上进行因式分解,将
![]()
分解成互不相同的一次因式的方幂的乘积,这些互不相同的一次因式方幂的乘积(相同的按出现的次数计算)便是该数字矩阵的全部初等因子。
在上面我们花费了相当长的篇幅进行铺垫,就是为了引出我们最终目标——矩阵的若尔当标准形。
矩阵的若尔当标准形是为了解决那些不可相似对角化的矩阵的化简问题,我们知道,如果一个矩阵可以进行相似对角化,那么这个矩阵的一些运算就可以被极大的简化,由于相似矩阵之间具有很多的相似不变量:特征多项式、特征值、矩阵的行列式、矩阵的迹、最小多项式、不变因子、行列式因子、初等因子。因此如果一个矩阵能够相似一个形式简单的矩阵,那么在求上述相似不变量时就可以很容易的得到,而矩阵当中最为简单的情形是对角矩阵,因此如果一个矩阵能够进行相似对角化,那么这是最好的一种情况,但是,绝大多数的矩阵并不能够进行相似对角化,那么这样类形的矩阵的相似最简形是什么样的呢?这个问题的答案就是我们下面讲述的主角——矩阵的若尔当标准形。
在讨论矩阵的若尔当标准形时,我们限制在复数域
![]()
上进行讨论,这点需要注意。
定义8:形式为
的矩阵称为一个若尔当块,由若干个若尔当块组成的准对角矩阵
称为若尔当形矩阵。
我们上面给出的若尔当块的定义形式是不唯一的,有的教材上面给出的若尔当块的定义是下面这样的:
并且有的教材上面若尔当块的记法为
![]()
。
这两种不同形式的若尔当块之间其实是相似的关系,我们可以取
可验证
![]()
。
并且
这里的
![]()
采用的是我们给出的第一种的定义的若尔当块。
由此可以看出无论采用何种定义方式的若尔当块,都可以通过矩阵的相似变换化成另外一种。为了定理的叙述方便,我们采用第一种定义方式下的若尔当块。
我们先来研究一下若尔当块的一些性质:
考虑若尔当块
它的特征矩阵
显然
![]()
,这就是
![]()
的
![]()
级行列式因子,由于
![]()
有一个
![]()
级行列式因子是
所以它的
![]()
级行列式因子是1,从而它以下的各级行列式因子都是1,它的不变因子
由此可知
![]()
的初等因子是
设若尔当矩阵
其中
由于
![]()
的初等因子是
![]()
,所以
![]()
与
![]()
等价
于是
![]()
与
等价。
由定理9可知,
![]()
的全部初等因子是
![]()
。
即每个若尔当形矩阵的全部初等因子就是由它的全部若尔当块的初等因子构成的,由于每个若尔当块完全被它的级数
![]()
和主对角线上元素
![]()
所确定,而这两个参数都反映在它的初等因子
![]()
中。因此,若尔当块被它的初等因子唯一决定。由此可见,若尔当形矩阵除去其中若尔当块的排列的次序之外被它的初等因子唯一确定。
下面我们给出最为重要的一个定理,即矩阵的若尔当标准形定理。
定理10:每个
![]()
级的复数矩阵
![]()
都与一个若尔当形矩阵相似,这个若尔当形矩阵除去其中若尔当块的排列次序外是被矩阵
![]()
唯一决定的,它称为
![]()
的若尔当标准形。
证明:设
![]()
级矩阵
![]()
的初等因子为
每一个初等因子
![]()
对应一个若儿当块
这些若尔当块构成一若尔当形矩阵
有前面的讨论已经知道
![]()
的初等因子为
![]()
,由于
![]()
与
![]()
具有相同的初等因子,因此
![]()
与
![]()
相似。
如果存在另一个若尔当形矩阵
![]()
与
![]()
相似,则
![]()
与
![]()
具有相同的初等因子,由初等因子与若尔当块之间的一一对应关系知,
![]()
与
![]()
除了若尔当块的排列次序不同外其余完全相同,唯一性成立。
未完待续...