1. 矩阵
1. 定义
定义4.1.1
对任意正整数 m m m和 n n n,由 m × n m \times n m×n个数排成的 m m m行 n n n列的表:
( a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n . . . . . . . . . . . . a m 1 a m 2 . . . a m n ) \begin{pmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{m1} & a_{m2} & ... & a_{mn} \end{pmatrix} ⎝ ⎛a11a21...am1a12a22...am2............a1na2n...amn⎠ ⎞
称为一个 m × n m \times n m×n的矩阵,记作 A = ( a i j ) m × n A = (a_{ij})_{m \times n} A=(aij)m×n。
表中的每个数称为矩阵 A A A的元素,特别的,当 i = j i=j i=j时, a i i a_{ii} aii称为 A A A的对角元。
其中,有一些特殊矩阵定义如下:
- 零矩阵( O \bold{O} O):元素都是0的矩阵;
- 方阵: n × n n\times n n×n的矩阵;
- 单位矩阵( I n \bold{I_n} In或 I \bold{I} I):对角元素都是1,其他元素都是0的n阶方阵;
- 数量矩阵:对角元素都是 a a a,其他元素都是0的n阶方阵,即 a I n a \bold{I_n} aIn;
- 对角矩阵:出对角元素之外均为0的n阶方阵;
- 上三角矩阵:对一个矩阵 A \bold{A} A,如果对任意的元素 a i j a_{ij} aij,满足 i > j i>j i>j时,均有 a i j = 0 a_{ij} = 0 aij=0,则称之为上三角矩阵;
- 下三角矩阵:对一个矩阵 A \bold{A} A,如果对任意的元素 a i j a_{ij} aij,满足 i < j i<j i<j时,均有 a i j = 0 a_{ij} = 0 aij=0,则称之为上三角矩阵;
- 三角矩阵:上三角矩阵和下三角矩阵统称为三角矩阵;
- 对称矩阵:若一个方阵 A = ( a i j ) n × n \bold{A} = (a_{ij})_{n\times n} A=(aij)n×n,对任意的 i , j i,j i,j都满足 a i j = a j i a_{ij} = a_{ji} aij=aji,则称 A \bold{A} A为对称矩阵;
- 反对称矩阵:若一个方阵 A = ( a i j ) n × n \bold{A} = (a_{ij})_{n\times n} A=(aij)n×n,对任意的 i , j i,j i,j都满足 a i j = − a j i a_{ij} = -a_{ji} aij=−aji,则称 A \bold{A} A为对称矩阵;
2. 矩阵运算
下面,我们来考察一下矩阵当中的一些常见运算。
1. 加法与数乘
定义4.2.1
设矩阵 A = ( a i j ) n × m ∈ F n × m , B = ( b i j ) n × m ∈ F n × m , λ ∈ F \bold{A} = (a_{ij})_{n\times m} \in F^{n \times m}, \bold{B} = (b_{ij})_{n\times m} \in F^{n \times m}, \lambda \in F A=(aij)n×m∈Fn×m,B=(bij)n×m∈Fn×m,λ∈F,定义矩阵加法和数乘如下:
A + B = ( a 11 + b 11 a 12 + b 12 . . . a 1 m + b 1 m a 21 + b 21 a 22 + b 22 . . . a 2 m + b 2 m . . . . . . . . . . . . a n 1 + b n 1 a n 2 + b n 2 . . . a n m + b n m ) \bold{A} + \bold{B} = \begin{pmatrix} a_{11} + b_{11} & a_{12} + b_{12} & ... & a_{1m} + b_{1m} \\ a_{21} + b_{21} & a_{22} + b_{22} & ... & a_{2m} + b_{2m} \\ ... & ... & ... & ... \\ a_{n1} + b_{n1} & a_{n2} + b_{n2} & ... & a_{nm} + b_{nm} \end{pmatrix} A+B=⎝ ⎛a11+b11a21+b21...an1+bn1a12+b12a22+b22...an2+bn2............a1m+b1ma2m+b2m...anm+bnm⎠ ⎞
λ A = ( λ a 11 λ a 12 . . . λ a 1 m λ a 21 λ a 22 . . . λ a 2 m . . . . . . . . . . . . λ a n 1 λ a n 2 . . . λ a n m ) \lambda\bold{A} = \begin{pmatrix} \lambda a_{11} & \lambda a_{12} & ... & \lambda a_{1m} \\ \lambda a_{21} & \lambda a_{22} & ... & \lambda a_{2m} \\ ... & ... & ... & ... \\ \lambda a_{n1} & \lambda a_{n2} & ... & \lambda a_{nm} \end{pmatrix} λA=⎝ ⎛λa11λa21...λan1λa12λa22...λan2............λa1mλa2m...λanm⎠ ⎞
简记为:
A + B = ( a i j + b i j ) n × m \bold{A} + \bold{B} = (a_{ij} + b_{ij})_{n\times m} A+B=(aij+bij)n×m
λ A = ( λ a i j ) n × m \lambda \bold{A} = (\lambda a_{ij})_{n \times m} λA=(λaij)n×m
我们有如下性质:
- 加法交换律: A + B = B + A \bold{A} + \bold{B} = \bold{B} + \bold{A} A+B=B+A
- 加法结合律: ( A + B ) + C = A + ( B + C ) (\bold{A} + \bold{B}) + \bold{C} = \bold{A} + (\bold{B} + \bold{C}) (A+B)+C=A+(B+C)
- 有零矩阵: A + O = O + A = A \bold{A} + \bold{O} = \bold{O} + \bold{A} = \bold{A} A+O=O+A=A
- 有负矩阵: A + ( − A ) = O \bold{A} + (\bold{-A}) = \bold{O} A+(−A)=O
- 左分配律: ( λ + μ ) A = λ A + μ A (\lambda + \mu)\bold{A} = \lambda \bold{A} + \mu \bold{A} (λ+μ)A=λA+μA
- 右分配律: λ ( A + B ) = λ A + λ B \lambda (\bold{A} + \bold{B}) = \lambda \bold{A} + \lambda \bold{B} λ(A+B)=λA+λB
- 数乘结合律: ( λ μ ) A = λ ( μ A ) (\lambda \mu) \bold{A} = \lambda (\mu \bold{A}) (λμ)A=λ(μA)
- 数乘单位元: 1 A = A 1\bold{A} = \bold{A} 1A=A
2. 矩阵乘法
定义4.2.2
设 A = ( a i j ) m n ∈ F m × n \bold{A} = (a_{ij})_{mn} \in F^{m \times n} A=(aij)mn∈Fm×n, B = ( b i j ) n × p ∈ F n × p \bold{B} = (b_{ij})_{n \times p} \in F^{n \times p} B=(bij)n×p∈Fn×p,则定义矩阵 A \bold{A} A和 B \bold{B} B的乘积为一个 m × p m \times p m×p的矩阵:
( ∑ k a 1 k b k 1 . . . ∑ k a 1 k b k p . . . . . . . . . ∑ k a m k b k 1 . . . ∑ k a m k b k p ) \begin{pmatrix} \sum_k a_{1k}b_{k1} & ... & \sum_k a_{1k}b_{kp} \\ ... & ... & ... \\ \sum_k a_{mk}b_{k1} & ... & \sum_k a_{mk}b_{kp} \end{pmatrix} ⎝ ⎛∑ka1kbk1...∑kamkbk1.........∑ka1kbkp...∑kamkbkp⎠ ⎞
记作 C : = ( c i j ) m × p = A B \bold{C} := (c_{ij})_{m \times p} = \bold{AB} C:=(cij)m×p=AB,其中, c i j = ∑ k = 1 n a i k b k j c_{ij} = \sum_{k=1}^n a_{ik}b_{kj} cij=∑k=1naikbkj,即 A \bold{A} A的第 i i i行和 B \bold{B} B的第 j j j列对应元素乘积之和。
显然有:
- A \bold{A} A与 B \bold{B} B能够相乘的充要条件是 A \bold{A} A的列数等于 B \bold{B} B的行数;
- A B \bold{AB} AB与 B A \bold{BA} BA并不一定相同;
- 非零矩阵的乘积也可能是零矩阵;
- 数量矩阵与矩阵的相乘相当于矩阵的数乘,即 λ I A = A λ I = λ A \lambda \bold{I} \bold{A} = \bold{A} \lambda \bold{I} = \lambda \bold{A} λIA=AλI=λA;
- A O = O A = A \bold{AO} = \bold{OA} = \bold{A} AO=OA=A;
此外,矩阵的乘法有以下性质:
- 乘法结合律: ( A B ) C = A ( B C ) \bold{(AB)C} = \bold{A(BC)} (AB)C=A(BC)
- 乘法单位元: A I = I A = A \bold{AI} = \bold{IA} = \bold{A} AI=IA=A
- 左分配律: ( A + B ) C = A C + B C \bold{(A+B)C} = \bold{AC+BC} (A+B)C=AC+BC
- 右分配律: A ( B + C ) = A B + A C \bold{A(B+C)} = \bold{AB+AC} A(B+C)=AB+AC
- 数乘结合律: λ ( A B ) = ( λ A ) B = A ( λ B ) \lambda (\bold{AB}) = (\lambda\bold{A})\bold{B} = \bold{A}(\lambda \bold{B}) λ(AB)=(λA)B=A(λB)
特别的,如果有 A A T = I \bold{AA^T} = \bold{I} AAT=I,则称矩阵 A \bold{A} A为正交矩阵。
同样的,我们可以定义方阵的幂为: A k = A . . . A \bold{A}^k = \bold{A}...\bold{A} Ak=A...A。
3. 矩阵的逆
定义矩阵的逆如下:
定义4.2.3
设 A \bold{A} A是任意一个 n n n阶方阵,如果存在一个 n n n阶方阵 X \bold{X} X满足:
A X = X A = I \bold{AX} = \bold{XA} = \bold{I} AX=XA=I
则称矩阵 A \bold{A} A可逆,矩阵 X \bold{X} X称为 A \bold{A} A的逆矩阵,记作 A − 1 \bold{A^{-1}} A−1。
可逆矩阵也成为非奇异矩阵,反正不可逆矩阵称为奇异矩阵。
矩阵的逆运算有性质如下:
- ( A − 1 ) − 1 = A (\bold{A}^{-1})^{-1} = \bold{A} (A−1)−1=A
- ( λ A ) − 1 = λ − 1 A − 1 (\lambda \bold{A})^{-1} = \lambda^{-1} \bold{A}^{-1} (λA)−1=λ−1A−1
- ( A B ) − 1 = B − 1 A − 1 (\bold{AB})^{-1} = \bold{B}^{-1} \bold{A}^{-1} (AB)−1=B−1A−1
4. 转置、共轭与秩
同样,我们首先给出其定义如下:
定义4.2.4
将矩阵 A = ( a i j ) m × n \bold{A} = (a_{ij})_{m \times n} A=(aij)m×n的行列互换,得到的矩阵称为 A \bold{A} A的转置矩阵,记作 A T = ( a j i ) n × m \bold{A}^{T} = (a_{ji})_{n \times m} AT=(aji)n×m
A T = ( a 11 a 21 . . . a m 1 a 12 a 22 . . . a m 2 . . . . . . . . . . . . a 1 n a 2 n . . . a m n ) \bold{A}^{T} = \begin{pmatrix} a_{11} & a_{21} & ... & a_{m1} \\ a_{12} & a_{22} & ... & a_{m2} \\ ... & ... & ... & ... \\ a_{1n} & a_{2n} & ... & a_{mn} \end{pmatrix} AT=⎝ ⎛a11a12...a1na21a22...a2n............am1am2...amn⎠ ⎞
对于一个复矩阵 A \bold{A} A,如果将其每个元素都转换其共轭复数,得到的矩阵称为 A \bold{A} A的共轭矩阵,记作 A ‾ = ( a i j ‾ ) m × n \bold{\overline{A}} = (\overline{a_{ij}})_{m\times n} A=(aij)m×n
A ‾ = ( a 11 ‾ a 12 ‾ . . . a 1 n ‾ a 21 ‾ a 22 ‾ . . . a 2 n ‾ . . . . . . . . . . . . a m 1 ‾ a m 2 ‾ . . . a m n ‾ ) \bold{\overline{A}} = \begin{pmatrix} \overline{a_{11}} & \overline{a_{12}} & ... & \overline{a_{1n}} \\ \overline{a_{21}} & \overline{a_{22}} & ... & \overline{a_{2n}} \\ ... & ... & ... & ... \\ \overline{a_{m1}} & \overline{a_{m2}} & ... & \overline{a_{mn}} \end{pmatrix} A=⎝ ⎛a11a21...am1a12a22...am2............a1na2n...amn⎠ ⎞
对于一个 n n n阶方阵 A \bold{A} A,其对角元之和称为 A \bold{A} A的迹,记作 t r ( A ) tr(\bold{A}) tr(A)
t r ( A ) = ∑ i = 1 n a i i tr(\bold{A}) = \sum_{i=1}^{n}a_{ii} tr(A)=i=1∑naii
同样的,我们有性质如下:
- 转置
- ( A + B ) T = A T + B T (\bold{A} + \bold{B})^T = \bold{A}^T + \bold{B}^T (A+B)T=AT+BT
- ( λ A ) T = λ A T (\lambda \bold{A})^T = \lambda \bold{A}^T (λA)T=λAT
- ( A B T ) = B T A T (\bold{AB}^T) = \bold{B}^T\bold{A}^T (ABT)=BTAT
- ( A − 1 ) T = ( A T ) − 1 (\bold{A}^{-1})^T = (\bold{A}^T)^{-1} (A−1)T=(AT)−1
- 迹
- t r ( A + B ) = t r ( A ) + t r ( B ) tr(\bold{A} + \bold{B}) = tr(\bold{A}) + tr(\bold{B}) tr(A+B)=tr(A)+tr(B)
- t r ( λ A ) = λ t r ( A ) tr(\lambda \bold{A}) = \lambda tr(\bold{A}) tr(λA)=λtr(A)
- t r ( A T ) = t r ( A ) tr(\bold{A}^T) = tr(\bold{A}) tr(AT)=tr(A)
- t r ( A ‾ ) = t r ( A ) ‾ tr(\overline{\bold{A}}) = \overline{tr(\bold{A})} tr(A)=tr(A)
- t r ( A B ) = t r ( B A ) tr(\bold{AB}) = tr(\bold{BA}) tr(AB)=tr(BA)
5. 分块运算
对于一个矩阵 A \bold{A} A,如果我们可以将其按照行列分成若干块:
A = ( A 11 A 12 . . . A 1 s A 21 A 22 . . . A 2 s . . . . . . . . . . . . A r 1 A r 2 . . . A r s ) \bold{A} = \begin{pmatrix} \bold{A}_{11} & \bold{A}_{12} & ... & \bold{A}_{1s} \\ \bold{A}_{21} & \bold{A}_{22} & ... & \bold{A}_{2s} \\ ... & ... & ... & ... \\ \bold{A}_{r1} & \bold{A}_{r2} & ... & \bold{A}_{rs} \end{pmatrix} A=⎝ ⎛A11A21...Ar1A12A22...Ar2............A1sA2s...Ars⎠ ⎞
则称矩阵 A \bold{A} A为分块矩阵,记作 ( A i j ) r × s (\bold{A}_{ij})_{r\times s} (Aij)r×s,每一个 A i j \bold{A}_{ij} Aij称为 A \bold{A} A的子块。
特别的,如果对 ∀ i ≠ j , A i j = O \forall i \neq j, \bold{A}_{ij} = \bold{O} ∀i=j,Aij=O,则称 A \bold{A} A为准对角矩阵。
同样的,我们可以定义准上三角矩阵和准下三角矩阵,这里就不赘述了。
对于分块矩阵,我们同样有如下性质:
- 设 A = ( A i j ) r × s , B = ( B i j ) r × s \bold{A} = (\bold{A}_{ij})_{r\times s}, \bold{B} = (\bold{B}_{ij})_{r\times s} A=(Aij)r×s,B=(Bij)r×s,则 A + B = ( A i j + B i j ) r × s \bold{A} + \bold{B} = (\bold{A}_{ij} + \bold{B}_{ij})_{r \times s} A+B=(Aij+Bij)r×s
- 设 A = ( A i j ) r × s \bold{A} = (\bold{A}_{ij})_{r\times s} A=(Aij)r×s,则 λ A = ( λ A i j ) r × s \lambda \bold{A} = (\lambda \bold{A}_{ij})_{r\times s} λA=(λAij)r×s
- 设 A = ( A i j ) r × s , B = ( B i j ) s × t \bold{A} = (\bold{A}_{ij})_{r\times s}, \bold{B} = (\bold{B}_{ij})_{s\times t} A=(Aij)r×s,B=(Bij)s×t,则 A B = C i j r × t \bold{AB} = \bold{C_{ij}}_{r\times t} AB=Cijr×t,其中 C i j = ∑ k = 1 n A i k B k j \bold{C_{ij}} = \sum_{k=1}^{n}\bold{A}_{ik}\bold{B}_{kj} Cij=∑k=1nAikBkj
- 设 A = ( A i j ) r × s \bold{A} = (\bold{A}_{ij})_{r\times s} A=(Aij)r×s,则 A T = ( A j i T ) s × r \bold{A}^{T} = (\bold{A}_{ji}^T)_{s \times r} AT=(AjiT)s×r
- 设 A = ( A i j ) r × s \bold{A} = (\bold{A}_{ij})_{r\times s} A=(Aij)r×s,则 A ‾ = ( A i j ‾ ) r × s \overline{\bold{A}} = (\overline{\bold{A}_{ij}})_{r \times s} A=(Aij)r×s
- 设 A = ( A i j ) r × r \bold{A} = (\bold{A}_{ij})_{r\times r} A=(Aij)r×r,则 t r ( A ) = ∑ i = 1 r t r ( A i i ) tr(\bold{A}) = \sum_{i=1}^{r} tr(\bold{\bold{A}_{ii}}) tr(A)=∑i=1rtr(Aii)
- 当 A 1 , . . . , A r \bold{A}_1, ..., \bold{A}_r A1,...,Ar均可逆时, ( d i a g ( A 1 , . . . , A r ) ) − 1 = d i a g ( A 1 − 1 , . . . , A r − 1 ) (diag(\bold{A}_1, ..., \bold{A}_r))^{-1} = diag(\bold{A}_1^{-1}, ..., \bold{A}_{r}^{-1}) (diag(A1,...,Ar))−1=diag(A1−1,...,Ar−1)
6. 初等变换
矩阵的初等变换主要包括以下三种操作:
- 交换矩阵的某两行;
- 将某一行乘以某个非零常数;
- 将某一行的常数倍加入到另一行上;
我们可以用三个基本初等变换矩阵对这三类操作进行实现,分别为:
-
交换矩阵的 i , j i,j i,j两行
S i j = ( 1 . . . 0 1 . . . 1 0 . . . 1 ) \bold{S}_{ij} = \begin{pmatrix} 1 \\ & ... \\ & & 0 & & 1 \\ & & & ... & \\ & & 1 & & 0 \\ & & & & & ... \\ & & & & & & 1 \end{pmatrix} Sij=⎝ ⎛1...01...10...1⎠ ⎞
-
将矩阵的第 i i i行倍乘 λ \lambda λ
D i ( λ ) = ( 1 . . . 1 λ 1 . . . 1 ) \bold{D}_{i}(\lambda) = \begin{pmatrix} 1 \\ & ... \\ & & 1 \\ & & & \lambda & \\ & & & & 1 \\ & & & & & ... \\ & & & & & & 1 \end{pmatrix} Di(λ)=⎝ ⎛1...1λ1...1⎠ ⎞
-
将矩阵的第 j j j行的 λ \lambda λ倍加入到第 i i i行中
T i j ( λ ) = ( 1 . . . 1 λ . . . 1 . . . 1 ) \bold{T}_{ij}(\lambda) = \begin{pmatrix} 1 \\ & ... \\ & & 1 & & \lambda \\ & & & ... & \\ & & & & 1 \\ & & & & & ... \\ & & & & & & 1 \end{pmatrix} Tij(λ)=⎝ ⎛1...1...λ1...1⎠ ⎞
同样的,对于初等矩阵,我们有如下性质:
- S i j \bold{S}_{ij} Sij为对称方阵,且 S i j − 1 = S i j \bold{S}_{ij}^{-1} = \bold{S}_{ij} Sij−1=Sij;
- D i ( λ ) \bold{D}_i(\lambda) Di(λ)为对角方阵,且 D i ( λ ) − 1 = D i ( λ − 1 ) ) \bold{D}_i(\lambda)^{-1} = \bold{D}_i(\lambda^{-1})) Di(λ)−1=Di(λ−1));
- T i j ( λ ) \bold{T}_{ij}(\lambda) Tij(λ)为三角方阵,且 T i j ( λ ) − 1 = T i j ( − λ ) \bold{T}_{ij}(\lambda)^{-1} = \bold{T}_{ij}(-\lambda) Tij(λ)−1=Tij(−λ);
此外,我们还有如下定理:
定理4.2.9
对任意矩阵 A = ( a i j ) m × n \bold{A} = (a_{ij})_{m \times n} A=(aij)m×n,存在一系列 m m m阶初等方阵 P 1 , . . . , P s \bold{P}_1, ..., \bold{P}_s P1,...,Ps以及 n n n阶初等方阵 Q 1 , . . . , Q t \bold{Q}_1, ..., \bold{Q}_t Q1,...,Qt,使得
P s . . . P 1 A Q 1 . . . Q t = ( I r O O O ) \bold{P}_s ... \bold{P}_1 \bold{A} \bold{Q}_1 ... \bold{Q}_t = \begin{pmatrix} \bold{I}_r & \bold{O} \\ \bold{O} & \bold{O} \end{pmatrix} Ps...P1AQ1...Qt=(IrOOO)
其中, r r r为非负整数,称之为矩阵 A \bold{A} A的秩。
又因为初等矩阵都是可逆矩阵,因此,我们又可以简化上述定理为:
定理4.2.10
对任意矩阵 A = ( a i j ) m × n \bold{A} = (a_{ij})_{m \times n} A=(aij)m×n,存在 m m m阶可逆方阵 P \bold{P} P以及 n n n阶可逆方阵 Q \bold{Q} Q,使得
P A Q = ( I r O O O ) \bold{PAQ} = \begin{pmatrix} \bold{I}_r & \bold{O} \\ \bold{O} & \bold{O} \end{pmatrix} PAQ=(IrOOO)
其中, r r r为非负整数,称之为矩阵 A \bold{A} A的秩。
更进一步的,我们可以有:
定理4.2.11
方阵 A \bold{A} A可逆的充要条件为: A \bold{A} A可以分解为一系列初等方阵的乘积。
2. 行列式
1. 定义
定义4.3.1
方阵 A = ( a i j ) n × n \bold{A} = (a_{ij})_{n\times n} A=(aij)n×n的行列式通常记为 d e t ( A ) det(\bold{A}) det(A)或者
∣ a 11 a 12 . . . a 1 n a 21 a 22 . . . a 2 n . . . . . . . . . . . . a n 1 a n 2 . . . a n n ∣ \begin{vmatrix} a_{11} & a_{12} & ... & a_{1n} \\ a_{21} & a_{22} & ... & a_{2n} \\ ... & ... & ... & ... \\ a_{n1} & a_{n2} & ... & a_{nn} \end{vmatrix} ∣ ∣a11a21...an1a12a22...an2............a1na2n...ann∣ ∣
当 n = 1 n=1 n=1时, d e t ( A ) = a 11 det(\bold{A}) = a_{11} det(A)=a11,当 n ≥ 2 n \geq 2 n≥2时, d e t ( A ) det(\bold{A}) det(A)可以递归地定义为:
d e t ( A ) : = ∑ k = 1 n ( − 1 ) k + 1 a 1 k ⋅ ∣ a 21 . . . a 2 , k − 1 a 2 , k + 1 . . . a 2 n a 31 . . . a 3 , k − 1 a 3 , k + 1 . . . a 3 n . . . . . . . . . . . . . . . . . . a n 1 . . . a n , k − 1 a n , k + 1 . . . a n n ∣ det(\bold{A}) := \sum_{k=1}^{n}(-1)^{k+1}a_{1k} \cdot \begin{vmatrix} a_{21} & ... & a_{2,k-1} & a_{2, k+1} & ... & a_{2n} \\ a_{31} & ... & a_{3,k-1} & a_{3, k+1} & ... & a_{3n} \\ ... & ... & ... & ... & ... & ... \\ a_{n1} & ... & a_{n,k-1} & a_{n, k+1} & ... & a_{nn} \end{vmatrix} det(A):=k=1∑n(−1)k+1a1k⋅∣ ∣a21a31...an1............a2,k−1a3,k−1...an,k−1a2,k+1a3,k+1...an,k+1............a2na3n...ann∣ ∣
我们引入符号:
M
i
j
=
∣
a
21
.
.
.
a
2
,
j
−
1
a
2
,
j
+
1
.
.
.
a
2
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
i
−
1
,
1
.
.
.
a
i
−
1
,
j
−
1
a
i
−
1
,
j
+
1
.
.
.
a
i
−
1
,
n
a
i
+
1
,
1
.
.
.
a
i
+
1
,
j
−
1
a
i
+
1
,
j
+
1
.
.
.
a
i
+
1
,
n
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
a
n
1
.
.
.
a
n
,
j
−
1
a
n
,
j
+
1
.
.
.
a
n
n
∣
M_{ij} = \begin{vmatrix} a_{21} & ... & a_{2,j-1} & a_{2, j+1} & ... & a_{2n} \\ ... & ... & ... & ... & ... & ... \\ a_{i-1,1} & ... & a_{i-1,j-1} & a_{i-1, j+1} & ... & a_{i-1,n} \\ a_{i+1,1} & ... & a_{i+1,j-1} & a_{i+1, j+1} & ... & a_{i+1,n} \\ ... & ... & ... & ... & ... & ... \\ a_{n1} & ... & a_{n,j-1} & a_{n, j+1} & ... & a_{nn} \end{vmatrix}
Mij=∣
∣a21...ai−1,1ai+1,1...an1..................a2,j−1...ai−1,j−1ai+1,j−1...an,j−1a2,j+1...ai−1,j+1ai+1,j+1...an,j+1..................a2n...ai−1,nai+1,n...ann∣
∣
则称 M i j M_{ij} Mij为矩阵 A \bold{A} A关于元素 a i j a_{ij} aij的余子式, A i j : = ( − 1 ) i + j M i j A_{ij}:=(-1)^{i+j}M_{ij} Aij:=(−1)i+jMij称为矩阵 A \bold{A} A关于元素 a i j a_{ij} aij的代数余子式。
则我们易有:
定理4.3.1
设 A \bold{A} A为 n n n阶方阵,则有:
d e t ( A ) = ∑ i = 1 n a k i A k i = ∑ i = 1 n ( − 1 ) k + i a k i M k i det(\bold{A}) = \sum_{i=1}^{n}a_{ki}A_{ki} = \sum_{i=1}^{n}(-1)^{k+i}a_{ki}M_{ki} det(A)=i=1∑nakiAki=i=1∑n(−1)k+iakiMki
在此基础上,我们来考察一下行列式的具体展开形式。
要考察行列式的具体展开,我们需要引入逆序数的定义,其定义如下:
定义 4.3.2
将 n n n个两两不同的的正整数 s 1 , s 2 , . . . , s n s_1, s_2, ..., s_n s1,s2,...,sn按顺序排成一个有序数组成为一个排列,记作 s = ( s 1 , . . . , s n ) s=(s_1, ..., s_n) s=(s1,...,sn),满足 s 1 < s 2 < . . . < s n s_1 < s_2 < ... < s_n s1<s2<...<sn的排列称之为顺序排列。互换 s s s当中的 i , j i,j i,j位置上的两个数 s i , s j s_i, s_j si,sj称之为一次对换,满足 i < j i<j i<j且 s i > s j s_i > s_j si>sj的一对数 ( s i , s j ) (s_i, s_j) (si,sj)称为 s s s的一个逆序, s s s的逆序的个数称之为 s s s的逆序数,记作 τ ( s ) \tau(s) τ(s),逆序数为奇数的排列称为奇排列,反之逆序数为偶数的排列称为偶排列。
我们有引理如下:
引理 4.3.1
每一个排列 s s s可经过 τ ( s ) \tau(s) τ(s)次对换之后变成从小到大的顺序排列。
由此,我们可以给出给出行列式的展开表达式如下:
定理 4.3.3
设 A = ( a i j ) n × n \bold{A} = (a_{ij})_{n \times n} A=(aij)n×n为 n n n阶方阵,则:
d e t ( A ) = ∑ ( j 1 , . . . , j n ) ∈ S n ( − 1 ) τ ( j 1 , . . . , j n ) a 1 j 1 a 2 j 2 . . . a n j n det(\bold{A}) = \sum_{(j_1, ..., j_n) \in S_n} (-1)^{\tau(j_1, ..., j_n)}a_{1j_1}a_{2j_2}...a_{nj_n} det(A)=(j1,...,jn)∈Sn∑(−1)τ(j1,...,jn)a1j1a2j2...anjn
2. 性质 & 计算
基于行列式的定义,我们很方便就能够得到行列式的如下性质:
- 交换方阵 A \bold{A} A的某两行,得到方阵 B \bold{B} B,则有 d e t ( B ) = − d e t ( B ) det(\bold{B}) = -det(\bold{B}) det(B)=−det(B);
- 将方阵 A \bold{A} A的某一行乘以常数 λ \lambda λ,得到方阵 B \bold{B} B,则有 d e t ( B ) = λ d e t ( A ) det(\bold{B}) = \lambda det(\bold{A}) det(B)=λdet(A);
- 若方阵 A \bold{A} A的某一行是两个向量之和,则 d e t ( A ) det(\bold{A}) det(A)可以拆成对应的两个行列式之和;
- 若方阵 A \bold{A} A有某两行成比例,则 d e t ( A ) = 0 det(\bold{A}) = 0 det(A)=0,特别地,若 A \bold{A} A有两行相同,则其行列式为 0 0 0;
- 若将方阵 A \bold{A} A地某一行的常数倍加到矩阵 A \bold{A} A的另一行,得到方阵 B \bold{B} B,则有 d e t ( A ) = d e t ( B ) det(\bold{A}) = det(\bold{B}) det(A)=det(B);
- 对任意 n n n阶方阵 A \bold{A} A,有 d e t ( A T ) = d e t ( A ) det(\bold{A}^T) = det(\bold{A}) det(AT)=det(A);
- 对任意 n n n阶方阵 A , B \bold{A, B} A,B,有 d e t ( A B ) = d e t ( A ) d e t ( B ) det(\bold{AB}) = det(\bold{A}) det(\bold{B}) det(AB)=det(A)det(B)
- 设方阵
A
=
(
a
i
j
)
\bold{A} = (a_{ij})
A=(aij)为
n
n
n阶方阵,引入
A
\bold{A}
A的伴随矩阵
A ∗ : = ( A 11 A 12 . . . A 1 n A 21 A 22 . . . A 2 n . . . . . . . . . . . . A n 1 A n 2 . . . A n n ) \bold{A}^{*} := \begin{pmatrix} A_{11} & A_{12} & ... & A_{1n} \\ A_{21} & A_{22} & ... & A_{2n} \\ ... & ... & ... & ... \\ A_{n1} & A_{n2} & ... & A_{nn} \end{pmatrix} A∗:=⎝ ⎛A11A21...An1A12A22...An2............A1nA2n...Ann⎠ ⎞
其中 A i j A_{ij} Aij是 a i j a_{ij} aij的代数余子式,则有:
A ∗ A = A A ∗ = d e t ( A ) I \bold{A^{*}A} = \bold{AA^{*}} = det(\bold{A}) \bold{I} A∗A=AA∗=det(A)I - 方阵
A
\bold{A}
A可逆的充要条件是
d
e
t
(
A
)
≠
0
det(\bold{A}) \neq 0
det(A)=0,且当
A
\bold{A}
A可逆时,
A − 1 = 1 d e t ( A ) A ∗ \bold{A}^{-1} = \frac{1}{det(\bold{A})} \bold{A}^{*} A−1=det(A)1A∗
特别的,我们引入Vandermonde行列式:
Δ
=
∣
1
a
1
.
.
.
a
1
n
−
1
1
a
1
.
.
.
a
2
n
−
1
.
.
.
.
.
.
.
.
.
.
.
.
1
a
n
.
.
.
a
n
n
−
1
∣
=
Π
1
≤
i
<
j
≤
n
(
a
j
−
a
i
)
\Delta \begin{aligned} &= \begin{vmatrix} 1 & a_1 & ... & a_1^{n-1} \\ 1 & a_1 & ... & a_2^{n-1} \\ ... & ... & ... & ... \\ 1 & a_n & ... & a_n^{n-1} \end{vmatrix} \\ &= \Pi_{1 \leq i < j \leq n}(a_j - a_i) \end{aligned}
Δ=∣
∣11...1a1a1...an............a1n−1a2n−1...ann−1∣
∣=Π1≤i<j≤n(aj−ai)
此外,我们还给出Cramer法则:
定理 4.3.9 (Cramer法则)
当系数矩阵 A = ( a i j ) n × n \bold{A} = (a_{ij})_{n \times n} A=(aij)n×n的行列式不等于0时,方程组
{ a 11 x 1 + a 12 x 2 + . . . + a 1 n x n = b 1 a 21 x 1 + a 22 x 2 + . . . + a 2 n x n = b 2 . . . a n 1 x 1 + a n 2 x 2 + . . . + a n n x n = b n \left\{ \begin{aligned} a_{11} x_1 + a_{12} x_2 + ... + a_{1n} x_n &= b_1 \\ a_{21} x_1 + a_{22} x_2 + ... + a_{2n} x_n &= b_2 \\ ... \\ a_{n1} x_1 + a_{n2} x_2 + ... + a_{nn} x_n &= b_n \end{aligned}\right. ⎩ ⎨ ⎧a11x1+a12x2+...+a1nxna21x1+a22x2+...+a2nxn...an1x1+an2x2+...+annxn=b1=b2=bn
有唯一解,为:
( x 1 , x 2 , . . . , x n ) = ( Δ 1 Δ , Δ 2 Δ , . . . , Δ n Δ ) (x_1, x_2, ..., x_n) = (\frac{\Delta_1}{\Delta}, \frac{\Delta_2}{\Delta}, ..., \frac{\Delta_n}{\Delta}) (x1,x2,...,xn)=(ΔΔ1,ΔΔ2,...,ΔΔn)
其中, Δ = d e t ( A ) \Delta = det(\bold{A}) Δ=det(A), Δ i \Delta_i Δi时将矩阵 A \bold{A} A的第 i i i行换成 b = ( b 1 , . . . , b n ) \bold{b} = (b_1, ..., b_n) b=(b1,...,bn)之后得到的矩阵的行列式。
3. 秩与相抵
首先,我们给出相抵以及秩的定义如下:
定义4.4.1
设 A , B \bold{A, B} A,B是 m × n m \times n m×n矩阵,如果存在可逆方阵 P \bold{P} P和 Q \bold{Q} Q,使得 B = P A Q \bold{B} = \bold{PAQ} B=PAQ,则称矩阵 A , B \bold{A,B} A,B相抵。
显然,我们有:
- A \bold{A} A与 A \bold{A} A本身相抵;
- 若矩阵 A \bold{A} A与 B \bold{B} B相抵,则 B \bold{B} B与 A \bold{A} A相抵;
- 若矩阵 A \bold{A} A与 B \bold{B} B相抵,矩阵 B \bold{B} B与 C \bold{C} C相抵,则 A \bold{A} A与 C \bold{C} C相抵;
更一般地,我们有定理:
定理4.4.1
设 A \bold{A} A是 m × n m \times n m×n矩阵,则存在 m m m阶可逆方阵 P \bold{P} P和 n n n阶可逆方阵 Q \bold{Q} Q,使得
P A Q = ( I r O O O ) \bold{PAQ} = \begin{pmatrix} \bold{I_r} & \bold{O} \\ \bold{O} & \bold{O} \end{pmatrix} PAQ=(IrOOO)
其中,非负整数 r r r由 A \bold{A} A唯一确定。
由此,我们可以引出秩的定义:
定义4.4.2
设 b o l d A bold{A} boldA是 m × n m \times n m×n矩阵,上述定理中给出的矩阵 d i a g ( I r , O ) diag(\bold{I_r}, \bold{O}) diag(Ir,O)称为矩阵 A \bold{A} A的相抵标准形。整数 r r r称之为矩阵 A \bold{A} A的秩,记作 r a n k ( A ) rank(\bold{A}) rank(A)或者 r ( A ) r(\bold{A}) r(A)。若 r = m r = m r=m,则称矩阵 A \bold{A} A是行满秩的;若 r = n r = n r=n,则称矩阵 A \bold{A} A是列满秩的。
对于秩,我们有如下定理:
定理4.4.2
设 A , B \bold{A, B} A,B是 m × n m \times n m×n,则 A \bold{A} A与 B \bold{B} B相抵的充要条件是 r a n k ( A ) = r a n k ( B ) rank(\bold{A}) = rank(\bold{B}) rank(A)=rank(B)。
定理4.4.3
设 A \bold{A} A是 m × n m \times n m×n矩阵, P , Q \bold{P, Q} P,Q分别 m , n m,n m,n阶可逆方阵,则 r a n k ( P A Q ) = r a n k ( A ) rank(\bold{PAQ}) = rank(\bold{A}) rank(PAQ)=rank(A)。
引理4.4.1
设 A \bold{A} A是 m × n m \times n m×n矩阵, P , Q \bold{P, Q} P,Q分别 m , n m,n m,n阶初等方阵,若 A \bold{A} A的所有 k k k阶子式都是零,则 P A \bold{PA} PA与 A Q \bold{AQ} AQ的所有 k k k阶子式也是零。
定理4.4.4
矩阵 A \bold{A} A的非零子式的最大结束等于矩阵 A \bold{A} A的秩。
此外,还有一些性质如下:
- 对任意 m × n m \times n m×n矩阵 A \bold{A} A, n × p n \times p n×p矩阵 B \bold{B} B,都有 r a n k ( A B ) ≤ m i n ( r a n k ( A ) , r a n k ( B ) ) rank(\bold{AB}) \leq min(rank(\bold{A}), rank(\bold{B})) rank(AB)≤min(rank(A),rank(B))
- 设 A \bold{A} A为 n n n阶方阵, I \bold{I} I为同阶单位矩阵,且 A 2 = A \bold{A}^2 = \bold{A} A2=A,则有 r a n k ( A ) + r a n k ( I − A ) = n rank(\bold{A}) + rank(\bold{I-A}) = n rank(A)+rank(I−A)=n