矩阵是数学中的一个重要的基本概念,是代数学的一个主要研究对象,也是数学研究和应用的一个重要工具。“矩阵”这个词是由西尔维斯特首先使用的,他是为了将数字的矩形阵列区别于行列式而发明了这个述语。而实际上,矩阵这个课题在诞生之前就已经发展的很好了。从行列式的大量工作中明显的表现出来,为了很多目的,不管行列式的值是否与问题有关,方阵本身都可以研究和使用,矩阵的许多基本性质也是在行列式的发展中建立起来的。
1855 年,埃米特(C.Hermite,1822~1901)证明了别的数学家发现的一些矩阵类的特征根的特殊性质,如现在称为埃米特矩阵的特征根性质等。后来,克莱伯施(A.Clebsch,1831~1872)、布克海姆(A.Buchheim)等证明了对称矩阵的特征根性质。泰伯(H.Taber)引入矩阵的迹的概念并给出了一些有关的结论。 在矩阵论的发展史上,弗罗伯纽斯(G.Frobenius,1849-1917)的贡献是不可磨灭的。他讨论了最小多项式问题,引进了矩阵的秩、不变因子和初等因子、正交矩阵、矩阵的相似变换、合同矩阵等概念,以合乎逻辑的形式整理了不变因子和初等因子的理论,并讨论了正交矩阵与合同矩阵的一些重要性质。 1854 年,约当研究了矩阵化为标准型的问题。1892年,梅茨勒(H.Metzler)引进了矩阵的超越函数概念并将其写成矩阵的幂级数的形式。傅立叶、西尔和庞加莱的著作中还讨论了无限阶矩阵问题,这主要是适用方程发展的需要而开始的。
矩阵
矩阵类型
向量的类型根据元素的实际意义不同可以分为,
-
物理向量
泛指既有幅值,又有方向的物理量,如速度、加速度、位移等。
-
几何向量
为了将物理向量可视化,常用带方向的线段表示。这种有向线段出称为几何向量。
-
代数向量
几何向量可以用代数形式表示。例如,若平面上的几何向量v=ab⃗v=\vec{ab}v=ab中点a的坐标为(a1,a2)(a_1,a_2)(a1,a2),点b的坐标为(b1,b2)(b_1,b_2)(b1,b2),则该几何向量可以表示为代数形式[b1−a1b2−a2]\begin{bmatrix} b_1-a_1\\ b_2-a_2\\ \end{bmatrix} [b1−a1b2−a2]
其中,根据元素的类型不同,代数向量又可以分为以下三种,
-
常数向量
向量中的元素为实数或复数
-
函数向量
向量中的元素包含函数值,如x=[1,x,x2,...,xn]T\mathbf{x}=[1,x,x^2,...,x^n]^Tx=[1,x,x2,...,xn]T
-
随机向量
向量中的元素为随机变量或随机过程,如x=[x1(n),x2(n),...,xm(n)]T\mathbf{x}=[x_1(n),x_2(n),...,x_m(n)]^Tx=[x1(n),x2(n),...,xm(n)]T,其中x1(n),x2(n),...,xm(n)x_1(n),x_2(n),...,x_m(n)x1(n),x2(n),...,xm(n)是mmm个随机过程或随机信号
矩阵运算
转置、共轭、共轭转置、加法、乘法和求逆
矩阵的基本运算包括矩阵的转置、共轭、共轭转置、加法、乘法和求逆
A=[a11a12⋯a1ma21a22⋯a2m⋯⋯⋯⋯am1am2⋯amm]
A=\begin{bmatrix}{a_{11}} & {a_{12}} & {\cdots} & {a_{1 m}} \\ {a_{21}} & {a_{22}} & {\cdots} & {a_{2 m}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}} & {a_{m 2}} & {\cdots} & {a_{m m}}\end{bmatrix}
A=⎣⎢⎢⎡a11a21⋯am1a12a22⋯am2⋯⋯⋯⋯a1ma2m⋯amm⎦⎥⎥⎤
- 矩阵AAA的转置记为ATA^TAT,其元素定义为[AT]ij=aji[A^T]_{ij}=a_{ji}[AT]ij=aji,
AT=[a11a21⋯am1a12a22⋯am2⋯⋯⋯⋯a1ma2m⋯amm] A^T=\begin{bmatrix}{a_{11}} & {a_{21}} & {\cdots} & {a_{m1}} \\ {a_{12}} & {a_{22}} & {\cdots} & {a_{m2}} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}} & {a_{2m}} & {\cdots} & {a_{m m}}\end{bmatrix} AT=⎣⎢⎢⎡a11a12⋯a1ma21a22⋯a2m⋯⋯⋯⋯am1am2⋯amm⎦⎥⎥⎤
- 矩阵AAA的共轭记为A∗A^*A∗,其元素定义为[A∗]ij=aij∗[A^*]_{ij}=a_{ij}^*[A∗]ij=aij∗,
A∗=[a11∗a12∗⋯a1m∗a21∗a22∗⋯a2m∗⋯⋯⋯⋯am1∗am2∗⋯amm∗] A^*=\begin{bmatrix}{a_{11}^*} & {a_{12}^*} & {\cdots} & {a_{1 m}^*} \\ {a_{21}^*} & {a_{22}^*} & {\cdots} & {a_{2 m}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{m 1}^*} & {a_{m 2}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix} A∗=⎣⎢⎢⎡a11∗a21∗⋯am1∗a12∗a22∗⋯am2∗⋯⋯⋯⋯a1m∗a2m∗⋯amm∗⎦⎥⎥⎤
- 矩阵AAA的共轭转置记为AHA^HAH,其元素定义为[AH]ij=aji∗[A^H]_{ij}=a_{ji}^*[AH]ij=aji∗,
AT=[a11∗a21∗⋯am1∗a12∗a22∗⋯am2∗⋯⋯⋯⋯a1m∗a2m∗⋯amm∗]
A^T=\begin{bmatrix}{a_{11}^*} & {a_{21}^*} & {\cdots} & {a_{m1}^*} \\ {a_{12}^*} & {a_{22}^*} & {\cdots} & {a_{m2}^*} \\ {\cdots} & {\cdots} & {\cdots} & {\cdots} \\ {a_{1m}^*} & {a_{2m}^*} & {\cdots} & {a_{m m}^*}\end{bmatrix}
AT=⎣⎢⎢⎡a11∗a12∗⋯a1m∗a21∗a22∗⋯a2m∗⋯⋯⋯⋯am1∗am2∗⋯amm∗⎦⎥⎥⎤
共轭转置又被称为Hermitian伴随、Hermitian转置或Hermitian共轭,A=ATA=A^TA=AT的实方阵称为对称矩阵,A=AHA=A^HA=AH的复方阵称为Hermitian矩阵
-
方阵AAA的逆矩阵记为A−1A^{-1}A−1,A−1A^{-1}A−1被定义为满足以下关系AA−1=AA−1=IAA^{-1}=AA^{-1}=\mathbf{I}AA−1=AA−1=I
-
加法与乘法
-
两个m×nm\times nm×n矩阵A、BA、BA、B的加法,[A+B]ij=aij+bij[A+B]_{ij}=a_{ij}+b_{ij}[A+B]ij=aij+bij
-
m×nm\times nm×n大小的矩阵AAA与1×n1\times n1×n大小的向量x=[x1,...,xn]x=[x_1,...,x_n]x=[x1,...,xn]相乘,[Ax]i=∑j=1naijxj,i=1,...,m[Ax]_i=\sum_{j=1}^na_{ij}x_j,\quad i=1,...,m[Ax]i=∑j=1naijxj,i=1,...,m
-
m×nm\times nm×n大小的矩阵AAA与n×rn\times rn×r大小的矩阵BBB相乘,[AB]ij=∑k=1naikbkj,i=1,...,m;j=1,...,r[AB]_{ij}=\sum_{k=1}^na_{ik}b_{kj},\quad i=1,...,m;j=1,...,r[AB]ij=∑k=1naikbkj,i=1,...,m;j=1,...,r
需要注意的是,一般来说,矩阵乘积是不满足交换律的
-
性质
关于矩阵中转置、共轭、共轭转置、求逆的性质
-
分配律
(A+B)∗=A∗+B∗,(A+B)T=AT+BT,(A+B)H=AH+BH(A+B)^*=A^*+B^*,\quad (A+B)^T=A^T+B^T,\quad (A+B)^H=A^H+B^H(A+B)∗=A∗+B∗,(A+B)T=AT+BT,(A+B)H=AH+BH
-
矩阵乘积中转置、共轭转置、求逆的性质
(AB)T=BTAT,(AB)H=BHAH,(AB)−1=B−1A−1(AB)^T=B^TA^T,\quad (AB)^H=B^HA^H,\quad (AB)^{-1}=B^{-1}A^{-1}(AB)T=BTAT,(AB)H=BHAH,(AB)−1=B−1A−1
-
转置、共轭、共轭转置与求逆交换
(A∗)−1=(A−1)∗,(AT)−1=(A−1)T,(AH)−1=(A−1)H(A^*)^{-1}=(A^{-1})^*,\quad (A^T)^{-1}=(A^{-1})^T,\quad (A^H)^{-1}=(A^{-1})^H(A∗)−1=(A−1)∗,(AT)−1=(A−1)T,(AH)−1=(A−1)H
矩阵函数
除了上述矩阵的基本运算之外,还有矩阵函数
-
三角函数
sin(A)=∑n=0∞(−1)nA2n+1(2n+1)!=A−13!A3+15!A5−⋯cos(A)=∑n=0∞(−1)nA2n(2n)!=I−12!A2+14!A4−⋯ \begin{aligned} \sin (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n+1}}{(2 n+1) !}=\boldsymbol{A}-\frac{1}{3 !} \boldsymbol{A}^{3}+\frac{1}{5 !} \boldsymbol{A}^{5}-\cdots \\ \cos (\boldsymbol{A}) &=\sum_{n=0}^{\infty} \frac{(-1)^{n} \boldsymbol{A}^{2 n}}{(2 n) !}=\boldsymbol{I}-\frac{1}{2 !} \boldsymbol{A}^{2}+\frac{1}{4 !} \boldsymbol{A}^{4}-\cdots \end{aligned} sin(A)cos(A)=n=0∑∞(2n+1)!(−1)nA2n+1=A−3!1A3+5!1A5−⋯=n=0∑∞(2n)!(−1)nA2n=I−2!1A2+4!1A4−⋯ -
指数函数
eA=∑n=0∞1n!An=I+A+12A2+13!A3+⋯e−A=∑n=0∞1n!(−1)nAn=I−A+12A2−13!A3+⋯eAt=I+At+12A2t2+13!A3t3+⋯ \begin{aligned} \mathrm{e}^{A} &=\sum_{n=0}^{\infty} \frac{1}{n !} \boldsymbol{A}^{n}=\boldsymbol{I}+\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}+\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{-\boldsymbol{A}} &=\sum_{n=0}^{\infty} \frac{1}{n !}(-1)^{n} \boldsymbol{A}^{n}=\boldsymbol{I}-\boldsymbol{A}+\frac{1}{2} \boldsymbol{A}^{2}-\frac{1}{3 !} \boldsymbol{A}^{3}+\cdots \\ \mathrm{e}^{\boldsymbol{A} t} &=\boldsymbol{I}+\boldsymbol{A} t+\frac{1}{2} \boldsymbol{A}^{2} t^{2}+\frac{1}{3 !} \boldsymbol{A}^{3} t^{3}+\cdots \end{aligned} eAe−AeAt=n=0∑∞n!1An=I+A+21A2+3!1A3+⋯=n=0∑∞n!1(−1)nAn=I−A+21A2−3!1A3+⋯=I+At+21A2t2+3!1A3t3+⋯ -
对数函数
ln(I+A)=∑n=1∞(−1)n−1nAn=A−12A2+13A3−⋯ \ln (I+A)=\sum_{n=1}^{\infty} \frac{(-1)^{n-1}}{n} A^{n}=A-\frac{1}{2} A^{2}+\frac{1}{3} A^{3}-\cdots ln(I+A)=n=1∑∞n(−1)n−1An=A−21A2+31A3−⋯ -
矩阵导数
dAdt=A˙=[da11dtda12dt⋯da1ndtda21dtda22dt⋯da2ndt⋮⋮⋱⋮dam1dtdam2dt⋯damndt] \frac{\mathrm{d} \boldsymbol{A}}{\mathrm{d} t}=\dot{\boldsymbol{A}}=\left[ \begin{array}{cccc}{\frac{\mathrm{d} a_{11}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{12}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{1 n}}{\mathrm{d} t}} \\ {\frac{\mathrm{d} a_{21}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{22}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{2 n}}{\mathrm{d} t}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\frac{\mathrm{d} a_{m 1}}{\mathrm{d} t}} & {\frac{\mathrm{d} a_{m 2}}{\mathrm{d} t}} & {\cdots} & {\frac{\mathrm{d} a_{m n}}{\mathrm{d} t}}\end{array}\right] dtdA=A˙=⎣⎢⎢⎢⎡dtda11dtda21⋮dtdam1dtda12dtda22⋮dtdam2⋯⋯⋱⋯dtda1ndtda2n⋮dtdamn⎦⎥⎥⎥⎤ -
矩阵积分
∫Adt=[∫a11dt∫a12dt⋯∫a1ndta21dt∫a22dt⋯∫a2ndt⋮⋮⋱⋮∫am1dt∫am2dt⋯∫amndt] \int \boldsymbol{A} \mathrm{d} t=\left[ \begin{array}{cccc}{\int a_{11} \mathrm{d} t} & {\int a_{12} \mathrm{d} t} & {\cdots} & {\int a_{1 n} \mathrm{d} t} \\ {a_{21} \mathrm{d} t} & {\int a_{22} \mathrm{d} t} & {\cdots} & {\int a_{2 n} \mathrm{d} t} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {\int a_{m 1} \mathrm{d} t} & {\int a_{m 2} \mathrm{d} t} & {\cdots} & {\int a_{m n} \mathrm{d} t}\end{array}\right] ∫Adt=⎣⎢⎢⎢⎡∫a11dta21dt⋮∫am1dt∫a12dt∫a22dt⋮∫am2dt⋯⋯⋱⋯∫a1ndt∫a2ndt⋮∫amndt⎦⎥⎥⎥⎤
特殊矩阵
对角矩阵、零矩阵、单位矩阵
幂等矩阵
幂等矩阵AAA具有以下性质:
幂单矩阵
又被称为对合矩阵,若A2=AA=IA^2=AA=\mathbf{I}A2=AA=I,若AAA为幂单矩阵,则函数f(⋅)f(\cdot)f(⋅)具有以下性质:
f(sI+tA)=12[(I+A)f(s+t)+(I−A)f(s−t)]
f(s \boldsymbol{I}+t \boldsymbol{A})=\frac{1}{2}[(\boldsymbol{I}+\boldsymbol{A}) f(s+t)+(\boldsymbol{I}-\boldsymbol{A}) f(s-t)]
f(sI+tA)=21[(I+A)f(s+t)+(I−A)f(s−t)]
其中,幂等矩阵和幂单矩阵也有关系,矩阵AAA是幂单矩阵,当且仅当12(A+I)\frac{1}{2}\boldsymbol({A}+\boldsymbol{I})21(A+I)
幂零矩阵
方阵AAA被称为幂零矩阵,若A2=AA=OA^2=AA=\boldsymbol{O}A2=AA=O,若AAA为幂单矩阵,则函数f(⋅)f(\cdot)f(⋅)具有以下性质:
f(sI+tA)=If(s)+tAf′(s)
f(s \boldsymbol{I}+t \boldsymbol{A})=\boldsymbol{I}f(s)+t\boldsymbol{A}f^{\prime}(s)
f(sI+tA)=If(s)+tAf′(s)
Source from: 《矩阵分析与应用》,张贤达