二次型
二次型是一种特殊的多项式,其中可以有n个变量,但是每项的次数必须为二(某两个变量的乘积),例如x2+xy+xz+z2x^2+xy+xz+z^2x2+xy+xz+z2
- 之前说过,一元n次多项式(函数)可以视为一个向量,基函数就是1,x,x2...1,x,x^2...1,x,x2...
- 类似的思路,n元2次多项式(二次型)的问题可以视为矩阵的问题,只不过这里的基函数是n个变量x1,x2,...,xnx_1,x_2,...,x_nx1,x2,...,xn
二次型可以表示为f(A)=(x1,x2,...,xn)A(x1,x2,...,xn)Tf(\mathbf A)=(x_1,x_2,...,x_n)\mathbf A(x_1,x_2,...,x_n)^Tf(A)=(x1,x2,...,xn)A(x1,x2,...,xn)T
实对称矩阵A\mathbf AA称为二次型的矩阵,Rank(A)Rank(\mathbf A)Rank(A)称为二次型的秩
这样一来,我们就能利用线性代数解决n元2次多项式问题了,但是这里不能随意应用矩阵的各种变换,针对二次型的研究,还需要矩阵的合同变换
二次型的几何意义
二次型的提出,是为了研究:几何图形在三维坐标系下二次曲线/二次曲面方程
这里直接给出结论:研究几何图形,只要研究这个二次函数的二次项就可以了
- 二次型的一次项和常数项并不能影响图形本身的特性,只要二次项相同,矩阵就是合同的(它们的几何图形是在不同坐标系下看到的同一个图形,或者说他们的图形经过缩放、选择、平移后能够重合)
(这就好像在分析高频信号时,抓住关键特性,只要分析其复包络/等效低通信号就可以了)
这里的合同,偏向于说几何图形的“根本特性”相同,例如圆和椭圆就是合同的,其二次型相同中的二次项相同,但是相较于不包含交叉项的函数图形,包含变量交叉项的函数的图形发生了旋转和伸缩变化,但我们仍可将其视为“取不同坐标系”时看到的同一个图形
- 由此可知,二次型的二次项完全表现了图形的特性,这种“特性”相同的一类二次型,其矩阵就是合同矩阵(几何意义:线性空间里的同一个几何图形,在不同的坐标基下的不同矩阵表示)
合同矩阵
称A\mathbf AA和B\mathbf BB为合同矩阵的条件:它们满足B=PTAP\mathbf B= \mathbf P^T\mathbf A\mathbf PB=PTAP,且其中P\mathbf PP为可逆矩阵(理解为:由自然基到非自然基的过渡矩阵,从而用于转换观察的坐标系)
- 对比:对称矩阵的相似对角化为A=QΛQT\boldsymbol{A}=\boldsymbol{Q} \boldsymbol{\Lambda} \boldsymbol{Q}^{T}A=QΛQT,其中Q\boldsymbol{Q}Q为正交矩阵
两种定义有相似之处,相似对角化与合同有某种联系(相似对角化是合同的特殊情况?待进一步学习) - 和相似矩阵类似,合同矩阵就是同一个二次型在不同坐标基下的矩阵
- 合同矩阵的几何意义:同一个二次函数的几何图形,在不同坐标系下的矩阵表示
- 二次型的矩阵(对称矩阵)必合同于对角矩阵
原因:对称阵一定可以正交对角化
标准型、规范型
前面说过,几何图形的特性完全由二次项决定,然而我们又不希望出现交叉项这样的二次项,希望得到一种“最简”的形式,这就是标准型和规范型
标准型:形如a1x12+a2x22+...+anxn2a_1{x_1}^2+a_2{x_2}^2+...+a_n{x_n}^2a1x12+a2x22+...+anxn2的二次型
规范型:形如x12+x22+...+xn2{x_1}^2+{x_2}^2+...+{x_n}^2x12+x22+...+xn2的二次型
对于同一个二次型f(A)=(x1,x2,...,xn)A(x1,x2,...,xn)Tf(\mathbf A)=(x_1,x_2,...,x_n)\mathbf A(x_1,x_2,...,x_n)^Tf(A)=(x1,x2,...,xn)A(x1,x2,...,xn)T,我们变换观察的视角(在不同坐标系下看同一个几何图形),由于二次型的矩阵A\mathbf AA(实对称矩阵)必可正交对角化,因此任何二次型可以通过[合同变换]化为标准型
- 通过配方法/施密特正交变换,可以化二次型为标准型
- 二次型化为标准型,几何上就是不停进行坐标变换,最终找到一组正交基,使得在这个基下的二次型矩阵为对角矩阵