在众多科学与工程学科,如物理、化学工程、统计学、经济学、生物学、信号处理、自动控制、系统理论、医学和军事工程等中,许多问题都可能落脚到求解矩阵方程 Ax=b。根据数据向量 b 和数据矩阵
1. 超定矩阵方程 m>n, 并且数据矩阵 A 和数据向量
2. 盲矩阵方程 仅数据向量 b 已知,数据矩阵
3. 欠定稀疏矩阵方程 m<n ,数据矩阵 A 和数据向量
这里主要介绍超定矩阵方程的最小二乘求解方法。最小二乘方法是最常用的线性参数估计方法。早在高斯的年代,最小二乘方法就用来对平面上的点拟合线,对高维空间的点拟合超平面。许多从事科学研究的朋友可能对这个方法已经很熟悉,这里主要是一个简要的综述,了解最小二乘方法的原理、最优解的条件以及不足。
1. 普通最小二乘
普通最小二乘估计是大家最熟悉的、也是用得最多的最小二乘方法。
考虑超定矩阵方程
假定数据向量存在加性观测误差或噪声,即 b=b0+e,其中 b0 和 e 分别是无误差的数据向量和误差向量。
为了抑制误差对矩阵方程求解的影响,引入一个校正向量
上述的这一思想可用下面的优化问题进行描述
于是,矩阵方程 Ax=b 的普通最小二乘解为
展开上面的矩阵相乘的式子,有
两边对 x 求导数,并且令导数为0,则有