最小二乘法-优快云博客

本文链接：https://blog.youkuaiyun.com/nanxl1/article/details/135020744

本文介绍了最小二乘法，其指残余误差平方和最小。阐述了该方法的应用，如回归分析，回顾了其历史。详细讲解了最可信赖估计的原理、运算过程，包括方程推导、矩阵推导等，还提及非线性参数的最小二乘运算，最后说明了精度估计相关内容。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最小二乘法

最小二乘法是指: 残余误差平方和最小

最小二乘法应用(至少)

$\begin{cases} 最可信赖估计\\ 回归分析\\ 组合数据的测量处理\\ \end{cases}$

本质一致

回归分析

回归: 寻找变量与变量之间的关系

最小二乘法历史

高斯提出了计算方法，奥地利天文学家重新发现了谷神星
1809年，最小二乘法发表于《天体运动论中》
1806年，勒让德发表最小二乘法于《计算彗星轨道的新方法》
1829年，高斯给出最小二乘法的最优证明，定名为高斯—马尔科夫定理
最初用于计算(回归)谷神星轨迹(回归分析)

系统指标

$\begin{cases} 量程\quad测量范围\\ 分辨力\quad灵敏度\\ 时漂\quad温漂\\ 重复性\quad线性度\quad迟滞\quad精度\quad综合误差小\\ 系统误差\quad随机误差小\\ \end{cases}$

反映系统误差的指标: 线性度、迟滞
反映随机误差的指标: 重复性
实测和理想对比

最可信赖估计

本质: 最佳函数匹配

原理

在间接测量中，为了确认 $t$ 个未知的估计量, 可对与这 $t$ 个未知量有函数关系的直接测量的量 $Y$ 进行 $n$ 次测量, 得到测量数据 $l_1,l_2,...,l_n$ , 设其函数关系如下:
$\begin{aligned} \begin{cases} Y_1=f_1(X_1,X_2,...,X_t)\\ Y_2=f_2(X_1,X_2,...,X_t)\\ ...\\ Y_n=f_n(X_1,X_2,...,X_t)\\ \end{cases} \end{aligned}$

$n = t$ 时，直接求得测量结果
为减小随机误差影响，可增加测量次数提高测量精度

设直接量 $Y_1,Y_2,...,Y_n$ 的估计量分别为 $y_1,y_2,...,y_n$ ,则存在如下关系：
$\begin{aligned} \begin{cases} y_1=f_1(x_1, x_2,...,x_n)\\ y_2=f_2(x_1, x_2,...,x_n)\\ ...\\ y_n=f_n(x_1, x_2,...,x_n)\\ \end{cases}\quad\Rightarrow\quad \begin{cases} v_1=l_1-y_1\\ v_2=l_2-y_2\\ ...\\ v_n=l_n-y_n\\ \end{cases}\quad\Rightarrow\quad \begin{cases} v_1=l_1-f_1(x_1,x_2,...,x_t)\\ v_2=l_2-f_2(x_1,x_2,...,x_t)\\ ...\\ v_n=l_n-f_n(x_1,x_2,...,x_t)\\ \end{cases} \end{aligned}$

残余误差的平方和最小
最小二乘原理是在测量误差为无偏、正态分布并且相互独立的条件下推理出来的，在不严格服从正态分布的情况下也可以近似使用
非线性参数的问题可借助于级数展开的方法，在某一区域近似地作为线性问题进行处理

运算过程

方程推导

$\begin{cases} u_1=l_1-(a_{11}x_1+a_{12}x_2+...+a_{1t}x_t)\\ u_2=l_2-(a_{21}x_1+a_{22}x_2+...+a_{2t}x_t)\\ ...\\ u_n=l_n-(a_{n1}x_1+a_{n2}x_2+...+a_{nt}x_t)\\ \end{cases}$

在等精度测量中，应满足， $u_1^2+u_2^2+...+u_n^2=\sum_{i=1}^nu_i^2$ 最小，因此对残余误差的平方和 $\sum_{i=1}^nu_i^2$ 求导数，并令其为零, 有:
$\begin{aligned} \frac{\partial(\sum_{i=1}^nu_i^2)}{\partial x_1}&=-2\{{\sum_{i=1}^na_{i1}l_i}-(x_1\sum_{i=1}^na_{i1}a_{i1}+\sum_{i=1}^nx_2a_{i1}a_{i2}+...+\sum_{i=1}^nx_na_{i1}a_{in})\}=0\\ \frac{\partial(\sum_{i=1}^nu_i^2)}{\partial x_2}&=-2\{{\sum_{i=1}^na_{i2}l_i}-(x_1\sum_{i=1}^na_{i2}a_{i1}+\sum_{i=1}^nx_2a_{i2}a_{i2}+...+\sum_{i=1}^nx_na_{i2}a_{in})\}=0\\ &..\\ \frac{\partial(\sum_{i=1}^nu_i^2)}{\partial x_t}&=-2\{{\sum_{i=1}^na_{it}l_i}-(x_1\sum_{i=1}^na_{it}a_{i1}+\sum_{i=1}^nx_2a_{it}a_{i2}+...+\sum_{i=1}^nx_na_{it}a_{in})\}=0\\ \end{aligned}$
且二阶导数大于零:
$\begin{aligned} \frac{\partial^2(\sum_{i=1}^nu_i^2)}{\partial x_1^2}&=2\sum_{i=1}^na_{i1}a_{i1}>0\\ \frac{\partial^2(\sum_{i=1}^nu_i^2)}{\partial x_2^2}&=2\sum_{i=1}^na_{i2}a_{i2}>0\\ &...\\ \frac{\partial^2(\sum_{i=1}^nu_i^2)}{\partial x_t^2}&=2\sum_{i=1}^na_{it}a_{it}>0\\ \end{aligned}$

由一阶导数为零有:
$\begin{aligned} {\sum_{i=1}^na_{it}l_i}-&(x_1\sum_{i=1}^na_{it}a_{i1}+\sum_{i=1}^nx_2a_{it}a_{i2}+...+\sum_{i=1}^nx_na_{it}a_{in})=0\\ 最后有&\\ &a_{n1}v_1+a_{n2}v_2+...+a_{nt}v_t=0\\ \end{aligned}$
即:
$\begin{aligned} &a_{11}v_1+a_{21}v_2+...+a_{n1}v_t=0\\ &a_{21}v_1+a_{22}v_2+...+a_{n2}v_t=0\\ &...\\ &a_{n1}v_1+a_{n2}v_2+...+a_{nt}v_t=0\\ &矩阵形式:\\ &A^TV=0\\ \end{aligned}$

矩阵推导

在这里插入图片描述
$\begin{aligned} &\begin{cases} V=L-A\hat X\\ A^TV=0\quad 一阶导数为零\\ \end{cases}\quad\Rightarrow\quad A^TL-A^TA\hat X=0\\ &令\quad C=A^TA\\ &C\hat X=A^TL\\ &\hat X=C^{-1}A^TL\\ \end{aligned}$

不等精度

加权残余精度最小

在这里插入图片描述

例题

在这里插入图片描述

权值= $\frac{1}{\sigma^2}$

非线性参数的最小二乘运算

在这里插入图片描述

二维函数 $f (x, y)$ 在 $x_0,y_0$ 处泰勒展开保留一阶项
$\begin{aligned} &f(x,y)\rightarrow x_0,y_0处展开\\ &f(x,y)=f(x_0,y_0)+\frac{\partial f(x_0,y_0)}{\partial x}(x-x_0)+\frac{\partial f(x_0,y_0)}{\partial y}(y-y_0) \end{aligned}$

精度估计

对测量数据最小二乘法处理的最终结果，不仅要给出待求量的最可信赖估计值，而且还要确定其可信赖程度，即应给出所得估计量的精度
直接测量数据的精度估计(用标准差衡量)
- 等精度测量
- 不等精度测量
最小二乘估计量的精度估计
- 等精度测量
  
  同乘d 左边求和=右边求和
假设有: (假设是有唯一解且成立的)(总是有一个唯一解使假设成立)

这样就有

x1的方差就是:

$\sigma$ 是测量误差, 进一步有(未证明, 结论)

最神奇的是 d11-dnn是C矩阵的逆矩阵对角线上的值

例题
- 不等精度测量