线性代数——最小二乘法和投影矩阵

文章讲解最小二乘法拟合曲线的性质及其与投影矩阵的联系。以拟合直线为例,通过求误差平方和最小得到最佳拟合直线。从高维视角将其转换为矩阵形式 Ax=b-e,当 Ax=b 无解时,拟合最接近 b 的向量即其投影,给出矩阵算法求最佳拟合系数,还提及计算可能出现的问题。

最小二乘法是统计学中重要的概念,这篇文章将讲解它拟合曲线的性质以及它与投影矩阵的联系

拿最小二乘法拟合直线来举例

将误差的平方和作为总误差,总误差最小时可求得最佳拟合直线

若设y为ax+b,分别对a和b求导,因为这种函数大多为凹函数,所以取偏导为0时有极值,这里不再展开。

这种求误差方式是从一维图像上求向量模的最小值,但我们可从高纬度来审视这种方法,先把y-yi列出来

ax1+b=y1-e1

ax2+b=y2-e2

ax3+b=y3-e3

ax4+b=y4-e4

行列式?那我们可以把它转换成矩阵

 

这不就是Ax=b吗,更准确的说y1,y2,y3,y4是我们的拟合对象,e1,e2,e3,e4是误差,这个公式是Ax=b-e

若Ax=b有解则e=0,此时的x就是我们所需的答案,但往往数据集要远超变量的数目,b在列空间之外,我们没法通过空间内的向量去拟合空间外的向量,所以我们要去拟合最接近b的向量,如果拿二维平面(列空间)和三位向量(b)来举例,最接近b的向量就是b在平面上的投影,此时e^2最小,它就是点到平面的最短距离的平方。

现在假设Ax-b垂直于列空间展开的平面,即Ax-b在A的零空间中,故AT(Ax-b)=0

ATAx=ATb—>x=(ATA)^-1*ATb

此时x中的系数即为最佳拟合系数,这种矩阵算法给计算机提供了一个快速计算系数的方法,但计算上还是可能出现问题,设Ax=0的解为x1,则x1也是ATAx=0的解,同时ATAx=0的解也是xTATAx=0,(Ax)^2=0的解。所以rank(A)=rank(ATA),对m*n矩阵(n>m)时以及A不可逆时,ATA不可逆,也就是说没法直接求解。但ATAx=ATb中的x必定存在,因为b的范围必在AT的零空间和A列空间的线性组合中,设零空间向量x0,b=Ax+x0,ATb=ATAx+ATx0=ATAx

 

转载于:https://www.cnblogs.com/matrixmlpforever/p/10963240.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值