最小二乘法 是指 根据测量数据,得到这组数据规律的公式表示,其原则是 误差的平方和最小。“二乘” 即为平方,最小二乘拟合是机器学习最简单也是最实用的方法之一。
最小二乘法是用于 模型逼近 和 曲线拟合 的常用手段。
上图表示根据一组数据 拟合直线的情况,最小二乘 一定程度上得到和数据最逼近的解。
用公式来表示:
根据上面的公式,针对直线方程 y = a0 x+a1,代入计算二次误差,分别对参数求偏导,能够得到:
将样本值(X,Y)代入即求得直线方程参数 (a0,a1) 的解。
最小二乘法 的几何意义是 高维空间中的一个向量在低维子空间的投影。
最小二乘法的代码:
/*
最小二乘法C++实现
参数1为输入文件
输入 : x
输出: 预测的y
*/
#include<iostream>
#include<fstream>
#include<vector>
using namespace std;
class LeastSquare{
double a, b;
public:
LeastSquare(const vector<double>& x, const vector<double>& y)
{
double t1=0, t2=0, t3=0, t4=0;
for(int i=0; i<x.size(); ++i)
{
t1 += x[i]*x[i];
t2 += x[i];
t3 += x[i]*y[i];
t4 += y[i];
}
a = (t3*x.size() - t2*t4) / (t1*x.size() - t2*t2); // 求得β1
b = (t1*t4 - t2*t3) / (t1*x.size() - t2*t2); // 求得β2
}
double getY(const double x) const
{
return a*x + b;
}
void print() const
{
cout<<"y = "<<a<<"x + "<<b<<"\n";
}
};
int main(int argc, char *argv[])
{
if(argc != 2)
{
cout<<"Usage: DataFile.txt"<<endl;
return -1;
}
else
{
vector<double> x;
ifstream in(argv[1]);
for(double d; in>>d; )
x.push_back(d);
int sz = x.size();
vector<double> y(x.begin()+sz/2, x.end());
x.resize(sz/2);
LeastSquare ls(x, y);
ls.print();
cout<<"Input x:\n";
double x0;
while(cin>>x0)
{
cout<<"y = "<<ls.getY(x0)<<endl;
cout<<"Input x:\n";
}
}
}
最小二乘法不同于梯度下降法,是用于解决现性问题的直接求解方法,而梯度下降法是解决非线性问题的迭代方法。
很多搞深度学习的童鞋可能对梯度下降情有独钟,而对最小二乘 呲之以鼻,这里不提倡,任何一种方法都试解决问题的一种思路而已,简单有效才是最好的,高大上有时候反而未必真是解决问题的思路。