机器学习读书笔记之1 - 最小二乘法

最新推荐文章于 2025-10-13 08:59:36 发布

原创最新推荐文章于 2025-10-13 08:59:36 发布 · 1.1k 阅读

3 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #读书笔记 #最小二乘法 #最小二乘 #最小二乘拟合

机器学习 | 计算机视觉专栏收录该内容

37 篇文章

订阅专栏

本文是机器学习读书笔记的第一部分，主要介绍最小二乘法。最小二乘法是一种误差平方和最小化的曲线拟合方法，常用于模型逼近。通过公式解析和几何意义阐述，展示了如何求解直线方程的参数。文中提醒，虽然深度学习中梯度下降常见，但不应忽视简单有效的最小二乘法。

最小二乘法 是指根据测量数据，得到这组数据规律的公式表示，其原则是误差的平方和最小。“二乘” 即为平方，最小二乘拟合是机器学习最简单也是最实用的方法之一。

最小二乘法是用于 模型逼近和曲线拟合 的常用手段。

上图表示根据一组数据拟合直线的情况，最小二乘一定程度上得到和数据最逼近的解。

用公式来表示：

根据上面的公式，针对直线方程 y = a0 x+a1，代入计算二次误差，分别对参数求偏导，能够得到：

将样本值（X,Y）代入即求得直线方程参数 (a0,a1) 的解。

最小二乘法的几何意义是 高维空间中的一个向量在低维子空间的投影。

最小二乘法的代码：

/*
 最小二乘法C++实现
 参数1为输入文件
 输入 ： x
 输出： 预测的y  
 */
#include<iostream>
#include<fstream>
#include<vector>
using namespace std;

class LeastSquare{
    double a, b;
public:
    LeastSquare(const vector<double>& x, const vector<double>& y)
    {
        double t1=0, t2=0, t3=0, t4=0;
        for(int i=0; i<x.size(); ++i)
        {
            t1 += x[i]*x[i];
            t2 += x[i];
            t3 += x[i]*y[i];
            t4 += y[i];
        }
        a = (t3*x.size() - t2*t4) / (t1*x.size() - t2*t2);  // 求得β1 
        b = (t1*t4 - t2*t3) / (t1*x.size() - t2*t2);        // 求得β2
    }

    double getY(const double x) const
    {
        return a*x + b;
    }
    void print() const
    {
        cout<<"y = "<<a<<"x + "<<b<<"\n";
    }

};

int main(int argc, char *argv[])
{
    if(argc != 2)
    {
        cout<<"Usage: DataFile.txt"<<endl;
        return -1;
    }
    else
    {
        vector<double> x;
        ifstream in(argv[1]);
        for(double d; in>>d; )
            x.push_back(d);
        int sz = x.size();
        vector<double> y(x.begin()+sz/2, x.end());
        x.resize(sz/2);
        LeastSquare ls(x, y);
        ls.print();
        
        cout<<"Input x:\n";
        double x0;
        while(cin>>x0)
        {
             cout<<"y = "<<ls.getY(x0)<<endl;
             cout<<"Input x:\n";
         }
     }
}

最小二乘法不同于梯度下降法，是用于解决现性问题的直接求解方法，而梯度下降法是解决非线性问题的迭代方法。

很多搞深度学习的童鞋可能对梯度下降情有独钟，而对最小二乘呲之以鼻，这里不提倡，任何一种方法都试解决问题的一种思路而已，简单有效才是最好的，高大上有时候反而未必真是解决问题的思路。