线性回归模型sklearn.LinearRegression（）原理解析

最新推荐文章于 2025-03-10 14:00:00 发布

原创

最新推荐文章于 2025-03-10 14:00:00 发布 · 3.1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#机器学习 #python

本文介绍了sklearn线性回归模型的原理，基于最小二乘法的线性回归用于数据拟合，寻找数据间的规律。线性回归模型通过调整直线的斜率和截距最小化残差平方和RSS。讨论了MSE作为优化目标，以及当涉及多个变量时如何使用最小二乘法和梯度下降算法求解函数系数。

一、模型原理

Linear Rgegrssion基于最小二乘法的线性回归。是机器学习算法里面的基本算法，在sklearn.linear_model 的包里面。它能解决的问题是通过数据拟合，从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在。例如对于房价的预测。

二、线性回归的原理表示

我们先从最简单的函数看起，在只有一个变量的情况下，线性回归可以用方程：y = ax+b 表示。

Linear Regression模型会去不断的去调整下图直线的斜率和截距，使得残差平方和Residual sum of Squares（RSS）最小。

这里残差平方是指下图中同一个x坐标下，实际点位置的y轴数值减去拟合直线上y轴数值的平方，将所有点的残差平方加起来就出来了RSS。

将RSS处以数据数量就得出了MSE，这是一个重要的参数。Model Fitting的目标就是最小化MSE。

一级行函数我们可以求导，那很多个变量的多级函数怎么求函数的系数呢？

一个是用最小二乘法（Ordinary Least Square），拟合一个带有系数** w = (w1, ..., wp) **的线性模型去最小化其预测结果与实际结果的残差平方和。它的公式为：

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。