机器学习算法笔记——线性回归

异人无双

已于 2024-04-01 10:01:15 修改

阅读量1.2k

点赞数 23

分类专栏：机器学习文章标签：算法机器学习

于 2024-03-31 23:30:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/sinat_34326100/article/details/137211797

版权

本文详细介绍了线性模型的概念，包括一元和多元线性回归，以及回归分析的作用。重点讲解了最小二乘法、极大似然估计和梯度下降在参数估计中的应用，讨论了正则化在多元线性回归中的作用，如岭回归、Lasso回归和ElasticNet。同时，文章提到了在实际应用中如何使用这些方法，如scikit-learn库的示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

📖概念

字面意思就是建立线性模型进行回归分析。

线性回归可以是一维的（如一元线性回归），也可以是多维的（如多元线性回归），涉及多个自变量。通过拟合一条直线（二维空间）或一个超平面（多维空间）来进行预测。

❓什么是线性模型

线性模型的核心思想是建立自变量（特征）与因变量（预测值）之间的线性关系，即当自变量发生变化时，因变量也会按照一个固定的比率发生变化，这个比率就是模型的权重，在回归方程中也叫回归系数。

假设数据有d维的特征，它们的线性组合符合公式：

$f(x) = w_1x_1 + w_2x_2 + ... + w_dx_d + b$ ，一个d元一次函数

简写一下，用向量形式表示：

$f(x) = w^Tx+ b$ ，输出f(x)是输入特征的一个仿射变换①

这里的w^T表示权重向量（行向量），x表示特征列向量（列向量），截距b是偏置项；转置T的意义是把列向量w转为行向量（类似矩阵乘法），使w^Tx结果为标量，方便与b相加。

狭义的线性模型如上所述，指的是自变量上不可能有高次项，自变量与标签之间不能存在非线性关系的模型；广义的线性模型包括岭回归、lasso回归、Elastic Net、逻辑回归、线性判别分析等。

❓什么是回归分析

为一个或多个自变量与因变量之间的关系建模的方法，预测因变量的数值。

回归经常用来表示输出与输出之间的关系。

🎲参数估计

机器学习求解参数的过程被称为参数估计。

线性回归的核心是求解最佳拟合曲线，对应到模型本身就是求解最优的w和b，使得新样本预测的误差尽可能小。什么情况下模型的参数最优呢？肯定是模型质量最优的时候，因此引入模型常用的性能度量——损失函数。

损失函数能量化实际值与预测值的差距，损失越小，模型自然越优。

线性回归本质是一个最优化问题，存在解析解②。

❎最小二乘法

回归任务中最常用的损失函数是均方误差（mean squared error），基于均方误差最小化来求解的方法称为“最小二乘法”。几何意义是，找到一条直线，使所有样本到直线上的欧式距离之和最小。

对于一元线性回归：

损失函数的计算公式为 $E(w,b) = \mathop{\arg\min}\limits_{(w,b)}\sum^{m}_{i=1}(f(x_i)-y_i)^2$

这里E(w,b)是关于w和b的凸函数③，因此局部最优解就是全局最优解，可以在导数为0时找到。

分别对w和b求导，然后令结果为0，可以得到w和b的最优解。

对于多元线性回归：

先将偏置b合并到参数w中（合体为 $\hat{w}$ ），合并方法是在包含所有参数的矩阵中增加一列。把损失

最小化的公式转换为 $\hat{w}* = \mathop{\arg\min}\limits_{\hat{w}}(y-X\hat{w})^T(y-X\hat{w})$

对

最低0.47元/天解锁文章

博客等级

码龄9年

6
原创

94
点赞

254
收藏

59
粉丝

关注

私信

热门文章

分类专栏

机器学习 3篇
工具 1篇
mySQL 1篇

展开全部收起

上一篇：: 机器学习算法笔记——KNN

最新评论

Win10 Python yt-dlp下载youtube视频 | 安装使用详细教程
JCFIGGFFDWE: 我想问一下，ytdlp和ffempeg都配置好后，通过ytdlp指令，在下载过程中合并音视频比如（yt-dlp -f 625+140 https://www.youtube.com/watch?v=-4dektCi80c&t=54s--merge-output-format mp4），和下载后通过ffempeg指令合并音视频，比如（ffmpeg -video.part -audio.m4a -c:v copy -c:a aac -strict experimental output.part），这两种方式是否有区别?在下载后通过ffempeg来合并视频是否有损视频质量？
Win10 Python yt-dlp下载youtube视频 | 安装使用详细教程
只吹45°风: 写的很实用，赞一个
机器学习高频知识点——1. 正则化
优快云-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
Win10 Python yt-dlp下载youtube视频 | 安装使用详细教程
m0_74182056: 请问yt-dlp可以下载视频的波峰波谷吗
Win10 Python yt-dlp下载youtube视频 | 安装使用详细教程
xt19880314: 用了，一直被拒绝····

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。