从0开始手撕线性回归

最新推荐文章于 2025-06-04 14:32:55 发布

33好好写代码

最新推荐文章于 2025-06-04 14:32:55 发布

阅读量225

点赞数 2

分类专栏：亿些些笔记📒 文章标签：线性回归 python 机器学习

本文链接：https://blog.youkuaiyun.com/weixin_53895111/article/details/140509401

版权

线性回归

在我们开始考虑如何用模型拟合（fit）数据之前，我们需要确定一个拟合程度的度量。损失函数（loss function）能够量化目标的实际值与预测值之间的差距。

解析解：能用公式表达出来的解（对问题的限制很严格）

即使在我们无法得到解析解的情况下，我们仍然可以有效地训练模型。在许多任务上，那些难以优化的模型效果要更好。因此，弄清楚如何训练这些难以优化的模型是非常重要的。

梯度下降

线性回归优化方法：梯度下降

小批量随机梯度下降：

b是batch size

随机采样b个样本

最简单的用法是计算损失函数关于模型参数的导数

但实际中的执行可能会非常慢：因为在每一次更新参数之前，我们必须遍历整个数据集。因此，我们通常会在每次需要计算更新的时候随机抽取一小批样本，这种变体叫做小批量随机梯度下降

总结：

梯度下降是不断沿着反梯度方向更新参数求解
小批量随机梯度下降是深度学习的默认解法
重要超参：batch size和lr

代码实现

从0开始手撕：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

33好好写代码

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

手撕机器学习01-线性回归

blowfire123的博客

11-23

4982

线性回归定义设房屋的面积为，房龄为，售出价格为。我们需要建立基于输入和来计算输出的表达式，也就是模型（model）。顾名思义，线性回归假设输出与各个输入之间是线性关系：其中和是权重（weight），是偏差（bias），且均为标量。它们是线性回归模型的参数（parameter）。模型输出是线性回归对真实价格的预测或估计。参数更新：在上式中，代表每个小批量中的样本个数（批量大小，batch size），称作学习率（learning rate）并取正数。需要强调的是，这里的批量大小和学习率

手撕：线性回归

流的博客

12-30

353

1.一元线性回归 2.多元线性回归

参与评论您还未登录，请先登录后发表或查看评论

手撕算法_线性回归

weixin_44414593的博客

07-27

256

线性回归基本原理&公式用这种线性方法去逼近真实值。损失函数：最小均方误差就是要最小化损失函数求解方法 1.梯度下降法中间推导我就不写了，太简单，大脚趾头都能推。之后就是梯度下降法了。 ...

手撕机器学习线性回归

lucklydog123的博客

11-23

286

import numpy as np def linearRegression(data_X,data_Y,learningRate,loopNum): W = np.zeros(shape=[1, data_X.shape[1]]) # W的shape取决于特征个数，而x的行是样本个数，x的列是特征值个数 # 所需要的W的形式为行=特征个数，列=1 这样的矩阵。但也可...

机器学习-线性回归【手撕】

weixin_43186779的博客

02-02

1771

回归是一种应用广泛的预测建模技术，这种技术的核心在于预测的结果是连续型变量。决策树，随机森林，支持向量机的分类器等分类算法的预测标签是分类变量，多以{0，1}来表示，而无监督学习算法比如PCA，KMeans的目标根本不是求解出标签，注意加以区别。

手撕线性回归

weixin_40777649的博客

03-04

188

【代码】手撕线性回归。

【机器学习】手撕多元线性回归

CXY819394的博客

01-26

928

学习笔记#线性回归模型是机器学习的入门经典模型多元线性回归模型的原理是什么，今天来梳理一下，文章末尾复现sklearn中的LinearRegression。

手撕多元线性回归

神奇海螺万岁

04-16

359

多元线性回归 之前做了一元线性回归 但是影响因素往往不是一个，而是多个，有x1、x2、x3、……、xn 线性方程方程也有多个未知数x以及相对应的系数β y = β0 + β1x1 + β2x2 + β3x3 + … + βnxn + ε 矩阵式大写的X和Y代表了x和y的集合 Y=[y1y2⋮yn]Y=\begin{bmatrix}y_1\\y_2\\\vdots\\y_n\end{bmatrix}Y=⎣⎢⎢⎢⎡y1y2⋮yn⎦⎥⎥⎥⎤ X=[1x11⋯x1p1x21⋯x2p⋮⋮⋱⋮1xn1

机器学习算法手撕系列(一)----回归算法

huhuo123456的博客

07-24

1089

一.回归算法是啥子? 回归算法是一种有监督算法(有监督是指有确定标签(Y)) 用来建立“解释”变量(自变量X)和观测值(因变量Y)之间的关系；从机器学习的角度来讲，用于构建一个算法模型(函数)来做属性(X)与标签(Y)之间的映射关系，在算法的学习过程中，试图寻找一个函数使得参数之间的关系拟合性最好。回归算法中算法(函数)的最终结果是一个连续的数据值，输入值(属性值)是一个d维度的属性(数值向量...

C和Python手撕机器学习算法1

08-03

2.1 读取csv文件数据 2.2 数据K折交叉验证 2.5 555.2 121.4 2.1 2.5.000 555.2.000 121.4.000 2.1.0

机器学习复习（2）——线性回归&SGD优化算法

在深度学习的路上不断探索

01-30

1005

机器学习线性回归算法与SGD优化算法

手撕机器学习系列一---线性回归（np，torch分别实现）

qq_37395293的博客

04-26

1873

手撕机器学习系列一—线性回归（np，torch分别实现）一、前言虽然前几个系列都还没做完，但是最近面试发现很多地方都开始要求手撕xxx了，周围同学也有些笔试题开始考这东西了，因此再开一坑，之后慢慢填。二、问题背景随便给个函数 y=4.5∗x1+2∗x3+5y = 4.5*x_1 + 2*x_3 + 5y=4.5∗x1+2∗x3+5，给你一些列数据和label预测这里的三个系数三、np实现 import numpy as np from sympy import true # 生成数据集 n

深度学习实践1：手撕线性回归

white_0629的博客

08-31

175

random用于随机数生成，torch用于深度学习框架。函数用于生成合成数据。它接受权重w、偏置b和样本数量作为输入，并生成服从正态分布的特征X和对应的标签y。标签y由特征X和权重w以及偏置b计算得到，然后添加了服从正态分布的噪声。函数用于生成小批量数据。它接受批量大小batch_size、特征features和标签labels作为输入，并返回一个生成器，每次生成一个批量的特征和标签。函数内部通过随机打乱样本的索引，然后按照批量大小分割数据。

深度学习(tensorflow版本)（一）-----拟合y=w*x+b,从线性回归说起逻辑回归与FM（含推导、手撕及Python和scala代码）

不负如来不负卿

08-21

2899

#Ref: https://www.beibq.cn/book/cw0v22-1583 import tensorflow as tf import numpy as np x_data = np.float32(np.random.rand(2,100)) #2行100列 y_data = np.dot([0.100,0.200], x_data) + 0.300 #1行2列　×　2行100...

线性回归与逻辑回归的原理及推导

HouDouZhou的博客

05-09

1303

线性回归 线性回归使用线性模型去拟合数据集，进行预测。线性回归的预测函数的一般形式为： f(x)=Σi=0nwixi+b f(\bold x) = \Sigma_{i=0}^n w_ix_i +b f(x)=Σi=0nwixi+b 用xi\bold x_ixi表示第i个样本的特征，如果样本有m个特征，则xi\bold x_ixi为一个m为特征向量xi=[x1(i) x2(i)&...

线性回归算法思路总结(详细)

一念执着

03-27

9341

机器学习的分类（下边都是监督学习）监督学习分类回归无监督学习聚类降维半监督学习强化学习 机器学习（监督）的基本概念 机器学习，就是让电脑模仿人进行学习人在做任何事，也需要学习，比如说考试，需要看文档或者查资料，再或者有人传授。那么这个人在文档中、资料中、听课中，得到一个一个个的问题，以及这些问题所对应的正确答案，对自己进行训练。训练完毕之后，人就会从里边得到一些...

使用 `\033` 方式设置终端字体颜色

程序员黄老师的精品课！

05-30

353

ANSI 转义序列是一组特殊的字符序列，用于控制终端的显示属性，如颜色、光标位置等序列通常以\033[开始，后跟一个或多个参数，最后以m结束。

PAT-乙级JAVA题解(更新中...)