线性回归理论部分

最新推荐文章于 2020-06-05 10:39:33 发布

原创最新推荐文章于 2020-06-05 10:39:33 发布 · 346 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#线性回归

tensorflow 专栏收录该内容

18 篇文章

订阅专栏

本文介绍了线性回归的基本原理，包括模型假设、损失函数定义及如何使用梯度下降法求解最优参数。通过实例展示了单特征与多特征情况下的线性模型。

一、线性回归

1 假设一个模型函数，初始化函数的参数

2 根据损失函数计算预测值与真实值的差值，求取使得损失函数最小值的参数

线性回归是由训练集得到一个映射关系，当给定待测样本X时，可以通过映射关系得到预测值y

X为特征向量，也为输出值

当X中只有一个特征值时，即X=｛X₁｝学习到的线性模型

当X存在n个特征值时，这时学习到的模型为

X={1,x1,x2,...,xn}

二、损失函数

为了得到线性模型hθ (X)，需要获得特征系数矩阵

θ=｛θ0，θ1，...，θn｝

计算特征系数，依靠损失函数

三、梯度下降法求解

在上面，找到了一个特征系数向量θ好坏的利用损失函数 J(θ)表示的是预测值与真实值的差值，当损失函数最小时，

预测值与真实值最接近，即线性拟合最好。

损失函数是关于θ的函数，最小的时候，此时取得的特征系数θ为模型的系数。

梯度下降就是一个不断地最小化损失函数的过程。

从图像上看，先初始化 θi为某个值，然后让θi沿着J(θ)在θi的偏导方向不断地走，直到走到底部收敛为止，

最后可以得到J(θ)最小时的θi的值。

这个不断迭代的过程犹如一个不断下山的过程，我们可以得到图中关于θi的迭代函数，α为步长。

参考：线性回归

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

red_ear

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

线性回归（一）：线性回归理论以及代码复现

hdsbdjsjsbs的博客

04-28

2119

本文主要是讲了线性回归的一些简单的必备的理论，以及sklearn中线性回归库的底层代码复现，水平有限，不喜勿喷！

18L1和L2正规化（正则化）

花梦飞的博客

11-25

1338

为了说明这个标准化的问题，我们以线性拟合数据举例，当然其他机器学习算法都可以类似的推广。在用线性一次方程拟合数据的时候，我们的训练误差可能很低，但是泛化能力比较好。但对于高次方程去拟合数据时，训练误差可能很小，但是泛化误差可能很低。在高次方程中起重要作用的就是那些高次项和其系数，所以我们想要让这些能力强的项变得不那么牛，这时候我们加入了惩罚机制，对其参数进行惩罚，就是我们的正则化项啦。当然

参与评论您还未登录，请先登录后发表或查看评论

斯坦福机器学习3之局部线性回归建模

MissCoder的博客

12-26

3306

**【模型引入】**当我们需要对某输入变量x进行预测时，若使用线性回归对问题进行建模，算法流程是这样的：首先：使用最小二乘法或者极大似然法，基于梯度下降或正规方程法求解模型参数theta,确定模型；最后：返回输入变量的预测值y= theta’ * x 然而当线性建模并不能很好地描述问题时，我们便不能再使用这种方式来对变量x进行预测了。举个简单例子，对于y=exp(x)的实际问题，若以y=the

第六章 线性回归 学习笔记下

moonlightpeng的博客

06-05

312

6-7 scikit-learn中的随机梯度下降法封装我们自己的SGD 所有的样本看一边，无法保证有的样本不能使用，将其索引打乱，全三分之一的够用，两倍的样本量肯定够用了 LinearRegression.py import numpy as np from .metrics import r2_score class LinearRegression: def __init__(self): """初始化Linear Regression模型""" ...

OPenCV3.2 图像的线性混合

one__dream的博客

10-06

442

最近一直在学OPenCV，正好学到图像的线性混合，我准备把其中的一些原理和注意点和大家分享下。原理：其中α的取值范围为0~1之间。注意点：输入的两幅图像一定要有相同的尺寸和类型函数说明：实现线性混合主要是利用OPenCV中的addWeighted函数。 void cv::addWeighted ( InputArray src1, double a

局部线性回归（Locally Weighted Linear Regression）

LeoDuo的专栏

10-08

6350

简单的线性回归有可能出现欠拟合的现象，这是由于数据可能不是

线性回归正则化

qq_38120760的博客

09-02

3604

前面我们对线性回归已经有了一个基本认识，接下来我们探讨正则化。首先对于只有一个特征的n个样本。。我们用直线去拟合效果如下。发现拟合效果不好。如果我们用二次曲线去拟合发现效果很好这里有一个问题，我们明明做的是线性回归这里怎么是曲线？其实很简单,在这里我们只是把一个特征变成了两个特征。把低维映射到了高维就是线性的。（但是这里的特征并不是独立的）。下面我们看看更高维的情...

机器学习之线性回归理论与代码实践

06-13

总的来说，线性回归是机器学习中不可或缺的一部分，它不仅提供了对数据直观的理解，也是其他复杂模型的基础，如岭回归、套索回归和弹性网络。通过理论学习和实践经验，我们可以更好地掌握这一工具，解决实际问题。

实验一-线性回归.docx

05-25

线性回归是一种基础而重要的统计学和机器学习方法，它被...总的来说，这个实验旨在帮助学习者从理论到实践全面理解线性回归，包括基本概念、数学原理、Python实现和优化算法，以提升其在数据分析和机器学习领域的技能。

PyTorch实现线性回归：从理论到代码.txt

10-24

在PyTorch框架下，线性回归的实现分为理论和代码实现两部分，首先介绍线性回归理论基础。 线性回归理论基础包含三个主要部分：线性回归方程、损失函数和梯度下降。线性回归方程形式简单，以 y = w*x + b 表示，其中...

基于spss的一元线性回归与多元线性回归案例.rar

10-30

一元线性回归和多元线性回归是统计学中常用的数据分析方法，它们在预测和探索变量间关系方面发挥着重要作用。本案例资料基于SPSS软件进行讲解，适合学习者进行实战练习。SPSS（Statistical Product and Service ...

线性回归原理和实现基本认识

热门推荐

追赶者的博客

04-28

7万+

一：介绍 线性回归在假设特证满足线性关系，根据给定的训练数据训练一个模型，并用此模型进行预测。先举个简单的例子；我们假设一个线性方程 Y=2x+1, x变量为商品的大小，y代表为销售量；当月份x =5时，我们就能根据线性模型预测出 y =11销量；对于上面的简单的例子来说，我们可以粗略把 y =2x+1看到回归的模型；对于给予的每个商品大小都能预测出销量；当然这个模型怎么获取到就是

断点分析法_局部线性回归_matlab

ncf的博客

07-11

1万+

本文介绍断点分析法在数据作假方面的应用局部线性回归的matlab实现

opencv中的线性变换

UESTC_C2_403的博客

05-30

2128

代码如下： #include "opencv2/highgui/highgui.hpp" #include "opencv2/imgproc/imgproc.hpp" #include "opencv2/opencv.hpp" #include "opencv2/core/core.hpp" #include using namespace std; using namespace cv; /

机器学习--线性回归4（线性拟合、局部线性拟合实战）

进击的菜鸟

11-01

1万+

前面三节，我们从最简单的一元线性回归到多元线性回归，讨论了，损失函数到底由那几部分组成（这点我觉很重要，因为它不仅仅存在线性回归中还存在其他机器学习中，因此有必要搞明白他，有兴趣的请看这篇文章），后面详细讨论了多元线性回归，主要介绍了多元线性回归的共线性问题，为了解决共线性问题引出了岭回归，然而岭回归存在缺点，因此又引出了lasso算法，此算法是解决共线性和选择特征很有效的方法（不懂的请看这篇文章...

回归：最佳拟合直线与局部线性回归

lijianping962464的博客

03-13

7383

回归是用来做什么的？回归可以做任何事，例如销售量预测或者制造缺陷预测。什么是回归？回归有线性回归和非线性回归，本篇文章主要讨论线性回归。回归的目的是预测数值型的目标值。最直接的办法是依据输入写出一个目标值的计算公式，即所谓的回归方程，可表示为：具体的做法是用回归...

机器学习（六）——局部加权线性回归（Locally weighted linear regression）

qq_31589695的博客

04-24

1万+

原文：http://cs229.stanford.edu/notes/cs229-notes1.pdf 考虑从x∈R中预测y的问题。下面最左边的图显示了将拟合到数据集的结果。我们看到数据并不是直线上的，所以拟合不是很好。取代原来的方法，如果我们加上一个额外的特征，并用来拟合数据，你会发现效果稍微好了那么一点（看中间这幅图片）。似乎可以天真地认为，我们添加的特征越多越好。然而，添...

局部线性回归

liang23333的博客

01-17

3053

线性回归就是对整个数据集进行训练，就比如说拟合成一条直线，参数选择所依据的标准就是而局部线性回归是对要预测的点的左右区域进行拟合，也就是根据它的周围情况拟合成一条直线，而不是整个数据集。它是非参数学习方法，是因为不能确定参数的值，而是对于某个预测，求得一组参数。参数随着要预测的x变化而变化。它的Loss function是这里的w(i) 如果|x(i)-x|约等于

局部加权线性回归（附实战代码python）

ZHE

05-06

1万+

1. 前言：我们知道线性回归的一个问题就是欠拟合，将不能取得很好的预测效果。因为它是具有最小均方误差的无偏估计。解决这个问题的方法就是允许在估计中一些偏差。其中一个非常有效的方法就是局部加权线性回归（LWLR）。2. 算法思想： 2.1. 比较线性回归： 2.2. 局部加权线性回归：（使用高斯核权重） ...

多元线性回归理论

最新发布

04-11

### 多元线性回归理论详解 #### 数学模型公式多元线性回归的目标是建立一个线性方程来描述多个自变量 \(X_1, X_2, \ldots, X_p\) 对应于因变量 \(Y\) 的变化关系。该模型可以表示为： \[ Y = \beta_0 + \beta_1X_1 + \beta_2X_2 + \cdots + \beta_pX_p + \epsilon \] 其中，\(Y\) 是因变量，\(X_i (i=1,\dots,p)\) 表示各个自变量，\(\beta_0\) 是截距项，\(\beta_i (i=1,\dots,p)\) 是各自变量对应的系数，而 \(\epsilon\) 则代表随机误差[^1]。为了估计这些参数，通常采用最小二乘法（OLS），即寻找使残差平方和最小的一组参数值。具体而言，目标是最小化下述函数： \[ SSE = \sum_{i=1}^{n}(y_i - (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + \cdots + \beta_px_{ip}))^2 \] 这里 \(n\) 为样本数量，\(y_i\) 和 \(x_{ij}\) 分别对应第 \(i\) 个观测中的因变量和各自变量取值[^1]。 #### 多重共线性的检测与处理在实际应用中，可能存在某些自变量之间高度相关的情况，这被称为多重共线性。它会使得回归系数的估计变得不稳定，并可能导致错误结论。为此引入了两个指标：容忍度（Tolerance）以及方差膨胀因子（Variance Inflation Factor, VIF）。 - **容忍度**定义为某自变量与其他所有自变量做回归后的 R² 值之补数，即 Tolerance = 1-R²。当容忍度低于 0.1，则表明存在显著的多重共线性问题。 - **VIF**则是容忍度的倒数，因此如果某个自变量的 VIF 超过 10，则同样提示可能存在问题[^2]。 #### 正则化的概念及其作用为了避免过度拟合数据集或者解决高维空间下的计算难题，在传统多元线性回归基础上增加了惩罚项形成新的优化目标函数。常见的两种形式分别是 L1 正则化（也叫拉普拉斯先验或绝对值收缩）、L2 正则化（岭回归或二次范数约束）。特别是对于 L1 正则化来说，由于其等值面形状特殊往往能够迫使部分权重降为零从而实现自动特征选择的效果；相比之下，尽管 L2 不具备这种能力但它有助于平滑解向量减少波动幅度[^3]。 ```python from sklearn.linear_model import Ridge, Lasso import numpy as np # Example of applying regularization techniques using scikit-learn library. X = [[0], [1], [2]] y = [0, 1, 2] ridge_reg = Ridge(alpha=.5) lasso_reg = Lasso(alpha=.1) ridge_reg.fit(X, y) lasso_reg.fit(X, y) print("Ridge coefficients:", ridge_reg.coef_) print("Lasso coefficients:", lasso_reg.coef_) ``` 上述代码展示了如何利用 Python 中 `scikit-learn` 库分别实施岭回归(L2正则化)及套索回归(L1正则化)，帮助理解不同类型的正则化技术对最终结果的影响差异。