机器学习算法/模型——线性回归

Robin_Pi

于 2020-02-21 13:13:04 发布

阅读量3.6k

点赞数

CC 4.0 BY-SA版权

分类专栏：机器学习（ML）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/Robin_Pi/article/details/104425568

线性回归

0. 本质和概论
- 0.1 本质
- 0.2 概念/术语
1. 假设函数
2. 损失函数：平方误差函数
3. 优化算法
- 3.1 梯度下降法：求解函数极值
- 3.2 标准方程（矩阵求解）
4.代码实例
- 4.1 模型训练
- 4.2 模型可视化（如何将学习好的模型画出来）
5. 模型分析与总结

0. 本质和概论

0.1 本质

线性回归：利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。
（最小二乘 = 平方）
概括地说，线性回归模型就是对所有特征添加一个权重，之后求和，最后再添加一个我们称为偏置项的常数，以此进行预测。（瞬间联想到神经网络）

0.2 概念/术语

线性回归模型是：利用线性函数对一个或多个自变量（x 或 (x₁,x₂,…x_k)）和因变量（y）之间的关系进行拟合的模型。

正确理解”线性“：直线、平面…
注意：“线性”的意思并非是 y 和 x 为直线关系！

线性函数的定义是：一阶（或更低阶）多项式，或零多项式。

当线性函数只有一个自变量时，y = f(x)，这里f(x) 的函数形式有三种：

f(x) = a + bx （a、b 为常数，且 b≠0）—— 一阶多项式；

f(x) = c (c为常数，且 c≠0) —— 零阶多项式；

f(x) = 0 —— 零多项式；

但如果有多个独立自变量，y=f(x1,x2,…,xk) 的函数形式则是：

f(x₁,x₂,…,x_k)=a+b₁x₁+b₂x₂+…+b_kx_k

也就是说，只有当训练数据集的特征是一维的时候，线性回归模型可以在直角坐标系中展示，其形式是一条直线。

结论:

特征是一维的，线性模型在二维空间构成一条直线；
特征是二维的，线性模型在三维空间中构成一个平面；
若特征是三维的，则最终模型在四维空间中构成一个体，以此类推。

注：如果不考虑空间维数，这样的线性函数统称为超平面。

注意：特征可以构造，也就是说只有一个特征 x，也可以变为多个：
在这里插入图片描述

回归
回归分析用于寻找最佳拟合线，使得尽可能多的数据点位于这条线附近（或这条线上）。
变量 y ：想要预测的变量
变量 y = 因变量 = 响应变量 = 目标 = 结果
自变量：用于预测y的变量
自变量 = 自变量X = 特征 = 属性
回归系数：回归线的斜率（一元）

回归系数 = 参数估计值 = 权重 = 斜率（一元）

注：当只存在一个预测变量(x)时，该预测变量的标准化回归系数也被称为相关系数 ，记作 r
拟合值：拟合得到的估计值 $\widehat{y}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。