学习机器学习之线性回归的概念

最新推荐文章于 2023-03-27 21:07:53 发布

翻译最新推荐文章于 2023-03-27 21:07:53 发布 · 481 阅读

CC 4.0 BY-SA版权

原文链接：https://blog.youkuaiyun.com/hsk6543210/article/details/88049160?depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-2&utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-2

文章标签：

#机器学习 #python

机器学习专栏收录该内容

5 篇文章

订阅专栏

本文深入解析线性回归原理，探讨如何通过最小化均方误差来确定最佳参数，介绍梯度下降法、随机梯度下降法及牛顿法等优化方法，并对比不同方法的优劣。此外，还详细阐述了线性回归的常见评价指标。

线性回归的理解：

在二维平面内，有一些数据集，分别对应的有x值和y值，然后x与y之间有对应的函数关系。而我们说的线性回归，就是拟合出一条直线段，让尽可能多的数据集在直线段附近，拟合出最好的一条线段。
描述y和x之间关系的函数表达式我们可以写为：
𝑓(𝑥)=𝜃0+𝜃1𝑥1+𝜃2𝑥2+…+𝜃𝑑𝑥𝑑
如何确定好𝜃 的值，使得𝑓(𝑥) 尽可能接近y的值。均方误差是回归中常用的性能度量：
在这里插入图片描述找到合适的𝜃 值，让𝐽(𝜃)的值最小
对于 $hθ(x(i)−y(i))^2$ 而言，为了可以找到最优值θ，将其变为凸函数，这样子只要找到合适的学习率，不断迭代，即可找到全局最优值。

优化方法：

梯度下降法是一种迭代算法．选取适当的初值x(0)x(0)，不断迭代，更新x的值，进行目标函数的极小化，直到收敛．由于负梯度方向是使函数值下降最快的方向，在迭代的每一步，以负梯度方向更新x的值，从而达到减少函数值的目的。
在这里插入图片描述用这个方法，参数在每个数据点上同时进行了移动，迭代了参数𝜃，因此被称为批梯度下降法。
𝜃=𝜃+𝛼(𝑦(𝑖)−𝑓𝜃(𝑥)(𝑖))𝑥(𝑖)
这个算法成为随机梯度下降法，随机梯度下降法的好处是，当数据点很多时，运行效率更高；缺点是，因为每次只针对一个样本更新参数，未必找到最快路径达到最优值，甚至有时候会出现参数在最小值附近徘徊而不是立即收敛。但当数据量很大的时候，随机梯度下降法经常优于批梯度下降法。