学习机器学习之线性回归的概念

本文深入解析线性回归原理,探讨如何通过最小化均方误差来确定最佳参数,介绍梯度下降法、随机梯度下降法及牛顿法等优化方法,并对比不同方法的优劣。此外,还详细阐述了线性回归的常见评价指标。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

线性回归的理解:

在二维平面内,有一些数据集,分别对应的有x值和y值,然后x与y之间有对应的函数关系。而我们说的线性回归,就是拟合出一条直线段,让尽可能多的数据集在直线段附近,拟合出最好的一条线段。
描述y和x之间关系的函数表达式我们可以写为:
𝑓(𝑥)=𝜃0+𝜃1𝑥1+𝜃2𝑥2+…+𝜃𝑑𝑥𝑑
如何确定好𝜃 的值,使得𝑓(𝑥) 尽可能接近y的值。均方误差是回归中常用的性能度量:
在这里插入图片描述找到合适的𝜃 值,让𝐽(𝜃)的值最小
对于(hθ​(x(i)−y(i))2(hθ​(x(i)−y(i))^2(hθ(x(i)y(i))2而言,为了可以找到最优值θ,将其变为凸函数,这样子只要找到合适的学习率,不断迭代,即可找到全局最优值。

优化方法:

梯度下降法是一种迭代算法.选取适当的初值x(0)x(0),不断迭代,更新x的值,进行目标函数的极小化,直到收敛.由于负梯度方向是使函数值下降最快的方向,在迭代的每一步,以负梯度方向更新x的值,从而达到减少函数值的目的。
在这里插入图片描述用这个方法,参数在每个数据点上同时进行了移动,迭代了参数𝜃,因此被称为批梯度下降法。
𝜃=𝜃+𝛼(𝑦(𝑖)−𝑓𝜃(𝑥)(𝑖))𝑥(𝑖)
这个算法成为随机梯度下降法,随机梯度下降法的好处是,当数据点很多时,运行效率更高;缺点是,因为每次只针对一个样本更新参数,未必找到最快路径达到最优值,甚至有时候会出现参数在最小值附近徘徊而不是立即收敛。但当数据量很大的时候,随机梯度下降法经常优于批梯度下降法。

牛顿法

牛顿法和拟牛顿法也是求解无约束最优化问题的常用方法,有收敛速度快的优点.牛顿法是迭代算法,每一步需要求解目标函数的海赛矩阵的逆矩阵,计算比较复杂

线性回归的评价指标

MAE(Mean Absolute Error) 平均绝对误差
在这里插入图片描述MSE(Mean Square Error) 平均平方差/均方误差是回归任务最常用的性能度量。
在这里插入图片描述RMSE(Root Mean Square Error) 方均根差。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值