线性回归算法梳理

本文详细梳理了线性回归算法,包括有监督学习的分类与回归概念,线性回归的原理,损失函数、代价函数和目标函数,优化方法如梯度下降、牛顿法和拟牛顿法,以及线性回归的评估指标如MSE、RMSE和MAE。同时介绍了sklearn库中线性回归模型的常用参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

**

任务1——线性回归算法梳理

**

机器学习的一些概念

1.有监督和无监督学习

有监督学习(Supervised Learning): 不仅给计算机一组数据,还告诉计算机这一组数据属于什么标签。计算机学习之后,再丢给计算机一组新的数据,这一组数据是还没有分类的。计算机经过计算之后给出这一组中每个数据最可能属于什么标签。
有监督学习有两类,回归(Regression)分类(Classification) 。比如现在让你预测上海静安寺附近一个120平米房子的房价。你会先去搜集静安寺附近不同房子的房价,然后以平米数为横轴,房价为纵轴让计算机拟合出一条曲线,把120平米代入可以得到预测的房价。这种情况下是在预测一个连续值的输出。这就是回归问题。
又比如现在让你帮助医院预测一个病人他的肿瘤是恶性还是良性。肿瘤是恶性还是良性,只有两种结果,记恶性为0,良性为1,这就是一个离散型的问题。根据已知的数据集,不同尺寸的肿瘤恶性还是良性的概率不同,预测出来的是一个离散的结果,这就是分类问题。
无监督学习(Unsupervised Learning): 同样给计算机一组数据,但不告诉计算机这组数据的标签,也就是说让计算机自己找到这一组数据中存在哪几种类型的数据并将它们分类好。可以根据数据中变量之间的关系对数据进行聚类,从而得出分类。

2.泛化能力

**泛化能力(generalization ability)**是指一个机器学习算法对于没有见过的样本的识别能力。我们也叫做举一反三的能力,或者叫做学以致用的能力。

3.过拟合欠拟合

欠拟合通俗地说就是模型没有很好的把握住数据的特征,比如要拟合出来一条直线,却只经过了很少的点。这种模型参考价值不大。解决方法有以下几种:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值