打卡1——线性回归算法梳理

本文深入探讨了机器学习中的核心概念,包括有监督学习、无监督学习、泛化能力、过拟合与欠拟合等问题,同时介绍了线性回归原理及其评估指标,适合初学者快速掌握机器学习的基本理论。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.有监督、无监督、泛化能力、过拟合欠拟合(方差和偏差以及各自解决办法)、交叉验证

a)监督学习:监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。(统计方法);监督学习是从标记的训练数据来推断一个功能的机器学习任务。训练数据包括一套训练示例。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。一个最佳的方案将允许该算法来正确地决定那些看不见的实例的类标签。这就要求学习算法是在一种“合理”的方式从一种从训练数据到看不见的情况下形成。(百度百科)

b)无监督学习:输入数据没有被标记,也没有确定的结果。样本数据类别未知,需要根据样本间的相似性对样本集进行分类(聚类,clustering)试图使类内差距最小化,类间差距最大化。通俗点将就是实际应用中,不少情况下无法预先知道样本的标签,也就是说没有训练样本对应的类别,因而只能从原先没有样本标签的样本集开始学习分类器设计。

非监督学习目标不是告诉计算机怎么做,而是让它(计算机)自己去学习怎样做事情。非监督学习有两种思路。第一种思路是在指导Agent时不为其指定明确分类,而是在成功时,采用某种形式的激励制度。需要注意的是,这类训练通常会置于决策问题的框架里,因为它的目标不是为了产生一个分类系统,而是做出最大回报的决定,这种思路很好的概括了现实世界,agent可以对正确的行为做出激励,而对错误行为做出惩罚。

c)泛化能力:学习方法的泛化能力是指由该方法学习到的模型对未知数据的预测能力,是学习方法本质上重要的性质。现实中采用最多的方法通过测试误差来评价学习方法的泛化能力。

d)过拟合:如果一味追求提高对训练数据的预测能力,所选模型的复杂度则往往会比真模型高。这种现象称为过拟合。过拟合是指学习时选择的模型所包含的参数过多,以至于出现这一模型对已知数据预测得很好,但对位置数据预测得很差的现象。常用正则化与交叉验证两种方式避免过拟合。

e)欠拟合:因为模型不够复杂而无法捕捉数据基本关系,导致模型错误的表示数据。模型没有很好地捕捉到数据特征,不能够很好地拟合数据的情况,就是欠拟合。通常利用添加其他特征项;添加多项式特征;减少正则化参数等方式避免欠拟合。

f)方差:方差反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。

g)偏差:偏差反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力。

过拟合会出现高方差问题;欠拟合会出现高偏差问题。

h)交叉验证:如果给定的样本数据充足,进行模型选择的一种简单方法是随机地将数据集切分成三部分,分别为训练集、验证集和测试集。测试集用来训练模型,验证集用于模型的选择,而测试集用于最终对学习方法的评估。在学习到的不同复杂度的模型中,选择对验证集有最小预测误差的模型。由于验证集有足够多的数据,用它对模型进行选择也是有效的。

但是,在许多实际应用中数据是不充足的。为了选择好的模型,可以采用交叉验证方法。交叉验证的基本想法是重复地使用数据;把给定的数据进行切分,将切分的数据集组合为训练集和测试集,在此基础上反复地进行训练、测试以及模型选择。

2.线性回归的原理

回归用于预测输入变量(自变量)和输出变量(因变量)之间的关系,特别是当输入变量的值发生变化时,输出变量的值随之发生的变化。按照输入变量之间关系的类型即模型的类型,分为线性回归和非线性回归。线性回归是在假设特征满足线性关系,根据给定的训练数据训练一个模型,并用此模型进行预测。

3.线性回归损失函数、代价函数、目标函数

线性回归的损失函数: 

 

线性回归的代价函数: 是定义在整个训练集上的,是所有样本误差的平均,也就是损失函数的平均。

线性回归的目标函数:

 

4.优化方法(梯度下降法、牛顿法、拟牛顿法等)

a)梯度下降法:梯度下降法的理解

b)牛顿法:牛顿法

c)拟牛顿法:拟牛顿法

5.线性回归的评估指标

主要有SSE(和方差);MSE(均方差);RMSE(均方根);R-square(确定系数)

6.sklearn参数详解

sklearn学习目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值