机器学习4-模型的误差来源以及减少误差的方法

本文深入探讨了机器学习中误差的两大来源——偏差(bias)和方差(variance),解释了它们的概念和区别。高偏差表示欠拟合,而高方差则表示过拟合。解决这些问题的方法包括增加特征、使用更复杂的模型、增加数据量以及正则化。交叉验证是选择最佳模型的关键策略,以避免训练和测试集的表现差异。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

误差来源的两个方面:

bias(偏差):度量了某种学习算法的平均估计结果所逼近的学习目标的程度。
variance(方差):度量了在面对同样规模的不同训练集时分散的程度。
高的bias表示离目标值远,低bias表示离靶心近;高的variance表示多次学习的结果越分散,低的variance表示多次学习的结果越集中。
区别
variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。
bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度。

先看没有bias存在的情况

在这里插入图片描述

图中的N个点他们的平均值不等μ,但是当取值足够多,它的期望与μ相等。比喻就是,没有bias就是说瞄准的是靶心没有偏差,但是射击的时候由于一些因素,实际射击的位置散落在了μ的周围。

不同训练集分散的程度取决于variance:

在这里插入图片描述

怎么估测variance:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值