机器学习:Bias(偏差),Error(误差),和Variance(方差)

本文介绍了学习曲线的概念及其在评估机器学习模型中的应用。通过绘制不同规模训练集上的准确率,可以帮助我们判断模型是否存在高偏差或高方差的问题,并据此采取相应措施进行调整。


转自 :http://blog.youkuaiyun.com/aliceyangxi1987/article/details/73598857

学习曲线是什么?

学习曲线就是通过画出不同训练集大小时训练集和交叉验证的准确率,可以看到模型在新数据上的表现,进而来判断模型是否方差偏高或偏差过高,以及增大训练集是否可以减小过拟合。


怎么解读?

当训练集和测试集的误差收敛但却很高时,为高偏差。 
左上角的偏差很高,训练集和验证集的准确率都很低,很可能是欠拟合。 
我们可以增加模型参数,比如,构建更多的特征,减小正则项。 
此时通过增加数据量是不起作用的。

当训练集和测试集的误差之间有大的差距时,为高方差。 
当训练集的准确率比其他独立数据集上的测试结果的准确率要高时,一般都是过拟合。 
右上角方差很高,训练集和验证集的准确率相差太多,应该是过拟合。 
我们可以增大训练集,降低模型复杂度,增大正则项,或者通过特征选择减少特征数。

理想情况是是找到偏差和方差都很小的情况,即收敛且误差较小。


评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值