学习曲线

本文探讨了在高偏差和高方差情况下增加训练数据数量对机器学习算法的影响。文中指出,在高方差情形下增加数据有助于提升算法表现,而在高偏差情况下效果不明显。此外,文章还介绍了几种解决高偏差和高方差问题的方法。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本节我们学习在高偏差和高方差的情况下,增加数据的个数能否有效的改进算法误差。

当训练集的个数很少时,你会发现数据很好用一条线来拟合,所以误差很小,当训练集的个数越来越多时,用一条线越来越难拟合所有的数据,所以误差越来越大。

但反之,当训练集个数越多,越具有泛化作用,验证集的误差越小,当训练集的数据较少时,泛化性差,验证集误差很大。

在高偏差的情况下,想通过增加训练集的个数来改进算法,结果发现是不可取的。

在高方差的情况下,想通过增加训练集的个数来改进算法,结果发现是可取的。

本章总结:

 1、我们可能尝试着去获取更多的训练集,认为只要获取两倍甚至10倍的训练集就可以得到准确的结果-------高方差问题

 2、我们尝试着去减少特征的个数,从而避免过拟合的结果-------高方差问题

 3、增加特征的个数-------高偏差问题

 4、我们也可能会尝试增加多项式特征的方法,比如x1的平方、x2的平方-------高偏差问题

 5、减小正则化参数-------高偏差问题

 6、增加正则化参数-------高方差问题

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值