为什么说交叉验证能防止过拟合呢？

最新推荐文章于 2025-02-05 15:00:32 发布

原创最新推荐文章于 2025-02-05 15:00:32 发布 · 7.5k 阅读

·

4

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

机器学习算法的直觉专栏收录该内容

13 篇文章

订阅专栏

本文解析了交叉验证如何通过分割数据集并独立评估模型，防止过拟合现象。通过对比不同超参数设置下的模型表现，选取最优参数，进而提升模型泛化能力。

为什么说交叉验证能防止过拟合呢？

交叉验证把原始数据分成可 K 块，用每次用其中的 K-1块训练，用余下的一块进行预测，

这样做，让算法在训练的时候没有接触过余下来的那一块数据子集中的内容，这样，在对余下这一块进行预测时，

算法只能靠他学会的本领来进行预测---------> 就是用学到的参数来预测。

但是，算法还是有超参数的：我们每次都需要主观选择超参数给算法才行，但是不同的超参数会导致模型有不同的效果，假设我们有四个超参数【1，10，100，1000】，我们运行10折交叉验证（既训练了40个模型），每次我们都用10个训练出来的模型的平均值来表示当前超参数的效果。

所以我们比较了 4 个超参数的效果后，我们能找到一个更加好的超参数，我们再用全量的数据在该超参数上训练模型。因此，这样训练出来的模型是相对更优的，在一定程度上能避免过拟合问题。

皮皮的解释一下什么是过拟合：

比如说语文老师让同学A 解释一个句子： ‘某鲁迅先生的文章~~~~~~~~’

欠拟合：差生：这是个什么鬼东西，比例哔哩哔哩~~~~

过拟合：语文老师的解释： ‘表面上看是~~~，但其实~~~~，本质上~~~~~~，反映了~~~~心情，烘托了~~~气氛~~~’

正常：当时鲁迅先生觉得天色晚了，该休息了。

嗯哈，皮了一下，正常的解释还是看书比较好哈

88

4 条评论

SZU_Hadooper 2019.06.04
写的很好啊
- 就叫温华啦回复SZU_Hadooper 2019.06.04
  哈哈哈，皮一皮就很有意思[reply]SZU_Hadooper[/reply]

rafael1994 2019.04.13
????
- 就叫温华啦回复rafael1994 2019.04.14
  关注点应该在超参数上面：我们每次都需要主观选择超参数给算法才行，但是不同的超参数会导致模型有不同的效果，假设我们有四个超参数【1，10，100，1000】，我们运行10折交叉验证（既训练了40个模型），每次我们都用10个训练出来的模型的平均值来表示当前超参数的效果。所以我们比较了 4 个超参数的效果后，我们能找到一个更加好的超参数，我们再用全量的数据在该超参数上训练模型。因此，这样训练出来的模型是相对更优的，在一定程度上能避免过拟合问题。[reply]sinat_41700577[/reply]

评论 4

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。