什么是过拟合 (Overfitting) 、解决方法、代码示例（tensorflow实现）

最新推荐文章于 2025-07-01 13:13:29 发布

注定走红Scream

最新推荐文章于 2025-07-01 13:13:29 发布

阅读量2.5k

点赞数 1

CC 4.0 BY-SA版权

分类专栏： tensorflow 文章标签：过拟合 dropout

本文链接：https://blog.youkuaiyun.com/qq_42016781/article/details/85337062

过拟合是指模型过于复杂，导致在训练数据上表现优秀，但在新数据上表现较差。文章通过实例解释了过拟合的概念，并介绍了两种解决方法：增加数据量和使用Dropout技术。在TensorFlow中实现Dropout，通过调整保留概率观察模型性能变化，结果显示Dropout有助于防止过拟合。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

过于自负

在这里插入图片描述
在细说之前, 我们先用实际生活中的一个例子来比喻一下过拟合现象. 说白了, 就是机器学习模型于自信. 已经到了自负的阶段了. 那自负的坏处, 大家也知道, 就是在自己的小圈子里表现非凡, 不过在现实的大圈子里却往往处处碰壁. 所以在这个简介里, 我们把自负和过拟合画上等号

回归分类的过拟合

在这里插入图片描述
机器学习模型的自负又表现在哪些方面呢. 这里是一些数据. 如果要你画一条线来描述这些数据, 大多数人都会这么画. 对, 这条线也是我们希望机器也能学出来的一条用来总结这些数据的线. 这时蓝线与数据的总误差可能是10. 可是有时候, 机器过于纠结这误差值, 他想把误差减到更小, 来完成他对这一批数据的学习使命. 所以, 他学到的可能会变成这样 . 它几乎经过了每一个数据点, 这样, 误差值会更小 . 可是误差越小就真的好吗? 看来我们的模型还是太天真了. 当我拿下面图中的这个模型运用在现实中的时候, 他的自负就体现出来. 小二, 来一打现实数据 . 这时, 之前误差大的蓝线误差基本保持不变 .误差小的红线误差值突然飙高 , 自负的红线再也骄傲不起来, 因为他不能成功的表达除了训练数据以外的其他数据. 这就叫做过拟合. Overfitting.