Introduction
数据科学专业人员面临的最常见问题之一是避免过度拟合。 您是否遇到过您的模型在训练数据上表现异常但无法预测测试数据的情况。 或者你在公共排行榜的竞争中处于领先地位,但在最终排名中只有数百个名额? 好吧 - 这是给你的文章!
避免过度拟合可以单独提高我们模型的性能。
在本文中,我们将理解过度拟合的概念以及正则化如何帮助克服同一问题。 然后,我们将研究一些不同的正则化技术,并在python中进行案例研究,以进一步巩固这些概念。
目录
什么是正规化?
正规化如何帮助减少过度拟合?
深度学习中的不同正则化技巧
L2和L1正则化
退出
数据增加
提前停止
使用Keras进行MNIST数据的案例研究
#####什么是正规化?
在我们深入研究这个主题之前,请看一下这个图像:
你以前见过这张照片吗? 当我们在此图像中向右移动时,我们的模型试图从训练数据中很好地学习细节和噪声,这最终导致对看不见的数据的不良表现。
换句话说,在向右移动时,模型的复杂性增加,使