正则化 regularization

最新推荐文章于 2024-10-12 09:45:59 发布

原创最新推荐文章于 2024-10-12 09:45:59 发布 · 269 阅读

0 ·

CC 4.0 BY-SA版权

深度学习笔记专栏收录该内容

2 篇文章

订阅专栏

正则化是一种在模型训练中防止过拟合的有效方法，它通过在损失函数中添加惩罚项来限制模型参数的大小。当训练数据不足或存在噪声时，过于复杂的模型可能导致过拟合。正则化通过增加模型训练的难度，鼓励模型寻找简单且泛化能力更强的解决方案。PaddlePaddle框架提供了支持统一和特定参数的正则化选项，帮助用户在模型复杂性和泛化能力之间找到平衡。

部署运行你感兴趣的模型镜像

从“很久很久”以前就听说正则化的目的是为了防止过拟合，进而增强泛化能力，但从来没有深入去了解过它是如何实现的。

近日在学习paddlepaddle，官方教程里写的不错，故copy至此。

为了方便自己之后翻阅所参考的文档、尊重网络所有作者的心血及帮助其他读者深入学习，reference留在最前面
Reference：
Link to paddlepaddle
知乎答主Yeung Evan，言有三

过拟合的背景

造成过拟合的原因是模型过于敏感，而训练数据量太少或其中的噪音太多；
也可以说是模型的表示能力过于强大，故这里有两个办法：
我们或者限制模型表示能力，或者收集更多的训练数据。
而清洗训练数据中的错误，或收集更多的训练数据往往是一句“正确的废话”，在任何时候我们都想获得更多更高质量的数据。在实际项目中，更快、更低成本可控制过拟合的方法，只有限制模型的表示能力。

正则化项

为了防止模型过拟合，在没有扩充样本量的可能下，只能降低模型的复杂度，可以通过限制参数的数量或可能取值（参数值尽量小）实现。

具体来说，在模型的优化目标（损失）中人为加入对参数规模的惩罚项。当参数越多或取值越大时，该惩罚项就越大。通过调整惩罚项的权重系数，可以使模型在“尽量减少训练损失”和“保持模型的泛化能力”之间取得平衡。泛化能力表示模型在没有见过的样本上依然有效。正则化项的存在，增加了模型在训练集上的损失。

飞桨支持为所有参数加上统一的正则化项，也支持为特定的参数添加正则化项。

您可能感兴趣的与本文相关的镜像