10、神经网络建模中的自适应正则化

最新推荐文章于 2025-12-18 20:56:42 发布

fox11

最新推荐文章于 2025-12-18 20:56:42 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：神经网络实战技巧精粹文章标签：神经网络自适应正则化泛化误差

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/fox11/article/details/154860327

神经网络实战技巧精粹专栏收录该内容

34 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

神经网络建模中的自适应正则化

1. 引言

神经网络是用于时间序列处理和模式识别的灵活工具。在两层架构中，增加隐藏神经元的数量可以使任何相关目标函数得到任意接近的近似。然而，在嘈杂数据上过度拟合的风险是神经网络设计中的主要问题，这体现为常见的偏差 - 方差困境。

正则化的需求有两个方面：一是通过平滑成本函数并在成本函数的低曲率（可能为零）区域引入曲率，解决训练过程中的数值问题；二是通过引入额外偏差来减少方差。架构优化的总体目标是最小化泛化误差。

架构可以通过逐步选择程序（包括剪枝技术）直接优化，也可以使用正则化间接优化。通常，人们更倾向于混合方案，但非常灵活的正则化可能会替代选择程序的需求。本文主要考虑混合剪枝/自适应正则化方案。

本文提出的方法是解决调整正则化参数的问题。其核心是制定一个简单的迭代梯度下降方案，以调整正则化参数，目标是最小化泛化误差。建议使用泛化误差的经验估计，即K折交叉验证。此前的一些研究使用了留出验证估计器。

除了泛化误差的经验估计器外，近年来还开发了一些代数估计器，如FPE、FPER、GEN、GPE和NIC。但这些估计依赖于一些难以证明的统计假设，尤其是它们是o(1/Nt)估计器，其中Nt是训练示例的数量。在许多实际建模场景中，很难满足大训练集的假设。

此外，还有一些研究在不同方面对正则化进行了探索。例如，有研究使用代数估计来研究自适应正则化在估计随机变量均值时的性质，也有基于代数估计提出神经网络的自适应正则化方案，但这些方案在鲁棒性方面存在不足，且可能无法满足大训练集的要求。贝叶斯方法是最小化所谓的证据，但证据与我们主要关注的泛化误差没有简单的关系。还有研究考虑使用验证集来调整正则化的量，特别是在

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符 | 博主筛选后可见

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。