7. 深度学习实践:正则化

本文详细介绍了深度学习中的正则化技术,包括L2参数正则化、L1正则化、数据集增强、噪声鲁棒性、半监督学习、多任务学习和提前终止策略。L2正则化通过权重衰减减少过拟合,L1正则化则倾向于产生稀疏解。数据集增强和噪声注入能提升模型泛化能力。提前终止作为一种简单有效的正则化手段,限制了模型在验证集上过拟合的可能性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

正则化:ML中的一种策略,可减少测试误差,提高模型泛化能力。

开发更有效的正则化策略:深度学习领域主要研究工作之一。

模型族训练的三个过程:

  1. 不包括真实的数据生成过程,欠拟合和含有偏差。
  2. 匹配真实数据生成过程
  3. 除了2中,还包括许多其他可能的生成过程,方差主导的过拟合

正则化的目标:使得模型从第3种转化为第2种。

1. 参数范数惩罚

1.1 L2 参数正则化

权重衰减。

目标函数:

这里写图片描述
梯度为:

这里写图片描述

单步梯度下降:

这里写图片描述

换种写法:

这里写图片描述

加入权重衰减引起学习规则的修改:每步梯度更新前,会先收缩权重向量。

分析训练的整个过程:

w 为不含正则化的目标函数取得最小训练误差时的权重向量。并在其邻域内对目标函数做二次近似。近似的 J^(θ) 如下:

这里写图片描述

H J w 处计算的Hessian矩阵。半正定的。当 J^ 取得最小时,其梯度为

这里写图片描述
为0。在该式中添加权重衰减的梯度,用 w~ 表示此时的最优点。

这里写图片描述

α 趋近于0时,正则化的解 w~ 会趋近于

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值