动手学深度学习-李沐(7)

博客探讨了处理过拟合的常用方法,特别是权重衰减。权重衰减通过引入L2正则项限制模型参数的大小,从而控制模型复杂度,防止模型在训练数据上过度拟合。正则权重是调整模型复杂度的重要超参数。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、权重衰退

常用的处理过拟合的方法

1、使用均方范数作为硬性限制

      通过限制参数值的选择范围来控制模型容量

       限制w的数值 

2、使用均方范数作为柔性限制(常用)

  补:正则项就是防止损失函数最优导致过拟合,把损失函数的最优点往外拉一拉

 3、总结

权重衰退通过L2正则项使得模型参数不会过大,从而控制模型复杂度

正则权重是控制模型负责度的超参数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值