【深度学习】权重衰减

最新推荐文章于 2025-10-09 15:14:31 发布

原创

最新推荐文章于 2025-10-09 15:14:31 发布 · 1.3k 阅读

·

27

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#深度学习 #人工智能

权重衰减

前一节我们描述了过拟合的问题，本节我们将介绍一些正则化模型的技术。我们总是可以通过去收集更多的训练数据来缓解过拟合。但这可能成本很高，耗时颇多，或者完全超出我们的控制，因而在短期内不可能做到。

假设我们已经拥有尽可能多的高质量数据，我们便可以将重点放在正则化技术上。

回想一下，在多项式回归的例子中，我们可以通过调整拟合多项式的阶数来限制模型的容量。

实际上，限制特征的数量是缓解过拟合的一种常用技术。然而，简单地丢弃特征对这项工作来说可能过于生硬。

我们继续思考多项式回归的例子，考虑高维输入可能发生的情况。多项式对多变量数据的自然扩展称为单项式（monomials），也可以说是变量幂的乘积。单项式的阶数是幂的和。
例如， $x_1^2 x_2$ 和 $x_3 x_5^2$ 都是3次单项式。

注意，随着阶数 $d$ 的增长，带有阶数 $d$ 的项数迅速增加。
给定 $k$ 个变量，阶数为 $d$ 的项的个数为
$\choose {k - 1}$ ，即 $C^{k-1}_{k-1+d} = \frac{(k-1+d)!}{(d)!(k-1)!}$ 。

因此即使是阶数上的微小变化，比如从 $2$ 到 $3$ ，也会显著增加我们模型的复杂性。仅仅通过简单的限制特征数量（在多项式回归中体现为限制阶数），可能仍然使模型在过简单和过复杂中徘徊，我们需要一个更细粒度的工具来调整函数的复杂性，使其达到一个合适的平衡位置。

范数与权重衰减

在线性代数中，我们已经描述了 $L_2$ 范数和 $L_1$ 范数，它们是更为一般的 $L_p$ 范数的特殊情况。

[ $L_2$ 范数是向量元素平方和的平方根：]
( $\|\mathbf{x}\|_2 = \sqrt{\sum_{i=1}^n x_i^2},$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。