深度学习笔记-正则化

disasters

于 2018-11-26 19:27:21 发布

阅读量189

点赞数

CC 4.0 BY-SA版权

分类专栏： deep learning 文章标签：深度学习正则化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/disasters/article/details/84554911

deep learning 专栏收录该内容

7 篇文章

订阅专栏

-通过正则化消除过度拟合，下面为公式介绍和解释

J(w,b)= $1m∑i=1mL(y^(i),y(i))+λ2m∣∣w∣∣22\frac{1}{m}\sum_{i=1}^{m}L(\hat{y}^{(i)},y^{(i)})+\frac{\lambda}{2m}||w||{^2_2}$
$L_2$ 正则化： $∣∣w∣∣22=∑j=1nxwj2=wTw||w||{^2_2}=\sum_{j=1}^{n_x} {w_j}^2=w^Tw$ ,
$w||{^2_2}$ 被称为参数W的 $L_2$ 范数
只对W进行正则化是因为W是一个高维参数，基本上包含了所有维度
$λ\lambda$ 是正则化参数，应该较大，避免过拟合，即避免数据权值矩阵过大
放在多层网络中变成了“ $+λ2m∑l=1L∣∣w[l]∣∣F2+\frac{\lambda}{2m}\sum_{l=1}^{L}||w^{[l]}||{^2_F}$ ”
L为层
$∣∣W[l]∣∣F2=∑i=1n[l−1]∑j=1n[l](wij[l])2w:(n[l−1],n[l])||W^{[l]}||{^2_F}=\sum_{i=1}^{n^{[l-1]}}\sum_{j=1}^{n^{[l]}}(w{^{[l]}_{ij}})^2\qquad w:(n^{[l-1]},n^{[l]})$
“Frobenius norm” 弗罗贝尼乌斯范数

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。