keras搬砖系列-重新理解ResNet网络

最新推荐文章于 2025-07-06 15:55:57 发布

googler_offer

最新推荐文章于 2025-07-06 15:55:57 发布

阅读量944

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习=====keras搬砖系列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/googler_offer/article/details/79487315

深度学习=====keras搬砖系列专栏收录该内容

55 篇文章

订阅专栏

keras搬砖系列-重新理解ResNet网络

1. plain net

对于一般网络来说，他们的传导方式是这样的：

z[l+1]=w[l+1]a[l]+b[l+1] a[l+1]=g(z[l+1]) z[l+2]=w[l+2]a[l+2]+b[l+2] a[l+2]=g(z[l+2])

2.short cut

z[l+1]=w[l+1]a[l]+b[l+1] a[l+1]=g(z[l+1]) z[l+2]=w[l+2]a[l+2]+b[l+2]

a[l+2]=g(z[l+2]+a[l])

3.difference

4.why

残差网络的提出背景是因为随着网络的加深，出现了训练集准确率下降的现象，在这里残差提出了两种映射：

其中一种则是y=F(x)+x,残差映射中的差是y-x,所以残差表示是F(x).

我们采用跳跃连接：

也就是在第二个问题所说的a[l+2]=g(z[l+2]+a[l])，a[l+2]=g(w[l+2]a[l+1]+b[l+2]+a[l]).当w[l+2]=0的时候，并且b[l+2]=0，那么此时a[l+2]=a[l],也就是说此时能学到恒等映射。并且与此同时能更加采集到有用特征，也就说能扩大视野，所以当更加深层的时候也不会进行梯度消失。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。