关于Backpropagation在DeepLearning的一点思考

最新推荐文章于 2024-10-17 21:14:49 发布

whuawell

最新推荐文章于 2024-10-17 21:14:49 发布

阅读量618

点赞数

分类专栏： ml 随笔

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/whuawell/article/details/77146163

版权

随笔同时被 2 个专栏收录

13 篇文章

订阅专栏

7 篇文章

订阅专栏

本文介绍了深度学习中Backpropagation的基本原理及其在CNN和RNN中的应用。详细阐述了误差后向传播的过程，并讨论了池化层、Dropout等特有组件的处理方式。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Backpropagation介绍

深度学习中，常见的CNN、RNN神经网络中，参数估计通常在经过样本批处理时，使用SGD算法更新权重W和偏置b。SGD会根据样本Loss将误差后向传播，根据chain rule链式法则计算每一层的误差，从而计算总误差关于W、b的导数，从而更新W或者b。

几个定义

神经元：这里考虑误差传播时，通常意义下的隐藏层、输出层、输入层点
神经元输入：u = 前一层输出x * W + b
神经元输出：经过激活函数处理logistic或其他 f(u)

经典Backpropagation实现

参考文档：UFLDL反向传播算法

CNN bp实现

与全连接神经网络相比，主要区别是添加了池化功能和稀疏连接、权值共享功能。这篇论文【1】讲的很清楚。

-总误差损耗

-层级关系

-相对于偏置导数

-卷积层

-卷积层后跟一个下采样层，计算下采样层误差

-普通卷积传播误差计算

同时这篇文章【2】也基本上体现了我要表达的内容。

这里我只说明不同的

-最大池化：后向传播时，只更新最大值的损耗，其他网格误差设为0即可。

-Dropout：没选中的神经元，不用更新权重。

RNN bp实现

每个时刻都有输出，每个时刻有输出和后一个时刻的隐藏层的连接，故后向时需考虑两块导数即可。参考bptt算法。

Trick

建议看下链式法则，两个相乘时，和求和时处理。

参考

【1】Notes on Convolutional Neural Networks, Jake Bouvrie

【2】http://blog.youkuaiyun.com/u010555688/article/details/38780807

【3】wiki-Backpropagation

【4】UFLDL后向传播算法

【5】cs231n-convolutional-networks

【6】Supervised Sequence Labelling with Recurrent Neural Networks

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。