两者的论文:
Dropout:http://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf
本文探讨深度学习中Dropout和Layer Normalization的应用,包括它们的理论依据、实现方式和常见疑问。引用了相关论文及Nematus项目的实现,并讨论了在RNN中Dropout的位置、State Below的LN处理、Scan内的Dropout可行性以及残差连接的效果。
两者的论文:
Dropout:http://www.jmlr.org/papers/volume15/srivastava14a/srivastava14a.pdf
1640
455
1629
4815

被折叠的 条评论
为什么被折叠?