【Recurrent Neural Network Regularization】读后感(未编辑完毕)

本文介绍了如何在RNN中应用正则化,特别是在LSTM模型中,通过在非递归连接上使用dropout来避免过度拟合。标准的dropout策略在递归连接上操作,影响了LSTM长期信息存储的能力。作者提出了一种改进的dropout方法,允许信息在多次timesteps中被扰动,但不影响长期记忆的保存。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

简介

正则化(Regularization)使神经网络应用广泛。对前馈神经网络,dropout是最有效的正则化方法。但是dropout不适用于RNN,因为递归(recurrence)会放大噪音,持续影响网络学习。RNN通常使用small model,large RNN趋于overfit。

这篇文章主要贡献是使用dropout在non-recurrent connections。如下图所示。在虚线箭头处应用dropout,在实线箭头处不应用。

1、LSTM units 长短记忆单元

首先RNN可以用表示为:



LSTM具体可以看这篇文章【Graves.Generating sequences with recurrent neural networks(2013)】

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值