LSTM学习总结

最新推荐文章于 2024-07-25 10:18:13 发布

YuHsin

最新推荐文章于 2024-07-25 10:18:13 发布

阅读量649

点赞数 1

博客主要介绍了LSTM的相关内容，包括其一般结构，如遗忘门层、输入门层和输出门层的具体公式及作用，还提及了LSTM的一些变形，如将Ct−1考虑进来和默认it=1−ft的情况。此外，还介绍了门控循环单元（GRU）的特点和细节。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

LSTM

一般结构

LSTM

Forget Gate Layer

Detail

$f_{t}=\sigma (W_{f}*[h_{t-1},x_{t}]+b_f)$
决定信息保留程度,“1”代表完全保留，“0”代表完全舍弃

Input Gate Layer

Detail

$i_t=\sigma (W_i*[h_{t-1},x_t]+b_i)$
$C_t^{'}=tanh (W_i*[h_{t-1},x_t]+b_i)$

Next

$C_t=f_t*C_{t-1}+i_t*C_t{'}$

Output Gate Layer

Detail

$o_t=\sigma (W_o*[h_{t-1},x_t]+b_o)$
$h_t=o_t*tanh (C_t)$

一些变形

将 $C_{t-1}$ 考虑进来

$f_{t}=\sigma (W_{f}*[h_{t-1},x_{t},C_{t-1}]+b_f)$
$i_t=\sigma (W_i*[h_{t-1},x_t,C_{t-1}]+b_i)$
$o_t=\sigma (W_o*[h_{t-1},x_t,C_{t-1}]+b_o)$

默认 $i_t=1-f_t$

$C_t=f_t*C_{t-1}+(1-f_t)*C_t{'}$

Gated Recurrent Unit(GRU)

特点

使用update gate代替forget & input gate
合并cell state 和 hidden state

Details

GRU

From

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。