传统的深度学习模型(RNN、LSTM、GRU等)使用hidden states或者Attention机制作为他们的记忆功能,但是这种方法产生的记忆太小了,无法精确记录一段话中所表达的全部内容,也就是在将输入编码成dense vectors的时候丢失了很多信息。所以本文就提出了一种可读写的外部记忆模块,并将其和inference组件联合训练
Memory Netwok_biji
最新推荐文章于 2024-12-19 15:17:34 发布
本文探讨了传统深度学习模型如RNN、LSTM、GRU的记忆局限性,提出一种新型可读写外部记忆模块,旨在解决信息丢失问题,通过与inference组件联合训练,实现更精准的内容记录。

589

被折叠的 条评论
为什么被折叠?



