16、记忆增强神经网络：从NTM到DNC的探索

最新推荐文章于 2025-11-11 09:58:58 发布

day7

最新推荐文章于 2025-11-11 09:58:58 发布

阅读量17

点赞数

CC 4.0 BY-SA版权

分类专栏：深度学习：从理论到实践文章标签： NTM DNC 记忆增强神经网络

本文链接：https://blog.youkuaiyun.com/day7/article/details/154597472

深度学习：从理论到实践专栏收录该内容

20 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

记忆增强神经网络：从NTM到DNC的探索

1. 序列分析与RNN潜力

在序列分析领域，循环神经网络（RNN）展现出了解决复杂问题的强大能力，如机器翻译。理论上，RNN架构是通用的函数表示器，即具有图灵完备性，意味着在合适的连接和参数下，RNN能学习解决任何可计算问题。然而，在实际中，要实现这种通用性极为困难，因为RNN可能的连接和参数值构成的搜索空间巨大，梯度下降法难以在其中找到任意问题的合适解决方案。

1.1 工作记忆的启示

以一个简单的阅读理解问题为例：

Mary travelled to the hallway. She grabbed the milk glass there.
Then she travelled to the office, where she found an apple
and grabbed it.
How many objects is Mary carrying?

答案是两个。我们的大脑解决这个问题的方式类似于一个简单的计算机程序：
1. 为计数器分配一个内存位置。
2. 将计数器初始化为0。
3. 遍历段落中的每个单词：
- 如果单词是 ‘grabbed’，则增加计数器。
4. 返回计数器的值。

在神经科学和认知心理学中，这种临时存储和处理信息的系统被称为工作记忆，它是后续研究的主要灵感来源。