关于NTM:神经图灵机
神经图灵机包含两个基本组成部分:神经网络控制器和记忆库。

控制器通过输入输出向量和外界交互。
不同于标准神经网络的是,控制器还会使用选择性的读写操作和记忆矩阵进行交互。类比于图灵机,我们将网络的参数化这些操作的输出称为**“读头”。
最关键的是,每个组成部分都是可微的**,这样可以更加直接地使用梯度下降进行训练。
我们通过定义 模糊的读写操作 根据一个更高或者更低的度(degree)和的记忆中的所有元素进行交互(而不是像在正常的图灵机或者数字计算机那样一次只是处理一个单个的元素)。
这个模糊的度 由一种 注意力聚焦机制 确定,将每个读写操作限制在记忆中的一小块上,忽略其他部分。因为和记忆的交互是高度稀疏的,NTM 倾向于无干扰地存储数据。进入注意力聚焦的记忆位置由读头特定的输出确定。这些输出定义了一个规范化的权重在记忆矩阵的行上(对应于内存位置)。
每个权重,对应于一个读头或者写头,定义了在每个位置读写的程度。读头可以在单个位置
神经图灵机(NTM)是一种结合了神经网络和图灵机概念的模型,其核心特点是可微的读写头和注意力聚焦机制。控制器通过输入输出与外界交互,并利用模糊的读写操作与记忆库进行高效且无干扰的数据存储。这种机制使得NTM能处理更复杂的学习任务。
订阅专栏 解锁全文
1523

被折叠的 条评论
为什么被折叠?



