深度神经网络中的记忆增强模型:从NTM到RCNN
在深度学习领域,为了实现更高效的单声道源分离和语音增强任务,研究人员开发了多种记忆增强的神经网络模型。本文将深入介绍神经图灵机(Neural Turing Machine, NTM)和端到端记忆网络(End-to-End Memory Network)中的回忆神经网络(Recall Neural Network, RCNN),并对它们的性能进行评估。
1. 神经图灵机(NTM)
1.1 寻址机制
NTM的寻址过程由参数 ${k_t, \beta_t, g_t, s_t, \gamma_t}$ 驱动,分为四个步骤:
1. 基于内容的寻址 :计算初始注意力 $w_{c,t}(i)$,公式为:
[w_{c,t}(i) = \frac{\exp(\beta_t \cos(M_t(i), k_t))}{\sum_j \exp(\beta_t \cos(M_t(j), k_t))}]
其中,$\cos(M_t(i), k_t)$ 是记忆槽 $M_t(i)$ 与键 $k_t$ 的余弦相似度,$\beta_t$ 用于加权相似度以得到归一化的注意力。
2. 插值步骤 :使用插值门 $g_t$ 更新注意力 $w_{g,t}(i)$,公式为:
[w_{g,t}(i) = g_t w_{c,t}(i) + (1 - g_t) w_{t - 1}(i)]
这里的 $w_{t - 1}(i)$ 是前一个时间步的读或写头。
3. 卷积移位 :进行基于位置的注意力更新,公式为:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



