人工智能概念:RNN中的注意力机制详解

RNN家族的介绍网页链接

一、注意力机制介绍

1.1 注意力机制的本质

注意力机制源于对人类认知过程的模拟:当人处理信息时,会有选择地聚焦于关键部分而忽略次要信息。例如看到"锦江饭店"照片时,大脑会优先关注牌匾文字而非背景细节:

原始输入
注意力聚焦
关键信息提取
信息处理

在深度学习中,注意力机制通过为输入的不同部分分配权重系数实现这种聚焦效果:

  • 高权重:重点关注
  • 低权重:次要关注
  • 零权重:完全忽略

1.2 语义融合方法

注意力机制的核心是融合不同来源的语义信息,常见方法如下:

融合方法 计算公式 特点
拼接 [ h i ; s j ] [h_i; s_j] [hi;sj] 保留原始特征但增加维度
累加 h i + s j h_i + s_j hi+sj 特征混合但可能信息冲突
加权融合 ∑ α i ⋅ h i \sum \alpha_i \cdot h_i αihi 注意力机制核心方法

1.3 相似性计算方法

计算注意力权重的核心是度量向量间相似性,常见方法如下:

计算方法 公式 特点
点积 score ( Q , K ) = Q ⋅ K \text{score}(Q,K) = Q \cdot K score(Q,K)=QK 计算简单高效
缩放点积 Q ⋅ K d k \frac{Q \cdot K}{\sqrt{d_k}} dk QK 避免梯度消失(Transformer使用)
余弦相似度 Q ⋅ K ∣ Q ∣ ∣ K ∣ \frac{Q \cdot K}{|Q| |K|} Q∣∣KQK 不受
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值