论文研读之 Self-Attention

本文深入探讨了Self-Attention机制在深度学习中的应用,特别是在《Graph Attention Convolution for Point Cloud Semantic Segmentation》和《Dual Attention Network for Scene Segmentation》两篇论文中的实现。Self-Attention不仅用于特征提取,还指导特征提取,通过学习的mask对特征进行加权。在点云处理中,Attention机制帮助区分同类和非同类点;而在图像场景分割中,通过卷积计算为每个像素分配mask。尽管在某些评价指标上效果不一,但Self-Attention为深度学习带来了新的视角。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

涉及论文:

  1. Graph Attention Convolution for Point Cloud Semantic Segmentation
  2. Dual Attention Network for Scene Segmentation

  在一篇标题包含“Attention”的论文中,你可能会看到以下公式:
a i j , k = e x p ( a ~ i j , k ) ∑ l ∈ N ( i ) e x p ( a ~ i l , k ) a_{ij,k} = \frac{\mathrm{exp}(\tilde{a}_{ij,k})}{\sum_{l \in \mathcal{N}(i)}\mathrm{exp}(\tilde{a}_{il,k})} aij,k=lN(i)exp(a~il,k)exp(a~ij,k)

h i ′ = ∑ j ∈ N ( i ) a i j ∗ M g ( h j ) + b i h_{i}^{'} = \sum_{j \in \mathcal{N}(i)}a_{ij}*M_{g}(h_{j})+b_{i} hi=jN(i)aijMg(hj)+bi

或者
s j i = e x p ( B i ⋅ C j ) ∑ i = 1 N e x p ( B i ⋅ C j ) s_{ji} = \frac{\mathrm{exp}(B_{i} \cdot C_{j})}{\sum_{i = 1}^{N}\mathrm{exp}(B_{i} \cdot C_{j})} sji=i=1Nexp(BiCj)exp(BiCj)

E j = α ∑ i = 1 N ( s j i D i ) + A j E_{j} = \alpha \sum_{i = 1}^{N}(s_{ji}D_{i}) + A_{j} Ej

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值