Non Local Module相关blog阅读笔记
申明
全文内容来自三篇blog。
BLOG1
Efficient Coarse-to-Fine Non-Local Module for t… - 简书 https://www.jianshu.com/p/7e7f677bc8eb
BLOG2
【最新前沿】Facebook何恺明等大神最新论文提出非局部神经网络(Non-local Neural Networks)
BLOG3 (提供了代码)
文献
主要来自以下两篇文章
2018 年 CVPR Efficient Coarse-to-Fine Non-Local Module for the Detection of Small Objects
Non-local neural networks
摘要(来自BLOG1)
思考?
关系推理过程可以以粗略到精细的方式更好地建模并呈现出一种新颖的框架,顺序地应用非局部模块以沿着自上而下的网络增加特征图的分辨率。通过这种方式,内部关系推理过程可以自然地将信息从较大的对象传递到较小的相关对象(分辨率从小到打?)。将该模块应用于精细的特征图,还可以利用来自同一类的多个重复对象在小目标本身之间传递信息。
(在代码里看解决)
介绍(来自BLOG1)
何为关系推理?
举例:
传统的非局部模块和改进的ENL(efficient non local module)(来自BLOG1)
主要贡献(来自BLOG1)
问题?
可以置于网络任意位置?
作者放在哪里?backbone?这个开销如何?
由粗到细的方式获得关系推理?
我是否可以认为从小分辨率的feature到大特征图的feature。
Related Work(来自BLOG1)
思考与解释
- bottom up top down networks 和 context modelling 比如Retinaface的代码。(未完善,待补充)
- modern relation reasoning 可嵌入backbone,已提供更多信息,当之前也提到可以放到任意位置。
Approach(来自BLOG1)
额外补充加强理解(来自BLOG2)
Non local module 例子(重点)
Implementation
BLOG3内容节选(重点)
local 典型的例子就是卷积和池化操作,针对于局部的信息,还有attention机制,而 non local 则就是考虑这种忽略的全局关系信息。
BLOG3更容易理解non local module
这一部分看原论文更好理解
原论文的non local module
简要说明公式的含义:
- x,y分别是输入输出,x和y均被展平,即修改为(HW×channels)的形式。
- 下标 i,j 分别是对应的空间位置。
- F相似矩阵,衡量两个像素 i , j的相似性。
- Z(x)是归一化因子
- g(xj)是第j个空间像素的表示即特征(g ∈ RHW×Cg,每个像素的表示中的Cg channels)
相似性函数F
xi 就是这里的残差。
具体实现