Context Encoding for Semantic Segmentation[CVPR2018]

该文探讨了在FCN框架下如何利用Context Encoding解决空间分辨率损失和多尺度对象的问题。文章提出了一种Featuremap Attention机制,通过Encoding Layer得到上下文嵌入,并采用语义编码损失来改进分割性能。实验部分显示了方法的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

更像是17年encoding network的一个应用,实验部分比较好
18,17

1.FCN framework

Good explanation

global receptive fields: conv(no linearities) + downsample

spatial resolution loss
  • encoder: dilated conv
    • pro: expand receptive field
    • con: isolate pixels from context scene, misclassified
  • decoder: upsample, deeplabv3+
multiple scale object

multi-resolution pyramid-based representation: SPP module
Q: Is capturing contextual information the same as increasing the receptive field size?

2.Architecture

arch

Featuremap Attention

本文的核心贡献, dense feature map经过一个encoding layer得到context embedding,然后通过FC得到一个classwise的score,作为权重(一种独特的Attention)

Semantic Encoding loss

实际上就是multi-label classification loss,分割网络加入一支classification loss可以提高结果
eg: Learning Multi-level Region Consistency with Dense Multi-label Networks for Semantic Segmentation[IJCAI2017]

Encoding Layer

本文的基石,

对比

cc
方法和传统方法的对比,以前使用bag of words或fisher vector, Dictionary一般通过聚类/GMM得到

步骤

eq1
eq2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值