Large Kernel Matters论文理解

本文介绍了一种通过Global Convolutional Network (GCN) 和 Boundary Refinement block (BR) 改进语义分割的方法。GCN增强分类与定位性能,BR优化边界对齐。采用大卷积核提高分类效果,结合ResNet多尺度框架实现精准分割。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

 

 

Large Kernel Matters ——Improve Semantic Segmentation by Global Convolutional Network

发表日期:8 May 2017

本文主要提出两种结构,全局卷积网络(Global Convolutional Network,GCN),Boundary Refinement block(BR)

GCN同时改善分类和定位的性能。

 

目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。从分类的角度,网络应该使用大的卷积核,这样能使分类器具有更强的分类能力来应对各种变换。使用Boundary Refinement block来进行边界对齐,该模块使用残差结构。

 

1.GCN

目前state-of-art的语义分割设计方法都是为了更好的定位,但这会降低分类的效果。而分类的效果差可能由于感受野造成的。当分类的有效感受野(能够获得有效信息的感受野)足以覆盖整个物体的时候,这个时候分类器就可以正确的分类。

网络设计用FCN,卷积的kernel size越大越好,但是越大的卷积核计算量越大,作者提出1*k+k*1和k*1+1*k的卷积组合,相当于feature map的k*k大小区域。在这里的卷积之后没有使用非线性激活函数。

2.Boundary Refinement

侧边的残差连接可以对boundary进行refine

3.网络结构

ResNet作为特征提取;使用ResNet不同stage的feature map,是多尺度框架;经过上采样输出结果

 

参考:

https://zhuanlan.zhihu.com/p/38055224 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值