2021-3-13论文学习——SENet,StairNet,Generalized Focal Loss,R3Det,CARAFE

本文深入探讨了Squeeze-and-Excitation Networks (SENet)、StairNet、Generalized Focal Loss等多种先进的视觉检测技术。重点介绍了SENet的注意力机制、StairNet的自上而下语义聚合方法及R3Det在旋转目标检测领域的应用。此外,还讨论了CARAFE作为一种轻量级通用上采样操作在多种视觉任务中的显著效果。

[1]Squeeze-and-Excitation Networks

论文地址:https://arxiv.org/abs/1709.01507
代码地址:https://github.com/moskomule/senet.pytorch/blob/master/senet
论文发表于CVPR 2018,同时提交于IEEE TPAMI 2019

在这里插入图片描述

结构图

一个全局avg pooling得到11C的向量,然后通过一个MLP感知机得到进行线性变换的11C
向量。 再通过一个Sigmod函数进行激活。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

各种SE block的变体

在这里插入图片描述

实验结果证明了SE net的有效性。

我认为其作用就是它对于通道施加了注意力机制,能够提取更加有用的信息。

Pytorch代码
import torch
from torch import nn

class SELayer(nn.Module):
    def __init__(self, channel, reduction=16):
        super(SELayer, self).__init__()
        ## 定义全局平均池化层
        self.avg_pool = nn.AdaptiveAvgPool2d(output_size=1)
        ## 定义一个MLP感知机
        self.fc = nn.Sequential(
            nn.Linear(channel, channel // reduction, bias=False),
            nn.ReLU(inplace=True),
            nn.Linear(channel // reduction, channel, bias=False),
            nn.Sigmoid()
        )
 
    def forward(self, x):   # exsample x.size() = [8,128,256,256]
        b, c, _, _ = x.size()
        y = self.avg_pool(x).view(b, c)    ## [8,128]
        print(y.size())
        y = self.fc(y).view(b, c, 1, 1)     # [8,128,1,1]
        print(y.size())
        return x * y.expand_as(x)    # [8,128,256,256]
"""
x = torch.Tensor(8,128,256,256)
print(x.size())
se = SELayer(128,16)
print(se(x).size())
"""

[2]StairNet: Top-Down Semantic Aggregation for Accurate One Shot Detection

论文地址:https://arxiv.org/pdf/1709.05788.pdf
论文发表于 2018 IEEE Winter Conference on Applications of Computer Vision(WACV)

在这里插入图片描述

针对于单阶段目标检测算法对于小目标检测难的问题,提出了一种自上而下的语义增强方式,设计的算法成为StairNet,在VOC数据集上改进了SSD算法,性能超过了其他单阶段目标检测SOTA算法。

总结:改进版本的FPN+一些小trick
创新之处:
  • 上采样模块使用反卷积自主学习而不是使用临近插值什么的;
  • 在F
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值