【xNets】MatrixNets: A New Scale and Aspect Ratio Aware Architecture for Object Detection

MatrixNets针对目标检测中的尺度问题提出了一种新的解决方案,尤其是在一阶段网络中。它通过改进FPN结构,创建了一个矩阵网络主干,能够更好地处理不同尺度和长宽比的目标。在MS COCO数据集上,MatrixNets相比CornerNet提高了5.6 mAP,适用于中心和角点基检测器。此外,MatrixNets可以被集成到各种目标检测框架中,提供更强的泛化能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在这里插入图片描述
代码: CODE
论文:PAPER

概述


  • 针对问题
    • 目标的尺度问题
  • 采用的方法
    • 主干结构上的修改,可以说是FPN上的一种改进方案吧
  • Contributions(个人总结)
    • 主要用来去增强一阶段网络,特别是对于非anchor-based
    • 同时,也可以将此主干用到各大检测网络中,可以泛化
  • 结果如何
    • MS COCO dataset : mAP 47.8, higher than CornerNet by +5.6 mAP

Introduce


文章还是将网络按照一般分法分为一阶段和二阶段。但是呢,文章又将一阶段分为anchor-based detectors以及corner(or key-points) based detectors,一般我们是把anchor-basedanchor-free放在对立面,不过corner(or key-points) based detector和anchor-free在很大程度上是一类的。

  • anchor-based detector :通常对每个anchor预测offsets以及classes
  • corner(or key-points) based detector:预测左上点和右下点的heat-maps,最后使用feature emmbedding来匹配这两类点(给出属于这类的有CornetNetCenternet(Huawei Noah’s Ark Lab、Oxford)

针对尺度问题来探讨解决方案:

  • 目标的不同尺度给检测带来问题——FPN可以带来很大的增益
  • 其中仍然有一些FPN解决不了的目标,如:high tower, giraffe, knife ——本文要更进一步去缓解这些尺度问题
  • 下图是对coco的目标的长宽比的统计——提出本文矩阵网络主干。
    在这里插入图片描述

MatrixNets


结构

在这里插入图片描述
具体的结构设计如下(做法倒是超级直接):

  • 对角线上就是原来的FPN layers
  • 另外的部分就是由FPN layers通过downsample扩充过去的(以下的共享3x3表示的范围是单个三角的部分三角呢还是两个三角的全局范围,)
    • width(下三角部分)由共享的3x3 conv 跨着1x2的步子对FPN layers进行操作得来的
    • height(上三角部分)由共享的3x3 conv跨着2x1的步子对FPN layers 进行操作得来的
  • layer所表达的pixel大小的变化为:
    • l 1 , 1 l_{1,1} l1,1 H ∈ [ 24 p x , 48 p x ] , W ∈ [ 24 p x , 48 p x ] H\in[24px, 48px],W\in[24px, 48px] H[24px,48px],W[24px,48px],那么 l 1 , 2 l_{1,2} l1,2 H ∈ [ 24 , 48 ] , W ∈ [ 48 , 96 ] H\in[24, 48], W\in[48, 96] H[24,48],W[48,96]

Advantages of MatrixNets

  • 本文diss:以往传统的w,h相同的conv kernel是反直觉的,因为不同尺度和不同长宽比率的boxes需要不同的上下文信息。(觉得这个,嗯,有点强行)
  • 所以,在MatrixNets里,conv kernel可以用来检测不同尺度的不同长宽比率的boxes,而且因为不同的metrix layer带有不同的上下文。
  • 可以作为主干用到任意的目标检测结构中,不论是anchor-based or keypoints-based,还是说one-stage or two-stage

Applications

  • Center-based Object Detection
    • ground-truth根据长宽来分配到不同的matrix layer上
      在这里插入图片描述
  • Corner-based Object Detection(CornerNet)
    • 使用MatrixNets可以确保层内对象所需要的上下文受到该层单个特征图的接受域限制,可以舍去corner pool,使用常规卷积

在这里插入图片描述

Experiments

  • center-based方式和corner-based方式对比
    在这里插入图片描述
  • 在COCO test-dev2017数据集上跟其他的detectors的结果对比
    在这里插入图片描述
  • 消融实验
    在这里插入图片描述
  • 效果图
    在这里插入图片描述
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值