论文:CenterNet: Keypoint Triplets for Object Detection 阅读笔记

本文围绕CenterNet物体检测论文展开。介绍其背景,指出anchor-based方法复杂、cornernet未充分利用区域信息等问题。阐述想法,即若预测框与真值框IOU高,中心区域关键点预测为同类概率高。还介绍创新点、算法流程,以及中心区域大小确定方法等细节。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、论文

CenterNet: Keypoint Triplets for Object Detection

https://arxiv.org/abs/1904.08189

code:https://github.com/Duankaiwen/CenterNet

 

二、笔记

1、背景

1)、anchor-based方法anchor方法的复杂性

2)、cornernet没有好好利用图片里每个物体的区域信息,同时预测的两个点,对物体的边界过于敏感。

 

2、想法

根据conrner存在的一些问题,提出的解决办法,从cornernet发展而来。

Our intuition is that, if a predicted bounding box has a high IoU with the ground truth box, then the probability that the center keypoint in its central region is predicted as the same class is high, and vice versa.

我们的直觉是,如果一个预测的box和ground truth有一个很高的IOU,那么它的中心区域的关键点被预测为同一类的概率很高,反之亦然

对于每个检测框有一个中心区域,同时对于每个物体有一个中心点,如果物体的中心点,落在了预测的框的中心区域,那么这个框就是可信的。

 

3、创新点

a)、使用center pooling and cascade corner pooling,类似两阶段的head部分(使用卷积单独对roi部分的feature再进行运算)来分析物体区域的视觉模式

在原来的cornernet预测两个点的基础上,又增加了一个分支来预测center point

 

 

4、细节

a)、算法流程

(1) select top-k center keypoints according to their scores; 

(2) use the corresponding offsets to remap these center keypoints to the input image; 

(3) de-fifine a central region for each bounding box and check if the central region contains center keypoints. Note that the class labels of the checked center keypoints should be same as that of the bounding box; 

(4) if a center keypoint is detected in the central region, we will preserve the bounding box. The score of the bounding box will be replaced by the average scores of the three points, i.e., the top-left corner, the bottom-right corner and the center keypoint. If there are no center keypoints detected in its central region, the bounding box will be removed.

 

b)、如何决定中心区域的大小,基于小的中心区域使得小的检测框的召回率低,大的中心区域使得大的预测框的准确率低,因此设计了一个可以根据预测框大小自动调整中心区域的公式,可以对于大的框算出来一个小的中心区域,对于小的框算出来一个大的中心区域

 

c)、Center pooling

采用了类似corner pooling的方式,在水平和垂直两个方向上求最大值

d)、Cascade corner pooling

不仅像corner pooling 那样在边界的水平反向和垂直方向上求最大值,而且会在最大值处,再沿着垂直,水平方向,往内部求最大值,最后将两个最大值加在一起。

e)、中心点和从预测框得出的中心区域相当于都是从网络得出来的。

git paper list: 

https://github.com/zhiAung/Paper/tree/master/2%E3%80%81Detection

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值