论文阅读《CenterNet: Keypoint Triplets for Object Detection》
论文idea
现在最流行的目标检测是传统基于anchor的,但是存在的问题:
- 需要大量的anchors来保证足够高的IOU
- anchor的比例和尺寸需要手工设置
- anchors与ground-truthboxes不对齐,不利于边界框分类任务。
于是CornerNet被提出,CornerNet用一对角点来表示一个对象,达到了 state-of-the-art one-stage object detection 精度。但是也是存在问题的,因为对象由一对角点来表示,说明算法对对象的边界比较敏感,这意味着不知道应该将哪些关键点对分组到对象中(这句话存疑,不是特别能理解。大概意思是 算法主要关注了边界,但是因为缺失中间的信息而分类错误吧。。)
那怎么解决这个问题呢,要增加对区域内的感知,很直接,再增加一个中心的关键点,这就是CenterNet。直觉就是如果预测的边界框与groundtruth的IOU高的话,那么中心点被分为同一类的概率很高。所以在推理期间,先用对角点生成proposal,然后判断中心点是否和proposal属于同一类来确定这个proposal是不是一个对象(注意是判断点和proposal是不是同一类,而不是判断是不是同一个对象。)。
论文设置两个策略来丰富角点和中心点信息。
- center pooling 一个用来预测中心点的分支。通过求中心点在特征图上垂直和水平方向最大的响应和来实现。
- cascade corner pooling 一个用来预测角点的分支。 通过求在特征图上边界和内部方向上最大的响应和。
CenterNet是一种先进的目标检测方法,通过引入中心关键点丰富了CornerNet的边界框信息,提高了检测精度。它使用中心池化和级联角点池化策略,有效解决了基于anchor的目标检测存在的问题。
1295

被折叠的 条评论
为什么被折叠?



