DeepDriving | 经典的目标检测算法：CenterNet

原创于 2024-06-16 22:20:35 发布 · 855 阅读

17 ·

CC 4.0 BY-SA版权

文章标签：

#目标检测 #算法 #人工智能 #python #计算机视觉 #目标跟踪 #ai

深度学习拓展阅读同时被 2 个专栏收录

989 篇文章

订阅专栏

CV-目标检测专栏

145 篇文章

订阅专栏

本文来源公众号“DeepDriving”，仅用于学术分享，侵权删，干货满满。

原文链接：经典的目标检测算法：CenterNet

1 前言

CenterNet是2019年发表的一篇文章《Objects as Points》中提出的一个经典的目标检测算法，该算法采用Anchor-Free的方式实现目标检测及其他一些扩展任务，非常值得研究。

2 主要思想

CenterNet将目标检测当做一个标准的关键点估计问题，将目标表示为一个在其bounding box中心位置的单独点，其他的一些属性比如目标尺寸、维度、朝向和姿态等则直接从这个中心点位置的图像特征中进行回归。该模型将图像输入到一个全卷积网络中用来生成热力图，热力图的峰值位置即为目标的中心，每个峰值位置的图像特征用来预测目标bounding box的宽度和高度。该模型训练过程采用标准的监督学习方法，推理过程则是简单的网络前向传播而不需要在后处理中做非极大值抑制处理。这篇文章提出的是一个通用的目标检测方法，只需要在中心点的预测中添加一些额外的内容就可以非常简单地扩展到其他任务中去，比如3D目标检测和人体姿态估计。对于3D目标检测任务，是通过回归目标的绝对深度、3D bounding box维度和目标的朝向来实现的；而对于人体姿态估计任务，则是将2D关节位置视为距中心点的偏移量，并且在中心点位置直接回归得到它们。