HigherHRNet: Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation (CVPR2020)

最新推荐文章于 2025-02-23 13:11:31 发布

原创

最新推荐文章于 2025-02-23 13:11:31 发布 · 3.2k 阅读

13 ·

CC 4.0 BY-SA版权

文章标签：

#HRNet #HigherHRNet #Bottom-Up #MultiPersonPose

HigherHRNet是HRNet的升级版，它在底向上的人体姿态估计任务中表现出色。通过增加反卷积层，提升特征图分辨率，从而提高了预测精度。HigherHRNet采用多分辨率监督，利用不同尺度的heatmap融合实现对不同大小人物的准确定位。在COCO和Crowd Pose数据集上，HigherHRNet达到了最先进的结果。

official pytorch code
paper link
恭喜文章被CVPR 2020接收。本来19年的时候在arxiv上找到了这篇文章，当时还是叫做"Bottom-up Higher-Resolution Networks for Multi-Person Pose Estimation"，今天一看arxiv上已经更新到v3了，名字也改了。

HigherHRNet是在HRNet和Simple baseline工作的基础上形成了。HRNet因其可以一直保持一个high resolution way来提取feature，提取的feature效果很好，从而可以用在pose estimation，object detection，semantic segmentation等工作上，具体可以查看here. HigherHRNet则更进一步，因为之前simple baseline的工作证明了，通过反卷积得到更高分辨率的featuremap有助于pose estimation效果的提高，因此，HigherHRNet就是在HRNet原本输出的featuremap基础上，额外加入了一个反卷积，使得模型的输出size进一步提高，pose estimation效果更好。HigherHRNet的具体网络结构如下图所示：在这里插入图片描述
虚线后面就是HigherHRNet在HRNet基础上新加的内容。除了需要在原本的1/4 branch上得到heatmap输出外，又在此基础上额外加入个反卷积得到1/2的featuremap，并在后面加上4个residual block用来refine，最终得到1/2