official pytorch code
paper link
恭喜文章被CVPR 2020接收。本来19年的时候在arxiv上找到了这篇文章,当时还是叫做"Bottom-up Higher-Resolution Networks for Multi-Person Pose Estimation",今天一看arxiv上已经更新到v3了,名字也改了。
HigherHRNet是在HRNet和Simple baseline工作的基础上形成了。HRNet因其可以一直保持一个high resolution way来提取feature,提取的feature效果很好,从而可以用在pose estimation,object detection,semantic segmentation等工作上,具体可以查看here. HigherHRNet则更进一步,因为之前simple baseline的工作证明了,通过反卷积得到更高分辨率的featuremap有助于pose estimation效果的提高,因此,HigherHRNet就是在HRNet原本输出的featuremap基础上,额外加入了一个反卷积,使得模型的输出size进一步提高,pose estimation效果更好。HigherHRNet的具体网络结构如下图所示:
虚线后面就是HigherHRNet在HRNet基础上新加的内容。除了需要在原本的1/4 branch上得到heatmap输出外,又在此基础上额外加入个反卷积得到1/2的featuremap,并在后面加上4个residual block用来refine,最终得到1/2

HigherHRNet是HRNet的升级版,它在底向上的人体姿态估计任务中表现出色。通过增加反卷积层,提升特征图分辨率,从而提高了预测精度。HigherHRNet采用多分辨率监督,利用不同尺度的heatmap融合实现对不同大小人物的准确定位。在COCO和Crowd Pose数据集上,HigherHRNet达到了最先进的结果。
最低0.47元/天 解锁文章
1372

被折叠的 条评论
为什么被折叠?



