姿态估计——HigherHRNet:Scale-Aware Representation Learning for Bottom-Up Human Pose Estimation

论文原文:https://arxiv.org/pdf/1908.10357.pdf

github:https://github.com/HRNet/HigherHRNet-Human-Pose-Estimation

 

 

Abstract

       自底向上的人体姿态估计方法由于尺度变化的挑战,在预测小个体的正确姿态方面存在困难。在这篇论文中,我们提出了HigherHRNet。一个新的自下而上的方法,使用高分辨率的特征金字塔学习scale-aware表达。 多分辨率监督用于训练和多分辨率聚合用于推理, 该方法能够解决自下而上多人姿态估计中的尺度变化挑战,并更精确地定位关键点,尤其是small persons。 HigherHRNet中的特征金字塔由来自HRNet的特征图输出和通过转置卷积的上采样高分辨率输出组成。 HigherHRNet对于medium person  在COCO测试上的性能优于以前最好的自下而上方法, 表明了其处理规模变化的有效性。此外,在不使用改进或其他后处理技术的情况下,HigherHRNet在COCO的test-dev (70.5%AP)上获得了新的最先进的结果, 超越所有现有的自下而上的方法。 在CrowdPose test(67.6% AP)中 HigherHRNet甚至超过了所有自上而下的方法。 表明它在拥挤场景中的鲁棒性。代码:https://github.com/HRNet/ Higher-HRNet-Human-Pose-Estimation

 

1.Introduction


      2D人体姿态估计旨在定位人体解剖关键点(例如肘部、手腕等。) 。 作为人类行为理解的基本技术,近年来受到越来越多的关注。目前的人体姿态估计方法可分为自顶向下和自下而上的方法。自顶向下的方法依赖人体检测和单人姿态估计。 由于自顶向下的方法可以通过裁剪和调整检测到的人员包围框的大小,将所有人员标准化到大致相同的规模, 它们通常对人的尺度差异不太敏感。  因此,在各种多人人体姿态估计基准上的最先进性能大多是通过自顶向下的方法来实现的。然而,由于这种方法依赖于一个单独的人检测器,需要单独估计每个人的姿态, 它们通常是计算密集型的,而不是真正的端到端系统。 相反,自下而上的方法首先通过预测不同解剖关键点的热图来定位输入图像中所有人的关键点,然后对关键点进行分组连接。 这种策略有效地使自下而上的方法更快,更能够实现实时姿态估计。 然而,由于自下而上的方法需要处理尺度变化, 自下而上和自上而下两种方法的性能之间仍然存在很大的差距,特别是对于small scale的人来说。

         在预测small persons的关键点方面两个挑战:

  1.   一是处理尺度变化,即提高small person的表现,而不影响large persons的表现。   
  2.   另一方面是生成高分辨率的高质量热图,用于精确定位small person的关键点。

 以往的自下而上方法主要集中在对关键点进行分组,简单地使用一个分辨率的特征图,即输入图像分辨率的四分之一来预测热图关键点。 这些方法忽视了尺度变化的挑战,在推理过程中依赖于图像金字塔。如图1 ,a所示。

 特征金字塔是处理尺度变化的基本组成部分, 然而,自顶向下特征金字塔中的较小分辨率特征图通常面临第二个挑战。PersonLab 通过增加输入分辨率生成高分辨率热图,如图1,b所示。虽然随着输入分辨率的增加,sma

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

乐亦亦乐

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值