”Single-Stage Multi-Person Pose Machines“—— bottom-up多人姿态估计新思路

文章出自2019ICCV,颜水成团队。

提出的SPM算法跳出传统top-downbottom-up的思路,直接预测每个人的位置和keypoints。

感觉是将yolov3CSP行人检测的思路进行了融合。

Structured Pose Representation (SPR)

  • 将人体实例和身体关节的位置信息进行统一。
  • 人体关节分级表示。
 

先前的方法之所以需要两个阶段,主要是由于关节位姿的表示需要基于人体实例的位置来进行。颜水成团队从这个角度出发,探索了新的关节位姿表达方式SPR。

想要单阶段实现多人位姿估计,就需要一个统一人体位置和关节位置的表达。SPR提出了一个很具有启发的观点,它在常规的关节位置外引入了一个辅助关键位置——基准关节,这个基准关节就代表了人体实例的位置。

  • 基本SPR表示

每个人体关键就可以表示为基于这一基准关节的偏移。在这样的表达下,检测问题就被转换为了预测每个人体对应的基准关节以及各个关节相对于基准关节的偏移量,两阶段为题就可以通过统一的关节表达而简化为单阶段问题:

因此,网络只要预测出基准关节的位置和每个关节点相对于基准关节的偏移,即可得到所有关节点的位置。

  • 改进的SPR表示

人在运动时,有些关节离中心的基准关节偏移太大,直接从图像中回归出这些关节的偏移量难度较大误差也大。针对这个为题,作者借鉴了人体关节自身的天然结构,将关节的位移分为了四个层级,将相对于基准关节的偏移转换为了相对于上一级关节的偏移。

改进SPR之后,减小了偏移估计的难度同时也充分利用了躯干构造的结构信息。

 

如何实施

思路非常清晰明了,那么如何构造label和网络的输出呢?

首先从原始SPR表示来讲:

  • root target

 
采用高斯核平滑,首先得到第  个人的 root joint map:
对于图中所有的人,若根节点离得很近,高斯区域有重叠,则该点处的值取每个人最大值:
 
  • joint target

以 joint j 的 label map 为例

首先对于第 个人,表示关节 j 的label map上根据第 i 个人得到的 (x,y) 点的取值

其中:

进一步对于图中所有人,若点

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值