Human Poe Estimation with Spatial Contextual Information

本文介绍了百度研究院与香港科技大学合作的研究,提出了Cascade Prediction Fusion (CPF) 网络和Pose Graph Neural Network来改进人体姿态估计。CPF网络通过1x1卷积和逐元素加法保持早期位置信息,辅助高层语义提取,提高关键点预测准确性。同时, Pose Graph Neural Network对初步预测的关键点进行修正,利用GRU和图知识。该方法不同于传统的多阶段网络设计,如Hourglass和CPM,为人体姿态估计带来了新的思路。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

文章地址链接:arxiv
百度研究院和香港科技大学联合出品的一篇单人pose检测文章.主要创新点有两个:

  1. 提出了Cascade Prediction Fusion网络用来预测关键点
  2. 提出了Pose Graph Neural Network, 用来对1预测的关键点进行修正

第二个创新点用到了GRU及一些图的知识, 不是很了解,重点讲下第一个创新点.
现有的pose estimation网络,自从hourglass及cpm提出之后,主流的思想都变成了设计一个特征提取更好的backbone网络 + multi-stage 的pose estimation网络. 例如hourglass, 是将一个一个的hourglass module串联起来, 上一个hourglass module的输出包括两个, 一个是单纯的featuremap输出, 另外一个生成的对应的heatmap输出. 这两个输出concate一起之后, 作为下一个hourglass module的输入. 更有名的比如openpose, 也是多个stage的串联, 上一个stage的输出, 包括featuremap和heatmap都会concate一起后作为下一个stage的输入. 目前多个stage的网络设计,虽然内部实现不一样, 但基本都是做类似处理, 把上一个stage的输出集中在一起作为下一个stage的输入. 本文的做法不大一样,首先看CPF网络的整体流程图:在这里插入图片描述
从上图可以看出, CPF网络仍然是multi-stage的形式, 但对pred heatmap做了不一样的处理. stage t 得到的heatm

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值