Deeply Learned Compositional Models for Human Pose Estimation

博客提出一种组合模型表示人体各部分层次关系,利于解决low-level模糊问题。介绍了bottom-up和top-down过程的信息估计方法,还提出bone heatmap解决组合爆炸问题。实际模型以hourglass为baseline,可借鉴利用人体层次信息及bone-based监督解决问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

提出一种组合模型,表示人体各部分的层次关系3,有利于解决low-level的模糊问题。

 

主要的思路是这样的:单个关节点是lowest-level part, 通过组合,形成各个层次的high-level part, 如上图(a)。在bottom-up过程中,  首先在输入图像中粗略估计lowest-level信息, 再依次迭代的估计high-level信息。 在top-down过程中,low-level信息可以通过high-level的信息估计, 当然也需要依靠同级的信息(bottom-up中获得)。这可以在(c)图看出。

为了解决组合爆炸的问题, 文中提出bone heatmap。他包含了scale, orietation等信息,同时降低了组合复杂度。

实际模型采用hourglass作为baseline, 5个stacks。整体实现比较hourglass改动不大。

可以借鉴的点:

1.  利用人体部位的层次信息, high-level的信息对low-level的问题解决有帮助;

2. bone-based 的监督, 这种heatmap包含方向、尺度等有益信息, 对遮挡等问题解决有帮助。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值