提高关键点预测精度的小技巧

本文探讨了人体姿态估计和人脸对齐领域的一个常见技巧:通过计算原图及其翻转图像产生的heatmap平均值来稳定预测结果。这种方法能有效提高预测的稳定性,被多种先进算法如Cascaded Pyramid Network(CPN)、Self Adversarial Training for Human Pose Estimation等采用。

在人体姿态估计(human pose estimation)和人脸对齐(face alignment)领域。很多文章中,在测试(testing)的时候,我们都会选择使用原图产生的heatmap和 翻转后图片(flipped image) 产生的heatmap求平均。
很多人不理解这个小技巧,在github上看到有人提到这个问题。
我理解的是因为预测是的不稳定造成的,同样的一个点,翻转后预测的点,再翻转回来就相当于原图的heatmap了, 他的位置和直接拿原图预测的点可能不在同一个位置。这样取平均可以折中一下,使得预测的结果更加平稳。
这样的提升一般都会很明显。
很多文章也用到了这个小技巧,
Cascaded Pyramid Network(CPN)
Self Adversarial Training for Human Pose Estimation
Deep High-Resolution Representation Learning for Human Pose Estimation
论文原话摘抄:
To stabilize the predictions, we evaluate both the original image and its flipped version, and average their output heatmaps.(《Self Adversarial Training for Human Pose Estimation》)

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值