人体姿态估计(Human Pose Estimation)也称为人体关键点检测(Human Keypoints Detection)。对于人体姿态估计的研究,大致可做如下分类。
1. RGB vs RGBD
后者多一项Depth信息,常用于3D人体姿态估计的研究。
2. 2D Human Pose Estimation vs 3D Human Pose Estimation
3. Singe Person vs Multiple Persons
4. Image vs. Video
对于Video,除了人体姿态估计算法外,要增加对于关键点的Tracking(追踪)的研究。
5. Top-down vs. Bottom-up
以上为深度学习方法中两个主要的研究思路。
Top-down首先利用目标检测算法检测出单个人,然后对proposal进行关键点的检测。这种方法一般具有较高的准确率但是处理速度较低。代表性的方法有:
(1) Stacked Hourglass Network(半壁江山)
Github: https://github.com/Naman-ntc/Pytorch-Human-Pose-Estimation (Pytorch)