一、人体姿态识别的定义
定位图像中人体的关键点,描绘出每个个体的躯干
二、实时多人姿态识别的困难
1.每张图片中人体的个数未知,而且人体的尺度大小和出现在图片中的位置不知道
2.人体与人体的交叉部分会产生复杂的干扰
3.算法的运行复杂度倾向于随着图片中人体的个数而增加(密集人体的识别问题),导致实时性困难
三、自顶向下的算法
首先运用目标检测算法检测出单个人体,然后再进行单人的姿态识别,该算法依赖于已经存在的单人姿态检测算法。但是受限于人体的目标检测,当对人体与人体之间挨得非常近得时候,检测就容易失败,而且无法从失败中恢复。而且该算法得运行时间和图片中人物的数量成正比。
四、自低向上的算法
自低向上算法的优点:早期健壮性;很有可能解决算法复杂度随图像中人物的增加而大幅上升的问题。然而,自底向上的方法并不直接使用来自其他身体部位和其他人的全局上下文线索。在实践中,以前的自底向上方法,没有保留效率的提高,因为最终解析需要昂贵的全局推理。如前人使用的基于全连接图的整数规划方法(NP hard);成对关键点表示低准确度,需要独立的逻辑回归。
五、Openpose的前言
使用PAF(part affinity fields),部分亲密场,一个2维向量场来对图像中关键点的位置和躯干方向进行编码。同时检测关键点和关联关键点,然后使用贪心解析的方式可以实现高质量的结果,同时计算开销可观。
(1)处理流程(2)PAF和Confidence MAP (3)GroundTruth的获取 (4)网络结构