OpenPose-Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields

本文深入探讨了人体姿态识别的概念,分析了实时多人姿态识别面临的挑战,比较了自顶向下和自底向上两种算法的优劣,并介绍了Openpose算法如何通过部分亲密场(PAF)实现高效准确的姿态识别。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、人体姿态识别的定义

定位图像中人体的关键点,描绘出每个个体的躯干

二、实时多人姿态识别的困难

1.每张图片中人体的个数未知,而且人体的尺度大小和出现在图片中的位置不知道

2.人体与人体的交叉部分会产生复杂的干扰

3.算法的运行复杂度倾向于随着图片中人体的个数而增加(密集人体的识别问题),导致实时性困难

三、自顶向下的算法

首先运用目标检测算法检测出单个人体,然后再进行单人的姿态识别,该算法依赖于已经存在的单人姿态检测算法。但是受限于人体的目标检测,当对人体与人体之间挨得非常近得时候,检测就容易失败,而且无法从失败中恢复。而且该算法得运行时间和图片中人物的数量成正比。

四、自低向上的算法

自低向上算法的优点:早期健壮性;很有可能解决算法复杂度随图像中人物的增加而大幅上升的问题。然而,自底向上的方法并不直接使用来自其他身体部位和其他人的全局上下文线索。在实践中,以前的自底向上方法,没有保留效率的提高,因为最终解析需要昂贵的全局推理。如前人使用的基于全连接图的整数规划方法(NP hard);成对关键点表示低准确度,需要独立的逻辑回归。

五、Openpose的前言

 

使用PAF(part affinity fields),部分亲密场,一个2维向量场来对图像中关键点的位置和躯干方向进行编码。同时检测关键点和关联关键点,然后使用贪心解析的方式可以实现高质量的结果,同时计算开销可观。

(1)处理流程(2)PAF和Confidence MAP (3)GroundTruth的获取 (4)网络结构

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值