读书笔记:DeepPose: Human Pose Estimation via Deep Neural Networks

本文介绍了DeepPose,一种利用深度神经网络进行人体姿态估计的方法。通过将姿态估计转化为关节回归问题,利用级联的DNN提高预测准确性,解决了传统方法在遮挡和上下文判断上的难题。实验表明,DeepPose在FLIC和LSP数据集上取得了较好的效果,为后续研究提供了新思路。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

摘要

文章提出一直基于DNN的人体姿势估计方法,人体姿势估计被转化成一个DNN的关节回归问题,文章还提出采用级联的DNN来提高预测的精度,这个方法的优势在于利用了全局的信息。

介绍

人体姿势估计被看做是一个关节点定位问题是计算机视觉一直重点关注的领域,但是在这个领域一直面临着很多挑战,比如说看不见的,那些小的关节,遮蔽的关节点,需要根据上下文判断的关节点,而这个领域主流的工作是各式样的关节姿态。在此之前的方法都是基于局部建模,他们的效果都不怎么好,下面的图就能说明一些问题。

为了解决上面的问题,作者提出了用DNN以整体方式来预测预测人类关节点的方法,作者把姿势估计问题看做是关节回归问题,并且给出了如何将DNN用于关节回归,每一关节点的定位使用一整幅图像输入到7层CNN来做回归,这样子做的优点在于,第一,DNN能够捕捉每一个关节的完整上下文,每一个关节回归点都使用全局的图像,第二,方法简单,容易实现,通用的DNN就可以解决问题。更进一步,作者使用级联的DNN-based 姿态检测器。这种级联的检测器能够增加关节点定位的精确度。首先在一整幅图像上进行粗略的姿态估计,然后使用多个DNN-based 回归器对关节点的邻域子图优化预测结果。

相关工作

作者定义人的一个姿势定义为k个人体关节来表示,yi表示第 i个关节点的坐标,一个带有标签的图像表示为 (x,y),因为x代表的图像代表的关节坐标是在绝对坐标系下,因此需要正规化。bound box 由b=(bc,bw,bh), bc 表示为预测之后关节点的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值