【手势识别-论文学习】 Hands Deep in Deep Learning for Hand Pose Estimation

最新推荐文章于 2023-05-31 18:00:09 发布

十年的小白

最新推荐文章于 2023-05-31 18:00:09 发布

阅读量5.1k

点赞数

CC 4.0 BY-SA版权

分类专栏：手势识别文章标签： depth image cnn 迭代

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/seavan811/article/details/48198281

本文介绍了一种使用CNN网络直接输出手部关键点的方法，通过引入prior和refinement网络提高了精度。研究对比了浅、深、多尺度网络，并提出了基于低维嵌入的手势参数化思想。refinement步骤进一步增强了关键点定位的准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

(CVWW 2015) Hands Deep in Deep Learning for Hand Pose Estimation

这篇文章是使用CNN网络来直接输出关节点位置。本文的特点是速度很快并且精度可以通过refinement提高。作者主要的贡献是两个部分:

设计一个加入了prior的网络输出手的关节点
基于上述关节点预测，对每一个关节点用一个refinement网络来进行更精确的关节点输出。甚至可以用迭代的方式多次refine关节点位置

文章直接对比了四个网络：shallow，deep，multi-scale，和deep with prior。

首先对于前面三者的对比，作者的观点：“unsurprisingly, the multi-scale approach performs better than the deep architecture, which performs better than the shallow one.” 多尺度网络>深网络>浅网络（的确unsurprisingly）。但是作者认为手势估计是一个非常复杂的任务，自由度非常高，在那么一个庞大的解空间里面直接搜寻一个最优解似乎是很不容易的。但是作者借着【1】的思想，认为“a low dimensional embedding is sufficient to parameterize the hand’s 3D pose”，所以不同于直接预测关节点位置，作者希望能预测low dimensional空间的参数。因为在【1】中，各种手势被认为是rely on a linear embedding，换句话说手势可以被认为是一些低维的basis configuration的线性组合。这样相当

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。