手势识别的整体流程分析

最新推荐文章于 2025-10-13 23:55:00 发布

转载最新推荐文章于 2025-10-13 23:55:00 发布 · 5.5k 阅读

·

1

·

文章标签：

#手势识别 #机器学习

机器学习同时被 2 个专栏收录

20 篇文章

订阅专栏

3 篇文章

订阅专栏

本文深入探讨了手势识别系统的核心流程，并通过分析ChaLearn数据库在2012年的挑战赛结果，展示了常见预处理、特征提取、维数约简、手势表达和分类方法。介绍了手势识别系统的整体流程，包括去噪、时间分割、特征提取、特征表示和分类器设计，以及在分类时常用的相似度测量方法。重点突出了识别过程中手势表达的重要性，并指出在分类时使用最多的分类器是最近邻。

本文转载自http://www.cnblogs.com/tornadomeet/archive/2013/02/26/2933358.html

关于ChaLearn数据库在前面文章ChaLearn Gesture Challenge_1：CGD数据库简单介绍中已经介绍过，当然了，关于该数据库的挑战赛在2012年主办了2场，其比赛结果依次分别在CCPRW2012和ICPRW2012中公布。这2轮比赛过程中官网http://gesture.chalearn.org/中都有对参加比赛的队伍所使用的方法等从感性上做了个调查，并且公布了其调查报告。从这些报告中我们可以参考到做手势识别的大概流程，每个流程中常见的方法是什么，我想这点对初步进入该领域的人来说应该有很大的启发作用。下面就官网发布的第二轮比赛调查Method survey文章来简单分析下。

　　从文章中可以看出识别过程主要分为2大部分：预处理及数据表达、识别。

　　其中预处理及数据表达又可以细分为很多，比如说图像增强和滤波，这有时候也是需要的，因为识别的视频数据中有不少噪声。文章对比赛获得前8名的方法分析了下，其结果如下：

　　

　　其中的方法也有不少，比如说去噪，均衡白化，对比度增强，频域变化，背景消除等。特征提取各队伍使用的方法分布如下：

　　

　　其中包括了常见的HOG/HOF描述等。

　　当然了，特征最终提取出来还是要经过维数约简的，如下:

　　

　　在识别过程中，有可能会使用到时间分割，如下：

　　

　　很多分割方法和识别是结合在一起的。

　　当然了，识别过程中比较重要的是手势的表达，这些队伍使用的方法如下：

　　

　　其中基于可变长度的向量表示最多。

　　在分类时的相似度测量，使用的方法分布如下：

　　

　　最后面就是使用的分类器了，如下所示：

　　

　　可以看出在这些队伍中，用得最多的分类器是最近邻。

　　现在总结下手势识别系统的大概流程可以如下（当然了，并不是每个步骤都需要的）：

　　去噪预处理——》时间分割——》特征提取——》维数约简——》特征表示——》分类器设计（可能用到相似度测量）.

　　参考资料:

http://gesture.chalearn.org/

Method survey

ChaLearn Gesture Challenge_1：CGD数据库简单介绍

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。