手势识别与文本分词技术研究
1. 手势识别特征提取方法
在图像识别领域,形状是描述图像内容的重要视觉特征。然而,从三维物体的二维图像中提取形状特征是一项具有挑战性的任务,因为将物体从三维投影到二维会导致信息丢失。当图像受到噪声、失真和遮挡影响时,任务变得更加复杂。
常见的形状特征可分为轮廓特征和区域特征,轮廓特征又可细分为全局特征和结构特征。全局特征如面积、周长等用于描述边界形状,而结构特征提取方法如链码、多边形分解等虽能进行部分匹配,但无法捕捉全局信息。特征提取是图像和模式识别系统成功的关键阶段,因此,本文提出了一种简单而高效的方法,用于提取手指的两个特征以识别手势。
- 方法流程
mermaid graph LR A[RGB Image] --> B[Gray Image] B --> C[Binary Image] C --> D[Gaussian Filtered Image] D --> E[MAT Image] E --> F[Cropped Image] F --> G[Find Angle & Tips_Distance] - 步骤说明
- 预处理 :将捕获的 RGB 图像转换为灰度和二值图像,具体任务在之前的研究中有描述。
- 中轴变换(MAT) :MAT 用于找出物体中每个点的最近边界点,最终得到图像的骨架。这里,MAT 被用于将单手势的二值图像转
超级会员免费看
订阅专栏 解锁全文
6

被折叠的 条评论
为什么被折叠?



