基于双堆叠去噪自编码器的手势识别方法
1 引言
随着可穿戴设备、智能家居、物联网等新技术的迅速发展,打造全面智能化的生活已成为社会发展的主要趋势之一,而人机交互则是实现这一生活的关键。手势作为日常生活中广泛使用的交流方式,是一种自然的人机交互手段。然而,由于手势的模糊性、多样性、相似性,以及背景干扰和不同光照环境的影响,计算机准确快速地识别手势仍然具有很大的难度。
传统的手势识别方法通常包含预处理(如手势区域检测和分割等)和识别两个过程。实际上,预处理对后续手势识别的效果有很大影响,但使用更复杂的预处理会导致较高的时间成本。因此,基于端到端的识别方法吸引了许多研究人员的关注。
自编码器(AE)具有自适应表示能力,在图像处理领域得到了广泛应用。随着成像技术的发展,深度信息可以与RGB图像一同获取。深度图像能计算物体与相机之间的距离,有助于区分不同物体在三维空间中的空间关系,这对于解决物体识别中的背景干扰问题非常重要。因此,考虑深度和强度信息对识别的影响,设计了一种双堆叠去噪自编码器(Dual - SDAE)网络用于手势识别,并分析了网络参数设置(如网络结构、噪声强度和正则化)的影响。
2 堆叠去噪自编码器
对于视觉、语言或其他人工智能任务,构建具有多层非线性映射特征的模型(如神经网络)对于学习更有效和抽象的特征非常必要。在神经网络中,多个隐藏层被引入,每个隐藏层对上层输出进行非线性变换,以提取更复杂的特征。例如,从自然图像中提取有用信息时,原始像素会逐渐转换为更抽象的表达。网络的第一个隐藏层可以组合像素来检测线条或边界,第二个隐藏层可以组合线条或边界来检测轮廓或简单“目标”,更深层次的隐藏层可以进一步组合这些轮廓来检测更抽象和高级的特征。
双堆叠去噪自编码器手势识别方法
超级会员免费看
订阅专栏 解锁全文
1009

被折叠的 条评论
为什么被折叠?



