动态手势识别与语音转录实验研究
在科技不断发展的今天,动态手势识别和语音转录技术在诸多领域展现出了巨大的应用潜力。本文将为大家详细介绍动态手势识别以及语音转录的相关研究,包括其使用的技术、实验结果以及未来的应用前景。
动态手势识别
在动态手势识别方面,为了对不同的手部手势进行分类,研究人员采用了多种技术。
变换技术
- 离散傅里叶变换(Discrete Fourier transform) :对于长度为 m 的向量 V,其傅里叶变换定义如下:
[
fft(V) = Y(k) = \sum_{j = 1}^{m} V(j) \times W_m^{(j - 1)(k - 1)}
]
其中,(W_m = exp(-\frac{2i\pi}{m}))。 - 离散小波变换(Discrete wavelet transform,dwt) :从长度为 m 的信号 V 开始,计算两组系数:近似系数 CA1 和细节系数 CD1。这些向量是通过将 V 与低通滤波器 (Lo_D) 进行卷积以获得近似值,与高通滤波器 (Hi_D) 进行卷积以获得细节,然后进行二进抽取得到的。每个滤波器的长度等于 2L。对于长度为 m 的信号,系数 CA1 和 CD1 的长度为 ([(m - 1) / 2 + L])。
分类器
为了将考虑的数据集中的不同手部手势区分为 11 类,研究人员使用了多类一对一的支持向量机(SVM)分类器,并在已有的合成数据集上进行训练。采用的是 LIBSVM 包中的实
超级会员免费看
订阅专栏 解锁全文
872

被折叠的 条评论
为什么被折叠?



