唇生物特征数字识别与嵌入式指纹认证系统技术解析
1. 唇生物特征数字识别
在数字识别领域,利用唇动信息进行数字识别是一个具有前景的研究方向。
1.1 特征提取
- 视觉特征 :唇动的视觉特征维度最初为 128 × 128 × 2 = 32768,经过处理后用 144 维(M × M)特征向量表示,其中 N 和 M 分别代表窗口大小和框的数量。
- 声学特征 :采用梅尔频率倒谱系数(MFCC)提取声学特征信息,通过隐马尔可夫模型工具包(HTK)处理音频数据流生成 MFCC 语音特征,其特征向量维度为 39,包含 12 个倒谱系数(带归一化对数能量)、13 个一阶差分系数(速度)和 13 个二阶差分系数(加速度)。
1.2 分类方法
使用支持向量机(SVM)进行分类,它是一种基于判别式的二元方法,以超平面 w · x + b = 0 作为两类或多类之间的决策边界。对于线性可分的训练数据集标记对 xi, yi(i = 1, …, l,其中 xi ∈ℜn 且 y ∈{1, -1}l),每个观测数据(这里指特征向量)需满足 di(wT xi + b) ≥1 −ξi(i = 1, 2, …, l,ξi > 0),其中 di 是样本数据 xi 的标签(可为 +1 或 -1),wi 和 b 是描述超平面的权重和偏置。实验中使用内积核函数作为径向基函数(RBF)核,并采用一对一分类方法。
1.3 实验结果
实验使用 XM2VTS 数据库,该数据库的视觉数据用于数字识别实验存在困难,因
超级会员免费看
订阅专栏 解锁全文
1751

被折叠的 条评论
为什么被折叠?



