基于未知语言字母表的唇语密码说话人验证
在说话人验证领域,传统方法在检测嘴部状态和分割唇语序列时存在诸多问题,而本文提出的新方法为解决这些问题带来了新的思路。
现有相关工作
视觉说话人验证因其抗噪性和可移除性受到关注,此前已有不少相关研究:
- 基于模型的方法 :
- Saeed基于唇部轮廓检测提取静态和动态唇部特征,利用高斯混合模型(GMM)对唇部运动进行建模以进行人员识别。
- Wang和Liew利用GMM训练静态特征,用隐马尔可夫模型(HMM)处理动态特征。
- Cetingul等人通过HMM评估明确的唇部运动信息,并与唇部强度和几何特征进行比较,用于说话人识别。
- 这些方法大多让用户说出相同短语进行验证,持续时间和文本固定,且未考虑目标用户说错短语的情况。
- 唇语密码相关方法 :
- Liu和Cheung提出了唇语密码的新想法,由嵌入唇部运动的密码和潜在的唇部运动特征组成,并基于外观和轮廓特征以及多提升HMM学习方法构建了基于唇语密码的说话人验证系统,实验表明该方法在验证私人密码信息和说话人唇部生物特征方面表现良好。
- 嘴部状态检测与序列分割方法 :
- 一些工作通过检测嘴部“闭合”状态将整个唇语序列分割成多个子序列,但这些方法存在分割时切断潜在区分特征的风险,计算繁琐,结果受环境(如光照)影响较大,且某些嘴部闭合较深的单词会被分割。
- 时空特征直接利用方法 :
- Chan等人提出了基于三个正交平面的局部序数对比模式(LOCP -
超级会员免费看
订阅专栏 解锁全文
38

被折叠的 条评论
为什么被折叠?



