19、利用浊音语音检测语音转换欺骗攻击

利用浊音语音检测语音转换欺骗攻击

一、引言

传统上,用户名和密码用于身份验证,但安全处理它们很困难,密码泄露会导致许多安全漏洞。生物识别认证可以消除使用密码的负担,如指纹、视网膜扫描或声纹等。自动说话人验证(ASV)系统作为一种低成本、灵活的生物识别认证技术很受欢迎,但它容易受到欺骗攻击,包括模仿、重放、语音合成、双胞胎和语音转换等。其中,重放、语音合成和语音转换由于有成功的开源工具可生成高质量的欺骗语音,仍然是威胁。

目前,检测欺骗语音的对策正在积极开发中,2015 年发起的 ASVspoof 挑战通过有组织的试验和评估推动了相关研究。大多数已开发的方法在频域中使用滤波器组进行特征提取,以获得子带频谱特征,然后使用复杂的分类器(如高斯混合模型(GMM)或深度神经网络(DNN))进行分析,最佳系统会结合多个分类器。虽然欺骗检测有了显著进展,但对于某些特定攻击,检测准确性仍然不足。

语音信号由浊音和清音段组成,它们的产生机制和特征不同。一般来说,欺骗攻击会应用于整个语音信号,而不分别考虑浊音和清音段,因此这些段中的伪像位置和程度会有所不同。研究发现,在比较真实语音和欺骗语音的频谱时,最大差异位于浊音段的 0 - 4 kHz 频段,基于此提出了一种低复杂度的预处理阶段,在欺骗检测之前对浊音帧进行下采样。

具体贡献如下:
1. 证明浊音语音段比清音语音段更有助于欺骗检测,并描述了用于欺骗检测的信息在浊音和清音语音段的频带中的分布。
2. 提出一种低复杂度的预处理阶段,在欺骗检测之前仅对浊音帧进行下采样,该阶段可将所需数据量减少 4 倍,同时保持整体检测准确性(类似的合并等错误率)。
3. 表明该预处理阶段可以与不同的现有欺骗检测系统结合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值