【论文学习】ASVspoof 2015 the First Automatic Speaker Verification Spoofing and Countermeasures Challenge

本文介绍了ASVspoof2015挑战,该挑战旨在评估自动语音验证(ASV)系统对欺骗攻击的鲁棒性。挑战使用了一个标准数据库,包含多种语音合成和语音转换欺骗攻击。结果表明,尽管存在针对已知攻击的高效对策,但对未知攻击的检测性能显著降低,强调了开发通用对策的必要性。未来工作将关注包括更多攻击类型、信道效应和通用性对策的开发。

《ASVspoof 2015: the First Automatic Speaker Verification Spoofing and Countermeasures Challenge》论文学习

  摘要

       越来越多的独立研究已经证实了自动说话人验证( ASV )技术对欺骗干扰的脆弱性。
       然而,与其他生物识别方式相比, ASV 的欺骗和对抗研究仍处于起步阶段。
       目前阻碍研究进展的一个障碍是缺乏标准,这阻碍了对不同研究人员产生的结果进行比较。
        ASVspoof 计划旨在通过提供标准语料库、协议和度量来支持共同的评估来克服这一瓶颈。
       本文介绍了第一届的情况,总结了结果,并讨论了未来的挑战和研究方向。
       
       关键词 —— 说话人验证,欺骗,反欺骗,反措施,欺骗检测
       

  1 介绍

       自动说话人验证( ASV )提供了一个低成本和灵活的生物识别解决方案的人身份验证。
       虽然 ASV 系统的可靠性现在被认为足以支持大众市场的采用,但人们担心该技术容易受到欺骗,也被称为表示攻击。
       欺骗是指一种攻击,欺骗者通过伪装成另一个注册人员来操作生物识别系统。
       已知的漏洞包括通过模仿、重放、语音合成和语音转换(《Spoofing and countermeasures for speaker verification: A survey》)进行的攻击。
       
       保护 ASV 系统免受欺骗的一般策略有两种:第一种是继续追求一般意义上更健壮的 ASV 技术;第二种更流行的方法是围绕开发新的欺骗干扰对策。
       针对重放攻击(《Preventing replay attacks on speaker verification systems》,《Detecting replay attacks from far-field recordings on speaker verification systems》,《Re-assessing the threat of replay spoofing attacks against automatic speaker verification》,《A study on replay attack and anti-spoofing for text-dependent speaker verification》),语音合成(《Detection of synthetic speech for the problem of imposture》,《Evaluation of speaker verification security and detection of HMM-based synthetic speech》,《Synthetic speech detection using temporal modulation feature》,《A cross-vocoder study of speaker independent synthetic speech detection using phase information》),语音转换(《Detecting converted speech and natural speech for anti-spoofing attack in speaker recognition》,《A study on spoofing attack in state-of-the-art speaker verification: the telephone speech case》,《A new speaker verification spoofing countermeasure based on local binary patterns》,《Spoofing countermeasures to protect automatic speaker verification from voice conversion》)和非语音、人工信号(《Spoofing countermeasures for the protection of automatic speaker recognition systems against attacks with artificial signals》)的对策已被报告。
       关于最近的调查,读者可以参考《Spoofing and countermeasures for speaker verification: A survey》。
       虽然目前没有其他选择,但使用非标准数据库、协议和指标导致了两个重大问题:(i)缺乏对可比和可重复研究的支持;(ii)缺乏泛化的对策。
       
       专注于高度特定的欺骗攻击和使用非标准数据库常常会阻碍不同结果的比较。
       例如,许多涉及语音转换欺骗攻击的工作是通过 NIST 说话人识别评估( SRE )数据集执行的,通常使用不同的语音转换算法、协议和度量。
       华尔街日报( WSJ )的数据集在涉及合成语音欺骗攻击的工作中一直很流行,但同样也有各种各样的实验配置。
       由于数据库、协议和度量多样性(《Spoofing and countermeasures for speaker verification: a need for standard corpora, protocols and metrics》)的存在,不同实验结果之间的比较是极其复杂的,如果不是近乎无意义的话。
       
       缺乏泛化的对策是由于在其发展过程中不恰当地使用了先前的信息而造成的。
       现有的大多数对策都是通过使用与将要被检测的相同的欺骗方法产生的训练数据进行优化。
       这显然不代表真实的用例场景,在实际用例场景中,不可能知道欺骗攻击的确切性质。
       最好的情况是,用这些方法产生的研究结果夸大了对策性能;最坏的情况是,它们掩盖了问题的真实尺度。需要通用的对策(《A one-class classification approach to generalised speaker verification spoofing countermeasures using local binary patterns》,《Joint speaker verification and anti-spoofing in the i-vector space》)来检测以前未被发现的欺骗干扰攻击,即未知欺骗干扰攻击。
       
        ASVspoof 挑战旨在通过以下方法激励进一步的发展:(i)通过多种不同算法实现的不同欺骗攻击来收集和分配标准数据集;(ii)一系列的竞争评估。
       继 2013INTERSPEECH 在法国里昂举行的 “欺骗干扰与自动扬声器验证对策” (《Spoofing and countermeasures for automatic speaker verification》)特别会议之后, 2015INTERSPEECH 在德国德累斯顿举行了第一届 ASVspoof 挑战赛(《ASVspoof 2015: Automatic speaker verification spoofing and countermeasures challenge evaluation plan》)。
       该挑战的目的是首次支持对欺骗漏洞和对抗性能的独立评估。
       该计划提供了一个公平的竞争环境,以方便在一个通用数据集上使用标准协议和度量比较不同的欺骗对策。
       在尽可能防止不恰当地使用先验知识的同时,该挑战还旨在刺激通用对策的开发,以潜在地检测变化的和不可预见的欺骗攻击。
       
       为了降低进入成本和最大化参与,第一个 ASVspoof 挑战只涉及检测欺骗语音。
       通过将欺骗干扰检测与 ASV 分离,后者的专业知识不是参与的先决条件。
       参与者被邀请开发欺骗检测算法,并为免费提供的标准数据集和协议提交分数。
       该数据集是根据10种不同的语音合成和语音转换欺骗算法的不同组合生成的。
       在评估过程中没有披露任何试验中涉及的特定欺骗干扰算法。
       组织者使用评估计划(《ASVspoof 2015: Automatic speaker verification spoofing and countermeasures challenge evaluation plan》)中描述的标准指标来评估性能。
       
       本文描述了 ASVspoof 数据库、协议和度量,所有这些都不受专利限制。
       此外,还提供了 16 组参与者结果的摘要。
       最后,报告将观察结果和发现于未来优先事项一并提出。
       

  2 ASVspoof数据库和协议

        ASVspoof 是基于一个标准的数据库,包括真实的和欺骗的语音。
       该系统记录了 106 位人类( 45 位男性和 61 位女性)的真实语音,没有任何修改,也没有显著的信道或背景噪音影响。
       利用多种语音合成( SS )和语音转换( VC )算法对原始的真实语音数据进行修改,得到欺骗语音。
       生成欺骗语音的更多细节和协议可以在(《SAS: A speaker verification spoofing database containing diverse attacks》)中找到。
       整个数据集被划分为三个子集,第一个用于培训,第二个用于开发,第三个用于评价。
       每个子集中的发言者和试验的数量如表 1 所示。在这三个子集中没有说话人重叠。

表1

1 : 训练、开发和评估集中不重叠目标说话者和话语的数量,每句话的持续时间都在一到两秒之间 </
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值