对Imperceptible, Robust, and Targeted Adversarial Examples for Automatic Speech Recognition的简单理解

博客介绍自动语音识别中的核心技术,利用听觉掩蔽原理构造微小扰动实现物理世界空中音频对抗实例,改变语音迷惑判断。相比以往,现在可让一整个句子作为对抗实例,且从白盒进攻切换到黑盒进攻,对抗性例子常通过对损失函数输入执行梯度下降生成。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

核心技术:
在自动语音识别中,使用不可被探测的高效的音频对抗实例,利用听觉掩蔽的心理声学原理,通过构造 即使在实际的模拟环境扭曲之后仍然有效的 微小扰动来实现物理世界的空中音频对抗性例子,改变语音,去迷惑人们的判断。
( 利用听觉掩蔽的心理声学原理: 仅将对抗性扰动添加到 音频区域,在那里人类不会听到这种干扰,即使这种扰动在绝对能量方面不是“安静”的)
提升的地方:原本只是三四个单词可以作为对抗实例,并且会被人们听到,而现在可以是一整个句子作为对抗实例。并且从白盒进攻(完全知道检测模型的算法机制)切换到黑盒进攻(完全不知道检测模型的结构)。
( 对抗性例子:就是由对手输入的为了扰乱判断的输入。)
对抗性例子通常是通过对损失函数的输入执行梯度下降来生成的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值