Stetman的读paper小记:Deep Learning Backdoor Survey (Shaofeng Li, Shiqing Ma, Minhui Xue)

本文深入探讨了深度神经网络(DNN)中的后门攻击,包括BadNet、CleanLabel、隐藏触发器等攻击方式。文章介绍了三种攻击类型:白盒、灰盒和黑盒攻击,并阐述了针对联邦学习的分布式后门攻击。检测和防御后门涉及识别后门存在、确定触发器和缓解攻击。常用方法如NeuralCleanse和ABS通过模型分析来检测和移除后门。此外,STRIP作为一种部署后防御技术,通过输入扰动来检测潜在的后门行为。

Contents:

1.Introduction to Backdoors in Deep Neural Networks

2. Backdoor Attacks

3. Detecting and Defending Backdoors

4.Applications of Backdoors

Introduction to Backdoors in Deep Neural Networks

文章对神经网络中的后面攻击给出了如下解释: 

A backdoor attack against Deep Neural Networks (DNNs) is to inject hidden malicious behaviors into DNNs such that the backdoor model behaves legitimately for benign inputs, yet invokes a predefined malicious behavior when its input contains a malicious trigger.

 简而言之,即是将恶意后门注入神经网络中,使它在一般情况下调用良性模型,在含有触发器的输入时发动恶意行为。

文章举了一个简单的例子:

Three kinds of Backdoor Attacks

文章根据攻击者的权限及能力,将后门攻击划分为三种情形:white-box、gray-box、black-box。(攻击者能力由强到弱)

white-box attack

attack

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值