Contents:
1.Introduction to Backdoors in Deep Neural Networks
2. Backdoor Attacks
3. Detecting and Defending Backdoors
4.Applications of Backdoors
Introduction to Backdoors in Deep Neural Networks
文章对神经网络中的后面攻击给出了如下解释:
A backdoor attack against Deep Neural Networks (DNNs) is to inject hidden malicious behaviors into DNNs such that the backdoor model behaves legitimately for benign inputs, yet invokes a predefined malicious behavior when its input contains a malicious trigger.
简而言之,即是将恶意后门注入神经网络中,使它在一般情况下调用良性模型,在含有触发器的输入时发动恶意行为。
文章举了一个简单的例子:

Three kinds of Backdoor Attacks
文章根据攻击者的权限及能力,将后门攻击划分为三种情形:white-box、gray-box、black-box。(攻击者能力由强到弱)
white-box attack
attack

本文深入探讨了深度神经网络(DNN)中的后门攻击,包括BadNet、CleanLabel、隐藏触发器等攻击方式。文章介绍了三种攻击类型:白盒、灰盒和黑盒攻击,并阐述了针对联邦学习的分布式后门攻击。检测和防御后门涉及识别后门存在、确定触发器和缓解攻击。常用方法如NeuralCleanse和ABS通过模型分析来检测和移除后门。此外,STRIP作为一种部署后防御技术,通过输入扰动来检测潜在的后门行为。
最低0.47元/天 解锁文章
553

被折叠的 条评论
为什么被折叠?



