机器学习系统安全:数据投毒攻击全解析
在机器学习系统的安全领域,数据投毒攻击是一个不容忽视的问题。这种攻击方式通过向训练数据中注入恶意样本,来干扰模型的正常学习过程,从而影响模型的性能和安全性。下面将详细介绍数据投毒攻击的相关内容。
数据投毒攻击场景
数据投毒攻击主要分为两种场景,这两种场景根据攻击者想要造成的错误类型来划分,基本涵盖了对多类分类系统的大部分可能攻击。
-
误差无关投毒攻击
- 攻击目的 :这是最常见的投毒攻击类型,通常在二分类任务中用于造成拒绝服务(DoS)攻击。攻击者旨在使系统产生错误,但不关心错误的具体类型。从安全违规的角度来看,这属于可用性攻击,可针对特定数据集或单个数据点进行无差别攻击。
- 攻击策略公式 :
[D^{*} {p} \in \text{arg} \max {D_p \in \varphi(D_p)} A(D_p, \theta) = L(D_{target}, w(D_p))]
其中,攻击者的目标是最大化目标函数,该目标函数由损失函数 (L) 定义,(L) 与目标分类器使用的损失函数类似,在目标数据集 (D_{target}) 上进行评估。(D_{target}) 可以是目标攻击中的一组精简数据点,也可以是从与受害者使用的相似数据分布中抽取的代表性数据点。损失函数 (L) 还依赖于学习算法的参数 (w),而 (w) 又取决于注入的投毒点集 (D_p),这种隐式依赖可以建模为一个双层优化问题。
超级会员免费看
订阅专栏 解锁全文
3414

被折叠的 条评论
为什么被折叠?



