小白读论文:机器学习的安全威胁和防御技术(下)——机器学习的防御技术

论文:Q. Liu et al. 2018. Survey on Security Threats and Defensive Techniques of Machine Learning: A Data Driven View. IEEE ACCESS.

目录

机器学习的防御技术:

安全性评估模型

主动防御

被动防御

安全性评估

训练阶段的防御对策

数据净化

鲁棒性提高

预测推断阶段的防御对策

通过博弈提高鲁棒性

通过数据重分布主动防御

平滑模型输出技术

降维策略

统计检验

集成学习

数据安全与隐私

差分隐私(differential privacy, DP)

同态加密(homomorphic encryption, HE)

减少API的敏感输出

未来研究方向/趋势


机器学习的防御技术:

模型的安全性测试通常用假设法:对分类器漏洞引入对抗性假设,然后提出保护对策。

安全性评估模型

通常有2种防御机制:主动防御、被动防御。

二者的主要区别:

(1)主体不同,主动防御中攻击和防御都是由模型设计者完成的,被动防御则是外部攻击

(2)目的不同,被动防御是真攻击(恶性)、主动防御是自我体检(良性)

主动防御

(1)选择对抗模型

(2)启动渗透测试

(3)评估攻击影响

(4)实施防御策略

被动防御

(1)攻击者会通过分析目标分类器找到合适的攻击方法

(2)模型的设计者会对新输入的数据进行分析并处理攻击下生成的结果、然后使用一些防御机制,比如重新收集数据、引入新的特征来更新分类器

(3)攻击者和模型设计者的行为不断竞争从而加强模型的防御性

安全性评估

对抗数据会导致非稳态分布,因而可以用于评估模型安全性以及是否存在对抗数据

(1)根据目标、模型了解度、攻击者能力等前述攻击条件选择合适的对抗模型

(2)重新定义数据集p(Y), p(A|Y) and p(X|Y, A)

Y∈{L, M}:类标签,L:良性,M:恶意;

L∈{F, T}:布尔随机变量,T:改过,F:没改过。

(3)对重新定义前的数据构建为训练集TR、测试集TS,通过经典重采样技术构建k个数据子集(cross-validation, bagging, ...

(4)用TR和TS集模拟测试攻击环境下的模型表现

训练阶段的防御对策

两大对策:保证训练数据的纯洁性/提高模型鲁棒性

数据净化

识别对抗样本、分离、删除

eg. Reject on Negative

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值