安卓恶意软件检测的对抗攻防-优快云博客

海报摘要：安卓恶意软件检测模型具有对抗性鲁棒性吗？

1 引言

近年来，安卓手机呈指数级增长。这些设备能够提供蜂窝网络连接以及计算能力。智能手机通过全球定位系统、麦克风等各种传感器获取大量输入信息。然而，安卓系统的流行也吸引了众多恶意软件开发者，他们出于盈利或娱乐目的设计针对这些设备的攻击。研究表明，当前基于签名、启发式和行为引擎的恶意软件检测系统无法有效应对现有的恶意软件攻击 [2]。因此，研究人员正在开发基于机器学习和深度学习算法的新一代恶意软件检测引擎。

文献表明，基于机器学习和深度学习构建恶意软件检测引擎的过程包含两个步骤：（1）特征提取；（2）分类模型 [2]。Rathore 等人使用了Drebin数据集，该数据集包含恶意和良性安卓应用。他们从应用程序中提取安卓权限，进行特征降维，并使用机器学习和深度学习分类器构建恶意软件检测模型[4]。Xu 等人提出了ICCDetector，该方法使用进程间通信作为特征，并利用支持向量机分类器构建恶意软件检测模型。然而，其他领域的研究人员发现，机器学习和深度学习模型具有对抗性脆弱[5][1]。恶意软件开发者也可以针对新一代恶意软件检测引擎设计类似的对抗攻击，从而危及安全生态系统。因此，在本研究中，我们将首先像恶意软件攻击者一样思考/行动，设计针对恶意软件检测模型的对抗攻击，以发现系统中的漏洞。随后，我们将分析这些漏洞，并开发一种防御策略，以应对攻击并提升恶意软件检测模型的对抗鲁棒性。

2 提出的框架

我们提出了一种六阶段框架（图1），用于开发针对安卓手机的对抗性鲁棒恶意软件检测模型。第一阶段是数据集构建，需要收集恶意和良性安卓应用程序用于实验。安卓应用程序的主要来源是Google Play 商店和其他 3rd方安卓应用商店。许多数据集也由各类研究机构开发并发布。我们在所有实验中使用了包含5560个恶意和5600个良性安卓应用程序的基准 Drebin数据集[2]。第二阶段是从安卓应用程序中进行特征提取，并随后构建恶意软件检测模型。我们从安卓应用程序中提取了权限信息，并生成了特征向量。接着，我们使用多种分类器开发了四种不同的恶意软件检测模型，分别是决策树（机器学习）、随机森林（基于装袋的学习）、自适应提升（基于提升的学习）以及多层感知机（深度学习）。我们开发了多样化的检测模型，以验证并比较它们的对抗鲁棒性。

第三阶段包括针对上述恶意软件检测模型的对抗攻击策略的构建。我们提出了一种基于相关性的规避攻击策略，以发现各种检测模型中的对抗性漏洞。该策略利用皮尔逊相关系数识别出高度相关的良性特征，并将其添加到恶意应用程序中，从而强制使其被错误分类为良性。攻击策略确保对恶意应用施加最小程度的扰动，且所有修改在语法上可行，同时不损害应用的功能完整性。第四阶段包括将所提出的基于相关性的规避攻击应用于第二阶段开发的四个恶意软件检测模型。该攻击策略预期会导致大量错误分类（将恶意应用误判为良性），并降低检测模型的整体性能。第五阶段包括开发对抗性防御措施以应对基于相关性的攻击。多位研究人员提出了对抗性重训练方法，其中在攻击过程中生成的对抗样本被正确标注，并用于重新训练模型[3][5]。第六个也是最后阶段包括将对抗性重训练作为对策应用于恶意软件检测模型，以抵御对抗攻击并提升模型的整体性能。

示意图0

3 实验结果

如所提出的框架中所述，我们首先使用多种分类器开发了四种不同的基线安卓恶意软件检测模型，即决策树、随机森林、自适应提升和多层感知机。图2显示了各种基线恶意软件检测模型的准确率（图‐2，蓝色条形），其中随机森林模型（94.43 %）达到了最高的准确率。接下来，我们对上述模型应用基于相关的规避攻击，将恶意应用转化为对抗样本，这些对抗样本被检测模型错误分类为良性。对抗攻击策略几乎成功地将所有恶意应用转换为对抗样本，这显著降低了所有四个恶意软件检测模型的准确率（图‐2，红色条形）。最后，我们采用对抗性重训练作为对策，将在攻击过程中生成的所有对抗样本正确标记为恶意，并添加到原始数据集中。现在，所有四个恶意软件检测模型都使用更新后的数据集和相同的对抗攻击进行重新训练。所有四个重训练后的模型在准确率上均实现了显著提升（图‐2，绿色条形），其中多层感知机（95.21%）达到了最高的准确率。因此，所提出的基于相关性的攻击利用了恶意软件检测模型中的漏洞。然而，还可以设计各种其他攻击来利用相同或不同模型的漏洞。最终，对抗防御机制提高了检测模型的鲁棒性。

示意图1

4 结论

研究人员提出了许多基于机器学习和深度学习算法构建的新一代恶意软件检测模型。然而，我们发现这些模型容易受到对抗攻击，从而威胁安全生态系统。因此，我们首先站在攻击者的角度，设计了一种基于相关性的逃逸攻击，显著降低了四种不同安卓恶意软件检测模型的性能。随后，我们分析了这些漏洞，并提出对抗性重训练作为对策，有效提升了检测模型的准确率和鲁棒性。