一、Android恶意软件检测模型训练方法
二、特征构建及有效性分析
1.4个类别
(1)权限类特征:Android程序中申请的高危权限数量以及自定义权限数量。
(2)证书类特征:证书是否已经过期。
(3)API调用特征:敏感API被调用的平均次数以及调用路径的长度。
(4)混淆技术使用特征:Android程序中标识符平均长度、字符串的信息熵以及Java反射的使用次数。
2.构建数据集
通过收集信息,构建出数据集,并使用scikit-learn库中的多种分类模型,再通过多种继承的分类模型来训练分类器,并进行预测,去完成实验。拟打算使用2000个正常Android程序和2000个恶意Android程序。对这些程序进行分析获取信息,然后根据获取的信息进行统计分析寻找出用于构建数据集的特征信息,利用这些特征信息再次对程序中的信息进行抽调。
3.特征提取代码
三、恶意软件分类器选择与优化
1.随机森林算法
ACC 和 AUC 是机器学习,尤其是分类问题中常用的评估指标,用于衡量模型的性能。
2.模型融合方式
2层stacking模型融合的方法作为选择的分类器。