基于机器学习与智能优化的安卓恶意软件检测及图像加密系统研究
1. 安卓恶意软件检测系统
在当今数字化时代,安卓应用面临着恶意软件的严重威胁,数据安全和隐私成为用户关注的焦点。为解决这一问题,研究人员提出了一种结合机器学习技术和群体智能优化的方法来区分恶意和良性应用。
- 数据集创建(特征提取)
- 研究人员收集了2118个安卓应用,其中包括1700个良性应用和418个恶意应用。
- 使用APK工具将对应的APK文件解包为源代码,针对静态分析提取AndroidManifest.xml文件。
- 利用Python 3模块解析每个应用的XML文件,收集与权限、操作、功能和接收器相关的信息,这些信息将成为数据集的特征。
- 解析所有应用后,共获得15,939个特征,每个特征为布尔或二进制值,即若特征在应用中出现,其特征值为1,否则为0。
- 特征选择
- 为减少特征数量,可采用小数据集、考虑有限特征集或使用特征排名和选择方法。
- 本研究应用卡方(χ²)检验来找出特征之间的相关性,并从15,939个特征中选择必要的特征。
- 卡方方法比较实际结果和预测结果之间的差异,同时考虑自由度(DOF)来确定是否可以拒绝特定的零假设。
- 使用sklearn的select KBest函数进行特征选择,根据特征的得分和α值(p_values),当p_values < 0.05时,该特征对分类结果无用,可予以丢弃。
- 最终得到一个包含2654个特征的数据集,用于后续的机器学习分类器训练。
- 模型设计 <
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



