恶意程序与多维灵敏度分析的研究进展
恶意程序潜在语义结构分析
在对恶意程序二进制文件的研究中,目标是提供额外的抽象层次,以确定生成其语法元素的模式。
特征提取与抽象表示
- 特征选择 :使用tf - idf词频方法的向量表示和程序的控制流邻接矩阵表示作为特征。这些特征基于程序的分段提取,分段操作提高了特征分辨率。
- 矩阵分解 :通过奇异值分解(SVD)对矩阵进行分解以获得抽象表示。每次矩阵分解会得到三个结果矩阵:
- 矩阵U :是段中指令的正交基,展示了文档与其抽象之间的关系。
- 矩阵D :是每个维度的主题权重矩阵,显示了单个抽象主题表示的强度。
- 矩阵V :是程序的正交基,展示了程序与抽象表示或主题的关联程度。
graph LR
A[程序] --> B[分段]
B --> C[特征提取:tf - idf向量、控制流邻接矩阵]
C --> D[矩阵分解:SVD]
D --> E[矩阵U]
D --> F[矩阵D]
D --> G[矩阵V]
主题分析与评估
- 主题分布