
论文标题:Order Matters: Semantic-Aware Neural Networks for Binary Code Similarity Detection
原文链接:https://ojs.aaai.org/index.php/AAAI/article/view/5466
说明:在读研究生为方便记忆梳理学习,手敲论文笔记,概括论文的主要思想和内容。
背景

- 二进制代码相似性检测,其目的是在不访问源代码的情况下检测相似的二进制函数,是计算机安全的一项基本任务。
- 利用二进制代码的流程图来构建代码的语义的提取。
- 使用NLP模型提取二进制代码语义信息,tokens=word,块=句子。
- 本文贡献:
- 提出通用框架学习CFG的图嵌入,可以学习语义信息,结构信息和顺序信息。
- 语义感知建模使用BERT对带有掩码1语言模型任务和相邻节点预测的token和块的嵌入进行预训练。
- 顺序感知建模中,节点顺序有用,在邻接矩阵上采用CNN模型提取CFG的节点顺序信息。
- 四个数据集对两个任务(图的块包含和图的块分类)的实验表明,本模型性能更好。

该论文提出了一种新的语义感知神经网络框架,用于在不依赖源代码的情况下检测二进制代码的相似性。通过将二进制代码转换为语义和结构信息丰富的图,结合BERT进行预训练,以及使用CNN捕捉节点顺序,模型在四个数据集上的实验显示了优越性能,特别是在图的块包含和分类任务中。
最低0.47元/天 解锁文章
4848

被折叠的 条评论
为什么被折叠?



