Improving ML-based Binary Function Similarity Detection by Assessing and Deprioritizing CFG Features

下面为组会笔记

一.introduction 

model:需要对函数的语义特征进行分析 ->通过CFG对语义特征进行分析

problem: 

过度依赖CFG,导致了语义的丧失

questions:

1)控制流图的特征在ML- BFSD 任务里面到底起到一个什么角色。

2)识别语义过程中CFG改变对整个语句的理解有什么副作用

contributions:

1)CFG 特征的作用

2)提出一个验证器:能检验是否模型过度依赖CFG

3)引入解释性的方法解析确实过度依赖

4)提出方法$CFG(核心方法)

5)提出数据增强的方法

二.background

1.ML-BFSD solutions

2.Explanation methods 

引入:神经网络的不可解释性 (黑盒)未知:哪些参数和特征是重要的

本文:希望能解释CFG中特征的重要性->使用的可解释性方法叫临近近似(approximation-based approach)

三.methodology

M1---Explainer:为了理解CFG在BFSD中扮演的角色

the impa

通过共享语义感知码本提高基于学习的图像传输语义编码效率是一个在图像传输领域具有创新性的研究方向。 在传统的图像编码中,往往侧重于对图像的像素级信息进行处理和压缩,而基于学习的语义编码则更关注图像中的语义内容。语义感知码本是一种能够对图像的语义信息进行有效表示的码本。共享语义感知码本的核心思想在于,不同的图像可能包含一些相似的语义元素,通过共享这个码本,可以避免对相同或相似语义的重复编码,从而提高编码效率。 从技术实现角度来看,需要构建一个能够准确捕捉图像语义信息的码本。这可能涉及到使用深度学习模型,如卷积神经网络(CNN),对大量图像进行训练,以学习图像中不同语义的特征表示,并将这些特征映射到码本中的特定条目。在图像传输时,发送端先将图像的语义信息与码本进行匹配,找到对应的码本条目,然后只需要传输这些条目的索引,而不是原始的图像数据。接收端则根据共享的码本和接收到的索引,重建出图像的语义信息。 这种方法的优势在于,一方面可以显著减少图像传输所需的数据量,降低传输带宽的要求;另一方面,由于关注的是语义信息,在一定程度上可以提高图像在接收端的理解和处理效率。例如,在一些智能视觉系统中,接收端可以直接根据重建的语义信息进行目标识别、场景分析等任务,而无需先对图像进行复杂的解码和特征提取。 ### 代码示例(简单示意构建码本和编码过程) ```python import numpy as np import torch import torch.nn as nn # 简单的CNN模型用于特征提取 class FeatureExtractor(nn.Module): def __init__(self): super(FeatureExtractor, self).__init__() self.conv1 = nn.Conv2d(3, 16, kernel_size=3, padding=1) self.relu = nn.ReLU() self.pool = nn.MaxPool2d(2, 2) def forward(self, x): x = self.conv1(x) x = self.relu(x) x = self.pool(x) return x # 生成码本(简单示例,随机生成) codebook_size = 100 codebook = np.random.randn(codebook_size, 16 * 16 * 16) # 模拟图像输入 image = torch.randn(1, 3, 32, 32) # 提取特征 extractor = FeatureExtractor() features = extractor(image).view(1, -1).detach().numpy() # 查找最近的码本条目 distances = np.linalg.norm(codebook - features, axis=1) index = np.argmin(distances) print(f"编码后的索引: {index}") ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值