数字取证中的文件分类与哈希集优化技术
1. 基于上下文的GIF文件分类实验
在数字取证领域,文件分类是一项重要的任务。为了提高GIF文件的检测效果,进行了一系列基于上下文分类的实验。
1.1 实验设置
- 数据集 :使用从互联网下载的1.5MB文件组成的新数据集,每个文件大小约为100KB。所有收集的文件被划分为512字节的块序列。
- 磁盘镜像场景 :创建了四种“磁盘镜像”场景:
- 场景1:文件随机连接,创建无碎片的磁盘镜像。
- 场景2:文件被分成两个相等的片段,随机连接以创建双碎片磁盘镜像。
- 场景3:文件被分成三个相等的片段,随机连接以创建三碎片磁盘镜像。
- 场景4:文件被分成十个相等的片段,随机连接以创建十碎片磁盘镜像。
- 实验阶段 :实验分为两个阶段。首先,使用GIF分类器对生成的磁盘镜像的所有块进行基本分类。然后,使用GIF分类器的输出计算每个块的基于上下文的分类。实验比较了包含和忽略块本身分类$C_i$的两种算法变体,并探索了上下文大小(ContextSize)参数值为3、5、8和10的情况。
以下是实验流程的mermaid流程图:
graph LR
A[下载数据集] --> B[划分文件为块序列]
B --> C[创建磁
超级会员免费看
订阅专栏 解锁全文
53

被折叠的 条评论
为什么被折叠?



