论文阅读-EMS: History-Driven Mutation for Coverage-based Fuzzing（2022）模糊测试-优快云博客

本文提出了一种轻量级的PBOM模型和历史驱动变异框架EMS，利用模糊测试历史中的变异策略，有效触发独特路径和崩溃。实验结果显示，EMS在多个程序上显著提高了漏洞发现和覆盖率，成为改进传统变异模糊测试的新方向。

一、背景

        本文研究了基于覆盖率的模糊测试中的历史驱动变异技术。之前的研究主要采用自适应变异策略或集成约束求解技术来探索触发独特路径和崩溃的测试用例，但它们缺乏对模糊测试历史的细粒度重用，即它们在不同的模糊测试试验之间很大程度上未能正确利用模糊测试历史。

        本文提出了一种轻量级且高效的概率字节定向模型（PBOM-Probabilistic Byte Orientation Model），以捕获来自试验历史的字节级变异策略，并因此有效地触发独特路径和崩溃。

        本文还提出了一种新的历史驱动变异框架EMS，用于加速基于覆盖率的模糊测试中的路径和漏洞发现。它将PBOM作为变异算子之一（包括 intra-PBOM和inter-PBOM），根据输入字节值概率性地提供所需的变异字节值【在论文中，EMS 在执行过程中根据选定的长度 L 读取输入字节值。这里的选择长度 L 指的是从所有可能的测试用例位置中随机选择一个位置，并读取该位置开始的连续 L 个字节作为输入。EMS接着在哈希映射中查找匹配索引节点，以便在索引节点中匹配到输入字节值 in 和长度 L。接着，EMS根据选择概率 P，在索引节点的链表中选择一种输出策略 (out, type, F, P)，并根据选定的位置和输出策略进行变异。】即EMS将PBOM作为附加变异操作符，根据输入字节值和长度概率性地提供所需变异字节值和类型。

PBOM是为了实现下面的目的：

「从内部和内部历史中捕获触发独特路径和崩溃的突变策略。换句话说，给定来自种子测试用例的输入字节值，学习到的突变策略模型应该能够输出相应的突变值和导致测试用例触发今天唯一路径或崩溃的突变类型。」

实验结果表明，EMS在9个真实世界程序上比AFL、QSYM、MO PT、MO PT-dict、EcoFuzz和AFL++等最先进的模糊测试工具发现了多达4.91倍的独特漏洞，并在大多数程序上发现了更多的覆盖。

本文的创新动机在于：利用模糊测试历史来加速发现新的路径和崩溃。