前言
本次主要解决上次的问题三。为了引入更好的测试用例进行模糊测试,afl提供了两个工具afl-cmin、afl-tmin
来进行语料库蒸馏。本文将对这两个工具进行介绍。
一、构建语料库
我们需要先构建一个该项目测试所需的语料库
第一个testcase里面放的是我自己瞎写的一个字符串, 把它多复制几份,每份都对里面进行一些修改,这7个测试样例就构成了我们本次实验的“语料库”了。
AFL功能纵使强大,也需要一个高效的执行速度。如果是普通的语料库作为测试用例,会出现很多无意义的测试,例如多个测试用例执行了同样的代码路径,再比如语料库的文件过大,测试和处理的时间太长等。
构建一个质量更高的语料库就成了必须完成的工作。像我们刚刚制作的几个testcase,随意删删改改的,7个文件都大同小异,显然不是一个合格的语料库,因此afl提供了afl-cmin
、afl-tmin
两种语料库蒸馏的工具。
二、语料库蒸馏
1.afl-cmin(移除执行相同代码的测试用例)
afl-cmin
的核心思想是:尝试找到与语料库全集具有相同覆盖范围的最小子集。 举个例子,假设有多个文件,都覆盖了相同的代码,那么就丢掉多余的文件。