3.5.1 数据集分类
本项目对物联网安全数据集包含的1000个不同指令集架构下的物联网设备二进制固件,使用IDA-Python提取出固件架构信息对数据集进行分类,得到表3-1。本项目假设其为一个特定不同架构、分布稳定的数据集的一个较小部分,用于训练和选择方案。
可以看到ARM、MIPS架构下固件集数量多,其他架构固件数据集较少,这也导致了后续本项目在进行训练的测试的时候,ARM、MIPS架构下的检测率和准确度较高,更贴合实际的检测结果,而其他架构下的检测率相对较低,和实际结果间存在一定的误差,在后续实验中,本项目也需要不断扩充数据集来提高检测的结果和精度。
表3-1 固件构架分类信息
Structure | Num |
ARM | 390 |
MIPS | 430 |
Metapc | 70 |
Octeonb | 90 |
其他 | 20 |