监督式机器学习在入侵检测系统中的评估
1. 研究背景与数据集
从另一个角度来看,有研究引入了对抗分类的概念。其中一项研究探讨了通用数据的问题,指出有标签的训练比对抗训练容易得多。该研究还检查了分类模型的鲁棒性能以及它们对分类器泛化能力的影响。
1.1 数据集介绍
本次研究聚焦于一个公共数据集,具体是使用 CFA - BA 方法预处理后的数据文件。该文件包含约 88,182 条为入侵检测系统捕获的记录。这些记录被标记为正常(非恶意传入流量)或攻击(恶意传入流量),攻击类型又分为拒绝服务(DoS)、探测(Probe)、远程到本地(R2L)和用户到根(U2R)攻击。
数据集被划分为训练集和测试集,训练集有 70,459 个样本(占数据的 70%),测试集有 17,723 个样本(占 30%)。以下是数据集中各特征及其含义:
| 特征 | 含义 |
| — | — |
| Service | 表示使用的目标网络服务 |
| Flag | 指示连接是否正常的状态 |
| Src bytes | 表示单个连接中从源到目标传输的数据字节数 |
| Dst bytes | 表示单个连接中从目标到源传输的数据字节数 |
| Root shell | 表示是否获得根 shell,获得为 1,否则为 0 |
| Srv serror rate | 是在 srv count 聚合的连接中,激活标志 s0、s1、s2 或 s3 的连接百分比 |
| Same srv rate | 是在 count 聚合的连接中,连接到相同服务的连接百分比 |
| Diffsrv rate | 是在 c
超级会员免费看
订阅专栏 解锁全文
1340

被折叠的 条评论
为什么被折叠?



