利用生成对抗网络扩展网络攻击数据及IT员工工作环境与创造力研究
一、生成对抗网络在网络攻击数据扩展中的应用
在网络安全研究领域,数据集的平衡性对于机器学习模型的训练至关重要。本文主要探讨了利用生成对抗网络(GAN)来平衡网络攻击数据集的相关研究。
(一)研究背景与目的
研究的主要目的是确定GAN是否能够用于平衡数据集。KDD99数据集虽然年代较久,可能无法反映当前网络攻击的现状,但它在机器学习应用中被广泛使用,并且其网络流量数据的存储格式仍可用于构建新的数据集。通过生成逼真的攻击数据并平衡数据集,这项研究成果有望应用于更现代的网络攻击数据集,对所有受不平衡数据集困扰的机器学习领域,包括网络安全机器学习研究都具有重要意义。
(二)数据集选择
选择KDD99数据集的原因在于其规模大,且已在机器学习应用中得到验证。该数据集用于第三届国际知识发现和数据挖掘工具竞赛,任务是构建网络入侵检测器和预测模型,以区分“不良”连接(入侵或攻击)和“良好”的正常连接。它包含超过500万个数据点,涵盖正常网络流量数据以及诸如Neptune和Smurf等攻击类型。KDD99数据集的攻击类型分为四大类:
| 攻击类别 | 攻击名称 | 数量 |
| ---- | ---- | ---- |
| DoS | back, land, neptune, pod, smurf | 388,2391 |
| R2L | ftp_write, guess_passwd, imap, multihop, phf, spy, warezclient, warezmaster | 1126 |
| U2R | buffer_ov
超级会员免费看
订阅专栏 解锁全文
9万+

被折叠的 条评论
为什么被折叠?



