数据集
1、KDD 99数据
KDD是知识发现与数据挖掘(Knowledge Discovey and Data Mining)的简称。
2、HTTP DATASET CSIC 2019
HTTP DATASET CSIC 2019包含大量标注过的针对web服务器的36000个正常请求及25000个攻击请求,攻击类型包括sql注入、缓冲区溢出、信息泄露、文件包含、xss等,被广泛用于WAF类产品的功能评测。
3、SEA数据集
数据集SEA被广泛用于内部伪装者威胁检测研究,涵盖70多个UNIX系统用户的行为日志,这些数据来自于UNIX系统acct机制记录的用户使用的命令。数据集链接:http://www.schonlau.net/
4、ADFA-LD数据集
ADFA-LD数据集是澳大利亚国防学院对外发布的一套主机级入侵检测系统的数据集合,被广泛应用于入侵检测类产品的测试。该数据集包括Linux和Windows,记录了系统调用数据。项目主页:https://www.unsw.adfa.edu.au
5、Alexa域名数据
Alexa对外提供了全球排名TOP一百万的网站域名的下载,文件是CSV格式,以排名、域名组成。
6、Scikit-Learn数据集
其中最常见的是iris数据集。
7、MNIST数据集
MNIST是一个入门级的计算机视觉数据集,包括各种手写数字图片。
网址为:http://yann.lecun.com/exdb/mnist/
8、Movie Review Data
Movie Review Data数据集包括1000条正面的评论和1000条负面评论,被广泛应用于文本分类,尤其是恶意评论识别方面。
网址:http://ww