Web安全之机器学习 | 数据集和特征值提取

数据集

1、KDD 99数据

KDD是知识发现与数据挖掘(Knowledge Discovey and Data Mining)的简称。

2、HTTP DATASET CSIC 2019

HTTP DATASET CSIC 2019包含大量标注过的针对web服务器的36000个正常请求及25000个攻击请求,攻击类型包括sql注入、缓冲区溢出、信息泄露、文件包含、xss等,被广泛用于WAF类产品的功能评测。

3、SEA数据集

数据集SEA被广泛用于内部伪装者威胁检测研究,涵盖70多个UNIX系统用户的行为日志,这些数据来自于UNIX系统acct机制记录的用户使用的命令。数据集链接:http://www.schonlau.net/

4、ADFA-LD数据集

ADFA-LD数据集是澳大利亚国防学院对外发布的一套主机级入侵检测系统的数据集合,被广泛应用于入侵检测类产品的测试。该数据集包括Linux和Windows,记录了系统调用数据。项目主页:https://www.unsw.adfa.edu.au

5、Alexa域名数据

Alexa对外提供了全球排名TOP一百万的网站域名的下载,文件是CSV格式,以排名、域名组成。

6、Scikit-Learn数据集

其中最常见的是iris数据集。

7、MNIST数据集

MNIST是一个入门级的计算机视觉数据集,包括各种手写数字图片。

网址为:http://yann.lecun.com/exdb/mnist/

8、Movie Review Data

Movie Review Data数据集包括1000条正面的评论和1000条负面评论,被广泛应用于文本分类,尤其是恶意评论识别方面。

网址:http://ww

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值