大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
本文主要介绍了HTTP报文数据检测与分类方案总结,希望能对同学们有所帮助。
文章目录
1. 背景介绍
根据HTTP报文数据的几大字段:Method、UA、URL、Referer和Body,从而识别出报文所属的具体分类。其中具体分类为六大类,分别为
- 白样本
- SQL注入
- 目录遍历
- 远程代码执行
- 命令执行
- XSS跨站脚本。
2. 机器学习方案
2.1 方案概览
2.2 特征构建
如何构建有效的特征是模型预测结果的决定性因素。可通过三大维度进行特征构建,分别为&