每日论文:《CENTIME: A Direct Comprehensive Traffic Features Extraction for Encrypted Traffic Classification》
翻译:《CENTIME:一种用于加密流量分类的直接全面的流量特征提取方式》
Introduction(引入)
作者先引入两种加密流量分类常用的方法:
| 基于统计的方法 | 基于原始流量的方法 | |
|---|---|---|
| 缺点 | 性能取决于选择的特征向量 | 分类器输入需统一流量大小,但这会使流量的整体提结果信息丢失 |
| 为何用该方法 | 基于统计的方法假设不同类型的流量具有独特的统计特征[1] | 基于原始流量的方法使用DNN自动从网络流量中提取特征[2] |
| 一些实现方法 | 用AutoEncoder对统计特征进行编码 | 用resNet从统一的流量提取信息 |
作者的思想:基于统计的方法和基于原始流量的方法相结合。用AutoEncoder对统计特征进行编码,然后用resNet从统一的流量提取信息,综合特征输入到全连接网络进行分类。
FrameWork(CENTIME框架)
作者提出的CENTIME框架:
1.数据预处理。(按会话session进行拆分,并匿名化:去掉IP、MAC等)
2.提取特征
-
resNet从原始流量提取特征,26个统计特征,然后用min-max归一化到[0-1]范围内。统计特征如图1所示,归一化公式如

本文介绍了CENTIME框架,一种结合统计和原始流量特征的加密流量分类方法。通过AutoEncoder压缩统计特征,利用ResNet从原始流量中提取信息,再用全连接网络进行分类。实验表明,CENTIME在与六种最先进的方法比较中表现出色,特别是在流量文件统一大小和是否使用池化层方面。此外,t-SNE可视化显示综合特征能有效区分流量类别。
最低0.47元/天 解锁文章
2233





