文件名 | 目标概述 | 特征 | 算法简述 | 超参数 | 样本数目 | 准确率 | 其他 |
Bayesian Neural Networks for Internet Traffic Classification | 10类 bulk database interactive mail service www p2p attack games multimedia | 246维论文大概写出,具体要读其他的文献[24] | naive bayes bayesian neural networks | 10 hidden layers | 512000 TCP flows | 95% | TCP ONLY 在flow packet byte上都进行试验 |
Discriminators for use in flow-based classification | 10类 bulk database interactive mail service www p2p malicious games multimedia | 248维 论文列表详细描述 | 无 | ||||
Efficient Flow based Network Traffic Classification using Machine Learning | 7类 chat, instant message, mail, FTP, VoIP, www, p2p | 44维 论文没有描述 是通过tcpdump和netmate两个工具得到 列表简述六类参考文献使用的特征 | BAYES NET/C4.5(weka软件实现) | 3500 | 82.33%/93.33% | ||
Toward the Accurate Identification of Network Applications | 10类 bulk database interactive mail service www p2p malicious games multimedia | 端口号,包头,签名,协议语义 | 以包 比特 流量为单位 多次分类 | ||||
Network Traffic Classification based on Unsupervised Approach | 文章没有说明 | 无描述 | K-MEANS DBSCAN AUTOCLASS | ||||
基于改进的C4.5 算法的网络流量分类方法 | 5类 BT,Edonkey,WEB,FTP,Youku | 21维 从前期文献【4】获得37维,采用filter和wrapper模型筛选 | C4.5 作者提出修改模型 准确率不变 速度更快 | weka默认参数;confidenceFactor=0.25;minNumObj=2;numFolds=3;seed=1 | 15000 | 97% | |
Lightweight Application Classification for Network Management | 10类 bulk database interactive Email service www p2p attack games multimedia | 文章表格列举 | Naïve bayes | 24小时采集到的数据 | 91% | 主要关注TCP的准确率 探讨了每一类特征的重要性 训练数据和正确率的关系 数据抽样,数据量和正确率的关系 | |
Internet Traffic Classification Using Bayesian Analysis Techniques | 10类 bulk database interactive Email service www p2p attack games multimedia | 248维 同论文Discriminators for use in flow-based classification | Naïve bayes | weka | 48664 | 96% | 应用kernel estimation的方法对数据进行预处理,后采用FCBF的方法,进行特征选择,实验证明对准确率有很大提升 |
ITCM A REAL TIME INTERNET TRAFFIC CLASSIFIER MONITOR | 5类 www http ftp xvttp isakmp | 5维 包数量,大小(MB),时间长度,包的平均大小,平均捕捉速度 | C4.5,AdaBoost,KNN,Naïve Bayes,Flexible Naïve Bayes | 3334 | 90% | ||
基于五元组加载荷特征的在线流量分类方法 | 5类 QQ HTTPS DNS SMTP HTTP | 261维 ASCII出现次数统计(256)+五元组(源IP,目标IP,协议类型,源端口,目标端口) | C4.5 | WEKA | 44786 | 99.82% | |
Internet Traffic Classification | 总结性地介绍推出的软件;建议从几个方面提取特征:·服务层 ·视频编解码器 ·IP地址 ·音频编解码器 ·MAC地址 ·客户端设备 ·客户端设备类型 ·内容(如视频、音频)提供商 ·操作系统 ·浏览器 ·媒体流类型 ·会话协议 ·媒体容器 ·传输协议 ·视频分辨率 | 从多个角度分析:·视频或音频流的持续时间 ·计数的事件的数目 ·跟踪“顶”项目(例如,使用最频繁的网址,最受欢迎的视频提供商, 等) ·累加(例如,添加了一些观察或测量值) | |||||
Traffic Classification Using Clustering Algorithms | 4类 HTTP P2P POP3 SMTP | 包数量,除去包头的平均有效载荷大小,包到达的平均间隔时间,包的平均大小,各个方向的比特传输数量 | DBSCAN KMEANS | e=0.02 minPts=3; K=9 | 1632051 | 72%,84% | |
网络流量分类识别若干技术研究 | 7类 bulk interactive mail service www p2p service | 5维 源IP地址、目的IP地址、传输时所采用的传输层协议类型以及源端口、目的端口 | 贝叶斯,神经网络,谱聚类 | 377526 | 51%,96.3% |