基于数据传输行为识别P2P流量
1. 引言
在网络领域,根据应用对网络流量进行分类至关重要,它涉及网络监控、管理优化、安全保障以及流量计费等多个方面。与传统的HTTP、电子邮件和FTP等应用不同,新兴的P2P应用通常采用动态端口号,这使得基于原生端口的流量分类技术效果大打折扣。
虽然基于有效负载签名的流量分类技术能够达到较高的准确率,但它也存在局限性。对于加密流量,该技术往往无能为力;而且许多P2P应用使用专有协议,缺乏开放的协议规范,这使得分析和维护最新的签名变得异常困难。
近年来,利用流量统计信息的机器学习算法也被提出用于网络流量分类。然而,这种方法也面临挑战。一方面,用于分类的统计特征不稳定,因为网络的延迟和丢包率是动态变化的;另一方面,不同应用的流量可能具有相似的统计特征,难以通过流量属性进行区分。
本文提出了一种基于数据传输行为识别P2P流量的新方法。该方法的核心思想源于观察到P2P节点在下载数据后会将其上传给其他节点。
2. 相关工作
2.1 基于有效负载签名的方法
有效负载签名在网络流量分类中很有用。应用签名是P2P协议中的通用字符串,用于识别P2P流量,但本文方法更关注P2P应用中共享的数据。除了基于签名的方法,还有其他基于有效负载的方法。例如,ACAS使用前N字节的有效负载作为输入来训练机器学习模型,并用于分类流量;Levchenko等人在有效负载上构建了多个概率模型,包括将每个n字节流量分布视为N个独立字节分布的乘积的统计模型,以及引入字节之间独立性的马尔可夫过程模型。这些模型仍然利用应用协议中频繁出现的字节来分类流量。
超级会员免费看
订阅专栏 解锁全文
30

被折叠的 条评论
为什么被折叠?



