CBD: A Deep-Learning-Based Scheme for Encrypted Traffic Classification with a General Pre-Training Method
CBD:一种基于深度学习的加密流量分类方案及通用预训练方法
摘要
随着网络环境中加密流量的迅速增长及其占比的不断提升,加密流量分类作为流量分析的重要组成部分,研究价值日益凸显。目前,在封闭环境下的加密流量分类已得到较为充分的研究,但现有分类模型大多仅适用于标注数据,难以在真实环境中推广应用。为解决上述问题,本文提出了一种具备泛化能力的可迁移模型——CBD,用于真实环境下的加密流量分类。CBD的整体结构由一维卷积神经网络(CNN)与Transformer编码器组成,能够利用未标注数据进行预训练,从而学习加密流量数据的基本特征,并可迁移至其他数据集,实现从数据包层面与流层面的加密流量分类。本文在公开数据集上对该模型进行了性能评估,实验结果表明,CBD模型的性能优于多种基线方法,同时预训练策略能够有效提升模型的分类能力。
引言
近年来,随着网络技术的迅猛发展以及公众对数据隐私保护意识的逐步提升,各类加密技术在网络通信中得到了广泛应用,导致网络加密流量急剧增长。同时,加密流量也被某些不法分子利用作为掩盖非法活动的工具,从而为恶意攻击者隐藏其指挥与控制行为提供了便利。由此可见,加密流量分类已成为监测网络异常状态和及时发现网络攻击行为的重要手段。此外,它还对提升网络服务性能、营造安全可靠的网络环境发挥了积极作用,并因此引起了学术界的广泛关注。
网络流量分类是指利用算法构建流量分类模型,其任务可分为三个粒度层次:基于序列的分类、基于数据包的分类以及基于流的分类。不同粒度的选择取决于具体应用场景,如应用识别、协议识别和服务分析等。网络流量分类在网络管理、流量控制与安全检测中具有重要意义。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



