多行为聚集问题

多行为聚集问题,也称异质流问题,出现在隧道流量分类中,当网络行为混合时识别率下降。该问题源于隧道内的流混合和重叠,主要挑战包括数据获取与标注、分流策略。场景定义分为固定混合应用数目、固定上限和未知数目三种情况。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

多行为聚集问题

编者语: 问题的定义,是为了更好说明问题。以便于学术界形成共识,每次提到该问题,大家都会想到这个场景。

1. 问题的定义

多行为聚集问题(异质流问题)是隧道流量分类领域的一个问题,当前隧道流量识别技术可以较高精度地识别用户单个网络行为的流量,但是当网络行为为两个或者多个时,识别率就会极大的降低,这一难题称为多行为聚集问题,又称为异质流问题(在一段时间内有多个网络行为同时发生)。(多行为聚集问题的定义由本人首次提出,参考请引用)

2. 伴随的问题
隧道内具有相同的发送者和接收者,是出现该问题的主要根源之一。传统的加密流量,就不存在这个问题。因为每条流属于不同的行为,可以通过流分类来确定不同的行为。隧道对流量进行了压缩,m条流被压缩成n条流(一般是压缩成一条流,如果存在多路复用的话,可能是n条流,可以在搭建隧道的时候,设定。m>n)。流与流之间存在混合和重叠,没有可以利用的明文信息把不同的流分割开(加密流量通过五元组分流)。因此多行为聚集问题主要问题在于:如何分流,能提取出单一应用的流量?
数据问题:混合流的研究,需要混合数据的支持,如何产生真实环境中的混合数据并对其进行标注是一个难题。该问题是解决混合流识别的第一步,也是最基础的一步。
分流问题: 多行为聚集问题,主要的一步在于分流,分流的好坏直接影响分类的效果。

3. 场景的定义
混合流千奇百态,混合形式复杂多样,场景众多,需要多不同场景进行细化,方便问题的解决:
按照混合行为数目分类:
(1) 固定混合应用数目场景
此场景是最简单的一个,已知混合行为的数目,较强的先验。经典的就是两应用混合问题

(2) 固定混合应用数目上限场景
此场景又是相对难的问题,此问题的先验是知道混合流最多混合几个行为,知道混合行为的上限。

(3) 未知混合应用数目场景
此场景是最难的问题,此问题没有依托于任何先验,比较接近真实中的场景。

本文本人首创,引用请说明!!!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值