数据流混合频率矩估计方法研究
在当今的数据处理领域,数据流模型的计算方式被广泛应用于各种监控场景。而其中,混合频率矩估计问题具有重要的实用价值和研究意义。
1. 问题背景与定义
在网络应用中,例如路由器会接收到一系列具有特定模式(源地址、目的地址、字节数、时间)的数据包。在可能的分布式拒绝服务攻击场景下,少数目的地址会收到来自大量不同源地址的消息。为了量化这种情况,我们引入了混合频率矩的概念。
设存在一个 $n × n$ 的矩阵 $A$,其中 $A_{i,j}$ 表示从节点 $i$ 发送到节点 $j$ 的消息数量。当 $i$ 向 $j$ 发送消息时,$(A_{i,j})^0$ 为 1,否则为 0。那么,$\sum_{i=1}^{n} A_{i,j}^0$ 就表示向 $j$ 发送至少一条消息的不同源的数量。定义混合矩 $F_{0,2}(A) = \sum_{j=1}^{n}(\sum_{i=1}^{n} A_{i,j}^0)^2$。在攻击场景下,$F_{0,2}(A)$ 的值会比其平均值大很多。因此,跟踪 $F_{0,2}(A)$ 的值是很有必要的。但由于 $n$ 可能非常大(例如达到数百万),以网络线路速度存储和更新流量矩阵 $A$ 是不可行的。所以,我们采用数据流方法来解决这个问题,即设计一个亚线性空间的数据结构,它能够处理矩阵 $A$ 元素的更新,并提供一个随机近似算法来估计 $F_{0,2}(A)$。
混合频率矩 $F_{p,q}(A)$ 是矩阵 $A$ 的一种重要度量,它的定义为:
[F_{p,q}(A) = \sum_{j=1}^{n} \left(\sum_{i=1}^{n} |A_{i,j}|^p \right)^q = \sum_{j
超级会员免费看
订阅专栏 解锁全文
1478

被折叠的 条评论
为什么被折叠?



