分布式流网络中的违规解决
在分布式流网络中,处理局部约束违规时,如何最小化通信需求是一个关键问题。本文将介绍不同数据集、评分函数、性能指标、对比算法以及实验结果,探讨在不同网络类型下解决违规的有效方法。
1. 数据集介绍
- Air-HM :由二维向量表示空气中 NO 和 NO₂ 的浓度,单位为微克每立方米,共组装了 n 个数据分布高度相关的节点。
- Syn-HT-n(n = 16, 32, …, 1024) :合成生成的异构数据集,由 n 个来自正态分布的随机 $\frac{n}{8}$ 维数据流(节点)组成。除了 8 个节点的数据方差在各维度上显著较高外,其他节点在各维度上的数据方差相同。
- RCV-HT-n(n = 16, 32, …, 256) :基于路透社语料库(RCV1 - v2),该语料库包含 804,014 篇新闻故事,每篇故事被标记为属于 103 个内容类别中的一个或多个。将这些故事组装成 $\frac{n}{8}$ 个大致相等大小的超级类别,并为每个类别选择一个在该类别中占主导地位的术语。每个超级类别的故事被划分为 8 个节点,这些节点在 100 篇故事的滑动窗口内跟踪所有选定术语的出现情况,即局部向量为出现计数向量。除了对应超级类别术语的维度方差显著较高外,节点在其他维度上的数据分布方差大致相同。
2. 评分函数和局部约束
不同数据集定义了不同的评分函数和局部约束:
- Syn - HM、Syn - HT、RCV - HT </
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



