信息论聚合协同聚类与网络欺凌半监督检测
信息论聚合协同聚类
在数据处理和分析领域,协同聚类是一项重要的技术,它能同时对数据的行和列进行聚类,从而发现数据中的潜在结构。下面将详细介绍基于信息论目标的协同聚类方法,以及它在合成数据集和真实数据集上的表现。
合成数据集实验
为了评估协同聚类算法的性能,研究人员创建了合成数据集。具体的数据生成方案有两种:
- 方案一 :固定聚类大小 ( s ),增加聚类数量 ( k ) 以得到更大的图。
- 方案二 :固定聚类数量,增加聚类大小以获得不同规模的图。
生成的矩阵具有对角强的特点,即对角块的密度为 ( p ),非对角块全为零。之后,通过在原始矩阵的随机位置添加 ( \beta ) 比例的非零元素来引入随机噪声,以研究不同噪声水平对聚类性能的影响。
研究人员创建了两种类型的合成图:
- CAVE1 图 :( s = 500 ),( 2 \leq k \leq 11 ),( p = 0.9 ),( \beta = {0.1, 0.2, 0.3, 0.4} ),共得到 4 组 10 个不同大小的图,每组图具有不同的噪声水平。
- CAVE2 图 :( s = 50t ),( 1 \leq t \leq 10 ),( k = 10 ),( p ) 和 ( \beta ) 与 CAVE1 图相同,同样得到 40 个图。
表 1 展示了噪声为 40% 时最大的 CAVE1 和 CAVE2 图的数据集统计
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



