22、信息论聚合协同聚类与网络欺凌半监督检测

信息论聚合协同聚类与网络欺凌半监督检测

信息论聚合协同聚类

在数据处理和分析领域,协同聚类是一项重要的技术,它能同时对数据的行和列进行聚类,从而发现数据中的潜在结构。下面将详细介绍基于信息论目标的协同聚类方法,以及它在合成数据集和真实数据集上的表现。

合成数据集实验

为了评估协同聚类算法的性能,研究人员创建了合成数据集。具体的数据生成方案有两种:
- 方案一 :固定聚类大小 ( s ),增加聚类数量 ( k ) 以得到更大的图。
- 方案二 :固定聚类数量,增加聚类大小以获得不同规模的图。

生成的矩阵具有对角强的特点,即对角块的密度为 ( p ),非对角块全为零。之后,通过在原始矩阵的随机位置添加 ( \beta ) 比例的非零元素来引入随机噪声,以研究不同噪声水平对聚类性能的影响。

研究人员创建了两种类型的合成图:
- CAVE1 图 :( s = 500 ),( 2 \leq k \leq 11 ),( p = 0.9 ),( \beta = {0.1, 0.2, 0.3, 0.4} ),共得到 4 组 10 个不同大小的图,每组图具有不同的噪声水平。
- CAVE2 图 :( s = 50t ),( 1 \leq t \leq 10 ),( k = 10 ),( p ) 和 ( \beta ) 与 CAVE1 图相同,同样得到 40 个图。

表 1 展示了噪声为 40% 时最大的 CAVE1 和 CAVE2 图的数据集统计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值