图聚类与关联规则质量评估研究
1. 图聚类研究
1.1 实验结果分析
在图聚类实验中,研究人员对不同的目标函数进行了评估。实验绘制了不同目标函数下的曲线,第一行是归一化互信息(NMI)值与混合参数 μ 的关系,第二行是找到的聚类数量与混合参数 μ 的关系,从左到右的图分别对应 500、1000 和 2000 个节点的图。
实验结果呈现出以下特点:
- 对于大多数目标函数,NMI 值在达到某个点(Q、B、LM 约为 0.6,J 约为 0.5,E 约为 0.3)后,往往会增长或趋于稳定。
- LM 准则倾向于产生比 Q、B 和 J 更多的聚类。
1.2 目标函数比较
总体而言,B 和 J 与 Q 表现相当,而 LM 明显是比其他目标函数更好的选择。LM 表现优越的一个原因是,它隐式地将二进制矩阵 A 转换为非负矩阵 A,其一般项为 Aij = 2Aij/(Ai. + A.j),并且其相关的中心趋势方案 μLMij = 1/n,对所有节点对 (i, j) 给出相同的值。这种方法与其他质量函数不同,其他函数都保留二进制矩阵,但不同函数的底层中心趋势方案 μZ(Z ∈ {Q, B, J, E})有所不同。
此外,实验结果还促使研究人员进一步分析不同目标函数背后的假设。关于 Newman 对模块化的假设,有趣的是,B 和 J 虽然不满足 Q 准则的所有假设,但表现与 Q 相似。更重要的是,LM 违反了 Newman 的大多数假设,但却优于包括 Q 在内的所有其他方法。
1.3 研究结论与展望
研究人员提出了用于无向和无权图聚类的新目标函数,方法是最大化统计关联度
超级会员免费看
订阅专栏 解锁全文
17

被折叠的 条评论
为什么被折叠?



