Louvain 聚类
使用 Louvain 聚类算法对项目进行分组。
输入
• 数据:输入数据集
输出
• 数据:带有聚类标签(作为元属性)的数据集
• 图(需安装 Network 插件):加权的 k 近邻图
该部件首先将输入数据转换为 k 近邻图。为保留距离的概念,使用共享邻居数量的杰卡德指数(Jaccard index)对边进行加权。最后,通过模块化优化社区检测算法对图进行处理,以获取高度互连节点的聚类。输出结果为一个新数据集,其中聚类标签作为元属性。
- 聚类数量信息:显示发现的聚类数量。
- 预处理:
● 数据归一化:将数据中心化至均值,并缩放到标准差为 1。
● 应用 PCA 预处理:通常对原始数据执行 PCA 处理以去除噪声(参见 PCA 部件)。
● PCA 主成分数量:使用的主成分数量。 - 图参数:
● 距离度量