k均值聚类
通过k均值聚类算法对数据进行分组。
输入
• 数据:输入数据集
输出
• 数据:带有聚类标签(作为元属性)的数据集
• 中心点:包含初始中心点坐标的表格
该组件使用k均值聚类算法处理数据,并输出一个新增了聚类标签(元属性)的数据集。组件中会展示不同k值下聚类结果的轮廓系数。若启用轮廓系数选项,分数越高表示聚类效果越好。

-
选择聚类数量
- 固定值:将数据聚类到指定数量的簇中。
- 范围选择(X到Y):组件会根据轮廓系数展示所选范围内不同k值的聚类评分(轮廓系数通过比较同一簇内元素平均距离与其他簇元素平均距离计算)。
-
预处理
- 若启用此选项,数据列将标准化(均值为0,标准差为1)。
-
初始化方法(算法开始聚类的方式):
订阅专栏 解锁全文
77

被折叠的 条评论
为什么被折叠?



