轮廓图
一种用于展示数据聚类内部一致性的图形化表示方法。
输入
• 数据:输入的数据集
输出
● 选中的数据:从图中选择的实例
• 数据:包含新增列(标记数据点是否被选中)的数据集
轮廓图部件提供了一种图形化方式来评估聚类的质量。轮廓分数(Silhouette Score)用于衡量一个数据点与其所属聚类之间的相似性,以及与其他聚类的差异。轮廓分数接近1表示该数据点靠近聚类中心,而接近0则表示数据点位于两个聚类的边界。

操作步骤
-
选择距离度量:可选以下三种方式:
● 欧几里得距离(两点之间的直线距离)
● 曼哈顿距离(所有属性绝对差之和)
• 余弦相似度(1减去两向量夹角的余弦值)
<