聚类算法:从谱聚类到层次聚类的深入解析
1. 谱聚类算法参数敏感性
谱聚类算法在不同参数设置下会产生不同的聚类结果。以数据集 X10 为例,当参数 e 分别取 1.5 和 3 时,聚类结果有明显差异。这体现了参数选择对聚类质量的重要影响。
绘制聚类结果的代码如下:
figure(2),plot(X10(1,bel==0),X10(2,bel==0),'ro',...
X10(1,bel==1),X10(2,bel==1),'b*')
figure(2), axis equal
步骤如下:
1. 先设置 e = 1.5,绘制聚类结果。
2. 再设置 e = 3,重复上述操作。
3. 比较两次结果,分析参数值对聚类质量的影响,并给出物理解释。
2. 层次聚类算法概述
与之前讨论的返回单一聚类结果的算法不同,层次聚类算法返回 N 个嵌套聚类的层次结构,其中 N 是数据集 X 中的数据点数量。
层次聚类算法主要分为两类:
| 类别 | 初始聚类 | 聚类过程 | 最终聚类 |
| ---- | ---- | ---- | ---- |
| 凝聚式 | N 个单元素聚类 | 逐步合并最相似的聚类 | 一个包含所有数据点的聚类 |
| 分裂式 | 一个包含所有数据点的聚类 | 逐步分裂成多个聚类 | N 个单元素聚类 |
后续主要讨论凝聚式聚类算法,包括广义凝聚算法方案和基于此的具体算法。
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



