层次聚类:原理、方法与实践
1. 层次聚类简介
层次聚类和树状图的优势在于,你可以看到所有潜在聚类的细分情况,从而进行选择。例如,若你只想将物种数据集分为狗和猫两类,那么可以在聚类的第一级停止;若想将所有物种分为家养动物和非家养动物,就可以在第二级停止聚类。
2. 构建层次聚类的实践
2.1 生成虚拟数据
我们可以使用 Python 来实现层次聚类。以下是生成虚拟数据的代码:
from scipy.cluster.hierarchy import linkage, dendrogram, fcluster
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
%matplotlib inline
# Generate a random cluster dataset to experiment on. X = coordinate
# points, y = cluster labels (not needed)
X, y = make_blobs(n_samples=1000, centers=8, n_features=2, random_state=800)
2.2 可视化数据
通过以下代码可视化生成的数据:
plt.scatter(X[:,0], X[:,1])
plt.show()
从输出结果
超级会员免费看
订阅专栏 解锁全文
1503

被折叠的 条评论
为什么被折叠?



