层次聚类:原理、方法与应用
1. 层次聚类概述
层次聚类和树状图的优势在于,你可以看到所有潜在聚类的细分情况,从而进行选择。例如,若要将物种数据集分为狗和猫两类,可在聚类的第一层停止;若要将所有物种分为家养和非家养动物,可在第二层停止。
2. 构建层次聚类
2.1 练习 7:构建层次结构
我们可以使用 Python 中的 SciPy 库来实现层次聚类。以下是具体步骤:
1. 生成虚拟数据 :
from scipy.cluster.hierarchy import linkage, dendrogram, fcluster
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
%matplotlib inline
# Generate a random cluster dataset to experiment on. X = coordinate
# points, y = cluster labels (not needed)
X, y = make_blobs(n_samples=1000, centers=8, n_features=2, random_state=800)
- 可视化数据 :
plt.scatter(X[:,0]
超级会员免费看
订阅专栏 解锁全文
10万+

被折叠的 条评论
为什么被折叠?



