35、k-Means与高斯混合模型：聚类与密度估计的深入探索

a1b2c

于 2025-07-21 11:12:04 发布

阅读量75

点赞数

CC 4.0 BY-SA版权

分类专栏： Python数据科学：从入门到精通文章标签： k-Means GMM 聚类

本文链接：https://blog.youkuaiyun.com/a1b2c/article/details/149587809

Python数据科学：从入门到精通专栏收录该内容

38 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

k-Means与高斯混合模型：聚类与密度估计的深入探索

1. k-Means算法的应用

1.1 k-Means在数字识别上的应用

我们可以尝试使用k - means算法，在不借助原始标签信息的情况下，对数字数据进行聚类，从而识别出相似的数字。这就好比在处理一个全新且没有先验标签信息的数据集时的第一步探索。

以下是具体的操作步骤：
1. 加载数字数据 ：

from sklearn.datasets import load_digits
digits = load_digits()
print(digits.data.shape)  # 输出：(1797, 64)

这里的数字数据集包含1797个样本，每个样本有64个特征，每个特征代表8×8图像中一个像素的亮度。

进行聚类操作 ：

from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=10, random_state=0)
clusters = kmeans.fit_predict(digits.data)
print(kmeans.cluster_centers_.shape)  # 输出：(10, 64)

聚类结果是在64维空间中形成了10个聚类。聚类中心本身是64维的点

会员秒杀 ¥9.9 重磅福利

超级会员免费看