35、k-Means与高斯混合模型:聚类与密度估计的深入探索

k-Means与高斯混合模型:聚类与密度估计的深入探索

1. k-Means算法的应用

1.1 k-Means在数字识别上的应用

我们可以尝试使用k - means算法,在不借助原始标签信息的情况下,对数字数据进行聚类,从而识别出相似的数字。这就好比在处理一个全新且没有先验标签信息的数据集时的第一步探索。

以下是具体的操作步骤:
1. 加载数字数据

from sklearn.datasets import load_digits
digits = load_digits()
print(digits.data.shape)  # 输出:(1797, 64)

这里的数字数据集包含1797个样本,每个样本有64个特征,每个特征代表8×8图像中一个像素的亮度。

  1. 进行聚类操作
from sklearn.cluster import KMeans
kmeans = KMeans(n_clusters=10, random_state=0)
clusters = kmeans.fit_predict(digits.data)
print(kmeans.cluster_centers_.shape)  # 输出:(10, 64)

聚类结果是在64维空间中形成了10个聚类。聚类中心本身是64维的点

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值