K均值聚类(K-means clustering)是一种常用的无监督学习算法,用于将数据集划分为K个不同的簇。在该算法中,每个数据点被分配到距离其最近的簇中心,从而形成了K个簇。本文将介绍如何使用Python实现K均值聚类算法,并提供相应的源代码。
首先,我们需要导入所需的库,包括NumPy和sklearn.cluster中的KMeans类:
import numpy as np
from sklearn.cluster import KMeans
接下来,我们需要准备要进行聚类的数据集。假设我们有一个包含N个数据点的数据集,每个数据点有M个特征。我们可以将数据存储在一个N行M列的NumPy数组中,其中每一行表示一个数据点,每一列表示一个特征。
data = np.