Kmeans算法是一个无监督算法, 他是根据一大堆数据自己训练出他自己是属于哪一类型的,本质上也是算距离 我们先自己搞一个已经做好分类的kmeans数据集 from sklearn.datasets import make_blobs #自己创建数据集 X, y = make_blobs(n_samples=500,n_features=2,centers=4,random_state=1) #有500样本,2个类别,4个中心点 plt.scatter(X[:, 0], X[:, 1]