利用python内置K-Means聚类算法实现鸢尾花数据的聚类

最新推荐文章于 2025-10-14 07:38:03 发布

原创

最新推荐文章于 2025-10-14 07:38:03 发布 · 8w 阅读

CC 4.0 BY-SA版权

在进去聚类情况分析前，我们需要为我们的IDLE安装sklearn库，scikit-learn是Python的一个开源机器学习模块，它建立在NumPy，SciPy和matplotlib模块之上能够为用户提供各种机器学习算法接口，可以让用户简单、高效地进行数据挖掘和数据分析。

python中安装sklearn机器学习库

pip install numpy
pip install scipy
pip install sklearn

如果安装过程中出现报错的话，就根据报错的信息来安装所需要的组件，最终的目的是为了能够成功的安装sklearn库。

K-Means聚类

然后下面我们来从sklearn库中引入K-Means聚类算法及导入鸢尾花数据集。

import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans
#from sklearn import datasets
from sklearn.datasets import load_iris

就这样就能够实现K-Means聚类算法的引入及鸢尾花数据集的引入，是不是很简单，很方面！

iris = load_iris()
X = iris.data[:]

下面我们将引入的数据样式print出来看看。

......
 [6.7 3.3 5.7 2.5]
 [6.7 3.  5.2 2.3]
 [6.3 2.5 5.  1.9]
 [6.5 3.  5.2 2. ]
 [6.2 3.4 5.4 2.3]
 [5.9 3.  5.1 1.8]]
(150, 4)

所引入的鸢尾花数据的形式就如上述所示，共有150行4个特征数据。

然后我们用图像来展示下数据点的分布情况

最低0.47元/天解锁文章

27 条评论

烤箱肉 2022.01.03
您好博主，请问如果想要确认Kmeans质心点的位置应该怎么做呢

L.M.Q 2021.12.21
不错，我用聚类做了minist数据集聚类，成功了

Ra1nyy 2021.10.14
博主您前一半代码其实用的是四维数据进行聚类所以可视化前两维时候效果不好，前面的一行代码改成X = iris.data[:,:2]效果就好了，前两个特征和后两个特征都分类的

weixin_44740930 2021.07.29
这个是使用pycharm软件实现的吗
- 木槿、回复weixin_44740930 2021.08.30
  是的。

qq_36008909 2021.06.29
那如果别的鸢尾花数据呢，怎么导入？

qq_43715664 2021.06.15
有用，感谢大佬

weixin_45836725 2020.12.30
你好，博主，请问这个程序对于17维的数据能够实现聚类吗

luan_Ha 2020.12.24
博主你好，我想问一下，如何输出簇的质心

充实而又快乐 2020.07.19
博主，您好，我想问您下，聚类后，怎样把每个簇中的所有数据给打印出来？

灵之来兮蔽日 2020.07.02
博主。只显示了数据分布图。第二个聚类图没有显示。运行了差不多5—6个小时，还是显示在运行。。。
- 灵之来兮蔽日回复木槿、 2020.07.06
  [reply]zijinmu69[/reply]不能同时显示吗
- 灵之来兮蔽日回复木槿、 2020.07.06
  [reply]zijinmu69[/reply]两个图不是一起出的。要关掉第一个图，第二个图才执行。然后才结束。
- 木槿、回复灵之来兮蔽日 2020.07.06
  [reply]qq_35269829[/reply]这个数据量其实是很小的，正常情况下1-2秒肯定就已经出来了，不会这么久时间出不了，既然5h不出来，我建议你去debug下，看看是否是因为第二个绘图函数没有执行，或者是因为聚类的库没有安装好的问题。